Question 1

Cos'è un sitemap?

Accepted Answer

Un sitemap è un file XML che elenca ogni URL che vuoi che i motori di ricerca eseguano il crawl e indicizzino. Risiede su yoursite.com/sitemap.xml e agisce come directory per i crawler, particolarmente utile per siti grandi, nuovi siti con pochi backlink o siti con navigazione profonda dove le pagine sono a cinque o più clic dalla homepage. I sitemap non garantiscono l'indicizzazione. Google decide comunque se una pagina vale la pena indicizzarla in base alla qualità e alla duplicazione. Senza un sitemap, Google si affida ai link interni e ai backlink esterni per trovare le pagine, il che può richiedere settimane o persino mesi per i nuovi contenuti. Con un sitemap, dici a Google che la pagina esiste e quando è stata aggiornata l'ultima volta, il che accelera la scoperta e aiuta a dare priorità ai contenuti freschi. Il nostro sitemap checker recupera il tuo sitemap.xml, analizza la struttura, convalida la sintassi XML, controlla i codici di stato HTTP per ogni URL elencato, contrassegna i duplicati e rileva le pagine orfane (pagine nel tuo sitemap ma irraggiungibili tramite link interni). Usalo dopo il lancio di un nuovo sito, dopo una migrazione o trimestralmente per catturare le regressioni.

Question 2

Come faccio a verificare se il mio sito web ha un sitemap?

Accepted Answer

Prova tre posti. Innanzitutto, aggiungi /sitemap.xml al tuo dominio (tuodominio.com/sitemap.xml) e vedi se si carica. La maggior parte dei CMS genera automaticamente un sitemap su questo percorso. Se vedi XML con un elenco di URL, quello è il tuo sitemap. In secondo luogo, controlla robots.txt su tuodominio.com/robots.txt per una riga che inizia con Sitemap: seguita da un URL. Molti siti dichiarano qui la posizione del loro sitemap. In terzo luogo, accedi a Google Search Console, vai a Sitemaps in Index e vedi quali URL di sitemap hai inviato. Questo è l'elenco autorevole che Google utilizza per dare priorità al crawl. Se trovi un URL di sitemap, incollalo nel nostro campo Sitemap URL per convalidare la struttura, confermare che tutti gli URL restituiscono codici di stato 200 e individuare i duplicati o gli orfani. Se nessuno di questi metodi trova un sitemap, probabilmente non ne hai uno. Va bene per i siti con meno di 50 pagine ma è un problema per quelli più grandi. Generane uno usando il plugin del tuo CMS (Yoast, Rank Math, next-sitemap), quindi invialo a Search Console per accelerare l'indicizzazione.

Question 3

Quali sono i tre tipi di sitemap?

Accepted Answer

I tre tipi sono sitemap XML (per i motori di ricerca), sitemap HTML (per gli utenti) e sitemap visivi (per i designer). I sitemap XML sono file leggibili dalla macchina in formato XML che elencano URL, date di ultima modifica, frequenza di aggiornamento e priorità. I motori di ricerca li usano per scoprire e dare priorità alle pagine. Risiedono su /sitemap.xml e non sono destinati alla navigazione umana. I sitemap HTML sono pagine leggibili dall'uomo con link a ogni sezione principale del tuo sito, organizzate gerarchicamente. Aiutano gli utenti a navigare siti grandi e forniscono link interni. Risiedono su URL come /sitemap e sono spesso collegati dal footer. I sitemap visivi sono diagrammi (in Figma, Miro, Sketch) che mappano la gerarchia delle pagine, i flussi utente e la navigazione prima che un sito sia costruito. Sono artefatti di pianificazione, non pagine attive. La maggior parte dei siti ha bisogno di un sitemap XML (richiesto per il SEO) e beneficia di un sitemap HTML se ha più di 100 pagine. I sitemap visivi sono per la fase di progettazione. Il nostro checker convalida solo i sitemap XML. La maggior parte dei CMS li genera automaticamente. Per siti statici, usa next-sitemap o astro-sitemap.

Question 4

Come valido un sitemap?

Accepted Answer

Validare un sitemap significa controllare la struttura XML, l'accessibilità dell'URL, l'accuratezza dei metadati e i limiti del protocollo. Innanzitutto, conferma che l'XML sia ben formato con la corretta dichiarazione dello spazio dei nomi (attributo xmlns che punta a sitemaps.org). L'XML mal formato causa il rifiuto del file intero da parte dei parser. In secondo luogo, verifica che ogni URL restituisca un codice di stato 200, non 301, 404 o errore 5xx. I motori di ricerca possono comunque eseguire il crawl di URL che si reindirizzano o sono interrotti, ma li deprioritizzano. In terzo luogo, controlla che gli URL usino percorsi assoluti ( https://example.com/page , non /page) e corrispondano al tuo dominio canonico (www o non-www, non misti). Quarto, conferma che la dimensione del file sia inferiore a 50 MB non compresso con meno di 50.000 URL. Se superi uno dei due, dividi in più sitemap e crea un file sitemap index. Quinto, valida che le date di lastmod usino il formato W3C (YYYY-MM-DD o ISO 8601). Il nostro strumento automatizza tutti e cinque: incolla il tuo Sitemap URL , scegli la crawl depth (solo index, tutti i sitemap referenziati o campione) e otteniamo i codici di stato, i duplicati, gli avvisi di lastmod mancante e un'esportazione CSV dei problemi.

Question 5

Google ha un generatore di sitemap?

Accepted Answer

Google offriva un generatore di sitemap (Google Sitemap Generator) per Apache e IIS, ma è stato deprecato anni fa. Non ne hai più bisogno. Quasi tutti i CMS moderni e i framework statici generano automaticamente i sitemap. WordPress (tramite Yoast SEO, Rank Math o sitemap core dal 5.5), Shopify (integrato), Webflow (integrato), Squarespace (integrato), Wix (integrato), Next.js (tramite next-sitemap), Astro (tramite astro-sitemap), Gatsby (tramite gatsby-plugin-sitemap) e Hugo (integrato) creano e aggiornano tutti i sitemap XML senza lavoro manuale. Per siti personalizzati, usa librerie open-source come sitemap.js (Node.js), django-sitemap (Python) o uno script di build. Una volta che hai un sitemap, invialo a Google Search Console in Sitemaps. Google lo eseguirà periodicamente. Puoi eseguire il ping di Google manualmente dopo aver aggiunto URL inviando una richiesta GET a google.com/ping?sitemap=turositemapurl, sebbene la maggior parte dei CMS lo faccia automaticamente. Usa il nostro sitemap checker per convalidare il sitemap prima di inviarlo a Search Console.

Question 6

Con quale frequenza dovrei aggiornare il mio sitemap?

Accepted Answer

Aggiorna il tuo sitemap ogni volta che pubblichi, annulli la pubblicazione o modifichi significativamente una pagina. La maggior parte dei CMS e dei generatori statici lo fanno automaticamente. I plugin WordPress rigenerano il sitemap su ogni pubblicazione di post, Shopify lo aggiorna quando i prodotti cambiano e i framework statici ricostruiscono il sitemap durante ogni deploy. Se gestito manualmente (raro su siti personalizzati), rigeneralo settimanalmente o dopo batch di contenuti. Il campo lastmod dice ai motori di ricerca quando una pagina è cambiata, il che aiuta loro a dare priorità ai contenuti freschi rispetto agli stantii. Se non aggiorni mai lastmod o imposti la stessa data per ogni URL, i motori di ricerca lo ignorano e ricadono sulla scoperta dei link e sul budget di crawl. Per i publisher quotidiani (notizie, blog, e-commerce con cambiamenti di inventario), i sitemap dinamici che si rigenerano su pubblicazione sono essenziali. Per i publisher mensili o trimestrali, un sitemap statico rigenerato su deploy va bene. Non lasciare che il tuo sitemap elenchi URL che 404, si reindirizzano o sono bloccati da robots.txt. Questo spreca il budget di crawl e segnala scarsa qualità del sito. Usa il nostro checker dopo i grandi cambiamenti (migrazione, ristrutturazione degli URL, cambiamenti di contenuto in blocco).

Question 7

Qual è la differenza tra un sitemap e robots.txt?

Accepted Answer

Robots.txt dice ai crawler quali parti del tuo sito sono loro permesse o vietate di accedere. Un sitemap dice ai crawler quali pagine vuoi che loro diano priorità al crawl. Servono a scopi diversi e lavorano insieme. Robots.txt risiede su yourdomain.com/robots.txt, usa sintassi in testo semplice con direttive User-agent, Allow e Disallow e blocca o consente l'accesso a percorsi, file o directory. Dichiara dove risiede il tuo sitemap tramite una direttiva Sitemap:. Robots.txt viene eseguito per primo. Se accidentalmente disabiliti l'intero sito, i crawler si fermano immediatamente e non vedono mai il tuo sitemap. Un sitemap risiede su yourdomain.com/sitemap.xml, usa sintassi XML ed elenca gli URL che vuoi vengano crawlati con metadati come lastmod e priority. Non controlla l'accesso. Suggerisce cosa eseguire il crawl. I crawler possono ignorare il tuo sitemap se trovano pagine tramite link, ma non possono aggirare robots.txt. Usa robots.txt per bloccare i pannelli di amministrazione, gli ambienti di staging e i crawler indesiderati. Usa un sitemap per elencare ogni pagina indicizzabile.

Question 8

Un sitemap può migliorare il mio SEO?

Accepted Answer

Un sitemap non migliora direttamente le classifiche, ma rimuove l'attrito nella scoperta, il che indirettamente aiuta il SEO assicurando che le pagine nuove e aggiornate vengano eseguite il crawl più velocemente. Senza un sitemap, Google si affida ai link interni e ai backlink esterni per trovare le pagine, il che può richiedere settimane per i nuovi contenuti, specialmente su siti grandi o siti con link interni deboli. Con un sitemap, dici a Google che la pagina esiste e quando è stata aggiornata l'ultima volta, il che accelera l'indicizzazione. Questo è importante per i nuovi siti con pochi backlink, i siti con gerarchie di pagina profonde (pagine sepolte cinque clic dalla homepage), i siti con pagine orfane e i siti che pubblicano frequentemente (blog, notizie, e-commerce). Un sitemap aiuta con l'efficienza del budget di crawl. Invece di scoprire le pagine tramite crawl di link, Google legge il tuo sitemap e sa cosa dare priorità. Tuttavia, un sitemap non può forzare Google a indicizzare pagine di bassa qualità, duplicate o thin. Se una pagina è nel tuo sitemap ma non è ancora indicizzata, il problema è solitamente la qualità del contenuto, la canonicalizzazione o i tag meta robots.

Question 9

Cosa non dovrebbe essere in un sitemap?

Accepted Answer

Un sitemap dovrebbe elencare solo gli URL che vuoi indicizzati, quindi escludi tutto ciò che è bloccato da robots.txt, contrassegnato con noindex, che si reindirizza a un altro URL, che restituisce errori 404 o 5xx, o canonicalizzato a un URL diverso. Includere questi spreca il budget di crawl e segnala scarsa manutenzione del sito. Non includere pagine di amministrazione, pagine di accesso, pagine di checkout o dashboard dell'account utente (solitamente bloccate da robots.txt o noindex). Non includere URL di parametri (come ?sort=price o ?page=2) se utilizzi tag canonici per consolidarli. Non includere ambienti di staging o test. Non includere URL che si reindirizzano (301 o 302). Elenca invece la destinazione finale. Non includere URL con tag meta noindex o intestazioni X-Robots-Tag. Non includere URL paginati a meno che ogni pagina non abbia contenuto univoco che vale la pena indicizzare. La maggior parte dei siti di e-commerce dovrebbe includere solo la pagina 1, con tag rel=next/prev o tag canonici che gestiscono il resto. Non includere URL di contenuto duplicato. Usa tag canonici per consolidare i duplicati, quindi elenca solo la versione canonica.

Question 10

Come faccio a correggere gli errori del sitemap?

Accepted Answer

Gli errori del sitemap rientrano in tre categorie: strutturale (XML mal formato, spazio dei nomi errato, file troppo grande), a livello di URL (404, reindirizzamenti, pagine noindex) e problemi di metadati (lastmod mancante, formati di data non corretti). Correggi gli errori strutturali per primo. Impediscono ai crawler di analizzare il file. Apri il tuo sitemap in un browser o validatore XML, conferma che inizi con la corretta dichiarazione XML e spazio dei nomi (xmlns=" http://www.sitemaps.org/schemas/sitemap/0.9 ") e controlla che ogni tag di apertura abbia un tag di chiusura corrispondente. Se il tuo sitemap supera 50 MB o 50.000 URL, dividilo in più file e crea un file sitemap index. Correggi gli errori a livello di URL rimuovendo o sostituendo le voci interrotte. Elimina qualsiasi URL che restituisca 404, sostituisci gli URL di reindirizzamento con la loro destinazione finale, rimuovi gli URL con tag noindex e conferma che ogni URL corrisponda al tuo dominio canonico (www o non-www, non misti). Correggi i problemi di metadati assicurando che le date di lastmod usino il formato ISO 8601 (YYYY-MM-DD o YYYY-MM-DDTHH:MM:SS+00:00). Rimuovi completamente lastmod se il tuo CMS non può mantenerlo accurato. Dopo aver corretto, riconvalida con il nostro strumento e reinvia a Google Search Console.

Sitemap Checker

Generate the whole content, not just check it.

Cosa fa effettivamente un sitemap checker

Come usare questo sitemap checker

Perché i codici di stato contano più della validità XML

URL duplicati e mancate corrispondenze canoniche

Pagine orfane e crawlabilità

Errori comuni

Suggerimenti avanzati

Generate the whole content, not just check it.

Domande frequenti

Strumenti gratuiti correlati