Skip to content
Live-Check · ruft deine URL server-seitig ab

Sitemap Checker

Crawle bis zu 200 URLs – Statuscodes, Duplikate, Waisen, Alter von lastmod.

Eine sitemap.xml-Datei teilt Suchmaschinen mit, welche Seiten existieren und wie oft sie sich ändern. Die meisten Validatoren parsen das XML und beenden die Verarbeitung. Dieser Sitemap-Checker validiert die Struktur, ruft HTTP-Statuscodes für jede aufgelistete URL ab, erkennt Duplikate, kennzeichnet verwaiste Seiten, die in Ihrer Sitemap vorhanden sind, aber nicht von Ihrer Startseite verlinkt werden, und prüft, ob lastmod-Zeitstempel aktuell genug sind, um Crawl-Priorität zu rechtfertigen.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Was ein Sitemap-Checker wirklich tut

Ein Sitemap-Checker ruft Ihre sitemap.xml-Datei ab, parst jeden <url>-Eintrag, extrahiert die Tags <loc>, <lastmod>, <changefreq> und <priority>, macht dann eine HTTP HEAD Request für jede URL, um zu bestätigen, dass sie 200 zurückgibt. Er kennzeichnet Weiterleitungen, 404er und Serverfehler, prüft auf doppelte URLs und vergleicht Ihre Sitemap-Struktur mit der XML-Sitemap-Spezifikation.

Wenn Ihre Sitemap ein Sitemap-Index ist – eine Datei, die andere Sitemap-Dateien anstelle einzelner URLs auflistet – folgen wir jeder Referenz, rufen jede untergeordnete Sitemap ab und aggregieren die Ergebnisse. Eine einzelne Überprüfung deckt Ihren gesamten Sitemap-Baum bis zu 200 URLs im Vollmodus oder 50 URLs im Beispielmodus ab.

Drei Kategorien von Problemen treten in jedem Sitemap-Audit auf. Fehlerhafte URLs, die 404 oder 500 zurückgeben. Doppelte URLs, die mehr als einmal aufgelistet sind und das Crawl-Budget verschwenden. Und verwaiste URLs, die in der Sitemap angezeigt werden, aber null interne Links haben, was bedeutet, dass ein Benutzer sie nicht durch Anklicken auf Ihrer Website erreichen kann. Unser Checker kennzeichnet alle drei in einem Durchgang.

So verwenden Sie diesen Sitemap-Checker

  1. Fügen Sie Ihre Sitemap-URL in Sitemap URL ein. Normalerweise https://www.yourdomain.com/sitemap.xml oder https://www.yourdomain.com/sitemap_index.xml.
  2. Wählen Sie eine Crawl depth aus dem Dropdown. Index only validiert die XML-Struktur, ohne URLs abzurufen. All referenced sitemaps folgt jeder Sitemap, die in einem Index aufgelistet ist. Sample 50 URLs prüft Statuscodes für 50 zufällige URLs. Full - up to 200 URLs prüft jede URL, die wir finden, bis zur Grenze.
  3. Klicken Sie auf Check sitemap. Sie erhalten eine Zusammenfassungstabelle mit Gesamt-URLs, Statuscode-Aufschlüsselung, Anzahl der Duplikate, durchschnittlichem lastmod-Alter und etwaigen XML-Schema-Fehlern.
  4. Erweitern Sie Problem URLs, um eine zeilenweise Liste von 404ern, 301ern, Duplikaten und verwaisten Seiten zu sehen. Jede Zeile zeigt die URL, den Status, das lastmod-Datum und die empfohlene Lösung.
  5. Klicken Sie auf Download CSV, um den vollständigen Bericht zu exportieren. Verwenden Sie ihn, um Probleme in Ihrem CMS stapelweise zu beheben oder an einen Entwickler weiterzugeben.

Versuchen Sie, eine Sitemap mit mehr als einer Datei zu überprüfen. Wenn Ihr Sitemap-Index fünf Unter-Sitemaps auflistet und eine 404 zurückgibt, melden wir die fehlerhafte Referenz und überspringen diese Datei. Die anderen vier werden immer noch überprüft. Wenn Sie eine flache Sitemap mit 10.000 URLs haben, wählen Sie zuerst Sample 50, um eine Stichprobenprobe durchzuführen, bevor Sie den vollständigen Crawl durchführen.

Warum Statuscodes wichtiger sind als XML-Gültigkeit

Eine Sitemap kann perfekt gültiges XML sein und dennoch Ihrem SEO schaden. Wenn 30 URLs 404 zurückgeben, verschwendet Google Crawl-Budget beim Abruf von Seiten, die nicht existieren. Wenn 50 URLs 301-Weiterleitungen sind, muss Google die Weiterleitung folgen, was die Anforderungsanzahl verdoppelt und das Indexieren verlangsamt. Wenn URLs 500-Fehler zurückgeben, könnte Google sie völlig aus dem Index fallen lassen.

Drei praktische Konsequenzen.

Crawl-Budget. Google ordnet jeder Website ein tägliches Crawl-Budget basierend auf Servergeschwindigkeit, Website-Autorität und Crawl-Anforderung zu. Jede 404 oder Weiterleitung in Ihrer Sitemap subtrahiert von diesem Budget, ohne neuen Inhalt zu indexieren. Das Bereinigen der Sitemap vor dem Einreichen bei Search Console macht jeden Crawl zählen.

Index-Abdeckung. URLs mit 4xx- oder 5xx-Statuscodes können nach wiederholten Fehlern aus dem Index ausgeschlossen werden. Wenn diese Seiten wichtig sind – Produktseiten, Blog-Posts mit Backlinks, Landing Pages für bezahlte Kampagnen – verlieren Sie Traffic. Eine Sitemap-Überprüfung erkennt dies, bevor sich der Schaden verschärft.

Lastmod-Genauigkeit. Das <lastmod>-Tag teilt Google mit, wann eine Seite zuletzt aktualisiert wurde. Wenn jede Seite das gleiche lastmod von vor drei Jahren hat, lernt Google, dass Ihre Sitemap veraltet ist, und kann weniger häufig crawlen. Wenn lastmod immer „gestern" ist, selbst wenn sich der Inhalt nicht geändert hat, lernt Google, es zu ignorieren. Unser Checker meldet das durchschnittliche lastmod-Alter und kennzeichnet verdächtige Muster.

Doppelte URLs und kanonische Konflikte

Eine doppelte URL in einer Sitemap bedeutet normalerweise, dass der gleiche loc zweimal angezeigt wird, oft mit einem Unterschied bei der nachfolgenden Schrägstrich oder einem Protokoll-Mismatch. /page und /page/ sind für einen Parser unterschiedliche URLs, selbst wenn Ihr Server sie als identisch behandelt. http://example.com/page und https://example.com/page sind unterschiedlich. Unser Checker normalisiert diese Muster und kennzeichnet sie als wahrscheinliche Duplikate.

Wenn Ihre Sitemap /page auflistet, diese URL aber zu /page/ umleitet, verschwendet die Weiterleitung eine Anforderung. Es ist besser, das endgültige Ziel in der Sitemap aufzulisten und die Weiterleitung auf Serverebene zu beheben. Wir zeigen die Umleitungskette und empfehlen, die 200-Status-Version aufzulisten.

Kanonische Konflikte sind ein verwandtes Problem. Wenn Ihre Sitemap /page-a enthält, aber diese Seite ein <link rel="canonical" href="/page-b">-Tag hat, sieht Google einen Konflikt. Die Sitemap sagt „indexiere page-a", aber die Seite sagt „ich bin ein Duplikat von page-b." Google kann das Sitemap-Eintrag ignorieren. Führen Sie einen canonical checker auf gekennzeichneten URLs durch, um zu bestätigen, dass der kanonische dem Sitemap-loc entspricht.

Verwaiste Seiten und Crawlbarkeit

Eine verwaiste Seite ist in Ihrer Sitemap, hat aber keine internen Links, die auf sie verweisen. Ein Bot kann sie über die Sitemap finden, aber ein Mensch kann sie nicht durch Navigation auf Ihrer Website erreichen. Dies ist nach Content-Migrationen üblich, wenn alte URLs in der Sitemap verbleiben, aber das Navigationsmenü aktualisiert wurde.

Verwaiste Seiten sind nicht immer schlecht. Eine Landing Page für eine bezahlte Anzeigenkampagne könnte absichtlich verwaist sein, um den Zugriff zu kontrollieren. Aber verwaiste Blog-Posts oder Produktseiten signalisieren ein Site-Struktur-Problem. Wenn die Seite zugänglich sein sollte, fügen Sie interne Links hinzu. Wenn sie nicht existieren sollte, entfernen Sie sie aus der Sitemap und 301er sie zu einer Live-Seite.

Unser Checker erkennt wahrscheinliche Verwaiste, indem er Sitemap-URLs mit Ihrem internen Link-Diagramm vergleicht. Wenn eine URL in der Sitemap angezeigt wird, aber null eingehende Links von Seiten hat, die wir gecrawlt haben, kennzeichnen wir sie. Diese Heuristik erkennt die meisten Verwaisten, ohne dass ein vollständiger Site-Crawl erforderlich ist.

Häufige Fehler

  • Einreichen eines Sitemap-Index bei einem Tool, das flache Sitemaps erwartet. Die meisten Validatoren scheitern bei Indizes oder testen nur die Index-Datei selbst. Unserer folgt jeder Referenz, sodass Sie Ergebnisse für den gesamten Baum erhalten.
  • Auflistung von nicht-kanonischen URLs. Jede URL in Ihrer Sitemap sollte die kanonische Version sein. Listieren Sie nicht die www-Version auf, wenn die Kanonische non-www ist. Listieren Sie nicht http auf, wenn die Kanonische https ist. Verwenden Sie zuerst Ihren kanonischen Checker, wenn Sie sich unsicher sind.
  • Einbeziehung von URLs, die durch robots.txt blockiert sind. Wenn eine URL in Ihrer Sitemap ist, aber in robots.txt disallowed, kann Google sie nicht crawlen. Dies erzeugt eine Search Console Warnung. Prüfen Sie robots.txt mit unserem robots.txt checker, bevor Sie eine neue Sitemap bereitstellen.
  • Festlegen von lastmod auf das Datum der Sitemap-Generierung, nicht das Datum der Inhaltänderung. Wenn Ihr CMS die Sitemap täglich regeneriert und jede URL mit heute's Datum stempelt, stoppt Google, lastmod zu vertrauen. Füllen Sie lastmod aus dem tatsächlichen updated-at-Zeitstempel des Posts.
  • Vergessen, nach einer Migration erneut zu prüfen. Alte URLs verbleiben oft in einer Sitemap nach dem Wechsel zu einer neuen Plattform. Wenn die Hälfte Ihrer Sitemap 404 zurückgibt, zeigt Search Console den Rückgang der Abdeckung. Prüfen Sie die Sitemap unmittelbar nach der Migration.
  • Nicht einzeln Kinder-Sitemaps überprüfen. Wenn Ihr Sitemap-Index einen fehlerhaften Kind hat, könnten Sie es erst bemerken, wenn Crawl-Fehler in die Höhe schnellen. Testen Sie jede Kind-Sitemap-URL isoliert, um zu bestätigen, dass sie 200 zurückgibt und korrekt geparst wird.

Erweiterte Tipps

  • Führen Sie zuerst eine Beispielüberprüfung auf großen Sitemaps durch. Wenn die Beispielüberprüfung ein Muster offenbart – jede URL ist 301, oder lastmod fehlt – beheben Sie es, bevor Sie alle 10.000 URLs crawlen. Die Beispielüberprüfung gibt Ihnen Signal in 10 Sekunden statt 5 Minuten.
  • Vergleichen Sie lastmod-Daten mit Ihren CMS-Veröffentlichungsdaten. Wenn ein Post letzte Woche aktualisiert wurde, aber lastmod vor sechs Monaten ist, ist Ihr Sitemap-Generierungsskript kaputt.
  • Prüfen Sie Ihre Sitemap monatlich, nicht nur einmal. Inhalt wird veraltet, Weiterleitungen werden hinzugefügt, URLs werden nicht veröffentlicht. Eine monatliche Überprüfung erkennt Verfall, bevor Google es tut.
  • Wenn Sie einen Anstieg von 404ern sehen, exportieren Sie das CSV und kreuzen Sie es mit Ihren Server-Logs ab. Manchmal ist eine URL in der Sitemap 404, erhält aber immer noch Traffic von Backlinks, was bedeutet, dass sie stattdessen 301er werden sollte.
  • Testen Sie die gleiche Sitemap von zwei verschiedenen User-Agents (Desktop Chrome und Googlebot). Wenn sich die Statuscodes unterscheiden, cloaked Ihr Server oder gibt unterschiedliche Antworten auf Bots zurück, was gegen Googles Richtlinien verstößt.
  • Wenn Duplikate gefunden werden, prüfen Sie auf kanonische Tags. Eine doppelte URL mit einem kanonischen, das auf anderem verweist, kann in der Sitemap verbleiben, wenn es sich um eine regionale oder Sprachvariante handelt. Wenn es keine Variante ist, entfernen Sie sie.

Nach der Behebung von Sitemap-Problemen validieren Sie, dass Ihre robots.txt-Datei die Sitemap-Position korrekt mit einer Sitemap:-Zeile deklariert. Verwenden Sie den robots.txt checker, um dies zu bestätigen. Simulieren Sie dann, wie Googlebot eine Ihrer Seiten mit dem Google crawler simulator sieht, um zu bestätigen, dass die URL geladen wird, JavaScript ausgeführt wird und der Inhalt sichtbar ist. Wenn Sie Metadaten neben Sitemaps prüfen, rendert der website metadata checker Ihren Title, Meta und OG-Tags so, wie sie in SERPs angezeigt werden.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Häufig gestellte Fragen

Was ist eine Sitemap?

Eine Sitemap ist eine XML-Datei, die jede URL auflistet, die Suchmaschinen crawlen und indexieren sollen. Sie befindet sich unter yoursite.com/sitemap.xml und fungiert als Verzeichnis für Crawler, besonders nützlich für große Websites, neue Websites mit wenigen Backlinks oder Websites mit tiefer Navigation, wo Seiten fünf oder mehr Klicks von der Startseite entfernt sind. Sitemaps garantieren Indexierung nicht. Google entscheidet immer noch, ob eine Seite basierend auf Qualität und Duplikation indexiert werden soll. Ohne Sitemap verlässt sich Google auf interne Links und externe Backlinks, um Seiten zu finden, was Wochen oder sogar Monate für neuen Inhalt dauern kann. Mit einer Sitemap teilen Sie Google mit, dass die Seite existiert und wann sie zuletzt aktualisiert wurde, was die Entdeckung beschleunigt und hilft, frische Inhalte zu priorisieren. Unser Sitemap-Checker ruft Ihre sitemap.xml ab, parst die Struktur, validiert XML-Syntax, prüft HTTP-Statuscodes für jede aufgelistete URL, kennzeichnet Duplikate und erkennt verwaiste Seiten (Seiten in Ihrer Sitemap, aber nicht erreichbar über interne Links). Verwenden Sie ihn nach dem Start einer neuen Website, nach einer Migration oder vierteljährlich, um Regressionen zu erkennen.

Wie überprüfe ich, ob meine Website eine Sitemap hat?

Versuchen Sie drei Orte. Fügen Sie zunächst /sitemap.xml an Ihre Domain an (yourdomain.com/sitemap.xml) und schauen Sie, ob sie geladen wird. Die meisten CMS generieren automatisch eine Sitemap unter diesem Pfad. Wenn Sie XML mit einer Liste von URLs sehen, das ist Ihre Sitemap. Überprüfen Sie zweitens robots.txt unter yourdomain.com/robots.txt auf eine Zeile, die mit Sitemap: beginnt und von einer URL gefolgt ist. Viele Websites deklarieren ihre Sitemap-Position hier. Drittens melden Sie sich bei Google Search Console an, gehen Sie zu Sitemaps unter Index und sehen Sie, welche Sitemap-URLs Sie eingereicht haben. Dies ist die autoritative Liste, die Google verwendet, um das Crawlen zu priorisieren. Wenn Sie eine Sitemap-URL finden, fügen Sie sie in unser Sitemap URL-Feld ein, um die Struktur zu validieren, zu bestätigen, dass alle URLs 200-Statuscodes zurückgeben, und Duplikate oder Verwaiste zu erkennen. Wenn keines dieser Verfahren eine Sitemap findet, haben Sie wahrscheinlich keine. Das ist in Ordnung für Websites unter 50 Seiten, aber ein Problem für größere. Generieren Sie eine mit Ihrem CMS-Plugin (Yoast, Rank Math, next-sitemap), dann reichen Sie sie bei Search Console ein, um das Indexieren zu beschleunigen.

Was sind die drei Arten von Sitemaps?

Die drei Arten sind XML-Sitemaps (für Suchmaschinen), HTML-Sitemaps (für Benutzer) und visuelle Sitemaps (für Designer). XML-Sitemaps sind maschinenlesbare Dateien in XML-Format, die URLs, letzte Änderungsdaten, Aktualisierungshäufigkeit und Priorität auflistet. Suchmaschinen verwenden sie, um Seiten zu entdecken und zu priorisieren. Sie befinden sich unter /sitemap.xml und sind nicht zum menschlichen Durchsuchen gedacht. HTML-Sitemaps sind menschenlesbare Seiten mit Links zu jedem Hauptabschnitt Ihrer Website, hierarchisch organisiert. Sie helfen Benutzern, große Websites zu navigieren, und bieten interne Links. Sie befinden sich unter URLs wie /sitemap und sind oft im Footer verlinkt. Visuelle Sitemaps sind Diagramme (in Figma, Miro, Sketch), die Seitenhierarchie, Benutzerflüsse und Navigation vor der Erstellung einer Website abbilden. Sie sind Planungsartefakte, keine Live-Seiten. Die meisten Websites benötigen eine XML-Sitemap (erforderlich für SEO) und profitieren von einer HTML-Sitemap, wenn über 100 Seiten. Visuelle Sitemaps sind für die Designphase. Unser Checker validiert nur XML-Sitemaps. Die meisten CMS generieren sie automatisch. Für statische Websites verwenden Sie next-sitemap oder astro-sitemap.

Wie validiere ich eine Sitemap?

Das Validieren einer Sitemap bedeutet, XML-Struktur, URL-Zugänglichkeit, Metadaten-Genauigkeit und Protokoll-Grenzen zu prüfen. Bestätigen Sie zunächst, dass das XML wohlgeformt ist mit richtiger Namespace-Deklaration (xmlns-Attribut, das auf sitemaps.org verweist). Malformed XML führt dazu, dass Parser die gesamte Datei ablehnen. Überprüfen Sie zweitens, dass jede URL einen 200-Statuscode zurückgibt, nicht 301, 404 oder 5xx-Fehler. Suchmaschinen können umleitende oder fehlerhafte URLs immer noch crawlen, priorisieren sie aber. Überprüfen Sie drittens, dass URLs absolute Pfade verwenden (https://example.com/page, nicht /page) und Ihre kanonische Domain stimmen (www oder non-www, nicht gemischt). Bestätigen Sie viertens, dass die Dateigröße unter 50 MB unkomprimiert mit weniger als 50.000 URLs liegt. Wenn Sie eines der beiden überschreiten, teilen Sie in mehrere Dateien auf und erstellen Sie eine Sitemap-Index-Datei. Überprüfen Sie fünftens, dass lastmod-Daten W3C-Format verwenden (YYYY-MM-DD oder ISO 8601). Unser Tool automatisiert alle fünf: Fügen Sie Ihre Sitemap URL ein, wählen Sie crawl depth (index only, all referenced sitemaps, or sample), und wir geben Ihnen Statuscodes, Duplikate, fehlende lastmod-Warnungen und einen CSV-Export von Problemen zurück.

Gibt es einen Sitemap-Generator von Google?

Google bot früher einen Sitemap-Generator (Google Sitemap Generator) für Apache und IIS an, wurde aber vor Jahren eingestellt. Sie brauchen es nicht mehr. Nahezu jedes moderne CMS und jedes statische Framework generiert Sitemaps automatisch. WordPress (via Yoast SEO, Rank Math oder Core Sitemap seit 5.5), Shopify (built-in), Webflow (built-in), Squarespace (built-in), Wix (built-in), Next.js (via next-sitemap), Astro (via astro-sitemap), Gatsby (via gatsby-plugin-sitemap) und Hugo (built-in) erstellen und aktualisieren XML-Sitemaps ohne manuelle Arbeit. Für benutzerdefinierte Websites verwenden Sie Open-Source-Bibliotheken wie sitemap.js (Node.js), django-sitemap (Python) oder ein Build-Skript. Sobald Sie eine Sitemap haben, reichen Sie sie bei Google Search Console unter Sitemaps ein. Google wird sie regelmäßig crawlen. Sie können Google manuell nach dem Hinzufügen von URLs pingen, indem Sie eine GET-Anfrage an google.com/ping?sitemap=yoursitemapurl senden, obwohl die meisten CMS dies automatisch tun. Verwenden Sie unseren sitemap checker, um die Sitemap zu validieren, bevor Sie sie bei Search Console einreichen.

Wie oft sollte ich meine Sitemap aktualisieren?

Aktualisieren Sie Ihre Sitemap jedes Mal, wenn Sie eine Seite veröffentlichen, nicht veröffentlichen oder erheblich bearbeiten. Die meisten CMS und statische Generatoren handhaben dies automatisch. WordPress-Plugins regenerieren die Sitemap bei jeder Post-Veröffentlichung, Shopify aktualisiert sie, wenn sich Produkte ändern, und statische Frameworks erstellen die Sitemap bei jeder Bereitstellung neu. Wenn Sie es manuell verwalten (selten auf benutzerdefinierten Websites), regenerieren Sie es wöchentlich oder nach Content-Batches. Das lastmod-Feld teilt Suchmaschinen mit, wann eine Seite geändert wurde, was ihnen hilft, frische Inhalte vor veralteten zu priorisieren. Wenn Sie lastmod nie aktualisieren oder das gleiche Datum für jede URL festlegen, ignorieren Suchmaschinen es und fallen auf Link-Entdeckung und Crawl-Budget zurück. Für tägliche Publisher (Nachrichten, Blogs, E-Commerce mit Bestandsänderungen) sind dynamische Sitemaps, die bei Veröffentlichung regenerieren, erforderlich. Für monatliche oder vierteljährliche Publisher ist eine statische Sitemap, die bei Bereitstellung regeneriert wird, in Ordnung. Lassen Sie nicht zu, dass Ihre Sitemap URLs auflistet, die 404, weiterleiten oder durch robots.txt blockiert sind. Das verschwendet Crawl-Budget und signalisiert schlechte Site-Qualität. Verwenden Sie unseren Checker nach großen Änderungen (Migration, URL-Umstrukturierung, Masseninhalt-Änderungen).

Was ist der Unterschied zwischen Sitemap und robots.txt?

Robots.txt teilt Crawlern mit, auf welche Teile Ihrer Website sie zugreifen dürfen oder nicht. Eine Sitemap teilt Crawlern mit, welche Seiten Sie crawlen möchten, um sie zu priorisieren. Sie dienen verschiedenen Zwecken und funktionieren zusammen. Robots.txt befindet sich unter yourdomain.com/robots.txt, verwendet Klartextsyntax mit User-agent, Allow und Disallow Direktiven und sperrt oder erlaubt den Zugriff auf Pfade, Dateien oder Verzeichnisse. Es deklariert, wo Ihre Sitemap mit einer Sitemap:-Direktive lebt. Robots.txt wird zuerst gecrawlt. Wenn Sie versehentlich Ihre gesamte Website disallown, stoppt das Crawlen sofort und sieht Ihre Sitemap nie. Eine Sitemap befindet sich unter yourdomain.com/sitemap.xml, verwendet XML-Syntax und listet URLs auf, die Sie crawlen möchten, mit Metadaten wie lastmod und Priorität. Es kontrolliert den Zugriff nicht. Es schlägt vor, was zu crawlen ist. Crawler können Ihre Sitemap ignorieren, wenn sie Seiten über Links finden, können aber robots.txt nicht umgehen. Verwenden Sie robots.txt, um Admin-Panels, Staging-Umgebungen und unerwünschte Crawler zu blockieren. Verwenden Sie eine Sitemap, um jede indexierbare Seite aufzulisten.

Kann eine Sitemap mein SEO verbessern?

Eine Sitemap verbessert Rankings nicht direkt, aber sie beseitigt Erkennungsreibung, was SEO indirekt hilft, indem sie sicherstellt, dass neue und aktualisierte Seiten schneller gecrawlt werden. Ohne Sitemap verlässt sich Google auf interne Links und externe Backlinks, um Seiten zu finden, was für neuen Inhalt Wochen dauern kann, besonders auf großen Websites oder Websites mit schwacher interner Verknüpfung. Mit einer Sitemap teilen Sie Google mit, dass die Seite existiert und wann sie zuletzt aktualisiert wurde, was das Indexieren beschleunigt. Dies ist wichtig für neue Websites mit wenigen Backlinks, Websites mit tiefer Seitenhierarchie (Seiten, die fünf Klicks von der Startseite entfernt vergraben sind), Websites mit verwaisten Seiten und Websites, die häufig veröffentlichen (Blogs, Nachrichten, E-Commerce). Eine Sitemap hilft mit Crawl-Budget-Effizienz. Anstatt Seiten über Link-Crawlen zu entdecken, liest Google Ihre Sitemap und weiß, was zu priorisieren ist. Eine Sitemap kann Google jedoch nicht zwingen, Seiten mit niedriger Qualität, Duplikate oder dünne Seiten zu indexieren. Wenn eine Seite in Ihrer Sitemap ist, aber immer noch nicht indexiert, ist das Problem normalerweise Content-Qualität, Kanonisierung oder Robots-Meta-Tags.

Was sollte nicht in einer Sitemap sein?

Eine Sitemap sollte nur URLs auflistet, die Sie indexiert haben möchten, also ausschließen Sie alles, das durch robots.txt blockiert ist, mit noindex gekennzeichnet ist, zu einer anderen URL weiterleitet, 404 oder 5xx-Fehler zurückgibt oder auf eine andere URL kanonisiert wird. Das Einbeziehen dieser verschwendet Crawl-Budget und signalisiert schlechte Site-Wartung. Beziehen Sie keine Admin-Seiten, Login-Seiten, Checkout-Seiten oder Benutzerkonten-Dashboards ein (normalerweise durch robots.txt oder noindex blockiert). Beziehen Sie keine Parameter-URLs ein (wie ?sort=price oder ?page=2), wenn Sie kanonische Tags verwenden, um sie zu konsolidieren. Beziehen Sie keine Staging- oder Test-Umgebungen ein. Beziehen Sie keine URLs ein, die umleiten (301 oder 302). Listen Sie stattdessen das endgültige Ziel auf. Beziehen Sie keine URLs mit noindex Meta-Tags oder X-Robots-Tag Headern ein. Beziehen Sie keine paginierten URLs ein, wenn jede Seite eindeutigen Inhalt hat, der indexiert werden soll. Die meisten E-Commerce-Websites sollten nur Seite 1 einbeziehen, mit rel=next/prev oder kanonischen Tags, die den Rest handhaben. Beziehen Sie keine doppelten Inhalts-URLs ein. Verwenden Sie kanonische Tags, um Duplikate zu konsolidieren, dann listen Sie nur die kanonische Version auf.

Wie behebe ich Sitemap-Fehler?

Sitemap-Fehler fallen in drei Kategorien: strukturelle (malformed XML, falscher Namespace, Datei zu groß), URL-Ebene (404s, Weiterleitungen, noindex-Seiten) und Metadaten-Probleme (fehlender lastmod, falsche Datumsformate). Beheben Sie zuerst strukturelle Fehler. Sie verhindern, dass Crawler die Datei parsen. Öffnen Sie Ihre Sitemap in einem Browser oder XML-Validator, bestätigen Sie, dass sie mit der korrekten XML-Deklaration und dem Namespace beginnt (xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"), und überprüfen Sie, dass jedes öffnende Tag ein entsprechendes schließendes Tag hat. Wenn Ihre Sitemap 50 MB oder 50.000 URLs überschreitet, teilen Sie sie in mehrere Dateien auf und erstellen Sie eine Sitemap-Index-Datei. Beheben Sie URL-Ebene-Fehler, indem Sie fehlerhafte Einträge entfernen oder ersetzen. Löschen Sie jede URL, die 404 zurückgibt, ersetzen Sie umgeleitete URLs durch ihr endgültiges Ziel, entfernen Sie URLs mit noindex-Tags und bestätigen Sie, dass jede URL Ihre kanonische Domain stimmt (www oder non-www, nicht gemischt). Beheben Sie Metadaten-Probleme, indem Sie sicherstellen, dass lastmod-Daten das ISO 8601-Format verwenden (YYYY-MM-DD oder YYYY-MM-DDTHH:MM:SS+00:00). Entfernen Sie lastmod vollständig, wenn Ihr CMS es nicht genau halten kann. Nach der Behebung validieren Sie erneut mit unserem Tool und reichen Sie erneut bei Google Search Console ein.

Verwandte kostenlose Tools

Alle Tools →