Skip to content
Verificación en vivo · obtiene tu URL del lado del servidor

Sitemap Checker

Rastrea hasta 200 URLs — códigos de estado, duplicados, huérfanos, antigüedad de lastmod.

Un archivo sitemap.xml le dice a los motores de búsqueda qué páginas existen y con qué frecuencia cambian. La mayoría de validadores analizan el XML y se detienen. Este Sitemap Checkers valida la estructura, obtiene los códigos de estado HTTP para cada URL listada, detecta duplicados, señala huérfanos que están en tu sitemap pero no vinculados desde tu página de inicio, y verifica si los timestamps de lastmod son lo suficientemente recientes como para justificar la prioridad de rastreo.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Qué hace realmente un verificador de sitemaps

Un verificador de sitemaps obtiene tu archivo sitemap.xml, analiza cada entrada <url>, extrae los tags <loc>, <lastmod>, <changefreq> y <priority>, luego realiza una solicitud HTTP HEAD a cada URL para confirmar que devuelve 200. Señala redirecciones, 404s y errores del servidor, verifica URLs duplicadas y compara tu estructura de sitemap contra la especificación XML sitemap.

Si tu sitemap es un índice de sitemap (un archivo que lista otros archivos sitemap en lugar de URLs individuales), seguimos cada referencia, obtenemos cada sitemap hijo y agregamos los resultados. Una única verificación cubre tu árbol de sitemap completo hasta 200 URLs en modo completo o 50 URLs en modo muestra.

Tres categorías de problemas aparecen en cada auditoría de sitemap. URLs rotas que devuelven 404 o 500. URLs duplicadas listadas más de una vez, que desperdician presupuesto de rastreo. Y URLs huérfanas que aparecen en el sitemap pero tienen cero enlaces internos, lo que significa que un usuario no puede alcanzarlas haciendo clic en tu sitio. Nuestro verificador señala las tres en un solo paso.

Cómo usar este verificador de sitemaps

  1. Pega tu URL de sitemap en Sitemap URL. Generalmente https://www.yourdomain.com/sitemap.xml o https://www.yourdomain.com/sitemap_index.xml.
  2. Elige una Crawl depth del menú desplegable. Index only valida la estructura XML sin obtener URLs. All referenced sitemaps sigue cada sitemap listado en un índice. Sample 50 URLs verifica códigos de estado para 50 URLs aleatorias. Full - up to 200 URLs verifica cada URL que encontramos, hasta el límite.
  3. Presiona Check sitemap. Obtendrás una tabla de resumen con total de URLs, desglose de códigos de estado, recuento de duplicados, edad promedio de lastmod y cualquier error de esquema XML.
  4. Expande Problem URLs para ver una lista fila por fila de 404s, 301s, duplicados y huérfanos. Cada fila muestra la URL, estado, fecha de lastmod y corrección recomendada.
  5. Haz clic en Download CSV para exportar el informe completo. Úsalo para corregir problemas por lotes en tu CMS o pásalo a un desarrollador.

Intenta verificar un sitemap con más de un archivo. Si tu índice de sitemap lista cinco sub-sitemaps y uno devuelve 404, reportamos la referencia rota y omitimos ese archivo. Los otros cuatro aún se verifican. Si tienes un sitemap plano con 10,000 URLs, elige Sample 50 primero para hacer una verificación rápida antes de ejecutar el rastreo completo.

Por qué los códigos de estado importan más que la validez XML

Un sitemap puede ser un XML perfectamente válido y aún así dañar tu SEO. Si 30 URLs devuelven 404, Google desperdicia presupuesto de rastreo obteniendo páginas que no existen. Si 50 URLs son redirecciones 301, Google tiene que seguir la redirección, lo que duplica el recuento de solicitudes y ralentiza la indexación. Si las URLs devuelven errores 500, Google podría eliminarlas del índice por completo.

Tres consecuencias prácticas.

Presupuesto de rastreo. Google asigna un presupuesto de rastreo diario a cada sitio basado en la velocidad del servidor, la autoridad del sitio y la demanda de rastreo. Cada 404 o redirección en tu sitemap resta de ese presupuesto sin indexar contenido nuevo. Limpiar el sitemap antes de enviarlo a Search Console hace que cada rastreo cuente.

Cobertura de índice. Las URLs con códigos de estado 4xx o 5xx pueden ser excluidas del índice después de fallos repetidos. Si esas páginas son importantes (páginas de productos, publicaciones de blog con backlinks, páginas de aterrizaje para campañas pagadas), pierdes tráfico. Una verificación de sitemap detecta esto antes de que el daño se agrave.

Precisión de lastmod. El tag <lastmod> le dice a Google cuándo se actualizó una página por última vez. Si cada página tiene el mismo lastmod de hace tres años, Google aprende que tu sitemap es antiguo y puede rastrear con menos frecuencia. Si lastmod siempre es "ayer" incluso cuando el contenido no ha cambiado, Google aprende a ignorarlo. Nuestro verificador reporta la edad promedio de lastmod y señala patrones sospechosos.

URLs duplicadas y desajustes canónicos

Una URL duplicada en un sitemap generalmente significa que la misma loc aparece dos veces, a menudo con una diferencia de barra diagonal al final o un desajuste de protocolo. /page y /page/ son URLs diferentes para un analizador, incluso si tu servidor las trata como idénticas. http://example.com/page y https://example.com/page son diferentes. Nuestro verificador normaliza estos patrones y los señala como duplicados probables.

Si tu sitemap lista /page pero esa URL se redirige a /page/, la redirección desperdicia una solicitud. Es mejor listar el destino final en el sitemap y arreglar la redirección a nivel de servidor. Mostramos la cadena de redirección y recomendamos listar la versión con estado 200.

Los desajustes canónicos son un problema relacionado. Si tu sitemap incluye /page-a pero esa página tiene un tag <link rel="canonical" href="/page-b">, Google ve un conflicto. El sitemap dice "indexa page-a" pero la página dice "soy un duplicado de page-b". Google puede optar por ignorar la entrada del sitemap. Ejecuta un verificador canónico en las URLs señaladas para confirmar que el canónico coincide con la loc del sitemap.

Páginas huérfanas y rastreabilidad

Una página huérfana está en tu sitemap pero no tiene enlaces internos que apunten a ella. Un bot puede encontrarla a través del sitemap, pero un humano no puede alcanzarla navegando tu sitio. Esto es común después de migraciones de contenido, cuando las URLs antiguas permanecen en el sitemap pero el menú de navegación se actualizó.

Los huérfanos no siempre son malos. Una página de aterrizaje para una campaña de anuncio pagado podría ser huérfana a propósito para controlar el acceso. Pero las publicaciones de blog o páginas de productos huérfanas señalan un problema de estructura del sitio. Si la página debería ser accesible, añade enlaces internos. Si no debería existir, elimínala del sitemap y 301 hacia una página activa.

Nuestro verificador detecta huérfanos probables comparando URLs de sitemap a tu gráfico de enlaces internos. Si una URL aparece en el sitemap pero tiene cero enlaces entrantes desde páginas que rastreamos, la señalamos. Esta heurística detecta la mayoría de huérfanos sin requerir un rastreo de sitio completo.

Errores comunes

  • Enviar un índice de sitemap a una herramienta que espera sitemaps planos. La mayoría de validadores fallan en índices o prueban solo el archivo de índice en sí. El nuestro sigue cada referencia, así que obtienes resultados para el árbol completo.
  • Listar URLs no canónicas. Cada URL en tu sitemap debería ser la versión canónica. No listes la versión www si el canónico es no-www. No listes http si el canónico es https. Usa tu verificador canónico primero si no estás seguro.
  • Incluir URLs bloqueadas por robots.txt. Si una URL está en tu sitemap pero está desautorizada en robots.txt, Google no puede rastrearla. Esto crea una advertencia en Search Console. Verifica robots.txt con nuestro verificador de robots.txt antes de desplegar un nuevo sitemap.
  • Establecer lastmod a la fecha en que se generó el sitemap, no a la fecha en que cambió el contenido. Si tu CMS regenera el sitemap diariamente y sella cada URL con la fecha de hoy, Google deja de confiar en lastmod. Completa lastmod a partir de la marca de tiempo actual real del post.
  • Olvidar re-verificar después de una migración. Las URLs antiguas a menudo permanecen en un sitemap después de pasar a una nueva plataforma. Si la mitad de tu sitemap devuelve 404, Search Console mostrará la caída en cobertura. Audita el sitemap inmediatamente post-migración.
  • No verificar los sitemaps hijo individualmente. Si tu índice de sitemap tiene un hijo roto, podrías no notarlo hasta que los errores de rastreo aumenten. Prueba cada URL de sitemap hijo aisladamente para confirmar que devuelve 200 y se analiza correctamente.

Consejos avanzados

  • Ejecuta una verificación de muestra primero en sitemaps grandes. Si la muestra revela un patrón (cada URL es 301, o lastmod falta), arréglalo antes de rastrear los 10,000 URLs. La muestra te da señal en 10 segundos en lugar de 5 minutos.
  • Compara fechas de lastmod con fechas de publicación de tu CMS. Si una publicación se actualizó la semana pasada pero lastmod es de hace seis meses, tu script de generación de sitemap está roto.
  • Verifica tu sitemap mensualmente, no una sola vez. El contenido se vuelve anticuado, se añaden redirecciones, las URLs se despubican. Una verificación mensual detecta degradación antes de que Google lo haga.
  • Si ves un pico en 404s, exporta el CSV y compáralo con tus registros de servidor. A veces una URL es 404 en el sitemap pero aún recibe tráfico de backlinks, lo que significa que debería ser 301 en lugar de ser removida.
  • Prueba el mismo sitemap desde dos agentes de usuario diferentes (Chrome de escritorio y Googlebot). Si los códigos de estado difieren, tu servidor está enmascarando o devolviendo respuestas diferentes a los bots, lo que viola las directrices de Google.
  • Si se encuentran duplicados, verifica los tags canónicos. Una URL duplicada con un canónico que apunta a otro lugar puede permanecer en el sitemap si es una variante regional o de idioma. Si no es una variante, elimínala.

Después de arreglar problemas de sitemap, valida que tu archivo robots.txt declare correctamente la ubicación del sitemap con una línea Sitemap:. Usa el verificador de robots.txt para confirmar. Luego simula cómo Googlebot ve una de tus páginas con el simulador de rastreador de Google para confirmar que la URL carga, JavaScript se ejecuta y el contenido es visible. Si estás verificando metadatos junto con sitemaps, el verificador de metadatos del sitio web renderiza tu título, meta y tags OG tal como aparecen en los SERPs.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Preguntas frecuentes

¿Qué es un sitemap?

Un sitemap es un archivo XML que lista cada URL que deseas que los motores de búsqueda rastreen e indexen. Vive en yoursite.com/sitemap.xml y actúa como un directorio para rastreadores, especialmente útil para sitios grandes, sitios nuevos con pocos backlinks, o sitios con navegación profunda donde las páginas están a cinco o más clics de la página de inicio. Los sitemaps no garantizan indexación. Google aún decide si una página vale la pena indexar basándose en calidad y duplicación. Sin un sitemap, Google se basa en enlaces internos y backlinks externos para encontrar páginas, lo que puede tomar semanas o incluso meses para contenido nuevo. Con un sitemap, le dices a Google que la página existe y cuándo se actualizó por última vez, lo que acelera el descubrimiento y ayuda a priorizar contenido fresco. Nuestro verificador de sitemap obtiene tu sitemap.xml, analiza la estructura, valida la sintaxis XML, verifica códigos de estado HTTP para cada URL listada, señala duplicados y detecta páginas huérfanas (páginas en tu sitemap pero inaccesibles a través de enlaces internos). Úsalo después de lanzar un sitio nuevo, después de una migración, o trimestralmente para detectar regresiones.

¿Cómo verifico si mi sitio web tiene un sitemap?

Intenta en tres lugares. Primero, añade /sitemap.xml a tu dominio (yourdomain.com/sitemap.xml) y ve si carga. La mayoría de CMS generan un sitemap en esta ruta automáticamente. Si ves XML con una lista de URLs, ese es tu sitemap. Segundo, verifica robots.txt en yourdomain.com/robots.txt buscando una línea que comience con Sitemap: seguida de una URL. Muchos sitios declaran su ubicación de sitemap aquí. Tercero, inicia sesión en Google Search Console, ve a Sitemaps en Índice, y ve qué URLs de sitemap enviaste. Esta es la lista autorizada que Google usa para priorizar el rastreo. Si encuentras una URL de sitemap, pégala en nuestro campo Sitemap URL para validar la estructura, confirmar que todas las URLs devuelven códigos de estado 200 y detectar duplicados u huérfanos. Si ninguno de estos métodos encuentra un sitemap, probablemente no tengas uno. Está bien para sitios de menos de 50 páginas pero es un problema para sitios más grandes. Genera uno usando tu plugin de CMS (Yoast, Rank Math, next-sitemap), luego envíalo a Search Console para acelerar la indexación.

¿Cuáles son los tres tipos de sitemaps?

Los tres tipos son sitemaps XML (para motores de búsqueda), sitemaps HTML (para usuarios) y sitemaps visuales (para diseñadores). Los sitemaps XML son archivos legibles por máquina en formato XML que listan URLs, fechas de última modificación, frecuencia de actualización y prioridad. Los motores de búsqueda los usan para descubrir y priorizar páginas. Viven en /sitemap.xml y no están destinados a navegación humana. Los sitemaps HTML son páginas legibles por humanos con enlaces a cada sección principal de tu sitio, organizadas jerárquicamente. Ayudan a los usuarios a navegar sitios grandes y proporcionan enlaces internos. Viven en URLs como /sitemap y a menudo se vinculan desde el pie de página. Los sitemaps visuales son diagramas (en Figma, Miro, Sketch) que mapean la jerarquía de páginas, flujos de usuario y navegación antes de que se construya un sitio. Son artefactos de planificación, no páginas activas. La mayoría de sitios necesitan un sitemap XML (requerido para SEO) y se benefician de un sitemap HTML si tiene más de 100 páginas. Los sitemaps visuales son para la fase de diseño. Nuestro verificador valida solo sitemaps XML. La mayoría de CMS los generan automáticamente. Para sitios estáticos, usa next-sitemap o astro-sitemap.

¿Cómo valido un sitemap?

Validar un sitemap significa verificar estructura XML, accesibilidad de URL, precisión de metadatos y límites de protocolo. Primero, confirma que el XML esté bien formado con declaración XML correcta y atributo de espacio de nombres (xmlns que apunta a sitemaps.org). El XML malformado causa que los analizadores rechacen el archivo completo. Segundo, verifica que cada URL devuelva un código de estado 200, no un 301, 404 o error 5xx. Los motores de búsqueda aún pueden rastrear URLs redirigidas o rotas, pero las desproitorizan. Tercero, verifica que las URLs usen rutas absolutas (https://example.com/page, no /page) y coincidan con tu dominio canónico (www o no-www, no mixto). Cuarto, confirma que el tamaño del archivo sea inferior a 50 MB sin comprimir con menos de 50,000 URLs. Si excedes alguno, divide en múltiples sitemaps y usa un archivo de índice de sitemap. Quinto, valida que las fechas lastmod usen formato W3C (YYYY-MM-DD o ISO 8601). Nuestra herramienta automatiza los cinco: pega tu Sitemap URL, elige crawl depth (index only, all referenced sitemaps, o sample), y devolvemos códigos de estado, duplicados, advertencias de lastmod faltante y una exportación CSV de problemas.

¿Google tiene un generador de sitemap?

Google solía ofrecer un generador de sitemap (Google Sitemap Generator) para Apache e IIS, pero fue deprecado hace años. Ya no lo necesitas. Casi todos los CMS modernos y frameworks estáticos generan sitemaps automáticamente. WordPress (vía Yoast SEO, Rank Math o sitemap central desde 5.5), Shopify (integrado), Webflow (integrado), Squarespace (integrado), Wix (integrado), Next.js (vía next-sitemap), Astro (vía astro-sitemap), Gatsby (vía gatsby-plugin-sitemap) y Hugo (integrado) todos crean y actualizan sitemaps XML sin trabajo manual. Para sitios personalizados, usa librerías de código abierto como sitemap.js (Node.js), django-sitemap (Python) o un script de construcción. Una vez que tengas un sitemap, envíalo a Google Search Console en Sitemaps. Google lo rastreará periódicamente. Puedes hacer ping a Google manualmente después de añadir URLs enviando una solicitud GET a google.com/ping?sitemap=yoursitemapurl, aunque la mayoría de CMS hacen esto automáticamente. Usa nuestro verificador de sitemap para validar el sitemap antes de enviarlo a Search Console.

¿Con qué frecuencia debo actualizar mi sitemap?

Actualiza tu sitemap cada vez que publiques, despubliques o edites significativamente una página. La mayoría de CMS y generadores estáticos lo hacen automáticamente. Los plugins de WordPress regeneran el sitemap en cada publicación de post, Shopify lo actualiza cuando cambian los productos, y los frameworks estáticos reconstruyen el sitemap durante cada despliegue. Si lo gestionar manualmente (raro en sitios personalizados), regenera semanalmente o después de lotes de contenido. El campo lastmod les dice a los motores de búsqueda cuándo cambió una página, lo que les ayuda a priorizar contenido fresco sobre antiguo. Si nunca actualizas lastmod o estableces la misma fecha para cada URL, los motores de búsqueda lo ignoran y recurren a descubrimiento de enlaces y presupuesto de rastreo. Para editores diarios (noticias, blogs, e-commerce con cambios de inventario), los sitemaps dinámicos que regeneran en la publicación son esenciales. Para editores mensuales o trimestrales, un sitemap estático regenerado en el despliegue está bien. No dejes que tu sitemap liste URLs que 404, redirijan o estén bloqueadas por robots.txt. Eso desperdicia presupuesto de rastreo y señala mala calidad del sitio. Usa nuestro verificador después de cambios mayores (migración, reestructuración de URL, cambios de contenido en lotes).

¿Cuál es la diferencia entre un sitemap y robots.txt?

Robots.txt le dice a los rastreadores qué partes de tu sitio pueden o no acceder. Un sitemap le dice a los rastreadores qué páginas deseas que prioricen rastrear. Sirven propósitos diferentes y funcionan juntos. Robots.txt vive en yourdomain.com/robots.txt, usa sintaxis de texto plano con directivas User-agent, Allow y Disallow, y bloquea o permite acceso a rutas, archivos o directorios. Declara dónde vive tu sitemap a través de una directiva Sitemap:. Los robots.txt se rastrea primero. Si accidentalmente desautorizas todo tu sitio, los rastreadores se detienen inmediatamente y nunca ven tu sitemap. Un sitemap vive en yourdomain.com/sitemap.xml, usa sintaxis XML y lista URLs que deseas que se rastreen con metadatos como lastmod y prioridad. No controla el acceso. Sugiere qué rastrear. Los rastreadores pueden ignorar tu sitemap si encuentran páginas a través de enlaces, pero no pueden eludir robots.txt. Usa robots.txt para bloquear paneles de administración, ambientes de prueba y rastreadores no deseados. Usa un sitemap para listar cada página indexable.

¿Puede un sitemap mejorar mi SEO?

Un sitemap no mejora directamente los rankings, pero elimina fricción de descubrimiento, lo que indirectamente ayuda al SEO asegurando que las páginas nuevas y actualizadas se rastreen más rápido. Sin un sitemap, Google se basa en enlaces internos y backlinks externos para encontrar páginas, lo que puede tomar semanas para contenido nuevo, especialmente en sitios grandes o con enlaces internos débiles. Con un sitemap, le dices a Google que la página existe y cuándo se actualizó por última vez, lo que acelera la indexación. Esto es importante para sitios nuevos con pocos backlinks, sitios con jerarquías de página profundas (páginas enterradas a cinco clics de la página de inicio), sitios con páginas huérfanas y sitios que publican frecuentemente (blogs, noticias, e-commerce). Un sitemap ayuda con la eficiencia del presupuesto de rastreo. En lugar de descubrir páginas a través del rastreo de enlaces, Google lee tu sitemap y sabe qué priorizar. Sin embargo, un sitemap no puede forzar a Google a indexar páginas de baja calidad, duplicadas o delgadas. Si una página está en tu sitemap pero aún no está indexada, el problema generalmente es la calidad del contenido, canonicalización o tags meta robots.

¿Qué no debería estar en un sitemap?

Un sitemap debería solo listar URLs que deseas que se indexen, así que excluye cualquier cosa bloqueada por robots.txt, etiquetada con noindex, redirigida a otra URL, devolviendo 404 o errores 5xx, o canonicalizada a una URL diferente. Incluir esto desperdicia presupuesto de rastreo y señala mala mantenimiento del sitio. No incluyas páginas de administración, páginas de inicio de sesión, páginas de pago o tableros de cuenta de usuario (generalmente bloqueados por robots.txt o noindex). No incluyas URLs de parámetros (como ?sort=price o ?page=2) si usas tags canónicos para consolidarlos. No incluyas ambientes de prueba o test. No incluyas URLs que redirijan (301 o 302). Lista el destino final en su lugar. No incluyas URLs con tags noindex meta o headers X-Robots-Tag. No incluyas URLs paginadas a menos que cada página tenga contenido único que valga la pena indexar. La mayoría de sitios de e-commerce deberían solo incluir la página 1, con tags rel=next/prev o canónicos manejando el resto. No incluyas URLs de contenido duplicado. Usa tags canónicos para consolidar duplicados, luego solo lista la versión canónica.

¿Cómo arreglo errores de sitemap?

Los errores de sitemap caen en tres categorías: estructural (XML malformado, espacio de nombres incorrecto, archivo demasiado grande), a nivel de URL (404s, redirecciones, páginas con noindex) y problemas de metadatos (lastmod faltante, formatos de fecha incorrectos). Arregla errores estructurales primero. Previenen que los rastreadores analicen el archivo. Abre tu sitemap en un navegador o validador XML, confirma que comienza con la declaración XML correcta y espacio de nombres (xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"), y verifica que cada tag de apertura tenga un tag de cierre coincidente. Si tu sitemap excede 50 MB o 50,000 URLs, divídelo en múltiples archivos y crea un archivo de índice de sitemap. Arregla errores a nivel de URL eliminando o reemplazando entradas rotas. Elimina cualquier URL que devuelva 404, reemplaza URLs redirigidas con su destino final, elimina URLs con tags noindex, y confirma que cada URL coincida con tu dominio canónico (www o no-www, no mixto). Arregla problemas de metadatos asegurando que las fechas lastmod usen formato ISO 8601 (YYYY-MM-DD o YYYY-MM-DDTHH:MM:SS+00:00). Elimina lastmod completamente si tu CMS no puede mantenerlo preciso. Después de arreglar, revalida con nuestra herramienta y reenvía a Google Search Console.

Herramientas gratuitas relacionadas

Todas las herramientas →