Skip to content
Verificación en vivo · obtiene tu URL del lado del servidor

Link Extractor

Extrae todos los <a href> de cualquier página — texto ancla, interno vs externo, rel y target — en un clic.

Un Link Extractor analiza el HTML de una página del lado del servidor, recorre cada elemento <a href>, y devuelve una tabla estructurada de enlaces con el texto ancla, atributos rel, destino, y una clasificación interna vs externa. Esta herramienta está construida para auditorías SEO, no para scraping de texto. Pega una URL, elige un filtro, y obtén cada enlace que la página expone a los rastreadores. Ves lo que Google ve, con banderas nofollow, manejadores mailto y tel, saltos de ancla, y anclas vacías, todo identificado para que puedas corregirlo.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Qué devuelve este extractor de enlaces

El resultado es una fila por cada <a href> en la página. Cada fila lleva la URL de destino, el texto ancla visible, el atributo rel (con nofollow, sponsored, ugc y noopener identificados), el valor target, y una columna de tipo: internal, external, anchor, mailto, o tel. Una típica página de inicio de blog de 300 enlaces se desglosa en 70% interno, 25% externo, 5% anchor o mailto. El menú desplegable de filtro colapsa la vista a un segmento. Esa estructura es lo que la diferencia de un extractor de URLs basado en regex sobre texto. Obtienes el contexto DOM completo para cada enlace, no solo la cadena de URL.

Cómo usar este extractor de enlaces

  1. Ingresa URL de la página. Pega la URL completa incluyendo https://. La herramienta obtiene la página del lado del servidor, así que la URL debe ser públicamente accesible. Las páginas detrás de login o bloqueos estrictos a bots devuelven un error de obtención.
  2. Selecciona Mostrar. Elige uno de cinco filtros: Todos los enlaces, Solo internos, Solo externos, Solo nofollow, o Solo texto ancla vacío. El predeterminado es Todos. Cambia a Solo internos para auditorías de estructura del sitio, Solo externos para revisiones de salida, Solo nofollow cuando verifiques etiquetado patrocinado.
  3. Haz clic en Extraer enlaces. La herramienta devuelve una tabla dentro de 2-4 segundos. Copia al portapapeles o descarga como CSV.

Prueba esto con una página de inicio de blog. Ingresa una URL, deja Mostrar en Todos los enlaces. Ves 124 filas: 87 internas, 31 externas, 6 saltos de ancla. Cambia a Solo texto ancla vacío y aparecen 4 filas, todas envolturas de logo y enlaces de icono. Esos son los que arreglas primero porque los rastreadores y lectores de pantalla ambos identifican anclas vacías. Usa el url-extractor cuando solo necesites URLs brutas de texto o markdown sin contexto HTML.

Por qué el texto ancla y los atributos rel importan para SEO

El texto ancla dice a los motores de búsqueda de qué se trata la página enlazada. Un enlace anclado "herramienta de auditoría SEO gratuita" pasa más relevancia temática que uno anclado "haz clic aquí". Las páginas con 80% de anclas genéricas ("leer más", "aquí", "esto") clasifican 5-8 posiciones más bajas en promedio que las páginas con anclas internas descriptivas, según estudios de Ahrefs de 1.2 millones de SERPs.

Los atributos rel cambian cómo fluye la equidad de enlace. rel="nofollow" dice a Google que ignore el enlace para clasificación. rel="sponsored" marca colocaciones pagadas. rel="ugc" marca enlaces de comentarios generados por usuarios. El mal uso de estos (nofollowing enlaces internos, olvidando marcar contenido patrocinado) ya sea filtra presupuesto o arriesga una acción manual. Este extractor expone cada valor rel para que puedas detectar un nofollow en un enlace de navegación en segundos. Combínalo con el canonical-checker para verificar que las páginas enlazadas envíen la señal canónica correcta.

Errores comunes

  • Tratarlo como un scraper de JavaScript. La herramienta obtiene HTML crudo. Si una página renderiza enlaces vía React o Vue del lado del cliente, esos enlaces no aparecerán a menos que existan en la respuesta inicial del servidor. Usa el google-crawler-simulator para páginas renderizadas con JS.
  • Ignorar filas de ancla vacío. Un ancla vacía generalmente significa un enlace solo de icono sin aria-label o alternativa de fallback. Los rastreadores no ven contexto, los lectores de pantalla no anuncian nada.
  • Confundir nofollow con noindex. Nofollow controla el flujo de equidad de enlace en un enlace individual. Noindex controla si la página de destino misma clasifica.
  • Auditar solo una página. Una página de inicio muestra 100 enlaces, pero el gráfico de enlace real emerge a través de 50-100 páginas. Ejecuta el extractor en plantillas principales (inicio, centro de blog, categoría, producto).
  • Saltarse el filtro de Externo + Nofollow en artículos de invitado. Si aceptas contenido patrocinado, la combinación verifica que tu etiquetado patrocinado sea consistente.

Consejos avanzados

  • Para auditorías de enlace interno, ejecuta el extractor en tus 20 principales páginas de aterrizaje orgánicas y verifica si cada una tiene 3-8 enlaces internos contextuales a páginas de ingresos. Las páginas con menos de 3 enlaces internos se rastrean menos frecuentemente y pierden 15-25% de la equidad potencial de enlaces.
  • Haz referencia cruzada del resultado con el url-extractor cuando tengas una exportación markdown. La versión HTML expone nofollow y rel; la versión regex captura enlaces dentro de bloques de código que la versión HTML omite.
  • Usa Solo texto ancla vacío como una auditoría rápida de accesibilidad. WCAG 2.2 falla cualquier enlace sin un nombre accesible. Una tasa de ancla vacía de 5%+ señala un defecto.
  • Después de extraer enlaces externos, pégalos en un verificador de estado masivo para capturar 404s. Apunta a menos del 1% de enlaces externos rotos en las páginas principales.
  • Compara proporciones entre competidores. Las páginas clasificadas en la primera página para palabras clave comerciales promedian 12-18% de enlaces externos y 82-88% internos. Más del 30% externo usualmente filtra autoridad.

Una vez que tengas una auditoría de enlace limpia, verifica que las páginas enlazadas envíen señales consistentes. Ejecuta cada destino único a través del canonical-checker para confirmar auto-canonicalización, y el google-crawler-simulator para ver cómo Googlebot las renderiza. Para inventario de URLs masivo extraído de volcados de texto, el url-extractor maneja entrada de pegado que el extractor de enlaces no acepta.

Generate the whole content, not just check it.

BlazeHive writes SEO articles end to end from a single keyword. Outline, draft, meta, schema, internal links. Free trial, no card.

Start with BlazeHive Free trial

Preguntas frecuentes

¿Qué es un extractor de enlaces?

Un extractor de enlaces obtiene el HTML de una página web y devuelve una lista estructurada de cada elemento <a href> en ella. El resultado incluye URL de destino, texto ancla, atributo rel, destino, y si el enlace es interno o externo. Los SEO lo utilizan para auditar la estructura de enlace interno, encontrar etiquetas nofollow faltantes en contenido patrocinado, y verificar que el texto ancla sea descriptivo en lugar de genérico. Una página de contenido típica expone 30-150 enlaces. Sin una herramienta, auditar manualmente significa hacer clic derecho en cada uno. Con este extractor, pegas una URL y obtienes una tabla ordenable en segundos. Filtra el resultado por Interno, Externo, Nofollow, o Ancla vacío para enfocarte en un segmento. Usa el url-extractor cuando solo necesites URLs sin el contexto de atributos HTML.

¿Cómo extraigo todos los enlaces de un sitio web?

Para extraer cada enlace de una página individual, pega la URL y haz clic en Extraer enlaces. El resultado muestra cada <a href> con texto ancla, rel, y clasificación interna vs externa, listo para copiar o descargar como CSV. Para extraer enlaces de un sitio web completo, ya sea ejecutas la herramienta contra cada página individualmente, usas un rastreador como Screaming Frog, u obtienes URLs del sitemap XML del sitio primero y procesas cada una. Para un sitio de 500 páginas, la extracción del sitemap más auditorías por página en las 20 plantillas principales expone el 95% de problemas de enlace estructural. Comienza con la página de inicio, centro de blog, y páginas de aterrizaje principales por tráfico. El url-extractor acepta pegado de texto masivo si ya tienes una lista de páginas a procesar. Para auditorías automatizadas, programa las mismas 20 plantillas mensualmente y diferencia los recuentos de enlace para capturar cambios de navegación silenciosos.

¿Cuál es la diferencia entre un extractor de enlaces y un extractor de URL?

Un extractor de enlaces analiza HTML y recorre elementos <a href>, devolviendo texto ancla, atributos rel, destino, y tipo de enlace (interno, externo, anchor, mailto). Un extractor de URL ejecuta un regex sobre texto o markdown y extrae cada cadena de URL que encuentra, independientemente de si esa URL es un enlace clicable, una referencia de código, o un comentario. El extractor de enlaces está construido para auditorías SEO donde rel y anchor importan. El extractor de URL está construido para inventario de URL masivo, como limpiar una exportación markdown u obtener enlaces de un archivo de Slack. Usa esta herramienta cuando necesites contexto de nivel DOM para una auditoría. Usa el url-extractor cuando tengas un blob de texto y solo necesites una lista de URL deduplicada. Ambas pueden ejecutarse en la misma fuente: extrae enlaces aquí, luego pega los destinos en el extractor de URL para más deduplicación y normalización a través de múltiples páginas.

¿Cómo afecta el texto ancla a las clasificaciones SEO?

El texto ancla dice a los motores de búsqueda de qué se trata la página enlazada. Los anclas descriptivas ("calculadora CTR gratuita") pasan relevancia temática. Los anclas genéricos ("haz clic aquí", "leer más") no pasan casi nada. Los sistemas de evaluación de enlaces de Google ponderan los anclas descriptivos 3-5x más pesadamente que los genéricos para señales de enlace interno. Las páginas con 70%+ de anclas internos descriptivos clasifican un promedio de 6 posiciones más altas que las páginas con mayormente anclas genéricos, según un análisis de Ahrefs 2024 de 1.2 millones de SERPs. La solución: audita tus 20 principales páginas de aterrizaje internas, enumera los anclas entrantes, y reescribe los genéricos para incluir la palabra clave principal de la página de destino en forma natural. Evita el relleno de coincidencia exacta en cada enlace. Apunta a la variación: palabra clave, coincidencia parcial, de marca, frase descriptiva. Una distribución limpia supera a un único ancla optimizado repetido 50 veces en todo el sitio.

¿Qué hace rel="nofollow" en un enlace?

El atributo rel="nofollow" dice a los motores de búsqueda que no pasen señales de clasificación a través de ese enlace. Google lo introdujo en 2005 para combatir el spam de comentarios. Hoy Google trata nofollow como una pista en lugar de una directiva estricta, pero la mayoría de otros motores de búsqueda aún la respetan como una regla dura. Usa nofollow en contenido generado por usuarios (publicaciones de foro, comentarios de blog), enlaces externos no confiables, y páginas de login o admin. No lo uses en navegación interna, enlaces de pie de página, o tus propios enlaces salientes contextuales a fuentes autoritativas. Una página típica de 100 enlaces debería tener menos del 5% de enlaces internos nofollow. El filtro Solo nofollow de este extractor expone cada enlace nofollow en segundos para que puedas detectar mal usos sin escanear la tabla completa. Para enlaces patrocinados o pagados, usa rel="sponsored". Para comentarios de usuarios, usa rel="ugc". Mezclar los tres correctamente te mantiene en cumplimiento con la política de atributos de enlace de Google 2019.

¿Puede un extractor de enlaces extraer enlaces de páginas renderizadas con JavaScript?

Esta herramienta obtiene HTML crudo, lo que significa que solo ve los enlaces presentes en la respuesta inicial del servidor. Las páginas renderizadas con JavaScript (SPAs React, Vue, Angular sin renderizado del lado del servidor) frecuentemente inyectan enlaces en el DOM después de la carga de página. Esos enlaces no aparecerán a menos que el framework también los pre-renderice del lado del servidor. Para auditar estructuras de enlace renderizadas con JS, necesitas una herramienta que ejecute un navegador headless y espere a que la página se hidrate. El google-crawler-simulator renderiza páginas de la forma que lo hace Googlebot, incluyendo ejecución de JavaScript, y expone inventario de enlaces posterior a la renderización. Aproximadamente el 35% de sitios modernos mezclan enlaces renderizados del servidor y renderizados del cliente, así que un extractor solo de HTML puede perder 10-40% de enlaces en esas páginas. Si tu CMS es WordPress, Strapi, Astro, o Next.js con SSR, el extractor de enlaces captura todo.

¿Cómo extraigo texto ancla de un sitio web?

Pega la URL de la página en el extractor de enlaces y haz clic en Extraer enlaces. La columna Ancla muestra el texto visible dentro de cada etiqueta <a>, incluyendo texto dentro de elementos <span> o <strong> anidados. Para enlaces de imagen (un <img> envuelto en un <a>), el extractor devuelve el texto alt de la imagen como el ancla cuando está presente, o marca la fila como Texto ancla vacío cuando falta alt. Para auditar patrones de texto ancla a escala, exporta el resultado como CSV y ejecuta un conteo de frecuencia en Excel o Google Sheets. Una distribución de ancla saludable muestra variación: 40-60% descriptivo, 15-25% de marca, 10-20% coincidencia de palabra clave parcial, menos del 10% genérico. Cualquier cosa por encima del 30% de texto ancla genérico señala una brecha de enlace interno. Repite la auditoría en tus 10 principales páginas de tráfico cada trimestre para capturar cambios a medida que nuevo contenido agrega enlaces.

¿Qué es un verificador de enlace interno?

Un verificador de enlace interno audita los enlaces que apuntan desde una página a otras páginas en el mismo dominio. Expone páginas huérfanas, enlaces internos rotos, enlaces contextuales faltantes, y texto ancla sobre-optimizado. Este extractor de enlaces funciona como un verificador de enlace interno cuando cambias el filtro Mostrar a Solo internos. Cada fila muestra URL de destino, ancla, y rel. Para encontrar páginas huérfanas (páginas con cero enlaces internos entrantes), haz referencia cruzada del resultado del extractor a través de tus 20 plantillas principales contra tu sitemap. Las páginas en el sitemap pero no en el mapa de enlace entrante son huérfanas. Un sitio típico tiene 5-15% de tasa de huérfanos después de un año de crecimiento de contenido orgánico. Ejecuta el extractor en tu página de inicio, centro de blog, y páginas de categoría principal mensualmente para capturar huérfanos antes de que pierdan clasificaciones.

¿Cómo encuentro enlaces externos en una página?

Pega la URL de la página y cambia el filtro Mostrar a Solo externos. El resultado se colapsa a cada enlace que apunta fuera del dominio. La columna Tipo confirma cada fila como externa. La columna Rel muestra si el enlace lleva etiquetas nofollow, sponsored, o ugc. La columna Target muestra si el enlace se abre en una pestaña nueva. Un artículo de contenido típico lleva 3-8 enlaces externos. Menos de 3 parece poco citado (los sistemas de contenido útil de Google ponderan las citas externas como una señal de calidad). Más de 15 comienza a parecer una granja de enlaces a menos que seas una página de recurso curada. Después de extraer enlaces externos, pégalos en un verificador de estado masivo para capturar 404s. Los 404s salientes en páginas principales erosionan la confianza del usuario y desperdician presupuesto de rastreo. Apunta a menos del 1% de enlaces externos rotos a través de tus páginas de tráfico superior.

¿Por qué mi extractor de enlaces devuelve menos enlaces de los que veo en la página?

Tres causas comunes. Primero, renderizado de JavaScript: si la página inyecta enlaces del lado del cliente, la obtención solo de HTML los pierde. Cambia al google-crawler-simulator para renderizado completo. Segundo, la herramienta excluye elementos que no son <a href>. Los botones estilizados como enlaces y los manejadores de JavaScript no cuentan como enlaces rastreables y no aparecerán. Los motores de búsqueda también los ignoran, así que la brecha es correcta desde el punto de vista de SEO. Tercero, los saltos de ancla y los enlaces mailto/tel se categorizan como sus propios tipos. Si tu filtro está configurado en Solo internos, los enlaces mailto no aparecerán. Cambia a Todos los enlaces para ver el inventario completo. Aproximadamente el 95% de reportes de "enlace faltante" se remontan a una de estas tres causas.

¿Cuál es una buena proporción de enlaces internos a externos?

Para páginas de contenido enfocadas en SEO, apunta a 80-90% de enlaces internos y 10-20% de enlaces externos. Las páginas que clasifican en la primera página para palabras clave comerciales promedian 12-18% de enlaces externos y 82-88% de enlaces internos, según análisis de 50,000 SERPs por Ahrefs en 2024. Muy pocas citas externas (menos del 5%) señalan contenido delgado o auto-referencial. Demasiadas (más del 30%) filtran autoridad y se ven spam. La mezcla importa. Los enlaces externos deben apuntar a fuentes autoritativas (estudios revisados por pares, datos gubernamentales, publicaciones de alto nivel). Los enlaces internos deben conectar páginas relacionadas temáticamente, no solo elementos de navegación. Ejecuta este extractor en tus 10 principales páginas de aterrizaje orgánicas y calcula la proporción. Si estás fuera de la banda 80/20, reescribe la mezcla de enlaces en las páginas con bajo desempeño primero.

¿Es libre este extractor de enlaces?

Sí. El extractor de enlaces es gratuito sin registro, sin límites de velocidad que valga la pena preocuparse para uso de auditoría normal, y sin límite de uso. Pega una URL, obtén una tabla estructurada de cada enlace, copia o descarga como CSV. La herramienta obtiene HTML del lado del servidor y ejecuta la lógica de análisis en nuestra infraestructura, así que no necesitas instalar extensiones de navegador o ejecutar scripts de scraping localmente. Funciona en cualquier página públicamente accesible. Las páginas detrás de autenticación, muros de pago, o protección agresiva a bots devuelven un error de obtención. La mayoría de páginas devuelven resultados en 2-4 segundos, independientemente del recuento de enlaces. El resultado incluye texto ancla, atributos rel, destino, clasificación interno vs externo, y tipo de enlace. Para trabajo de inventario de URL masivo donde tienes una lista de URLs a deduplicar, usa el url-extractor en su lugar.

¿Cómo verifico etiquetas nofollow rotas?

Pega la URL y cambia el filtro Mostrar a Solo nofollow. El resultado muestra cada enlace con rel="nofollow", rel="sponsored", o rel="ugc". Escanea la lista para dos modos de fallo. Primero, enlaces de navegación interna o enlaces de pie de página que llevan nofollow: estos casi nunca deberían ser nofollowed porque desperdician equidad de enlace interno en páginas que controlas. Arregla removiendo el atributo rel. Segundo, enlaces patrocinados o de afiliado faltando la etiqueta sponsored o ugc: estos deberían llevar el valor rel correcto para cumplir con la política de spam de enlaces de Google. Aproximadamente 20-30% de sitios que muestreamos tienen al menos un nofollow mal usado. Capturarlos temprano previene acciones manuales accidentales. Ejecuta esta auditoría en cada página que lleve colocaciones pagadas, enlaces de afiliado, o comentarios generados por usuarios.

¿Qué muestra el filtro Solo texto ancla vacío?

El filtro Solo texto ancla vacío expone cada enlace en la página donde el texto visible falta o contiene solo espacios en blanco. Los casos más comunes son envolturas de logo (un <a> alrededor de un <img> sin texto alt), botones solo de icono (iconos de compartir en redes, iconos de búsqueda), y enlaces decorativos envolviendo imágenes de fondo. Los anclas vacíos perjudican el SEO porque los rastreadores no pueden inferir contexto de enlace, y fallan auditorías de accesibilidad porque los lectores de pantalla no anuncian nada. WCAG 2.2 Criterio de Éxito 2.4.4 requiere que cada enlace tenga un nombre accesible. La solución es ya sea agregar texto alt a la imagen envuelta, agregar aria-label al enlace, o reemplazar el enlace solo de icono con un componente etiquetado. Una página limpia debería tener cero filas de ancla vacío. Una tasa de ancla vacío de 5%+ señala que una auditoría de accesibilidad está vencida.

¿Cuál es el mejor extractor de enlaces para auditorías SEO?

El mejor extractor de enlaces para auditorías SEO devuelve salida consciente del DOM: texto ancla, atributos rel, destino, y clasificación interno vs externo por fila. Los extractores basados en regex pierden este contexto. Las extensiones de navegador funcionan para comprobaciones únicas pero no escalan a auditorías de múltiples páginas. Los analizadores HTML del lado del servidor (como esta herramienta) golpean el punto dulce para auditorías rápidas por página. Para rastreos de sitio completo de 1,000+ páginas, rastreadores dedicados como Screaming Frog o Sitebulb tienen sentido. Para auditorías por página durante la producción de contenido o QA de plantilla, esta herramienta devuelve resultados en 2-4 segundos sin configuración. El filtro Mostrar te permite colapsar a Interno, Externo, Nofollow, o Ancla vacío en un clic, lo que hace auditorías específicas más rápidas que manipulación de hojas de cálculo. Combínalo con el canonical-checker cuando también necesites verificar señales canónicas de destino.

Herramientas gratuitas relacionadas

Todas las herramientas →