O que um verificador canonical realmente faz
Um verificador canonical busca uma URL, analisa a seção <head> do HTML procurando por <link rel="canonical" href="...">, lê os cabeçalhos de resposta HTTP para um cabeçalho Link: <...>; rel="canonical", e compara os dois. Se ambos estão presentes e diferem, há um conflito. Se nenhum está presente, a página não tem um canonical explícito e corre risco de problemas de conteúdo duplicado.
Ele também gera variantes comuns de URL e testa cada uma. Dada https://www.example.com/page, testamos http://www.example.com/page, https://example.com/page, http://example.com/page, https://www.example.com/page/, e https://www.example.com/page?utm_source=test. Cada variante pode retornar um canonical diferente, um redirecionamento, ou o mesmo canonical do original. Nosso verificador mapeia os resultados para que você veja o quadro completo em uma única tabela.
Três problemas aparecem repetidamente. O primeiro é canonicals entre domínios—onde a tag aponta para um domínio completamente diferente, geralmente após uma migração ou misconfigurações de CDN. O segundo é cadeias de redirecionamento—onde uma URL faz canonical para outra URL que redireciona para uma terceira. O terceiro é canonicals ausentes em páginas paginadas ou filtradas, o que leva a penalidades de conteúdo duplicado.
Como usar este verificador canonical
- Cole sua URL em Primary URL. Use a versão que você considera canonical—geralmente https, www se você o usa, e sem barra final a menos que seu CMS a exija.
- Cole variantes adicionais em Extra variants to check se quiser testar URLs específicas. Uma por linha. Geramos automaticamente as variantes comuns (protocolo, subdomínio, barra final), então este campo é opcional.
- Clique em Check canonicals. Você obtém uma tabela com uma linha por URL testada. Cada linha mostra a URL, o código de status HTTP, o canonical encontrado na tag HTML, o canonical encontrado no cabeçalho HTTP, e se eles correspondem.
- Olhe para a coluna Conflicts. Uma bandeira vermelha significa que o canonical HTML difere do canonical HTTP, ou a URL faz canonical para si mesma quando não deveria, ou o canonical aponta para uma URL que retorna 404.
- Clique em Download report para exportar a tabela como CSV. Use-a para corrigir canonicals em massa em seu CMS ou passe para um desenvolvedor.
Tente verificar https://www.example.com/page em um site WordPress. Você pode descobrir que a versão www faz canonical para https://www.example.com/page (non-www) e que a versão non-www faz canonical para si mesma. Se ambas as versões retornam 200, Google pode tratá-las como duplicatas a menos que uma redirecione para a outra. O verificador mostra este conflito em um único passe.
Por que variantes de URL criam conteúdo duplicado
Google trata https://example.com/page, https://www.example.com/page, http://example.com/page, e https://example.com/page/ como quatro URLs separadas. Se todas as quatro retornam 200 e mostram conteúdo idêntico, Google precisa adivinhar qual é o original. Tags canonical removem a adivinhação ao declarar uma URL como a fonte. As outras três devem tanto redirecionar para o canonical quanto incluir uma tag canonical apontando para ele.
Três consequências práticas.
Diluição de equity de link. Se metade dos seus backlinks apontam para a versão www e metade para a versão non-www, Google vê duas páginas dividindo a autoridade. Um canonical consolida esse equity em uma URL.
Desperdício de orçamento de crawl. Se Google faz crawl em todas as quatro variantes, usa quatro requisições para indexar uma página. Em sites grandes, isto se multiplica por milhares de páginas. Tags canonical ou redirecionamentos 301 param a duplicação.
Confusão de índice. Google pode indexar a variante errada—a versão http em vez de https, ou a versão com barra final quando você prefere sem barra. Uma tag canonical informa ao Google qual exibir nos resultados de pesquisa.
Canonical HTML vs canonical de cabeçalho HTTP
O canonical HTML vive no <head>: <link rel="canonical" href="https://example.com/page">. O canonical de cabeçalho HTTP vive nos cabeçalhos de resposta: Link: <https://example.com/page>; rel="canonical". Ambos servem o mesmo propósito. Se ambos estão presentes e concordam, ótimo. Se ambos estão presentes e discordam, Google escolhe um—geralmente o cabeçalho HTTP porque é enviado antes do HTML ser analisado.
CDNs, proxies e redirecionamentos do lado do servidor às vezes adicionam canonicals de cabeçalho HTTP sem o conhecimento do proprietário do site. Se seu CMS exibe um canonical HTML apontando para URL A, mas seu CDN adiciona um cabeçalho HTTP apontando para URL B, você tem um conflito silencioso. Nosso verificador mostra ambos para que você possa detectar incompatibilidades.
Alguns CMSes e frameworks configuram canonicals incorretamente por padrão. Shopify às vezes faz canonical de URLs de produto para a primeira coleção na qual aparecem, mesmo se o produto está em cinco coleções. Instalações WordPress multisite podem fazer canonical para o subdomínio errado se a configuração de URL do site está desatualizada. Testar variantes revela esses casos extremos.
Canonicals de auto-referência e quando importam
Um canonical de auto-referência significa que a tag canonical de uma URL aponta para si mesma: <link rel="canonical" href="https://example.com/page"> em https://example.com/page. Isto é correto para a versão canonical de uma página. Informa ao Google "este é o original, não uma duplicata."
Porém, se uma variante faz auto-referência—https://example.com/page/ faz canonical para si mesma em vez de para a versão sem barra—você tem um problema. Google vê duas URLs auto-referenciadas com conteúdo idêntico e precisa escolher uma. O melhor ajuste é fazer um redirecionamento 301 da versão com barra para a versão sem barra ou fazer canonical da versão com barra para a versão sem barra.
URLs paginadas—/blog/page/2, /blog/page/3—devem fazer canonical para si mesmas, não para /blog, porque cada página tem conteúdo único. URLs filtradas ou ordenadas—/products?sort=price—frequentemente devem fazer canonical para a versão não filtrada /products porque o conteúdo se sobrepõe. Nosso verificador não impõe essas regras automaticamente; ele mostra o canonical que você configurou e sinaliza inconsistências. Você decide a política.
Erros comuns
- Cada URL fazendo canonical para a página inicial. Alguns plugins e temas definem isso como padrão. Isto informa ao Google que cada página é uma duplicata da página inicial. Verifique uma página profunda—um post de blog ou produto—para confirmar que faz canonical para si mesma, não para
/. - Canonical aponta para um 404. Após uma migração ou mudança de URL, páginas antigas podem ainda fazer canonical para URLs que não existem mais. Nosso verificador busca a URL canonical e relata o código de status. Se for 404, remova o canonical ou atualize-o.
- Canonical aponta para um redirecionamento. Se o canonical é
https://example.com/oldmas essa URL faz 301 para/new, Google precisa seguir o redirecionamento. Melhor fazer canonical diretamente para/new. - Usar URLs relativas na tag canonical.
<link rel="canonical" href="/page">funciona na maioria dos navegadores mas é tecnicamente inválido. Use URLs absolutas:href="https://example.com/page". - Fazendo canonical de http para https mas não redirecionando. Se a versão http faz canonical para https mas ainda retorna 200, usuários na URL http veem avisos de conteúdo misto e permanecem em http. Um redirecionamento 301 é melhor que uma tag canonical para mudanças de protocolo.
- Testando apenas a versão canonical. Você precisa testar as variantes para ver o que elas fazem. Se a versão www não faz canonical para a versão non-www, você tem uma duplicata.
Dicas avançadas
- Teste uma URL de cada tipo de página: página inicial, categoria, produto, post de blog, arquivo paginado. Canonicals frequentemente diferem por template, e um problema em um template afeta todas as páginas que o usam.
- Verifique parâmetros de query.
?utm_source=twittere?ref=emaildevem fazer canonical para a URL limpa se o conteúdo é idêntico. Se não fazem, você está criando variantes infinitas. - Procure por canonicals entre domínios após uma migração. Se você se moveu de
old-domain.comparanew-domain.commas esqueceu de atualizar canonicals, páginas no novo domínio podem ainda fazer canonical para o antigo. Isto informa ao Google para indexar o site antigo. - Se você usa tags hreflang para páginas localizadas, confirme que cada variante de idioma faz canonical para si mesma. Um erro comum é ter todas as versões de idioma fazendo canonical para a URL em inglês.
- Verifique canonicals em massa em seu sitemap. Se seu sitemap lista 500 URLs, um script pode chamar este verificador em um loop e exportar um CSV de qualquer um que não tenha auto-referência. Detecte problemas antes que Google os detecte.
- Re-verifique após implantar um novo tema, plugin ou atualização de CMS. A lógica canonical pode quebrar silenciosamente quando uma dependência muda.
Se sua verificação de canonical revelar conflitos, corrija-os nas configurações do seu CMS ou código do tema, depois execute a verificação novamente. Se você também precisa confirmar que seu sitemap inclui apenas URLs canonical, use o sitemap checker para fazer referência cruzada. Para ver como os metadados completos da sua página—title, meta description, tags OG, e canonical—renderizam no Google, Twitter e LinkedIn, o website metadata checker visualiza todos eles lado a lado. Se você quer confirmar que Googlebot pode alcançar a URL canonical e não está bloqueado por robots.txt, o SEO checklist executa 20 verificações na página incluindo validação de canonical.