
Las URL canónicas (o canonical links, en inglés) son un elemento HTML que ayuda a los webmasters y expertos de marketing a prevenir problemas de contenido duplicado, especificando la versión «canónica o preferida» de una página web.
Evidentemente, un tema esencial en el posicionamiento orgánico en buscadores o SEO.
Los motores de búsqueda reconocen texto duplicado cuando el mismo contenido es accesible desde varias direcciones URL.
Por ejemplo:
- http://www.ejemplo.com/page.html
- http://www.ejemplo.com/page.html?parameter=1
En estos casos, los motores de búsquedas pensarán que son dos páginas web distintas, pese a que técnicamente ambas URL devuelven el mismo contenido. Otro ejemplo muy común es hacer esencialmente el mismo el contenido, pero ordenarlo de manera diferente.
URL Canónicas: Forma de Aplicación
Un enlace canónico se puede insertar en la sección <head> de una página web, lo que permite a los webmasters prevenir estos problemas. De esta manera se le está dejando en claro a los motores de búsqueda que la página debe ser acreditada como la original.
Otra cosa que ayuda es escoger la URL que se desee y utilizar esa URL en todo el sitio como la preferida.
Por ejemplo si se quiere que la «home» http://www.ejemplo.com/ no hay que generar la mitad de los enlaces como http://www.ejemplo.com/ y la otra como http://ejemplo.com/. En ese sentido, hay que tomar siempre la URL de preferencia y elegir ese formato para los enlaces internos.
Además, si se quiere que la dirección URL predeterminada sea http://www.ejemplo.com/ también se puede hacer que si alguien busca http://ejemplo.com/ se puede hacer un redireccionamiento 301 que redirija a http://www.ejemplo.com/. Eso ayuda a motores de búsqueda como Google a que sepan qué URL prefiere el usuario como «canónica».
URL Canónicas vs Redireccionamiento 301
Una alternativa a las URL canónicas es hacer redireccionamientos 301. Esto porque algunos motores de búsqueda como Google al parecer prefieren el uso de redireccionamientos 301, pues así las arañas de Google pueden optar por ignorar un elemento de vínculo canónico si sienten que es más beneficioso hacerlo.
Además, la adición de un redireccionamiento 301 puede ser una buena idea sobre todo si se tiene un sitio web que cambie con frecuencia (por ejemplo, de contenido dinámico, un blog, etc.).
Matt Cutts: Explicación de la Canonización o Canonicalización de Dominios
Quiero hablar un poco sobre canonicalización. WWW vs No-WWW, redireccionamientos, URL duplicadas, enlaces 302, etc.
La canonicalización es el proceso de elegir la mejor URL cuando hay varias opciones, y generalmente se refiere a páginas de inicio.
Por ejemplo, la mayoría de las personas consideraría estas mismas URL:
www.ejemplo.com
ejemplo.com/
www.ejemplo.com/index.html
ejemplo.com/home.aspPero técnicamente todas estas URL son diferentes. Un servidor web podría devolver contenido completamente diferente para todas las URL anteriores. Cuando Google «canoniza» una url, tratamos de elegir la url que parece ser el mejor representante de ese conjunto.
¿Hay algo más que pueda hacer? Sí. Supongamos que se desea que la URL predeterminada sea http://www.ejemplo.com/. Se puede configurar para que en casos que alguien escriba http://ejemplo.com/, se abra igual http://www.ejemplo.com/.
Para ello, hay que realizar una redirección 301 (permanente) a http://www.ejemplo.com/. Eso ayuda a Google a saber qué URL prefiere que sea canónica.
Agregar una redirección 301 puede ser una idea especialmente buena si una página web cambia con frecuencia (por ejemplo, contenido dinámico, un blog, etc.).
¿Qué sucede si alguien desea deshacerse de dominio.com pero mantener www.dominio.com, ¿Se debe usar la herramienta de eliminación de URL para eliminar dominio.com?
No, definitivamente no. Si se elimina uno de los nombres de host www y no-www, se puede terminar eliminando todo el dominio durante 6 meses.
¿Hay otras formas de canonizar las URL? Sí. Hay otras, pero la mayoría de la gente nunca los nota (o no necesita notar). Los motores de búsqueda pueden hacer cosas como mantener o eliminar las barras diagonales finales, tratar de convertir las URL con mayúsculas a minúsculas o eliminar las ID de sesión.
En relación al comando inURL: ¿Por qué mucha gente cree que si se aplica este comando en una página web propia y aparecen resultados que no son de la web propia es porque la web está hackeada?
Hace algún tiempo atrás, si alguien escribía algunresultado.com/search2.php?url=midominio.com, a veces mostraba contenido de midominio.
Eso podría suceder cuando la URL de algunresultado.com era una redirección 302 a midominio.com y en Google se decidió mostrar un resultado de algunresultado.com. Desde entonces, en Google han cambiado sus heurísticas para que sea mucho más raro mostrar la URL de origen para los redireccionamientos 302.
En Google nos estamos moviendo a un marco para manejar redirecciones en el que casi siempre mostraremos la URL de destino.
Yahoo maneja las redirecciones 302 al mostrar generalmente la URL de destino, y estamos en medio de la transición a un conjunto similar de heurísticas.
Hay que tener en cuenta que Yahoo se reserva el derecho de tener excepciones en el manejo de redireccionamiento, y Google también.
Según nuestro análisis, mostraremos la URL de origen para un redireccionamiento 302 menos del medio por ciento del tiempo (básicamente, cuando tengamos una buena razón para pensar que la URL de origen es correcta).
En relación a los resultados suplementarios, ¿Estos causan una penalización en Google? No.
Matt Cutts, ex director del departamento contra el spam en web de Google.
Canonicalización – Google Webmaster Tools
Explicación de Matt Cuts, de Google