Tip:
Highlight text to annotate it
X
Hola a todos. Bienvenido a otro vídeo. Hacemos esto cuando hablamos conferencias y hablamos de algo
importante, no sólo preguntas y respuestas, daremos un vistazo a nuestra presentación más tarde,
y la pondremos aquí para que la gente pueda seguirla, vea las diapositivas y con suerte aprenda algo nuevo.
Así que hoy quería hablar sobre el elemento enlace canónico. Algo que Google, Yahoo, y Microsoft
anunciaron que apoyarían durante el SMX West. La fecha en la que se anunció fue
el 12 de febrero de 2009, y una cosa curiosa es que Charles Darwin nació exactamente hace 200 años ese mismo día.
Así que empecé la presentación con una broma en la que decía que si creías que la web fue inteligentemente diseñada
por Tim Berners-Lee, o si creías que la web tiene que evolucionar, pero da lo mismo ya que es un estándar abierto
que ayuda a que la gente la mejore. Así que nos preguntamos, ¿qué tipo de problemas tiene hoy en día la gente,
webmasters, SEO y dueños de sitios web? Está bastante claro que el contenido duplicado es una de las cosas que
más preocupa. Entonces, ¿qué es contenido duplicado? Bueno, tengo aquí una diapositiva donde muestro ocho
URL diferentes, sabes que cada una de estas direcciones podría devolver un contenido completamente diferente.
Como humanos cuando miramos a www.example.com o a example.com / o a /index o a home.asp, pensamos en ellas como
la misma página. En práctica, suele ser la misma página. Y técnicamente no tiene que ser, pero casi siempre
los servidores web devolverán el mismo contenido para estas ocho diferentes versiones de la URL.
Esto puede causar muchos problemas a los motores de búsqueda, si en lugar de tener tus enlaces hacia una página,
están divididos entre la versión con www y la sin www. Y esto da muchos dolores de cabeza. ¿Cómo resolver esto?
¿Cómo solucionarlo? Bueno, pues resulta, y voy a detenerme en esta diapositiva unos minutos, hay muchas
formas de arreglarlo. Algunas personas han bromeado sobre este elemento enlace canónico que es como
masilla que arregla el aspecto de las grietas de una pared. El hecho es que hay un montón de
maneras de arreglar de antemano las cosas, así no hay necesidad de que las arregles a posteriori.
Hubo una cita muy graciosa en la conferencia de Jill Whalen, en la que dijo,
"Los desarrolladores son los que dan trabajo a los SEO"
Así que, tanto si eres desarollador como SEO, hay algunas buenas prácticas que pueden hacer las cosas un poco
más fáciles para tu sistema de modo que no tengas que preocuparte por el contenido duplicado.
Una es tratar de asegurarse de que tus URL están estandarizadas, Microsoft a veces las llama normalizadas,
en esencia, sólo hay una forma de llegar al contenido. Si tu sistema de gestión de contenidos genera siempre URL
coherentes, completamente uniformes y sin que tengas que preocuparte por tener ocho versiones diferentes,
esto te ahorrará un montón de problemas. No tienes que preocuparte de que esto te pase.
Una forma de evitarlo es arreglar tu sistema de gestión de contenidos o software para que sólo genere estas URL
de forma consistente. Otra cosa es pensar en tu sitio. Supongamos que tienes www.example.com y
la versión example.com, y a veces enlazas a la versión www y otras a la versión sin www, es natural que
los motores de búsqueda se líen un poco. Así que, enlazar consistentemente, diciendo, mi página de inicio es
www.example.com/. Nada más. Y, a continuación, asegurarse de que todos los enlaces internos son coherentes
puede marcar una gran diferencia, de manera que no termines con dos, tres o cuatro copias de cada página.
Si tienes, home.asp o index.html, puedes reescribirlas de tal manera que todos las demás URL sean redirecciones 301
a una única URL. Por lo tanto, es genial que puedas arreglarlo desde el principio y enlazarlo siempre igual así
este problema nunca ocurrirá, pero si se duplican URL, entonces puedes utilizar una redirección permanente 301,
una forma de estandarizar y agrupar todas estas URL. Los motores de búsqueda seguirán ese redireccionamiento 301,
y generalmente las agruparán. Google además hace un par de cosas más que otros motores de búsqueda no hacen.
Así pues, en nuestras Herramientas para webmasters, nuestra consola, totalmente gratuita, no cuesta nada,
puedes especificar, por ejemplo, mi sitio es mattcutts.com, qué versión prefieres si www.mattcutts.com o sin www,
sólo mattcutts.com. Esa es una configuración muy sencilla, y evita un montón de contenido duplicado.
Y un hecho poco conocido, no todo el mundo se da cuenta de esto, es que cada vez que envías tu URL a través
de un sitemap, otro estándar respaldado por la mayoría de los principales motores de búsqueda, que es un simple
archivo, tan sencillo como una lista de URL, cogemos esa lista de URL que has enviado y nos decimos,
"si vemos una URL en esa lista y, a continuación vemos otra versión de ésta que no está en la lista, preferiremos
las URL que están en tu lista. Así que solemos utilizarlo para atar cabos cada vez que envías URL en un sitemap.
Así que hay al menos un par de formas de darle pistas a Google que pueden ayudar con el contenido duplicado.
Pero, dicho esto, seguramente siempre habrá problemas de contenido duplicado que no podrás arreglar tu mismo.
Veamos algún ejemplo. A veces, no puedes generar una 301 permanente. Por ejemplo, en mi antigua cuenta del colegio,
cs.unc.edu, yo no controlo el servidor web. Así que tendré que abrir una incidencia o enviarles un email a los
administradores y decir "¿podéis añadir un 301 desde esta página a esa otra?" En muchos servidores gratuitos
no podrás generar un redireccionamiento 301. Tampoco podrás evitar cómo la gente enlaza a tu web. Por ejemplo,
sabes que incluso si enlazas consistentemente a la versión con www. de tu sitio web, el resto podría enlazar a
la versión sin www. Y realmente tú no puedes controlar esto.
Rutas con mayúsculas o con minúsculas. MS IIS muestra las páginas tanto si enlazan a la home.asp en mayúsculas
o en minúsculas, y a veces incluso en casos mezclados. Si la gente enlaza a las diferentes versiones en mayúscula y
minúsculas mezcladas, esto puede causar problemas. La ID de sesión es otro factor importante. Así que he visto,
al menos en algunos motores de búsqueda, un sitio con una página de Política de privacidad indexada
tres mil veces, cada vez con una ID de sesión diferente, porque la página era ligeramente diferente cada vez.
Así que ya sabes, en general, si puedes evitar la ID de sesión, mejor. Pero a veces, como
optimizador para motores de búsqueda o encargado del sitio web, no te puedes deshacer de estas por completo.
Códigos de seguimiento, si compras anuncios. Analytics, el parámetro UTM, las páginas de inicio cuando tienen que
ser diferentes para los diferentes anuncios. Estas son el tipo de cosas de las que a veces no te puedes deshacer.
Si diriges una tienda online, digamos con diferentes productos, puede que haya que ordenarlos por precio más bajo
o por el más alto y a veces es necesario que tengas diferentes facetas o puntos de vista de tus datos, y
conceptualmente es la misma cosa, se trata simplemente de diferentes formas de organizarlos.
Por último, rutas de navegación. Son como yo llegué a esta página. ¿Llego a esta tienda de campaña roja
a través de tiendas de campaña o a través de los colores? ¿o llegué porque estaba interesado en accesorios?
¿Cómo llegué? Incluso la documentación de ayuda para webmasters de Google a veces tiene un parámetro CTX que dice
aquí es como llegamos a esta página. Y ese día, fue gracioso, la Reina acababa de lanzar un nuevo sitio web:
royal.gov.uk. Yo le deseo lo mejor a la Reina, que viva muchos años y le deseo lo mejor a la monarquía británica,
Sin embargo, alguien en el Telegraph, telegraph.co.uk, hizo una auditoría SEO del sitio web y encontró
el tema del contenido duplicado. Aquí ves, sólo con barra, royal.gov.uk/Home.aspx y luego en la parte inferior
yo hice una nota de rescate, mayúsculas y minúsculas mezcladas, y el real sitio web devolvió la misma página
para cada una de estas URL. Era sólo un ejemplo muy simple para demostrar que cualquiera puede tener este
tipo de problemas.
Entonces, ¿cuál es la respuesta? ¿cómo resolvemos este problema en particular?
Asumiendo que no puedes resolverlo de ninguna otra manera, y de verdad animo a intentar arreglarlo por adelantado,
trata de enlazar consistentemente. Con esto no podrás decir "ah, ahora todos mis problemas están resueltos,
no tengo que preocuparme de nada más". Pero, si no puedes resolver tus problemas de otra manera, hay un
elemento muy sencillo, un elemento de enlace, donde puedes señalar tu canónica, y eso es como decir mi preferida,
o la primaria, o la definida, la versión bonita de la URL que yo deseo utilizar, y no esa fea URL con un código de
seguimiento o sesión ID, es esta bonita URL. Y todo lo que tienes que hacer es decir en el elemento head de este
documento, incluso aunque tenga una sesión extraña, que la bonita versión, que la versión canónica de
esta dirección URL, esta aquí. Y eso es todo lo que es. Es un estándar abierto muy simple. Un simple elemento
que se añade en el head de tu documento.
Algunas cosas interesantes. Esta es la versión del director así puedes tener más de información. ¿Es una etiqueta?
Es como una etiqueta, su nombre técnico creo que es "elemento". Pero aquí todos somos amigos y nadie se va a meter
contigo o burlarse de ti si le llamas etiqueta de enlace canónico o elemento enlace canónico. La gente a menudo
habla de meta etiquetas ¿verdad? Y las meta etiquetas son cosas que van también en el head del documento. Y así, si
una meta etiqueta tiene un valor que es un hiperenlace, creo que lo más correcto es que no sea un meta, sino que
se llame "enlace". Y es eso por lo que ves link rel="canonical" href= y el valor. Así que ahora ya sabes el nombre
oficial, pero a nadie le va a importar si le llamas etiqueta de enlace canónico.
Una cosa que es interesante sobre esta etiqueta, vamos a hablar solo de algunas cosas más relevantes.
No prometemos acatar esto al 100%. ¿Vale? Si vemos que un webmaster y ellos se han disparado accidentalmente
en el pie, ya sabes quizás hayan creado un bucle infinito, y es muy fácil crear uno,
nos reservamos el derecho de hacer lo que creamos que sea mejor. Al menos en Google, vamos a tratar esto como una
pista. Así que a menos que veamos algún caso excepcional o algo que perjudica tu propio sitio, probablemente sería
de esperar que respetemos la etiqueta. Así que en la mayoría de casos, funcionará bastante bien. Aunque nos tenemos
que reservar el derecho como caso final el decir que no, cuando no creamos que eso sea lo mejor para los usuarios.
Pero es mucho mejor si lo puede solucionar uno mismo. Así que echa un vistazo a las otras alternativas
antes de usar esta etiqueta. No pienses "le planto una etiqueta de enlace canónico y
ya está, ya he acabado".
Si eres un usuario con un pequeño negocio, y usas WordPress o cualquier software para carrito de compra,
puede que no sea lo mejor ponerte manos a la obra para arreglarlo tu solo,
por lo menos por ahora. Espera, porque creo que saldrán plugins, la gente incluso está hablando de si
WordPress lo añadirá al software base, así que puede que ni siquiera necesites el plugin. Así que si eres
uno de estos usuarios y esperas unos meses, todo debería ir bien. Es algo nuevo, así que tienes tiempo
para pararte a pensar y decir, vale, ¿qué tipos de contenido duplicado tengo y cómo puedo arreglarlo?
Tómate tu tiempo. No empieces directo "oh, apuntaré a todo el mundo, lo haré todo".
Tienes tiempo hasta que se dé respaldo a esto, así que puedes planear con tiempo.
Y como siempre, si vemos que se abusa, nos reservamos el derecho de cambiar el tratamiento que damos a la etiqueta
o no respetarla. Hay una buena manera de evitar el abuso. Permitimos cosas dentro del mismo dominio,
pero no las permitimos entre dominios. Con las 301 siempre ha habido esta noción de ¿me puedo apropiar de un sitio
con 301 raras, puedo robar la reputación de otro sitio? Y por lo menos ahora, este elemento no está
sujeto a eso, ya que sólo se puede usar dentro del mismo dominio. Una pregunta normal después de esto es,
¿qué pasa con los subdominios? ¿Puedo hacer cosas entre diferentes nombres de host?
Y la respuesta es sí que puedes. Estaba hablando con Tony Hsieh de Zappos, sobre contenido duplicado.
Tienen un servidor llamado zeta.zappos.com, que es un software de prueba y puede que sea la
próxima versión. Y me decían, ¿puedo enviar mi canónica, puedo pasarla de zeta.zappos.com a
www.zappos.com? Y la respuesta es que claro que puedes.
¿Se puede usar para enviarlo de https a http? Claro, va muy bien. Está en el mismo dominio, así que no es
un problema en absoluto, al menos en Google, el utilizarlo con ese fin.
Entonces ¿cuál es la diferencia entre esto y una 301 o redirección permanente? No hay mucha,
salvo que se limita a un solo dominio. Las 301 son posibles entre dominios, y esto es dentro del mismo dominio.
De hecho, el modelo mental que tengo de esto es que es básicamente como una mini
redirección 301 que puedes generar con este elemento de enlace. Así que, si piensas cómo Google trata las 301,
probablemente esta esa una buena suposición sobre cómo vamos a manejar este elemento.
Bueno, unas pocas preguntas más, ya que tienes tiempo y estás viendo el vídeo. ¿Deben las páginas ser idénticas?
Exactamente idénticas, no. Piensa de nuevo en el caso del catálogo, en el puedes ordenar la página por
precio ascendiente o decreciente, conceptualmente son casi la misma página. Así que si quieres
agruparla a la misma URL, y no preocuparte por el parámetro, claro que puedes hacerlo.
Deben ser parecidas. Esta situación es la única que se me ocurre donde podría haber abuso, digamos que
tienes una página de dibujos, y luego algo sin ninguna relación con los dibujos
y los intentas combinar a la vez. Y en realidad no estás ganando ventaja, ya que tenías PageRank
en las dos páginas. Así que no tiene sentido combinarlas, pero recomendamos que lo hagas con
páginas similares. No tienen que ser idénticas, tan sólo similares.
Más cosas. ¿Qué hay de las URL relativas contra las URL absolutas? Pues puedes usar las dos.
Recomendamos URL absolutas. Y hay una razón muy sencilla. Cuando tienes URL relativas, puedes mover una URL y
todo sigue igual con respecto a esa URL. Por lo tanto, la página principal puede decir "/images" o "images".
Y que se mueve en relación a esa página. Pero es mejor una URL absoluta porque se trata de
una herramienta potente, y te interesa especificar que ésa URL va exactamente a ésta URL.
Si es relativa y te equivocas ahí, te equivocarás en algún otro sitio más también.
¿Podemos seguir una cadena de etiquetas o elementos canónicos, como se sigue una cadena de redirecciones 301?
Sí, pero de nuevo, no lo recomiendo, porque si tienes un sitio grande con una cadena de redirecciones 301,
es fácil que algo se rompa. Es algo parecido, y no quieres sufrir las consecuencias,
así que recomiendo URL absolutas, y pasar de la antigua URL a la nueva URL, un salto
y eso es todo. Es más fácil de esta manera, y quieres ir a lo seguro. No quieres
dispararte al pie sin querer. ¿Y cómo podrías dispararte al pie accidentalmente? Pues por ejemplo si dices mi
canónica está aquí y ¿es eso una página 404? Cierto, puede que la página no exista. ¿Y qué pasa si tienes un
bucle infinito? Esto es canónico. No, ésto es canónico. Y todos hemos visto que eso ocurre, ya sabes, ¿qué es
guerra civil? Busca guerra entre estados. ¿Y qué es la guerra entre estados? Busca guerra civil.
Y tienes que dejar el diccionario, con un dolor de cabeza. Por eso, intenta evitar los bucles infinitos.
¿Qué pasa si apunto a una URL que no se ha rastreado? Intentaremos rastrearla, pero podría ocurrir algo excepcional,
¿y si digo en la consola para webmasters "oh sí, todo debe ser www.example.com, pero luego especifico los
canónicos sin "www"? Así que puedes hacer todo este tipo de cosas que son casi como dispararse uno mismo al pie,
y la respuesta es que trataremos estos casos excepcionales de la manera más razonable. La presentación tiene
Cazafantasmas, porque como ellos decían ¡No cruces los rayos! Así que piénsatelo y tomáte tu tiempo 00:17:00.810,00:17:06.090 no pongas las etiquetas canónicas de cualquier modo en tu sitio, ya sabes, planifícalo un poco para
evitar estas situaciones raras.
Estamos llegando al final de la presentación. Quería saludar a Joachim, que es
el ingeniero de Google que ha implementado esto y ha hecho todo el trabajo duro. Se aseguraró de que funcionaba
bien dentro de una 301 y pensó en todos estos casos excepcionales. Por ejemplo, alguien dijo, ¿y si
tengo un canónico que apunta a mí mismo? ¿Funciona eso? En efecto. ¿Y si tengo un canónico y mi
href está vacío? Entonces da un error, que hace que apunte a sí mismo. Así que todo esto
funciona porque Joachim hizo un buen diseño, pero de nuevo, asegúrate de que tienes URL absolutas y de que todo
está bien especificado. También me gustaría saludar a Greg Grothaus. Resulta que cuando investigas en esto,
un montón de gente había propuesto ideas similares. Vi por lo menos una entrada en la web después de empezar a
explorar esto diciendo, "hey, ¿porqué no hacéis algo así?". Pero fue Greg uno de los que comenzaron
a discutir el tema en Google, apostó fuerte por esto y tuvo una gran idea, así que pienso en él como,
al menos dentro de Google, quien empezó a mover el trabajo sobre este tema y lo aprecio.
Y, por supuesto, toda la gente, de Maile a Wysz pasando por Adam y Riona, que han trabajado
para que el mensaje llegue a diferentes personas. En Yahoo!, Priyank, y mucha gente de Microsoft,
Nathan Buggia y muchas otras personas también. Espero que muchos motores de búsqueda lo respalden.
Yahoo! y Microsoft han anunciado que lo respaldarán, crucemos los dedos por Ask, me encantaría que
participaran también. Wikia, Artur de Wikia, nos había enviado un email preguntando sobre las etiquetas canónicas.
Y fue genial que pudieran ponerlo a prueba mientras nosotros mismos estábamos probándolo.
Y luego un montón de webmasters que siempre nos envían sus comentarios sobre lo que les gustaría ver.
Por último enumero un montón de recursos, sobre los que tanto Google, Yahoo como Microsoft escribieron algo.
Hay una página oficial de documentación en el Centro de Asistencia. Y veíamos que la gente tenía preguntas sobre
contenido duplicado, cuando Joost vino a preguntarnos sobre un caso interesante; así que dijimos, ¿sabes qué?
Tenemos esto que va a salir y que podría ayudar. Y eso fue una muy buena manera de hacer como un
beta test tranquilo y vimos cómo funcionaba. Sucedió que Joost nos envió el mensaje unos días antes de que
anunciáramos nuestro respaldo al elemento, así que le dimos un preaviso de posible apoyo, y volvió con
plugins no sólo para WordPress, también para Magento, un software de comercio electrónico, y para Drupal,
otro CMS de código abierto, que creo que hasta la Casa Blanca usa.
Así que realmente apreciamos el trabajo que ha hecho tan bien. Y, en general, ya sabes, ten cuidado, sé prudente,
planifica cómo quieres usarla. No tenemos la intención de sacar dinero de esto, sólo que es bueno para la web,
da lugar a menos contenido duplicado. Es un estándar abierto, cualquier motor de búsqueda que rastrea la web
puede usar la información para hacer la web más relevante y aumentar la relevancia de sus resultados de búsqueda.
Y ahora ya sabes tanto como los que asistieron a la conferencia del SMX West.
Muchas gracias por tu atención, hablamos pronto.