Tip:
Highlight text to annotate it
X
Hola, mi nombre es Maile Ohye, y trabajo como Developer Program’s tech lead en Google.
Estoy encantada de estar hablando en nombre de todos mis colegas de Google.
Somos conscientes de lo importante que es contar con un ecosistema de Noticias fuerte,
así que espero que encuentres algo en esta presentación que te sea útil. Hoy vamos
a hablar de tres temas principales. En primer lugar, los factores de clasificación en la búsqueda de Google Noticias.
A continuación, vamos a responder a algunas preguntas frecuentes que escuchamos de editores o SEO.
Y por último, vamos a hablar sobre prácticas recomendadas a la hora de publicar artículos.
Veamos cómo aparecen los artículos en los resultados de búsqueda de Google. Hay varias maneras.
En primer lugar, obviamente, aparecen en google.com, donde puede aparecer una caja de Noticias. En la captura
de pantalla superior se muestra un resultado de una búsqueda de noticias,
como "Obama medals", donde se muestra al usuario algún artículo de prensa.
Hay una manera de hacer que sus artículos aparezcan en Google Noticias. En esta segunda pantalla,
un usuario va directamente a news.google.com y aquí es donde se ve un
grupo similar de artículos, pero en lugar de la página principal de google.com
lo que vemos es la página principal de Noticias. Así que puede que te estés preguntando,
"¿Cómo aparecen ahí estos artículos?" Primero se compilan para rastrearlos, luego
los agrupamos, luego esa información se clasifica. Vamos a hablar de cada uno de estos pasos.
Empecemos con el rastreo. En la etapa de rastreo, al igual que en la búsqueda
web, tenemos a Googlebot que va a los sitios de noticias en busca de nuevos artículos.
Hay dos maneras de recuperar estos artículos. Una de ellas es a través del rastreo de detección,
en el que Google ve nuevas URL y después rastrea los artículos. También
puedes crear un sitemap de noticias. Los sitemaps de Google Noticias son una
forma de enumerar tus nuevas URL, y podemos usar eso, además del rastreo de detección,
para encontrar nueva información. Y, por supuesto, respetamos el Protocolo de exclusión de robots,
así que puedes crear un archivo robots.txt o utilizar cabeceras HTTP para hacernos saber
qué documentos deseas que se rastreen y qué documentos deseas que se excluyan de los resultados de búsqueda de Google.
Por último, una vez que hemos rastreado y estamos seguros de que sólo hemos rastreado lo que se
nos permite rastrear, traemos estos artículos a Google. Y ese es el final
de la fase de rastreo. Así que ahora nos metemos en la fase de agrupación, y
aquí es donde viene la idea de clasificación.
Miramos el contenido de cada artículo. Puedes ver este
artículo "The millions Kozlowski didn't steal". Tomamos
palabras concretas como "business", "tycho", "money" y "CFO"
y entendemos que este artículo pertenece a la sección de negocios. Y así es
cómo se rellenan las diferentes secciones de Google Noticias, como las de negocios, salud o entretenimiento.
Otra cosa que se hace es definir si se trata de Reino Unido, EE.UU. o India.
Y esto también lo obtenemos del texto. Tomamos palabras como
New York y Manhattan que nos llevan a creer que este artículo pertenece
a los Estados Unidos. Así que esta es la etapa de agrupamiento en la que entendemos de qué tratan los artículos,
y también a las secciones y adiciones a las que pertenecen. Y ya que hemos hablado
de rastreo y agrupación, ahora pasamos a la clasificación. La clasificación tiene dos fases.
En primer lugar, se da la clasificación de historias. Es muy parecido a lo que se ve en Google Noticias,
donde hay un grupo de historias, ya sea sobre Obama,
sobre Michael Jackson o sobre el precio del petróleo. La clasificación de historias consiste en
decidir cuál de ellas debe aparecer en qué posición. Esta es la idea.
Grupos de historias. Y nosotros clasificamos estos grupos de historias de acuerdo
al interés editorial. Vamos a ver en detalle que es lo que significa esto.
En el diagrama superior podemos ver que una pequeña historia tiene un alcance pequeño en la actividad editorial.
Supongamos que en Carolina del Norte, un hombre da coches gratis a los necesitados.
Es una gran historia de interés humano. Podría tener alcance en un periódico local
y también ser recogida por un par de medios. Pero estas historias relativamente pequeñas no
muestran mucho interés editorial comparado con una historia más amplia como, pongamos, la muerte
de Michael Jackson, que no sólo se publica en un periódico local, también se publica en periódicos
extranjeros y nacionales, muchos medios le dan cobertura, incluyendo artículos de opinión y seguimiento.
A causa de todo este interés editorial es muy probable que esta historia se clasifique mejor que
la historia del hombre dando coches gratis en Carolina del Norte. En esto
En esto consiste la clasificación de historias. Clasificamos grupos de artículos.
El siguiente paso consiste en clasificar artículos individualmente. Tomamos historias de un grupo,
por ejemplo sobre la muerte de Michael Jackson, y determinar cuál de estas 200 historias
debe aparecer en primer lugar para nuestros usuarios, cuál en segundo lugar, y así sucesivamente.
Hay muchas señales para la clasificación de artículos, pero sólo hablaré de las cuatro más importantes para ti.
En primer lugar, se tiene en cuenta que la noticia sea fresca y nueva. Es importante
que un artículo tenga información reciente y relevante sobre un tema. Y es necesario que las noticias
que lideran un grupo sean noticias objetivas. Comunicados de prensa, sátiras o artículos de opinión
no liderarán grupos de noticias. Otro factor es la detección de la frescura y los duplicados. Y ahí es
donde tratamos de determinar la fuente original de los contenidos y los que están duplicando información.
Así que algo que usamos para esto es la idea de la clasificación de citas. Así, para un artículo,
podemos ver que si una noticia fue publicada en Los Angeles Times y,
posteriormente, otro artículo dice que Washington citó Los Angeles Times como la fuente de la información,
entonces podemos empezar a clasificar las citas para esa historia. Puede que este artículo
del diario Los Angeles Times tenga una mejor clasificación, ya que otras personas están citándolo
como la fuente original de la historia. Otro factor que se tiene en cuenta es la relevancia personal y local.
Y esto se aplica a las distintas secciones, así como en las adiciones de las publicaciones.
Queremos dar más peso a las fuentes locales, que son probablemente más relevantes para la noticia.
Si tomamos el ejemplo del hombre que daba coches gratis en Carolina del Norte,
es probable que se tenga en cuenta diarios como el Charlotte Observer, y que
sepamos que podría ser una autoridad superior para esta historia y por lo tanto que el artículo podría
clasificarse más alto dentro de este grupo. La última señal que quería abarcar es
la idea de las fuentes de confianza. Para nosotros, las fuentes de confianza no tienen que ver con una decisión
que hayamos tomado, si no que se basa en datos. Así que de acuerdo con datos compilados
durante un cierto tiempo,los usuarios ven tus artículos y luego hacen clic en ellos. Digamos que
había cinco artículos enumerados, y una cantidad significativa de usuarios eligió el tercero
y fue a esa fuente. Entonces podremos empezar a determinar que esta fuente resulta
de confianza para un determinado tipo de información y con el tiempo empezamos a conocer qué publicaciones
son fuentes de confianza.Pero no para toda la publicación, esto se hace para secciones y categorías.
Algo como el Sporting News podría ser de mucha confianza para información sobre deportes,
pero quizás no tanto para negocios. Y el Wall Street Journal podría ser
de mucha confianza en los Estados Unidos para obtener información de negocios,
pero quizás no en India. Repito, estas fuentes de confianza tienen que ver con la sección y la adición.
Es una cosa muy específica lo que estamos buscando, por el comportamiento del usuario en general.
Así que estos son sólo 4 señales que usamos en la clasificación de artículos para la búsqueda de Noticias.
A continuación vamos a ver algunas preguntas frecuentes. Puede que te preguntes
"¿Qué beneficios tiene usar un sitemap de noticias?" Creemos que son beneficiosos tanto para nosotros
como para ti, como editor. Proporcionan un mayor control sobre qué
artículos aparecen en Google Noticias. Y por eso, como ya he mencionado antes,
ayudan a complementar el rastreo de detección y nos indica qué artículos son nuevos
y los artículos que hay que rastrear. En segundo lugar, los sitemaps de Google Noticias te ayudan a
proporcionar metadatos de los artículos. Así que en lugar de confiar en nuestro extractor,
puedes dar la fecha de publicación. Y en lugar de depender sólo de nuestro extractor para determinar
las categorías de tu artículo, tú mismo puedes dar buenas pistas utilizando el campo de palabras clave.
En general, pensamos que los sitemaps de noticias benefician mucho a los editores.
Otra pregunta frecuente es "¿Googlebot visita las URL más de una vez?"
Y la respuesta es sí, definitivamente podemos volver a rastrear URL para comprobar si hay
actualizaciones. Dando un paso atrás, en principio Google puede encontrar nuevo contenido en cuestión de minutos
tras su publicación. Y encontramos el nuevo contenido a través del rastreo para detección o mediante
el sitemap de noticias y tras la detección inicial vamos a comprobar si hay contenido nuevo.
El momento en que volvemos a rastrear varía,
pero es bastante seguro decir que volveremos a buscar nuevos contenidos dentro de 12 horas.
Así que lo encontraremos en cuestión de minutos y vamos a volver a rastrear
en 12 horas en busca de nuevo contenido. Puede que también te preguntes "¿Cómo
puedo optimizar mi contenido multimedia?" Es una buena pregunta.
Demos un vistazo a 2 tipos de contenido. En primer lugar, vídeos.
Se puede crear un canal de YouTube y enviárnoslos. Estamos intentando
incluir otros servicios de almacenamiento de vídeo, pero por ahora con Youtube tenemos una idea de
la experiencia de usuario, sabemos que el vídeo carga, etc. YouTube es una plataforma de confianza para nosotros.
Y si usas Youtube, recuerda que resulta muy útil incluir descripciones textuales ya que nos ayuda
a asociar un vídeo con el tema sobre el que trata.
Ahora vamos a hablar de las imágenes.
Tenemos cinco consejos que ayudarán a que se incluyan en la búsqueda de Google Noticias.
En primer lugar, utiliza una imagen de gran tamaño con un buen formato. En segundo lugar,
pon subtítulos descriptivos y texto alternativo. En tercer lugar, mantén una imagen cerca del título.
Esto nos ayuda a asociar una imagen con el tema que trata. En cuarto lugar,
quieres un buena imagen y bien colocada y no una versión en la que se haga clic.
Y por último, preferimos JPG. Si usas cosas como PNG, no resultan
tan útiles para Google Noticias como un JPEG. Así que definitivamente usaría JPEG
si quieres que se incluyan en Google Noticias.
La última pregunta es, por supuesto, "¿Qué hay del PageRank?"
Es un factor secundario en Google Noticias. Y tiene sentido, porque la estructura
de enlaces de un artículo que se publicó hace minutos no va a ser la misma que la de uno que
se publicó hace años o meses. Así que tenemos que utilizar el PR con
cuidado en Google Noticias. En lugar de utilizar señales como el PR, realmente se utilizan señales
como las que hablamos antes. Como la actualidad. ¿Es contenido fresco y nuevo?
¿Tiene relevancia local o personal? Ese tipo de cosas. Así que ahora
ue hemos hablado de cómo Google rastrea, agrupa y clasifica artículos y hemos respondido a algunas de preguntas
vamos a hablar ahora de prácticas recomendadas.
Es importante crear URL permanentes y únicas con un mínimo de 3 dígitos.
Y la razón de esto es que, tradicionalmente, los editores de noticias han utilizado id de artículo
un número en sus cadenas de URL. Y eso nos ha ayudado a determinar que se trata de
un artículo y no de una página HTML estática. Pero si tu sistema de publicación de noticias no
incluye cifras, al menos 3 para Google Noticias, entonces puedes enviar un
sitemap de Google Noticias. Es una solución. Si no disponemos de los 3 dígitos en tus URL,
puedes crear un sitemap de Google Noticias y hacernos saber que URL en concreto pertenecen a Noticias.
También se recomienda es no romper el cuerpo del artículo. Así pues, el
artículo de noticias debe tener párrafos secuenciales que puedan incluirse en Google Noticias.
No quieres romper esa estructura con comentarios de usuarios o enlaces a cosas relacionadas.
Eso no funciona muy bien en Google Noticias.
Vamos a tomar todos el artículos de esa primera página. Así que intenta no romper
el cuerpo del artículo. Una tercera práctica recomendada consiste en poner las fechas
entre el título y el cuerpo del artículo. Esto ayudará a nuestro extractor de fechas
a tener la fecha de publicación correcta. En cuarto lugar, los títulos son importantes.
Significa tener un buen título en HTML y en el artículo. Quieres que tu título indique claramente
de qué trata la historia. En quinto lugar, es mejor para Google Noticias
si separas el contenido de artículos de los comunicados de prensa. Y puedes hacer esto
con una estructura de directorios. Y esto ayuda a determinar que es un artículo de noticias
frente a lo que podría ser una sátira o un artículo de opinión o una nota de prensa.
Y el último consejo es crear contenido original e informativo. Siempre te ayudará a obtener una buena clasificación.
Cuanto más contenido original crees, y más usuarios disfruten de él, más usuarios
se enviarán allí y esto es una especie de respuesta a la idea de publicar sólo contenido de otras
personas o simplemente tener información duplicada. Insisto, a más información se publique para
todos nosotros, más gente podrás atraer a tu sitio.
Si tienes más preguntas, no dudes en visitar nuestro Centro de Asistencia para Noticias.
Muchas gracias por ver este vídeo.