Metadatos y SEO de contenidos para periodistas (3) · Datos estructurados, Google News y URL

Un resultado enriquecido de Google gracias al uso de metadatos por parte de las páginas web
Una nueva clase de metadatos permite a los buscadores generar fichas con contenidos procedentes de diferentes fuentes. En la imagen: página de resultados de Google

En esta tercera y última entrega (por el momento) de la serie dedicada a metadatos y SEO de contenidos trataremos una clase de metadatos que podemos considerar de nueva generación: los datos estructurados, ya que están vinculados con la web semántica.

Pero antes, nos ocuparemos de las palabras clave en las URL, de los metadatos para noticias denominados News-Keywords (actualmente en desuso) y, como en las otras entregas, revisaremos el uso del plugin Yoast SEO para considerar su implementación práctica.

METADATOS Y SEO DE CONTENIDOS


Palabras clave en las URL

Recordemos que una URL (por Uniforme Resource Locator) es el nombre técnico que reciben las direcciones de sitios y de páginas en internet. Por ejemplo: http://es.unesco.org/ es la URL de la página de la Unesco.

La cuestión es que en WordPress (como en la mayor parte de los CMS), cada entrada (podemos decir, cada noticia) es una página web independiente, y por tanto, con su propia URL.

La parte variable de la URL

A partir de aquí, la URL de cualquier página está formada por dos partes: una que es fija, formada por el nombre del dominio, y otra que es variable y depende de cada página individual.

Siguiendo con el ejemplo de la Unesco, en la siguiente URL:

http://es.unesco.org/themes/ciencia-al-servicio-futuro-sostenible/

hemos marcado en negrita la parte variable.

Por tanto, esta parte variable es una excelente oportunidad para añadir palabras clave, como vemos en el ejemplo de la Unesco. De hecho, Google considera que las palabras clave de la URL forman parte del contenido de la página. Por tal motivo, aunque con el tiempo es un factor que ha ido perdiendo peso, sigue siendo importante para el SEO.

Si nos vamos a un ejemplo del mundo de la comunicación y tomamos el caso del sitio de  la BBC, la parte fija sería http://www.bbc.com/. La parte variable, denominada slug en el argot informático, dependerá, como decimos, de cada entrada o página.

URL sin palabra clave

En algunos CMS, la parte variable se genera de forma automática mediante un símbolo de interrogación seguido de una clave o de un número. Por ejemplo, como en (URL ficticia): http://www.lainformacion.com/?p=123456.

Este tipo de URL variables son nefastas para la usabilidad, la visibilidad y el posicionamiento de las noticias porque pierden un factor de posicionamiento muy importante.

Buenas prácticas

En la captura siguiente vemos un caso mejor que el anterior porque al menos el nombre de la sección (entertainment-arts en el caso que hemos tomado como ejemplo) forma parte de la URL:

Ejemplo de uso de palabras clave en la URL de una noticia

Como en el caso anterior, marcamos con negrita la parte variable de la URL o slug, que es la que puede recibir la palabra clave:

http://www.bbc.com/news/entertainment-arts-40690349

En este caso, vemos el uso del nombre de la sección, Entertainment-Arts, como parte de la URL. No es un caso óptimo, porque lo lógico sería que la URL pudiera tener como palabra clave el título del filme del que habla la noticia, y no la sección.

URL óptima

Por tanto, aún son mejores las que incluyen además alguna palabra clave de la noticia, como en esta URL (ficticia): 

http://www.bbc.com/news/entertainment-arts-blade-runner

Por cierto, el número con el que suelen acabar las URL de noticias en muchos medios de comunicación solía obedecer a un requerimiento técnico de Google para que sea debidamente incluida en su índice de noticias (Google News, cerrado en España). Actualmente, ya no es necesario, por lo que si aparece este número todavía en algunas URL debe ser por motivos internos.

En WordPress, podemos elegir esta clase de URL de manera que incluyan las palabras clave del título, tal como muestra la captura siguiente:

Las dos formas preferentes son (alguna de) las dos últimas:

  • Nombre de la entrada (sin artículos) con lo que tendremos una URL de este estilo (real):

    https://observatoriocibermedios.upf.edu/chatbots-medios-publicos

  • Estructura personalizada, lo que permite añadir variables, por ejemplo, el nombre de la categoría, seguido del nombre de la entrada, como en esta URL (ficticia):

    https://observatoriocibermedios.upf.edu/television/chatbots-medios-publicos

Control de la parte variable de una URL con Yoast

El formulario de Yoast SEO para el snippet permite editar la parte variable de la URL de cada entrada. Esta parte variable recibe el nombre de slug.

Edición del snippet con Yoast SEO
El slug es la parte de la URL que podemos editar.

La idea es la siguiente, mediante la primera configuración hemos planificado como serán las direcciones (URL) de cada noticia, pero después, gracias al plugin Yoast podremos refinar el slug (la parte variable) de la URL de cada página si el resultado de aplicar la plantilla no es óptimo.

El consejo en este caso es cuidar de no sobreactuar, es decir, no cargar demasiado la URL con palabras clave, porque puede quedar una dirección muy larga, con lo que será muy poco manejable, e incluso puede llevar al algoritmo de Google a pensar que se trata de un caso de sobreoptimización SEO, lo que nos podría penalizar. En este caso, el plugin Yoast advierte cuando la URL puede quedar demasiado larga con su famoso sistema de semáforos, que veremos después.

Otro aspecto clave es el siguiente: una vez publicada una noticia es mejor no modificar el slug, porque estaríamos modificando la URL y, por tanto, estaríamos provocando la existencia de enlaces rotos.

 News_Keywords en Google News (en desuso)

MUY IMPORTANTE: en la actualización de Septiembre de 2019, mantenemos esta sección para evitar malentendidos, ya que es posible que alguien busque información sobre este apartado, pero lo cierto es que Google News ya no tiene en cuenta el metadatos news_keywords. Puede leerse aquí más información: https://searchengineland.com/google-drops-support-meta-news-keywords-tag-292493
Página principal de ayuda del índice especializado en noticias de Google News (cerrado en España)

Corresponde ahora considerar el metadato que constituye un caso muy especial. Primero, porque en teoría solo tiene efecto en el índice Google News (no en la búsqueda general, ni en otros buscadores). Segundo porque Google News en España está cerrado.

Además, debemos recordar que uno de los dogmas de los últimos años en el mundo del SEO es el que afirma que el metadato keywords, antiguamente en gran uso junto con description, carece de efectos en el posicionamiento.

Pero este dogma, tendría la excepción de este formato propuesto por Google, aunque solo para el índice de noticias, como hemos señalado. Como sea, es un metadato especializado para noticias, así que vamos a considerarlo.

En el anterior artículo, vimos que el código fuente para el metadato description se escribe como sigue (usamos el ejemplo de una crítica de la última película de Nolan publicada en El País):

<meta name=»description» content=»En la película de Christopher Nolan hay pocos diálogos; no los necesita ya que el lenguaje visual es muy poderoso» />

Pues bien, el metadato news keywords se puede añadir siguiendo la misma sintaxis, es decir utilizando meta como etiqueta y los atributos name y content, de este modo:

Metadatos para Google News
Clic para hacer zoom

El cambio está en usar un valor distinto  para el atributo name según si el metadato es description o si es news keywords (observése que en el código fuente las palabras news y keywords han de estar unidas por un guión bajo).

En concreto, sobre la forma de utilizar news_keywords, la ayuda oficial de Google decía lo siguiente (pero recordemos que ahora es un metadato en desuso):

Our crawler also makes use of a Google-specific metatag to help determine how to best classify your content. By implementing the news_keywords metatag you can specify which keywords are most relevant to your articles. For example, in an article about the World Cup you could add the following code to help Google News better understand the nature of your content:

<meta name=»news_keywords» content=»World Cup, Brazil 2014, Spain vs Netherlands»>

Keywords could also be used to help disambiguate between related terms. Again, if this particular publisher wanted to specify that this article reported on soccer’s World Cup — as opposed to rugby’s World Cup — then they could try the following:

<meta name=»news_keywords» content=»World Cup, Brazil 2014, Spain vs Netherlands, soccer, football»>

Plugins para metadatos

Hay plugins de uso general para añadir metadatos (meta tags, como suelen denominarse en este entorno) que utilizando la sintaxis ya vista, basándonos en combinar la etiqueta meta más los atributos name y content, y que nos permitirían añadir el metadato news keywords a cada noticia.

Un ejemplo de tal plugin es Meta Tag Manager. Sin embargo, una búsqueda con la palabra clave «meta tag» en el directorio de plugins de WordPress nos dará varias alternativas. El consejo es elegir entre los que tengan más instalaciones, mejores puntuaciones y muestren una actividad de actualizaciones frecuente. Personalmente, evito instalar cualquier plugin de cuya última actualización haga un año o más.

Plugin meta tag manager para añadir metadatos
Meta Tag Manager permite añadir cualquier clase de metadato con la etiqueta meta y los atributos name y content

Por otro lado, aunque muchos medios de comunicación, sobre todo los nacidos digitales, utilizan WordPress, muchas empresas de comunicación suelen utilizar CMS especializados en prensa o incluso desarrollos propios.

Datos estructurados y web semántica

schema es una clase de metadatos
Schema es un vocabulario para una nueva clase de metadatos de segunda generación

Por último, nos corresponde hablar de un nuevo tipo de metadatos que han nacido influidos por la web semántica, los llamados datos estructurados.

Aunque, a su vez, hay varias clases de datos estructurados, la que nos interesa para este artículo consiste en un tipo de metadatos que suelen codificarse de forma automática, tomando sus valores del contenido y del código fuente de cada página, con la posibilidad de añadir informaciones adicionales de forma automática o manual.

rich snippets
Resúmenes de resultados, denominados snippets. Las flechas señalan resultados enriquecidos. Las de la izquierda son rich snippets. La tarjeta de la derecha es un knowledge graph (clic para hacer zoom)

Una de las características más importantes de los datos estructurados es que están concebidos para que, no solamente los buscadores, sino cualquier otro tipo de software, pueda procesar y, eventualmente, entender de la forma más adecuada posible el significado, esto es, la semántica, del contenido de las páginas web.

Por tanto, los datos estructurados, al menos inicialmente, no estaban concebidos para impactar en los buscadores, sino para dotar a los ordenadores de la capacidad de relacionar  la información de diferentes páginas que traten de los mismos temas, y todo ello de una forma que simulase en lo posible el razonamiento humano.

Este era el objetivo del proyecto conocido como web semánticay que a día de hoy puede considerar parcialmente fracasado (o parcialmente conseguido, claro).

Knwoledge Graph de Leonardo da Vince
Un ejemplo de knowledge graph o gráfico de conocimiento en todo su esplendor. Lo muestra Google cuando hacemos determinadas búsquedas, como en este caso, la de un personaje histórico. Las flechas señalan relaciones, no siempre acertadas.

Como sea, este objetivo ha quedado lejos de cumplirse, pero lo cierto es que los buscadores lo han utilizado para poder presentar resúmenes enriquecidos (rich snippets) en los resultados de una búsqueda, así como para mostrar información directa en una clase de fichas o tarjetas conocidas como knowledge graph.

En la captura precedente podemos ver un caso de knowledge graph, que se presentan en un formato de tarjeta. En concreto, la tarjeta que hemos capturado muestra información sobre Leonardo da Vinci y datos relacionados de diversas fuentes que hemos señalado con flechas. Como podemos ver no siempre acierta: la conexión con otros pintores puede ser muy adecuada, pero la conexión con un actor contemporáneo se debe únicamente a la coincidencia del nombre.

Ahora bien, lo cierto es que a partir del uso de tales rich snippets, se ha detectado que los usuarios hacen clic con más frecuencia en los resultados enriquecidos. Por lo tanto, han acabado siendo un factor SEO indirecto.

Datos estructurados y vocabularios

La cuestión es que hay  una clase de datos estructurados que ha sido promovida y potenciada directamente por los principales buscadores (Google, Bing, Yandex y Yahoo). Se trata de los metadatos que utilizan un vocabulario denominado Schema.org.

Se denomina vocabulario, en el contexto de los metadatos, a un conjunto de pares propiedad-valor que sirven para representar información sobre entidades determinadas. Por ejemplo, para representar artículos de prensa, podemos tener la propiedad Sección y como valores posibles los nombres de las principales secciones: Política, Economía, Cultura, etc.

De este modo, si tenemos (a) una lista de propiedades como la indicada y otras como Autor, Fecha de publicación, etc., (b), una indicación de la clase de valores que cada propiedad puede adquirir, más (c) una formalización sobre la forma de expresar toda esa información en un página web o en un fichero informático, entonces tenemos lo que se denomina un vocabulario.

Estos vocabularios también se suelen denominar schemas e incluso se les puede conocer como taxonomías, aunque esta última denominación puede confundir.

Schema.org es una colección de tales vocabularios, denominados ¡schemas! En este caso, todos ellos están relacionados entre sí, y articulados y formalizados de la misma forma. Es decir, cualquier schema es un subsquema de otro, salvo Thing, que es el schema general (literalmente, «cosa») y los contiene a todos.  

Datos estructurado en la página de resultados

rich snippets
Los resúmenes que incluyen información adicional se denominan resultados enriquecidos o rich snippets.

La información que aparece en la página de resultados sobre cada una de las páginas web se denomina snippet, que puede traducirse como fragmento o resumen (en este contexto). Un snippet o resumen normal consiste en dos líneas de texto debajo de la URL y el título de la página. Cuando el fragmento incluye cualquier otro elemento, se dice que es un fragmento enriquecido o un rich snippet.

La captura precedente muestra un ejemplo de rich snippet en una página de resultados de Google. Para que el buscador haya enriquecido el resumen con un elemento como la valoración, por ejemplo, tal información ha debido ser codificada antes mediante datos estructurados con el vocabulario NewsArticle de Schema.org.

Cabe insistir en que el objetivo no es únicamente que los snippets aparezcan de forma enriquecida, cosa que es imposible de controlar, sino sobre todo que el contenido de cada página, o de cada noticias sea interpretado lo mejor posible por los buscadores, como muestra la captura siguiente.

Un fragmento de código fuente de un artículo de El País que utiliza datos estructurados.

Buena parte de la popularización reciente de esta clase de metadatos obedece a un doble motivo: el primero ya lo hemos indicado, a saber, su adopción por los buscadores. El segundo, y tal vez aún más poderoso motivo, es que los han empezado a incorporar de forma automática los temas de WordPress.

A primera vista, podríamos pensar que la influencia de los buscadores debería bastar, pero resulta que el propio Google ha declarado que añadir datos estructurados a una página no tienen influencia en su ranking de ordenación de resultados. Y Google tampoco garantiza que los vaya a utilizar en su página de resultados. 

Aclaremos esto: se pueden añadir datos estructurados a una página incluyendo, por ejemplo, las famosas estrellitas de valoración u otros datos y, sin embargo, esto no significa que Google se considere obligado a reproducirlos en su página de resultados. Que tales datos enriquecidos aparezcan o no es una función de su algoritmo que depende (se supone) de otros factores de autoridad o popularidad de la página para la palabra clave utilizada en la búsqueda.

Más arriba, hemos visto el caso de un resultado que mostraba datos de valoración del filme de Nolan porque Google debe considerar que la página en cuestión, Sensacine, tiene una gran autoridad en relación con el tema.

Por otro lado, añadir «a mano» los datos estructurados queda fuera del alcance de muchos editores de páginas web, ni es realista para sitios con una gran producción, por lo cual hasta hace relativamente poco tiempo el número total de páginas con datos estructurados era muy pequeño. Sin embargo, algunos cambios recientes, han hecho que su número se dispare hasta el 30 por ciento de las páginas según un análisis de finales del 2015, por lo cual el procentaje seguramente habrá aumentado.

El rol de los gestores de contenidos

Gráfico del rol de Schema.org en una página web
Los temas de un CMS, como WordPress, que incluyen metadatos Schema.org declaran de forma expresa el significado de cada sección de una página a los buscadores (Fuente: tema Schema de My Themes Shop)

Por eso decimos que, casi seguramente, la influencia más poderosa en el incremento reciente de su utilización, sobre todo en dos frentes distintos: comercio electrónico, por un lado, y noticias de prensa, por otro, ha sido el hecho de que los incorporen los gestores de contenidos.

En concreto, los temas de WordPress modernos (al menos los de mayor calidad) suelen incluir alguna versión, aunque sea muy genérica, de tales datos estructurados, tanto para la página principal como para cada entrada o artículo individual.

Además, los temas así diseñados suelen incluir metadatos para identificar las diferentes secciones de la página: cabecera, menús, etc., con lo cual los buscadores interpretan mejor las páginas web que los incluyen.

En la captura precedente hemos mostrado el caso de un tema que se denomina igual que el vocabulario (Schema), pero hay muchos otros que los implementan, sobre todo si se trata de temas de nueva generación. 

NewsArticle e información periodística

NewsArticle
Parte de la especificación del vocabulario Schema.org dedicado a noticias.

Sea como sea, parece que los datos estructurados cada vez van a tener más importancia en el SEO de contenidos, incluyendo sin duda el mundo de las noticias de prensa.

Precisamente, grandes medios de comunicación, como el New York Times, The Guardian o la BBC eran citados en el estudio mencionado, como algunos de los principales sitios en la publicación de páginas con datos estructurados.

En el conjunto de la web, su adopción no es tan universal ni su impacto en el SEO es tan decisivo como los que se han tratado en estos tres artículos de la serie, sin embargo ya vemos que  los principales medios de comunicación los están utilizando.

Datos estructurados para prensa

La cuestión es que uno de los schemas disponibles en Schema.org está dedicado específicamente a artículos de prensa, y recibe el nombre de NewsArticle. Se trata de una subclase de una clase más general denominada Article, que a su vez es una subclase de un schema més general aún denominado CreativeWork.

Si observamos el dato de la figura (Usage…), podemos ver que indica que el schema NewsArticle se utiliza en varias decenas de miles de sitios, presumiblemente, sitios de medios de comunicación.

Ahora bien, es importante entender que los datos estructurados, y concretamente, los que proceden de NewsArticle, no sustituyen los metadatos que hemos examinado hasta ahora, únicamente los complementan.

También cabe insistir en que su impacto, ni en el posicionamiento ni en la forma de aparecer en la página de resultados, está garantizado. Incluir datos estructurados no garantiza que Google vaya a posicionar mejor la página que los contiene, ni que su snippet vaya a reflejarlos convirtiéndose en un rich snippet.

De momento, es una especia de apuesta, porque casi todo apunta, como ya hemos dicho, a que su importancia aumentará en la valoración de Google. Como además, su añadido suele ser automático, el coste de la oportunidad de utilizarlos resulta ser cero (o casi).

metadatos schema en El País
Uso de metadatos Schema.org en una noticias. Utilizamos un plugin de Chrome para visualizarlos.

En próximas entregas los consideraremos con más detalle dado su importante papel en el futuro del SEO de contenidos en general y del SEO de medios de comunicación en particular.

Plugins para Schema.org

Plugin Schema para datos estructurados
Schema es un plugin (sí, tiene el mismo nombre que el vocabulario, no por casualidad) para generar datos estructurados

El plugin Yoast SEO aplica datos estructurados de forma automática para indicar informaciones básicas del sitio, como el nombre del mismo y eventualmente, sobre la navegación del mismo. Por su parte, ya hemos señalado que algunos temas de WordPress, sobre todo los más orientados al SEO, generan de forma automática datos estructurados de cada página web del sitio.

Google también proporciona algunas herramientas para la creación asistida de los datos estructurados, como Structured Data Markup Helper, aunque no soluciona el problema de los sitios con mucha productividad.

Existen también plugins independientes que permiten añadir datos estructurados de forma automática, semiautomática o totalmente «a mano» a cada entrada o página creada con un CMS, como en el caso de WordPress. La captura precedente muestra uno de ellos. Si hacemos una búsqueda en la página de plugins de WordPress con la palabra clave schema encontraremos algunos más: este enlace lanza esta búsqueda.

La forma de proceder en este caso consiste en añadir metadatos estructurados mediante un formulario que presenta el plugin junto a cada entrada o página de nueva creación. La ventaja de usar un plugin en lugar de usar los datos estructurados del tema es que podemos refinar mucho más la información. La desventaja es que requieren una inversión adicional de tiempo.

Otro problema logístico es que pueden entrar en conflicto con los datos estructurados que genera el tema instalado. Por eso, utilizar plugins independientes debe combinarse con una consideración de qué parte puede añadir el plugin sin entrar en conflicto con los que añade el tema. Por supuesto, si usamos un tema que no incorpora datos estructurados, entonces el uso del plugin es perfecto.

Los indicadores de Yoast SEO

Vistos los metadatos más importantes, podemos volver nuestra atención a uno de los aspectos más icónicos del plugin con el que hemos examinado los aspectos del SEO de contenidos. Se trata de su sistema de análisis mediante el uso de colores como en un semáforo: verde (bien), ámbar (correcto, pero puede mejorar), rojo (mal), así como unas lineas de texto con información sobre cada variable analizada.

Lo vemos en la siguiente captura:

El resultado de los análisis de Yoast en 13 indicadores

Podemos ver en la captura que utiliza 13 variables, aunque las versiones más recientes de Yoast SEO incluyen 15. En el ejemplo de la captura, que se refiere a esta misma página, vemos que 12 de los 13 indicadores están en verde, lo que indica que, en teoría, este artículo está muy bien optimizado para la palabra clave elegida (metadatos).

Únicamente tiene en rojo el indicador según el cual esta misma palabra clave ya se ha utilizado otras veces. Pero en el caso de sitios de contenido (no de comercio electrónico) tal cosa dista de ser un problema, razón por la cual ignoramos esa señal.

Ahora bien, es importante señalar una cosa: estos indicadores son inferencias que realiza el software de Yoast, y por tanto, de ninguna forma indican lo que «piensan» realmente los buscadores sobre esta entrada. Son una simulación, no la realidad.

Ahora bien, sin duda es una buena disciplina intentar que cada entrada obtenga la mayor parte de indicadores en verde, siempre que no nos obsesionemos con ello, y menos si conseguir alguno de estos semáforos en verde significa ir contra las normas de contenido periodístico.



Conclusiones

A través de los artículos de esta serie, hemos podido examinar una buena parte del SEO de contenidos centrándonos en una amplia variedad de metadatos.

Hemos podido comprobar el lugar central que los metadatos tienen, además, en el caso de las noticias. Y hemos revisado, en concreto, diversos tipos y lugares donde intervienen los metadatos (sin agotar las posibilidades):

  • Título
  • Descripción
  • Metadatos Facebook
  • Metadatos Twitter
  • Imágenes
  • Navegación
  • Taxonomías
  • URL
  • News_Keywords (en desuso)
  • Datos estructurados

El mundo de los metadatos, en realidad, es amplísimo. Hemos dejado de lado dimensiones completas de los metadatos. Por ejemplo, no hemos mencionado una clase de datos estructurados conocidos como microdatos. Tampoco hemos considerado, porque creemos que no es este su lugar, toda otra serie de metadatos, como los que generan automatícamente las fotografias digitales, o los relacionados con las preservación, la propiedad intelectual, etc.

En fin, estas conclusiones no son el mejor lugar para explicar las cosas que NO hemos tratado, pero queremos dejar constancia de la amplitud del tema. Lo que si nos deja esto claro es que hay margen para nuevos artículos sobre metadatos.

En todo caso, la revisión que hemos llevado a cabo a través de estos tres artículos creemos que es más que suficiente para tener una base inicial sobre los metadatos que resultan decisivos para el SEO de los medios de comunicación.

Se trata además, de todos aquellos que debe conocer un periodista  o un comunicador que sea consciente de la necesidad de tener una visión holística de los medios digitales y de su encaje en el contexto de internet.

Dicho de otro modo, creemos que un profesional de la comunicación no tendría en realidad una visión integral de la información periodística en Internet sin conocer aspectos como los revisados en estos tres trabajos.

Para saber más

Los otros dos artículos anteriores de la serie


[1]


[2]


¿Suscribirse?

Si le ha gustado este trabajo, ahora es el momento de considerar si desea suscribirse a este sitio para no perder las nuevas entregas cuando reanudemos las publicaciones en septiembre.