Buscabilidad, Visibilidad y Hemerotecas Digitales: SEO como Optimización de la Experiencia de Búsqueda

buscabilidad y visibilidad son parte del nuevo SEO en la variada web actual

Considerar la buscabilidad (y no solo la visibilidad) aporta una mirada más amplia que el SEO clásico y más acorde con la diversidad de la web actual (Fuente: Pixabay. http://bit.ly/1Szt65B)

Buscabilidad y Visibilidad son dos aspectos relacionados, pero distintos y a la vez de importancia crucial para los sitios intensivos en contenidos, en especial para los Cibermedios. Como ambos términos parecen referirse a lo mismo, pero no es el caso, probablemente sería útil intentar aportar una clarificación de estos conceptos, en especial, dada su vinculación con dos de nuestros principales objetos de interés: los cibermedios y sus hemerotecas digitales.

Para ello, hemos querido recordar que, aunque es sabido que las siglas SEO nacieron como las iniciales de Search Engine Optimization, existe un movimiento actual entre algunos analistas y estudiosos que es partidario que signifiquen, de forma mucho más adecuada a la realidad actual, Search Experience Optimization (ignoramos el origen exacto de esta propuesta, por nuestra parte la primera vez que tomamos contacto con ella fue con los prestigiosos informes de la empresa Searchmetrics)

Un nuevo SEO

En lo que sigue, intentamos aportar algunas ideas al respecto, para lo cual empezaremos por considerar qué aporta el cambio de Engine por Experience. Es evidente que el primer efecto es del ampliar el campo de visión. En la web actual, con la gran diversidad de fuentes de información a disposición de los usuarios, centrarse en los motores de búsqueda tiene cada vez menos sentido.

Ciertamente, ni siquiera en el nuevo SEO puede dejarse de lado a los buscadores, ya que tienen un papel de primer orden y llevan a cabo una labor tan necesaria que, como suele decirse, si no existieran habría que inventarlos.

Lo que sucede es que ahora, como hemos señalado, el panorama es mucho más amplio. Por un lado, las redes sociales como Facebook y Twitter desempeñan un factor enormemente importante en el ecosistema informativo de la web. Por otro lado, cada vez más los sitios intensivos en contenidos como los cibermedios, las universidades y los museos, aportan una enorme riqueza informativa debido seguramente a la influencia tanto del SEO como del marketing basado en contenidos. Esto significa que los buscadores internos de esta clase de web son cada vez más necesarios e importantes.

Con el SEO antiguo, parecía que solo importaban la visibilidad, es decir que el sitio fuera muy visible en la página de resultados del buscador . Pero esto, en realidad, nunca ha sido cierto. La búsqueda interna, como complemento a la navegación, en sitios intensivos en contenidos, siempre ha sido de vital importancia.

Por todo esto, cuando consideramos la optimización de la experiencia de búsqueda (en lugar de la optimización para buscadores), entran en juego otros factores, puesto que la búsqueda constituye un ecosistema más amplio en el que participan, entre otros:

  • La recuperación de información en otros contextos diferentes de la web (p.e. en la hemeroteca digital de un cibermedio)
  • La navegación por la información, en contextos dentro y fuera de la Web, y por tanto, la Arquitectura de la Información
  • El desarrollo y aplicación de metadatos para la representación de diversas propiedades de la información
  • El uso de taxonomías y otros  recursos de la semántica documental para mejorar, precisamente, la experiencia de usuario

Buscabilidad, Visibilidad y Cibermedios

Para centrarnos en la comparación entre la pareja conceptual buscabilidad versus visibilidad, usaremos la siguiente tabla con una propuesta para sus respectivas definiciones, y añadimos la de cibermedios para evitar confusiones:

Buscabilidad

El conjunto de funciones que un cibermedio pone a disposición de sus usuarios para permitirles llevar a cabo funciones de búsqueda retrospectiva de información publicada por el propio medio. Una forma de entender la buscabilidad desde el punto de vista de su realización operativa es pensar en las opciones de búsqueda y recuperación de información de la Hemeroteca del propio medios. Utilizamos buscabilidad por adaptación del término findability, propuesto por Peter Morville.

Visibilidad

La facilidad relativa con la cual la producción periodística aparece en las plataformas de distribución de noticias, principalmente en buscadores. Una forma practica de concebir la visibilidad en considerarla en relación, pero no únicamente, con aspectos de SEO (Search Engine Optimization). 

Cibermedios

Término del ámbito académico para referirse tanto a los medios tradicionales, pero en su dimensión digital, como a los medios nacidos digitales. Es un término frecuente en el ámbito académico, como decimos, para evitar expresiones compuestas o simplemente incorrectas, como “edición web de un diario”, “diarios electrónicos”, “prensa online”,  “prensa digital”, etc. Equivale al término ingles “online newspapers”.

Una nueva dimensión en la responsabilidad de los cibermedios

Algunos entendemos que, a medida que los medios devienen cibermedios (esto es, devienen medios de comunicación eminentemente digitales), aparece una nueva responsabilidad de los mismos hacia sus usuarios o lectores, e incluso hacia sus propios periodistas profesionales. Esta nueva responsabilidad se refiere a la buscabilidad de su producción y se concreta en la calidad del sistema de búsqueda de sus hemerotecas (ponemos en cursiva lo de nueva, porque en realidad solamente es nueva si empezamos a considerarla o a reclamarla ahora, pero siempre estuvo ahí).

Parece algo simple: si un cibermedio genera su producción periodística en forma digital, resulta que la buscabilidad es uno de los atributos potenciales inherentes de este formato. En cambio, una página impresa no permite tal cosa ni siquiera cuando se “digitaliza”. Para poder proceder a buscar en contenidos de tales páginas facsímiles es necesario transformarla en un formato “digital” real, es decir, es necesario transformar una imagen unitaria (el facsímil de la página) en un conjunto de caracteres indizables y por tanto buscables.

Esta responsabilidad recae o se pone de especial manifiesto en la hemeroteca digital de cada cibermedio. Si esta hemeroteca no permite expresar de forma adecuada las necesidades de información de sus usuarios y si en consecuencia presenta resultados que irrelevantes, simplemente no cumple su función.

elpais2

Ejemplo de buscabilidad fallida en un Cibermedio. Una búsqueda por el apellido de un periodista de El País (pongamos que no recordamos el nombre de pila) no es capaz de proporcionar una lista de sus artículos. Como no hay búsqueda parametrizada, estamos castigados con una lista llena de ruido (el nombre es Jacinto, por si se lo preguntan)

La cuestión es que un simple chequeo de sus posibilidades reales suele dejar más frustración que otra cosa cuando intentamos buscar información en las hemerotecas digitales de los cibermedios de nuestro país. Con frecuencia, es más eficaz buscar en Google indicando el servidor del cibermedio en cuestión (a través de una búsqueda parametrizada). Pero incluso esta medida es inútil si lo que deseamos es encontrar información retrospectiva de una cierta “antigüedad”, aunque tal antigüedad sean unos pocos meses (o semanas), no digamos años.

Carece de toda lógica que se convierta en una odisea, por mencionar un caso sencillo, acudir a la hemeroteca de un cibermedio de referencia como El País o La Vanguardia, e intentar encontrar una lista de los artículos publicados por un determinado redactor o autor mediante una operación de recuperación de información.

lavanguardia

Página de resultados de La Vanguardia. La búsqueda es “Mayo 68”. Tampoco tenemos búsqueda avanzada como tal, pero al menos, destaca alguna opción de búsqueda por rangos de fechas y varias utilidades y funciones de búsqueda adicionales. Por cierto, el diseño de la página no parece que vaya a ganar ningún premio. Por cierto, el problema con el texto superpuesto en la cabecera es del navegador, Firefox. En otro navegador, por ejemplo, Chrome, el resultado aún es peor. Síntoma probablemente de una hoja de estilo, o de un código HTML (o ambos) mal resuelto.

Ciertamente, podemos encontrar esa lista por navegación, si se produce la circunstancia de estar delante de un artículo de ese autor. En ese caso, hacer clic en el nombre del autor nos puede llevar a la lista deseada. Pero prueben a usar la búsqueda simple desde la página principal del medio (la avanzada no suele existir) e incluso a ir a la página de búsqueda (elpais.com/buscador/) y se volverá en muchos casos una operación frustrante porque estará llena de ruido.

El motivo es que la mayor parte de las hemerotecas de los cibermedios parecen ignorar los principios más elementales de la recuperación de información, y por tanto, ignoran las funciones más elementales que debe cumplir un buen formulario de búsqueda. No contemplan ni la búsqueda parametrizada que permitiría restringir las búsquedas a un campo determinado (p.e. autor) ni apenas ninguna otra facilidad o utilidad para garantizar que su producción sea buscable ante necesidades de información mínimamente complejas, o simplemente tan realistas como conocer solamente el apellido de un autor.

No digamos si buscamos noticias sobre alguien (personaje, autor, lo que sea) cuyo apellido es también el nombre de una ciudad (como por ejemplo, es el caso del periodista José Luis Barcelona): ¿sin búsqueda avanzada cómo le “decimos” a la hemeroteca del medio que es un nombre de persona, y no un topónimo lo que buscamos? Sin un buen sistema de consulta es imposible.

Ilustración de un caso

Las siguientes capturas ilustran el  caso mencionado, consistente como hemos señalado, en buscar artículos publicados en un cibermedio (en este caso El País) sobre un periodista cuyo primer apellido coincide con el nombre de una ciudad (Barcelona), para ilustrar  las enormes limitaciones de las hemerotecas digitales, incluso en algunos medios de referencia.

Captura 1a Ilustración de la ecuación de búsqueda en el Archivo de El País. Podemos ver que hemos entrado el nombre compuesto y el primer apellido del periodista en cuestión en la caja de búsqueda correspondiente (en la página de resultados, el Archivo/Hemeroteca, pasa a llamarse Buscador, sin duda una pequeña muestra de confusión conceptual: ¿es un archivo, es un buscador, es una página de resultados?).

elpais3

La búsqueda en El País. La primera noticia es un caso de acierto, pero no así las siguientes

Captura 1b Página de resultados anterior algo más ampliada, sencillamente demuestra con mayor claridad su inutilidad para este caso.

elpais5

Página de resultados un poco más ampliada de la misma búsqueda de la Captura anterior. Vemos que es muy poco clara y altamente ruidosa para una búsqueda basada en el nombre de un persona con un apellido que coincide con el de una ciudad. La primera noticia contiene, ciertamente, una referencia al periodista. Pero tal cosa no aparece destacado de ninguna forma. Una comprobación de las siguientes noticias nos demuestra que el resto de ellas no tienen nada que ver con el periodista en cuestión. Al menos las de la primera página de resultados (que es la única que revisan los usuarios antes de decidir que la búsqueda ha fracasado)

Captura 2 de la misma búsqueda, como elemento comparativo. En este caso, la página de resultados de Google, donde podemos ver porqué parece ser el preferido por la mayor parte de los usuarios.

google

Google, en su intento de comprender todo el rango de las posibles intenciones del usuario combina datos no deseados en este caso, pero incluye un cuadro sinóptico muy destacado sobre el periodista como parte de los primeros resultados.

¡Un momento!, se dirán ustedes, ¿y si El País jamás publicó nada más sobre este periodista aparte de esa noticia referida (“50 años de TV con acento catalán”)? Tal vez por eso presenta una página de resultados con tan poca información relevante y con tanto ruido. Claro, podría ser (yo también me lo pregunté) pero esta posibilidad queda desmentida por la captura siguiente.

Captura 3. Una búsqueda en Google con el comando “site” permite restringir los resultados al servidor de El País (en este caso) y vemos que este medio publicó al menos varias decenas de noticias sobre el periodista en cuestión.

google2

Además de encontrar con facilidad  14 noticias en El País sobre el periodista en cuestión, el resumen (snippet) de cada noticia no deja lugar a dudas que contiene información sobre el mismo (hemos señalado algunos de los resultados solamente, pero en todos hay información de contexto que destaca el nombre buscado). Obsérvese que Google ha añadido comillas para rodear el nombre. En este caso, no lo hemos hecho nosotros expresamente, sino que nos limitamos a usar el formulario de búsqueda avanzada de Google, y fue el sistema el que interpretó que toda la cadenas de caracteres debía considerarse de forma conjunta.

 Conclusiones

Aunque solo hemos mostrado aquí dos casos, por estudios anteriores (ver al final la mención a la tesis del Dr. Guallar) debemos concluir que los medios de comunicación, incluidos medios de referencia, fallan en relación con su compromiso de calidad por lo que hace a sus hemerotecas, y por tanto, en lo que hace a la búsqueda retrospectiva. Es decir, a su compromiso con la calidad cuando se trata de acceder a informaciones que van más allá en el tiempo (hacia el pasado) de la mera actualidad.

Una deficiente implementación de los sistemas de búsqueda de las hemerotecas de los medios conduce a una labor más pobre o más difícil para quienes necesiten recuperar informaciones periodísticas retrospectivas, ya sean simples (o nada menos) ciudadanos interesados en algún aspecto del pasado o profesionales de la comunicación, o académicos intentando hacer mejor su trabajo gracias al input de tales informaciones.

Es por esto, que consideramos que, dándole la vuelta al problema, una adecuada implementación de la buscabilidad debería formar parte  del concepto de calidad en un cibermedio, ya que es la expresión (o la falta de ella) de un compromiso (o la falta de él) con los usuarios en la defensa de su derecho a la información. Este derecho no puede agotarse en el acceso a la información de actualidad presente en la página principal, sino que debe extenderse a la información retrospectiva.

La producción de un cibermedio queda recogida de forma unificada únicamente en la hemeroteca del propio cibermedio. No existe el caso de archivos impresos que conserven esa producción. Ciertamente, existen bases de datos comerciales de prensa que también incluyen esa producción (veáse MyNews, Factiva o LexisNexis).

Pero son sistemas cerrados, y la primera responsabilidad es del propio medio.  En este sentido, muestran poco compromiso con sus lectores y con la sociedad cuyos intereses dicen defender si no son capaces de dotar de un mínimo de calidad a sus hemerotecas. Solo podemos preguntarnos si sus propios redactores deben acudir a Google cuando necesitan recuperar información publicadas por ellos mismos en el pasado.

Como contraste positivo, la siguiente captura del formulario de búsqueda avanzada de la hemeroteca digital de The Guardian.

the Guardian

Parte de la página de búsqueda avanzada de la hemeroteca digital del diario The Guardian. Podemos ver, entre otros, los impagables parámetros (o campos) Author y Headline, garantía de búsquedas con resultados mucho más relevantes, además de opciones de ordenación

Por último, señalar que es una referencia obligada la página del Dr. Javier Guallar sobre Evaluación de Hemerotecas y Videotecas Digitales en la que el lector interesado podrá encontrar enlaces a su amplia producción sobre el tema y a su tesis doctoral (que tuve el honor de codirigir con el Dr. Ernest Abadal de la UB), así como también enlaces y referencias a obras de otros autores que han trabajado también alrededor de estos conceptos.

Anexo

En nuestro grupo hemos probado a añadir alguna letra extra para diferenciar al SEO que corresponde a la idea del Engine, del SEO que corresponde a la idea de la Experience, pero nos aparece entonces como SEXO (por eXperience) como acrónimo; o SEXPO, con lo que no sabemos qué es peor. En el contexto anglosajón, algunos autores utilizan  SXO. Si se generalizara sería una solución, pero creo que de momento no se entendería. Por tanto, de momento, lo dejamos en SEO, pero con la idea de que, de no decir lo contrario, para nosotros el SEO es siempre es el de Search Experience Optimization.