Análisis comparativo Google Académico vs Microsoft Academic: el caso del periodismo inmersivo

Fuente: Flaticon

Google Académico (o Scholar, en denominación internacional) y Microsoft Academic son actualmente los dos principales buscadores a nivel internacional de información académica y científica. 

El reciente paso de Microsoft Academic a una versión estable después de un largo período de cambios y «versiones preview«, justifica su comparación con Google Académico.

Para llevar a cabo esta comparación hemos adoptado el caso de un investigador interesado en el estudio del periodismo digital, o de los cibermedios. Preferimos partir de un caso concreto para poder utilizar un mismo conjunto coherente de palabras claves y tener una base realista con la que hacer comparaciones.

Nuestro caso consistirá en la realización de una misma búsqueda en ambas bases de datos. El tema en este caso lo definimos como la necesidad de estudiar aspectos relacionados con el periodismo inmersivo. Además, como ecuación de control, añadimos una mucho más genérica sobre periodismo digital en general (online journalism).

A continuación, mostramos las  ecuaciones de búsqueda con las que haremos las comparaciones:

N.Ecuación
1«online journalism»
2«immersive journalism»
3«immersive journalism» AND «augmented reality»

En una revisión sistemática, necesitaríamos otras ecuaciones para expresar todas las dimensiones de la investigación, ya que en las anteriores no hemos utilizados palabras clave sobre metodologías, ámbito temporal o marco teórico. Sin embargo, para una primera comparación entre los dos sistemas pensamos que es suficiente.

La ejecución de las anteriores búsquedas (8 de septiembre de 2017) en cada uno de los buscadores proporciona los siguientes resultados en cuanto al número de documentos encontrados:

NGoogle 
Académico
Microsoft 
Academic
115.900747
221612
3584

Cabe señalar que, en el caso de la ecuación n. 3, para hacer las búsquedas, hemos sustituido el operador correspondiente por un espacio en blanco (la ausencia de operadores es utilizada por los dos buscadores como un operador AND).

Resultados cuantitativos

Los resultados cuantitativos no dejan dudas. Es evidente que la cobertura de Google Académico es mucho más amplia. No obstante, obtener 15 mil resultados no siempre es mejor que obtener 700.

Lo que queremos decir, es que, en primer lugar, nadie va a leer 15 mil resultados, ni siquiera los 700. Lo que marca de verdad la diferencia es la relevancia de, por ejemplo, los 50 primeros resultados en cualquiera de los dos casos.

En segundo lugar, pudiera ser que la mayor parte de los 15 mil resultados fueran irrelevantes y, en cambio la mayor parte de los 700 fuera relevante.

Pero no nos entusiasmemos con tener menos resultados, porque también puede marcar diferencias importantes las opciones de de ordenación o de filtrado que pueden conseguir que, tener muchos resultados sea también igual a tener los más relevantes en las primeras posiciones.

Por lo tanto, un número de resultados más abultado, por sí solo no es necesariamente mejor ni peor, aunque debemos reconocer un sesgo inicial a favor de la mayor cobertura, porque un resultado mayor, con un adecuado sistema de cálculo de relevancia y opciones de ordenación y filtrado, sí puede ser mucho mejor.

En el caso que nos ocupa, Google proporciona una combinación de tipología de documentos que puede ser útil en algunas ocasiones, e inútil en otras. Por ejemplo, tal vez no nos ayude mucho encontrar una variedad de referencias impresas, capítulos de libro, informes, etc., si lo que queremos específicamente son artículos recientes en revistas indexadas.

En todo caso, el tipo de resultados que permite mejores comparaciones son los que arrojan unas cuantas decenas en lugar de unos cuantos centenares o miles. Como es el caso de las ecuaciones 2 y 3, que también son, todo hay que decirlo, más realistas, porque se supone que es más realistas buscar el cruce de dos o más conceptos (como en la ecuación 3), o un concepto especializado (como en la 2), y no uno solo y muy general (como en la ecuación 1).

Resultados cualitativos

Con el fin de  tener una comparación de tipo más cualitativo, vamos a comparar la primera página de resultados de las ecuaciones 2 y 3 en cada uno de los dos buscadores. 

Para apreciar mejor los resultados, se puede hacer clic en las capturas de pantalla y se verán a tamaño real.

«immersive journalism»

Para esta comparación veremos la primera página de resultados de cada uno de los dos buscadores con la palabra clave «immersive journalism».

Google Académico

La primera página de resultados de Google Académico
La primera página de resultados de Google Scholar para «immersive journalism». Clic para hacer zoom

Observaciones: la mayoría de los artículos parecen muy relevantes, tres de ellos, de facto, contienen la palabra clave en el título, una excelente indicación de su relevancia. Uno de los resultados, el sexto (empezando desde arriba) es un falso positivo. Los tres últimos son referencias (citas) encontradas en otros documentos, que sin duda aporta pistas relevantes, por lo cual lo podemos considerarlos acertados.

Podemos concluir, por tanto,  juzgando por el título y resumen, que nos encontramos con 7 aciertos sobre 8, si comparamos sobre la base de los 8 primeros para igualar resultados con Microsoft, que solo muestra 8 resultados en su primera página. Vemos, adicionalmente, que los otros 2 también serían relevantes, por lo tanto, serían 9 sobre 10.

Microsoft Academic

Primera página de resultados en Microsoft Academic
Primera página de resultados en Microsoft Academic para «immersive journalism». Clic para hacer zoom.

Observaciones: Todos los resultados en el caso de Microsoft son muy relevantes ya que en todos ellos la palabra clave aparece en el título, pero los dos últimos están repetidos. Por tanto, registramos 7 aciertos sobre 8.

Es interesante observar que coinciden con la lista de Google solamente 3 de los documentos.  Es decir, solamente 3 de las 18 referencias (10+8) son comunes a ambas listas.

«immersive journalism» AND «augmented reality»

 

Google Académico

Páginas de resultados de Google Scholar
Página de resultados de Google Académico para «immersive journalism» «augmented reality»

Observaciones: en el caso de búsquedas para temas muy específicos es cuando podemos apreciar la ventaja de los sistemas que tienen una mayor cobertura. En cuanto a la relevancia, solamente en cuatro de ellos aparecen las dos palabras clave. Podemos considerar una tasa de acierto de 4 sobre 10.

Microsoft

Páginas de resultados de Microsoft Academic
Páginas de resultados de Microsoft Academic para «immersive journalism» «augmented reality»

Observaciones: en el caso de Microsoft, que solamente entrega 4 resultados, podemos considerar que los cuatro son falsos positivos ya que, aunque en el primero vemos una de las palabras clave, en ninguno de ellos vemos el uso de ambas.

Limitaciones

Es evidente que usar un solo tema y tres ecuaciones de búsqueda, no permite extrapolar nada a otros ámbitos. No sabemos, por tanto, si en otras especialidades se aprecia también una mayor cobertura relativa por parte de Google Scholar, aunque es presumible que puede darse una pauta parecida en general en Ciencias Humanas y Sociales, ya que otras pruebas (no sistemáticas) arrojan diferencias de cobertura a favor de Google Scholar.

Sin embargo, sin pruebas adicionales para cada especialidad, no se puede afirmar nada. Aquí nos hemos limitado a una «cata». Si alguien estuviera interesado en llevarla más lejos debería escalar este tipo de pruebas.

Conclusiones

Estas pruebas iniciales nos dicen que, al menos en el ámbito del periodismo digital y en alguna de sus tendencias, como el periodismo inmersivo, Google Scholar aporta claramente una mayor cobertura.

La razón puede deberse a una  política deliberada por parte de Microsoft Academic de limitar su cobertura al caso de artículos de revista, mientras que Google Scholar, en cambio practica una política omnicomprensiva, consistente en abarcar toda clase de documentos académicos, no solamente artículos.

Para algunas necesidades de información e incluso para algunos ámbitos es posible que la política de Microsoft Academic pueda ser efectiva, porque menos información pero muy relevante, siempre es mejor que mucha información, pero llena de ruido. Lo primero siempre nos puede ser útil, por más que sea solo de forma parcial, lo segundo es letal.

No hemos comparado aspectos de la búsqueda avanzada por la sencilla razón de que Microsoft Academic no los contempla. En nuestra opinión, esto es un claro déficit por parte de este último.

Nuestra opinión es que deberían dejar de lado los consejos de marketing y no temer al uso de un buscador avanzado. Los usuarios académicos no van a retroceder en el uso de un sistema por el hecho de tener delante un formulario. Claro que yo soy un pésimo consejero en temas de marketing.

Otra carencia de Microsoft Academic es que no dispone de un sistema de administración de alertas. En cambio, entre sus indudables puntos fuertes está el de un atractivo diseño, muy centrado en el usuario, así como diversas funcionalidades e interacciones vinculadas con la presentación de la información en forma de tarjetas  y con el perfil del usuario.

Veremos cómo evoluciona este sector de la búsqueda, tan interesante y necesario para los académicos. Nos conviene mucho que Google no esté solo en este ámbito, y por tanto, esperamos que Microsoft vaya mejorando progresivamente. Si esto, además, espolea a Google para seguir mejorando también, solo tendremos cosas que ganar y el mundo será un poquito mejor.

Anexo – Enlaces directos a los mejores resultados encontrados en las pruebas

Para el lector interesado en el tema que hemos usado para las pruebas, a continuación las referencias más relevantes que hemos encontrado:


 Icon made by Freepik from www.flaticon.com