Microsoft Academic en el ecosistema de la información científica: análisis de la versión 2019

Microsoft Academic
Portal Microsoft Academic 2019. Clic para acceder

Microsoft Academic es una base de datos académica, abierta, multidisciplinar y polidocumental, con un buen número de innovadoras soluciones en el diseño de la interfaz, que se presenta como una alternativa razonable a otros sistemas de información científica.


Edición Septiembre 2019


Antes de pasar a revisar su rol en el ecosistema académico, así como el diseño de la interfaz, conviene revisar los atributos que hemos utilizado para su definición:

  • Base de datos académica: en efecto, ya no podemos considerar a Microsoft Academic como un «simple» buscador; desde hace algún tiempo se ha ganado el calificativo pleno de base de datos, por la composición de su colección, el uso de metadatos y otras características que examinaremos.
  • Abierta: aunque nos beneficiamos de recursos adicionales si abrimos una cuenta, Microsoft Academic es gratuita, en cualquier modo de utilización. En esto, difiere radicalmente de Scopus y WoS, y se iguala a Google Scholar.
  • Multidisciplinar: porque cubre el rango completo de disciplinas académicas, lo que incluye humanidades y ciencias sociales, que es nuestro núcleo de interés.
Tipología de documentos en Microsoft Academic
Cantidad total de documentos y tipología en Microsoft Academic (Julio 2019)
  • Polidocumental: es la forma de describir a la nueva generación de bases de datos que incluyen una amplia diversidad de producción académica desde el punto de vista de su naturaleza documental.
  • En concreto, Microsoft Academic incluye (1) libros, (2) capítulos de libro, (3) comunicaciones a congresos, (4) patentes y (5) artículos de revistas científicas, además de una categoría (6)»otros» de la que no especifica el formato, pero suponemos incluye documentos en repositorios académicos. En todo caso, la categoría más amplia (con un 38%) corresponde a artículos de revistas científicas, mientras la menos representada corresponde a libros y capítulos de libro (con un 2%).

Primera Parte
Microsoft Academic en el ecosistema de la información académica

Para poder decidir, hasta que punto Microsoft Academic ha pasado a ser una alternativa razonable no sólo frente a Google Scholar, sino también frente a otros sistemas, incluyendo los que requieren una suscripción de pago, como Scopus y WoS, primero hemos de conocer cuáles son las funciones de los mismos.

Este análisis, por tanto, será de naturaleza doble. En concreto, antes de revisar las funcionalidades y los aspectos de diseño de la interfaz, queremos revisar cuál es el rol que Microsoft Academic puede jugar en el ecosistema de la información académica.

Componentes de un sistema de información académica

Gracias a nuestros análisis previos, podemos decir que los principales componentes y funciones de un sistema de información académica, siempre desde el punto de vista de los intereses de un investigador o de su institución, son, en forma de diagrama, los siguientes:

Diagrama de un sistema de información académica
Diagrama general de un sistema de información académica. Fuente: elaboración propia

La explicación breve de los componentes anteriores es la siguiente:

  1. Búsqueda: formularios y lenguajes para expresar necesidades de información.
  2. Análisis: métricas y altmétricas a nivel de artículos, publicaciones y autores, así como del conjunto de documentos recuperados, en su caso.
  3. Perfiles: de investigador, de publicaciones y de instituciones, con facilidades de edición, difusión, etc.
  4. Alertas: definición y gestión de diversos tipos de alerta.
  5. Utilidades: funciones adicionales, como guardar búsquedas, crear listas, facilidades de exportación, difusión u otras.

Funciones

En lo que sigue, desarrollamos cada uno de los apartados anteriores mostrando sus componentes funcionales con un mayor nivel de detalle, ya que nos hará falta para calibrar las comparaciones que seguirán después:

  1. Búsqueda
    1. Booleana
    2. Parametrizada
    3. Mixta
    4. Filtros o facetas (en página de resultados)
    5. Opciones de descubrimiento (en registros o página de resultados)
  2. Análisis
    1. De los resultados de una búsqueda
      • Métricas y distribuciones de los resultados recuperados
      • Análisis de citas del conjunto de resultados recuperados
    2. Independientes
      1. Métricas de publicaciones
      2. Métricas de artículos
        • Factor de impacto
        • Altmétricas
      3. Métricas de Autores
      4. Métricas de Países
      5. Métricas de Áreas de conocimiento
      6. Métricas de Instituciones
  3. Perfiles
    1. De investigador
      • Afiliación
      • Gestión del perfil
      • Reclamación de autorías
      • Unificación de identidad
      • Seguimiento, difusión, etc.
    2. De Publicaciones
    3. De Instituciones
  4. Alertas
    1. De temas
    2. De documento
    3. De publicación
    4. De autor
  5. Utilidades
    1. Guardar y gestionar búsquedas
    2. Generar y operar con listas de resultados
    3. Facilidades de exportación

Fiabilidad

Hemos de añadir también el principio de la fiabilidad en nuestros análisis. En efecto, no basta con la existencia teórica de las funciones. Debido al funcionamiento totalmente automatizado y, al parecer, carente de supervisión, puede suceder que las funciones estén presentes, pero su ejecución sea de fiabilidad variable.

El soporte documental a la investigación es una misión crítica, y por tanto, los organismos que se ocupan de proporcionar tal soporte, notablemente, las bibliotecas universitarias, deben actuar con enorme prudencia en este sentido, lo cual presiona hacia la contratación de sistemas que, aparentemente, pueden solaparse, aunque sea solamente en parte.

Comparaciones

Como sea, en las siguientes tablas mostramos una serie de comparaciones entre Microsoft Academic y los otros tres sistemas de referencia principales que vamos a tomar como elementos de comparación:

Funciones

Empezaremos por el mapeo de funciones entre Microsoft Academic, Google Scholar y Scopus/Web of Science siguiendo el esquema anterior:

Funciones/
Sistemas
BúsquedaAnálisisPerfilesAlertasUtilidades
Microsoft
Academic
***ND*
Google
Scholar
************
Scopus/
WoS
*************************

Explicación de la tabla

  • Otorgamos la máxima puntuación (5 estrellas) a las bases de datos Scopus y WoS porque presentan la totalidad de las funciones y en un grado de desarrollo máximo.
  • Por otro lado, el motivo de la única estrella que recibe Microsoft Academic en todos los apartados (en lugar de las tres que recibe Google Scholar), es porque las funciones están mucho menos desarrolladas y además, como veremos, presentan problemas de fiabilidad.
  • En concreto, la búsqueda en Microsoft Academic es extremadamente limitada, tanto en lo que hace a flexibilidad como a número de opciones para el usuario.
  • Lo mismo sucede con otros elementos como los perfiles de autor debido a problemas clásicos de control de autoridades en grado agudo.
  • Por último, ND, por No Disponible, señala una carencia total de la función, cosa que como puede verse ya no se presenta en ningún apartado de Google Scholar, por contraste con Microsoft Academic donde aún hay una función no implementada y sin embargo de enorme importancia, a saber, las Alertas.

Es evidente que estas valoraciones tienen un componente subjetivo difícil de evitar. Tome el lector estas valoraciones con las debidas precauciones, pues corresponden a un juicio personal (que creemos fundamentado, eso sí), pero juicio personal al fin.

Fiabilidad

En cuanto a fiabilidad de funciones (ejecución efectiva de las funciones teóricas) y de datos (consistencia de los resultados), nuestra apreciación (basada en pruebas no sistemáticas) es la siguiente (después pondremos ejemplos):

SistemaFiabilidad
global
Microsoft Academic***
Google Scholar****
Scopus/WoS*****

Podemos ver que hemos marcado a Microsoft Academic con la puntuación relativa más baja, con un 3 sobre 5, mientras que hemos otorgado la máxima al grupo Scopus/WoS que tratamos como una unidad en este caso, y con un 4 (sobre 5) a Google Scholar. En el caso de Microsoft es evidente que su menor fiabilidad corresponde a su producción y mantenimiento sin ninguna (o apenas ninguna) supervisión humana.

La máxima puntuación de Scopus/WoS corresponde a la superior y contrastada fiabilidad de los datos y métricas de estas dos bases, aunque es evidente que no están exentas de problemas.

Pero además de esta mayor fiabilidad, ejercicio de una mayor supervisión humana (fruto sin duda del hecho de ser herramientas de pago), actúa en su favor los mecanismos de corrección y feedback en manos de los autores para solicitar adscripciones de documentos o la unificación de nombre y el uso mas consistente de claves de identificación (mediante ORCID, p.e.).

Por su parte, Google Scholar se sitúa en una cómoda situación intermedia gracias a la mayor eficacia relativa de su sistema de gestión, a pesar de ser mayoritariamente también no supervisado, hasta donde sabemos.

Mejoras en los perfiles de autor

Los autores solemos comprobar nuestro propio perfil en los sistemas de información cuando los usamos la primera vez, como una forma elemental de ponerlos a prueba.

Una explicación es que, si el sistema en cuestión no es capaz de proponer un reflejo mínimamente fiable de nuestra propia producción (que es la que conocemos mejor), no tenemos demasiados motivos para pensar que, en cambio, lo hará bien con los demás.

Otra explicación es el simple ego. Quédense con la que prefieran. Pero esto es justo lo que hicimos para empezar a testear: buscarnos a nosotros mismos y los resultados fueron altamente inconsistentes, como se mostrará.

Solución de inconsistencias

La cuestión es que en unas semanas, Microsoft Academic parece haber solucionado al menos algunas de las inconsistencias. En concreto, donde hace unas semanas indicaba 0 citaciones para nuestro propio perfil, ahora ha restituido las métricas de citación.

Es una mejora que debemos reconocer. En ausencia de pruebas sistemáticas, al menos lo que podemos decir es que el error que nos afectaba personalmente está solucionado. Espero que esto corresponda a algo extrapolable al conjunto de Microsoft Academic.

Ficha de un autor en Microsoft Academic
Perfil en Microsoft Academic del autor de esta entrada

Esto último coincide con el que proporciona Google Scholar, aunque en este caso a partir de los datos de casi 3 mil citaciones para un total de 358 documentos (disculpas por el uso reiterado de nuestro propio caso, pero no solo es el autor que conocemos mejor, sino que tratar con datos equivocados sería delicado aplicarlo a otro investigador, que podría sentirse molesto).

La «antigua ficha» de este autor

Ficha de un autor
Ficha de un autor

Un paso adelante y un paso atrás

Microsoft Academic ha mejorado en diversos aspectos, pero ha retrocedido en otros. Ha recuperado la fiabilidad (o eso esperamos) en aspectos importantes, pero ha cedido en aspectos relacionados con la búsqueda.

Inconsistencias en los resultados de búqueda

Por su parte, las siguientes capturas muestran las inconsistencias en las búsquedas. Veremos que la suma lógica (OR) no funciona bien, pero tampoco hay nada que advierta que no puede usarse. Todo parece indicar que el lenguaje de consulta no admite operadores de algún tipo, pero no está indicado en ningún sitio.

Captura 1: frase

Una búsqueda simple, con una frase, proporciona 110 documentos.

Captura 2: operador booleano

Ahora, la misma búsqueda con un término añadido y combinado con on OR debería dar el mismo resultado anterior o superior. Por pura lógica booleana (matemática) nunca puede ser menor.

Captura 3: Frase

Para salir de dudas, vemos que el segundo término aporta 783 resultados. Por tanto, la suma de los dos términos es imposible que arroje una cantidad inferior a cualquiera de los dos por separado.

Captura 4: múltiples términos sin operadores explícitos

La posible respuesta es que Microsoft Academic siempre utiliza un AND implícito en todas las búsqueda, sin posibilidad de modificar o de modular el uso de operadores. Un fallo importantísimo que impide resolver necesidades de información mínimamente complejas.

La búsqueda de nuevas soluciones

El empeño en justificar el eslogan: «investigar más, buscar menos», supuestamente apoyado en el uso de búsqueda semántica, sea lo que sea que signifique esto, limita las posibilidades reales de hacer búsquedas unitarias capaces de resolver todo el rango de problemas de información que pueda tener un investigador.

Research more, search less
El lema que marca la política de Microsoft Academic

Ciertamente, llevar a cabo diferentes búsquedas y cruzar manualmente los resultados puede funcionar, pero no proporciona la misma eficiencia. El uso de los filtros de la página de resultados, también puede compensar la inexistencia de un formulario estándar de búsqueda avanzada, pero solo en parte.

Como sea, el interés en buscar nuevas formas de búsqueda que sean transparentes al usuario, esto, es que no hagan necesario conocer los operadores booleanos, concretamente, es muy legítimo.

Bienvenido todo lo que, ahora o más adelante, haga más intuitivas las búsquedas, pero no a costa de retirar completamente las formas más tradicionales, pero todavía más eficientes que las nuevas.

Banco de pruebas

Es evidente, que al ser un producto que no genera ingresos (es gratuito y no incluye publicidad) debe estar considerado un banco de pruebas para sus ingenieros para experimentar con un caso real sus algoritmos de análisis y de representación de información.

El problema es que, hasta que no se encuentre y no se demuestre la eficacia de un nuevo sistema, es poco eficiente retirar la posibilidad de usar la búsqueda convencional.

Otros sistemas de información, lo que hacen en estos casos es ofrecer las dos interfaces: la más fácil e intuitiva, a fin de estudiar sus posibilidades, y también la avanzada y convencional para quien lo desee. Esta simple solución la podemos ver en los mejores sistemas, con una caja de búsqueda simple, bajo la cual hay un enlace a la búsqueda avanzada.

Contenidos

En cuanto al número de documentos y publicaciones, los de Microsoft Academic están entre los más altos, con 225 millones de documentos y casi 50 mil revistas en total, si los comparamos con Scopus y WoS, pero está bastante por debajo de Google Scholar, con un total estimado para esta última de casi 390 millones de documentos (Gusenbauer, 2018).

Los datos de la siguiente tabla están tomados del trabajo de Gusenbauer salvo para Microsoft Academic que los hemos actualizado con los que propone la propia plataforma (no hemos podido hacer lo mismo con las demás, pero tampoco podíamos mantener desfasado el dato de Microsoft), con lo cual la base de comparación no es consistente, pero las dimensiones relativas creemos que quedan bien expresadas.

SistemaNúmero
de documentos

(Millones)
Microsoft Academic223
(2019)
Google Scholar389
(2018)
Scopus72
(2018)
Wos68
(2018,
Core Collection)

De todos modos, las diferencias relativas pueden variar mucho entre disciplinas, por ejemplo, Medicina y disciplinas relacionada (Biología, p.e.) suelen estar representadas de manera más uniforme entre distintos sistemas de información. En cambio, en Ciencias Humanas y Sociales suele haber muchas más diferencias y sin pruebas sistemáticas concretas esta diferencia no es fácil de determinar de manera precisa.

La tipología de contenidos que podemos encontrar en los sistemas de información académicos, a partir de los análisis que hemos ido publicando en este sitio, son los siguientes:

  • Artículos de revista
  • Comunicaciones (congresos)
  • Capítulos de libro (y libros, en su caso)
  • Patentes
  • Informes/preprints (repositorios)
  • Tesis
  • Otros: convocatorias de ayuda, ensayos clínicos, casos, materiales didácticos, vídeos, etc.

Comparación

ArtículosCom.Cap.L.PatentesInformesTesisOtros
Microsoft A.+++++
Google S.+++(*)+(*)+++
Scopus/
WoS
++++

Por su parte, la comparativa de la tipología documental, deja claro que el único de los sistemas que contempla todo el espectro es Google Scholar, aunque esto es así siempre que tengamos en cuenta que Google utiliza índices separados para las patentes, Google Patents y libros, motivo por el cual hemos marcado esas celda con un asterisco.

En el otro extremo, Scopus y WoS es el más limitado. A cambio, el espacio de búsqueda de estos es el más fiable, ya que se centra en las fuentes de mayor autoridad y prestigio.

Discusión

Si podemos tomar como indicadores el conjunto de las tablas anteriores a la hora de considerar la capacidad de Microsoft Academic de fungir como alternativa a los sistemas considerados, la respuesta corta es aún no.

No es la alternativa definitiva, ni a Google Scholar por el mayor número de documentos de este último, ni por la menor funcionalidad en comparación con los otros dos sistemas.

El factor coste

La respuesta larga es que la gratuidad (aunque es esto se iguala con Google Scholar) es un elemento muy potente en cualquier decisión. En el caso de países y organismos con escasez de recursos, utilizar Microsoft Academic, junto con Google Scholar, puede actuar como sustitución razonable de las costosas bases de datos académicas Scopus y WoS.

La misma base de comparación, en cambio, nos señala que en el caso de instituciones que dispongan de financiación suficiente, bases de datos como Scopus y WoS (y otras) aportan aún una diferencia importante con funcionalidades exclusivas de .gran valor añadido, como son la selección de las fuentes (no presente, al menos en el mismo grado en Google ni en Microsoft), las funciones avanzadas de búsqueda, las utilidades y los potentes análisis que proporcionan

Por lo tanto, es indudable que cualquier centro de investigación que se lo pueda permitir tenderá siempre a contar con el uso de Scopus y de WoS, dado que, hoy por hoy, siguen siendo unos instrumentos de apoyo a la investigación de una potencia y calidad formidables y, por el momento, sin alternativas del todo equivalentes como hemos visto.

El modelo freemium

Otra cosa es que podemos esperar que la influencia de Microsoft Academic y de Google Scholar, empuje hacia unas tarifas más accesibles e, incluso, ¿porqué no? a alguna forma de apertura de las bases de datos mencionadas, mediante modelos de negocio freemium (opciones básicas gratuitas, y avanzadas o complementarias, de pago).

Este modelo freemium debería conducir a que al menos las funciones más básicas de Scopus y WoS estén disponibles en forma abierta, algo que ya está sucediendo en forma incipiente.

Segunda Parte
Interfaz de usuario Microsoft Academic


Además de los aspectos de cobertura y fiabilidad funcional, en este sitio nos interesa, y mucho, las interfaces de los sistemas de búsqueda y recuperación de información.

Por tanto, en esta segunda parte llevaremos a cabo una revisión amplia de tales aspectos, con mayor motivo porque es aquí donde Microsoft Academic aporta sus mejores bazas, con propuestas innovadoras y de gran utilidad.

Todas las capturas se llevan a cabo tras un inicio de sesión, que es la forma de utilizar esta clase de sistemas que siempre recomendamos.

Página principal

Página principal de Microsoft Academic
Cabecera de Microsoft Academic con inicio de sesión

La organización de la página principal es una de los puntos fuertes principales de Microsoft Academic, así como nuestra un giro importante en el público de las bases de datos.

Cuando accedemos a esta base de datos, da por supuesto que el usuario es un investigador, y por eso la interfaz está calculada para proporcionarle la información más útil como tal:

  • Novedades relacionadas con su ámbito (noticias y congresos, p.e.)
  • Nuevas citaciones recibidas de sus publicaciones
  • Nuevas publicaciones en los temas que sigue

En el pasado, en cambio, las bases de datos se diseñaron pensando en documentalistas, esto es, en personal técnico de bibliotecas y centros de documentación.

Las bases de datos Scopus y WoS aún mantienen esta herencia en el diseño de su página principal, pues apenas cambia su composición un vez un investigador inicia sesión. La diferencia es que tiene acceso a una gama amplia de prestaciones adicionales.

Citaciones recibidas

Datos de la página principal de la base de datos
Como parte de la página principal se incluyen las citaciones recibidas más recientes

El diseño centrado en investigadores (y no solo en personal técnico de la biblioteca o el centro de documentación) queda de manifiesto en esta pestaña que solo tiene sentido si el usuario es, también, autor de documentos.

Búsqueda y página de resultados

Búsqueda y página de resultados Microsoft Academic
La búsqueda y la página de resultados se fusionan

Por su parte, la búsqueda, al carecer de un formulario avanzado, se integra en la misma página de resultados. Esta está muy bien organizada y con componentes funcionales principales bien distribuidos.

Como aspecto diferencial vemos una columna a la derecha con datos esenciales de la palabra clave cuando corresponde a un ámbito bien definido de investigación, como es en este caso.

Arriba, a la derecha, hemos señalado el icono que representa unas comillas (al lado de la foto del usuario). Es donde tendremos que hacer clic para poder exportar los resultados.

Resultados individuales

Primera referencia/registro de la página de resultados

Cada resultado individual dispone de un tratamiento completísimo, como hemos procurado ilustrar con esta captura detallada.

Exportación

Exportación
Opciones de exportación tras marcar algunos resultados

Cuando marcamos uno o más registros, tenemos acceso a las opciones de exportación que, como podemos ver, contemplan varios formatos y opciones de salida.

Para obtener esta ventana emergente, es necesario hacer clic en el icono de la parte superior derecha de la página de resultados que muestra el icono de unas comillas:

Registro (1)

Vista parcial del registro: referencia, resumen y palabras clave

Cada resultado individual dispone de un enlace para ampliar los datos accediendo al registro completo del documento. En las siguientes capturas mostramos el resto de componentes.

Registro (2)

Vista parcial del registro: palabras clave y botones asociados

Entre los botones asociados al registro, vemos algunos sumamente significativos, como el que permite añadirlo como seguimiento, reclamarlo si somos los autores y no figura asignado a nuestro perfil y el de compartirlo.

Registro (3)

Vista parcial del registro: documentos que recibe el artículo

Registro organiza la información en pestañas. Una de ellas recoge las citas que ha recibido el documento presentado en el registro.

Filtros de la página de resultados

Uno de los filtros de la página de resultados son las fuentes (puiblicaciones)

La página de resultados presenta determinados filtros, uno de ellos especialmente útil muestra las fuentes (esto es las publicaciones), de modo que no solamente podemos ver qué revistas son más importantes en el tema de la pregunta, sino que podemos limitar los resultados por las revistas de nuestra elección, gracias a las casillas de verificación de cada revista.

Búsqueda de autores

El mismo autor considerado como autores diferentes

La búsqueda ha sido siempre sorprendentemente conflictiva. Últimamente, los dos sistemas que parece haberla resuelto mejor son Google Scholar y Scopus. Microsoft Academic, en cambio, presenta algunos de los peores problemas, como mostramos en la captura precedente.

Uno de los principales problemas de Microsoft Academic es lo que podríamos llamar el registro de autoridades. Un mismo autor puede estar tratado como cuatro (o más) autores distintos, cada uno de ellos con datos diferentes, a pesar de que el nombre y el apellido coinciden totalmente.

Por otro lado, no hemos encontrado ninguna forma para reclamar a la base de datos que considere estos diferentes hipotéticos autores como uno solo. Hay un procedimiento aparente para reclamar las diferentes autorías, pero no se consolidan en una misma ficha.

Perfil de un autor (1)

Hemos visto que al hacer una búsqueda por nombre de autor, el sistema puede devolver una lista de candidatos, tratados como diferentes autores, aunque sea el mismo en realidad. En este caso, hemos optado por ver la ficha más completa que era la que aparecía también como primera opción.

Perfil de un autor (2)

Publicaciones de un autor

La ficha de autores incluye a través de sendas pestañas la lista de obras producidas por el mismo, y la de citas recibidas.

Perfil de un autor (3)

Obras que citan al autor considerado

Perfil de una publicación

Como podemos ver, las publicaciones también disponen de una ficha con datos básicos de producción y de citaciones, y dos botones muy importantes:

  • FOLLOW, para poder seguir la publicación (que en la captura lo vemos como UNFOLLOW porque el usuario está siguiendo esta publicación);
  • SEE ALL PAPERS, para tener acceso a la lista de todos los artículos de la publicación que constan en la base datos.

Una aclaración importante, es que FOLLOW no actúa como una alerta, es decir, no vamos a recibir un correo electrónico cada vez que aparezca un nuevo número, sino que sirve para las novedades de la página principal, que están adaptadas a cada usuario en caso de que inici sesión.

Topics Analytics

Citation Matrix
Citation Matrix de Microsoft Academic

Un interesante componente experimental de Microsoft Academic es el que denominan Topic Analytics. Forma parte,a su vez, de su denominado Microsoft Knowledge Graph. Un instrumento que apoya los índices del producto que analizamos, pero también de otros, como Bing.

En la captura precedente vemos una interesante Citation Matrix que ofrece datos de citación cruzada entre disciplinas.

Materias: Comunicación

Trending Topics
Trending Topics

Otro de los componentes del Topic Analytics es el gráfico denominado Trending Topics. Otra aportación innovadora y sumamente interesante, pero por desgracia difícil de explorar, porque no admite búsquedas por palabras clave. En su lugar, se puede explorar solamente por filtrado sucesivo de las materias que forman parte del mismo.

En la captura, vemos el gráfico correspondiente al camino Top level > Sociology > Communication.

Authors Analytics

Parte de la sección Author Analytics

Por su parte, la sección Author Analytics relaciona materias (Topics), autores, fuentes e instituciones. Es una sección de indudable interés, pero como en el caso anterior, es especialmente difícil de explorar porque no admite búsquedas por palabras clave.

Institutions Analytics

Perfil de CSIC en Microsoft Academic

Por último, sucede algo parecido con los análisis de instituciones. No es posible utilizar palabras clave (el nombre de la universidad, por ejemplo). En su lugar es necesario recorrer el árbol de temas y vemos para cada uno, las cien primeras.

En conjunto, Topics Analytics, Author Analytics e Institutions Analytics, qué duda cabe de que son instrumentos no solamente innovadores sino muy valiosos pero como hemos ido señalando están fuertemente limitados en sus opciones de exploración.

Conclusiones

Hay que reconocer y celebrar las continuas mejoras e innovaciones que viene presentando Microsoft Academic desde los últimos dos años, frente al mucho mayor inmovilismo de Google Scholar.

En el siglo XXI necesitamos sistemas de información académica que sean realmente innovadores y que incorporen más potencial del mundo digital y de la ciencia abierta. En este sentido, la labor de Microsoft Academic es ejemplar.

Algo se mueve

También cabe reconocer su esfuerzo por aplicar potencial de computación a la mayor parte de las tareas que deben resolver estos sistemas, desde la recuperación hasta la vinculación de datos, pasando por su interesante y prometedor Topics Analytics y otros similares, parte de su ambicioso y no menos interesante Microsoft Academic Graph que está siendo utilizado por otros buscadores académicos, como es el caso de Semantic Scholar.

Cabe mencionar que todas estas iniciativas están relacionadas con la denominada Open Academic Society, impulsada entre otros por Microsoft Academic y por AMiner, otro buscador académico, en este caso impulsado por la Tsinghua University.

Disfunciones e inconsistencias

No obstante, esta interesante política basada en la automatización extrema sin supervisión (o con supervisión mínima) presenta factura en forma de diversas disfunciones y limitaciones importantes en el caso que nos ocupa. Sin duda, irán mejorando progresivamente, pero de momento, aquí están.

En concreto, hemos visto que limitaciones e inconsistencias en diversos apartados, y cuyo grado de importancia o de amplitud desconocemos, dado que no hemos hecho pruebas sistemáticas. Pero lo que si es fácil detectar es que los problemas parecen significativos, tal como hemos mostrado con ejemplos concretos.

El problema principal

No obstante, desde el punto de la interfaz de usuario, el problema más grave, al menos desde nuestro punto de vista, es la inexistencia de una búsqueda avanzada al confiarlo todo a su búsqueda semántica.

Es antigua, en realidad, la desconfianza por diseñadores y programadores en la búsqueda booleana y parametrizada. La teoría dice que son formas de búsqueda disuasorias para los usuarios que, en general carecen de formación en estos aspectos.

En concreto, se culpa a la búsqueda booleana de ser anti intuitiva y a los formularios muy detallados de ser disuasorios para los usuarios. Sin embargo, en el caso de los sistemas de información académica, estamos hablando de misiones críticas y de usuarios que distan de ser aficionados.

Por tanto, hasta que otras formas de recuperación de información más transparentes sean realmente efectivas, es una pésima solución impedir que usuarios bien entrenados, o profesionales de la documentación, como el personal de la Biblioteca, pueda utilizar la búsqueda avanzada.

Descubrimiento progresivo

Muchos sistemas lo que hacen es poner en primer plano la búsqueda simple, pero añadir un discreto enlace a un formulario de búsqueda avanzada, en aplicación del principio de descubrimiento progresivo, propio de las interfaces mejor diseñadas.

Según este principio, inicialmente no es necesario mostrar todas las funciones, sino que se van ofreciendo de modo progresivo solamente a aquellos usuarios que las demandan, precisamente porque saben usarlas.

Balance

Como balance final, recuperamos algunas ideas que ya hemos avanzado: solamente podemos alegrarnos de que Microsoft siga innovando con su sistema, y esperamos que los problemas principales, al ritmo de cambios que parecen llevar, queden pronto bien resueltos.

Lo mejor, con diferencia, de Microsoft Academic son la mayoría de los diseños de su interfaz, con excelentes soluciones, como el registro, el tratamiento de materias o la página principal de la base de datos. Lo peor, la inexistencia de un formulario de búsqueda asistida y otras limitaciones similares en la búsqueda de instituciones y autores.

Anexo: ¿base de datos o buscador?

¿Donde acaba el buscador y dónde empieza la base de datos? Hasta ahora un criterio posible era la existencia de metadatos organizados en un registro complejo. Otro criterio era el control de la colección de datos. Ambas cosas, propias de las bases de datos y ajenas a los buscadores.

Un buscador utiliza metadatos internos, pero no los organiza en un registro complejo ni los muestra al usuario. Un buscador tampoco controla la colección, sino que rastrea la web y copia el contenido para crear sus índices, pero la información primaria puede desaparecer y dar lugar a enlaces rotos.

¿Microsoft Academic es un buscador o una base de datos? Si alguna vez fue un buscador, creemos que ahora ya se puede considerar una auténtica base de datos por derecho propio.

Para saber más


Con esta entrada cerramos el curso 2018-2019. Reanudaremos la publicación de nuevos análisis a partir del 26 de agosto. Próxima entrada prevista: Revisión de Nuzzel, un agregador de noticias con gestión de newsletters.

Suscríbase a este sitio: ver la opción en la barra lateral derecha o al pie, para recibir un aviso de las próximas publicaciones en su correo.