OpenAlex: ¿una alternativa a Scopus y Web of Science?

Cabecera de la plataforma web OpenAlex. Clic para acceder

OpenAlex es presentada a veces como la base de datos académica que puede sustituir a otras bases de datos, como Scopus o Web of Science. En lo que sigue pretendemos examinar esta posibilidad.

¿Qué implica ser una alternativa?

Para esta comparativa, consideramos que decir que X es una alternativa para Y implica que X desarrolla las mismas funciones que Y o que las supera, en este caso podemos decir que X subsume las funciones de Y. Con una tercera posibilidad, a saber, que haya una relación de complementariedad. A partir de aquí, podemos preguntarnos si OpenAlex, en relación a Scopus y WoS:

  1. Desarrolla las mismas funciones
  2. Subsume sus funciones, esto es, incluye las mismas funciones, y además añade nuevas
  3. Presenta funcionalidades diferentes y complementarias en lugar de sustitutivas.

Por último, desde un punto de vista lógico en esta clase de relaciones, puede darse la posibilidad siguiente:

  1. Presenta menos funciones.

Si es el caso que se diera 1 o 2, es evidente que OpenAlex podría sustituir a bases de datos como Scopus o Web of Science y de paso a otras como Google Scholar.

Si el caso es que se da la posibilidad 3, sería un recursos intrínsecamente valioso, sin necesidad de constituirse en alternativa de otros sistemas, sino que tendría sentido por sí mismo, al tratarse de un sistema complementario.

Pero si el caso que se da 4, esto es, si sus funcionalidades son menores, entonces, sin dejar de ser un recurso valioso, no podría predicarse de OpenAlex que tiene la capacidad para sustituir a las bases de datos mencionadas.

Podemos avanzar que, al menos con nuestros criterios de análisis, la relación expresada en 1 o 2, NO se produce. Esto es, OpenAlex aún siendo un recurso muy valioso, no aporta más funciones, ni tampoco iguala las que encontramos en Scopus o WoS (siempre en base a nuestros criterios)



La ciencia abierta es importante

La ciencia abierta es uno de los empeños más nobles de la humanidad de los últimos años, perfectamente alineable en importancia y dignidad con otros empeños como los derechos humanos.

Pero esta defensa y este empeño no puede hacerse en contra ni de la realidad ni de la eficiencia de la investigación científica, porque entonces lo único que haremos es ponerla en riesgo. Si la ciencia abierta produjera una ciencia peor, entonces estaría traicionando sus objetivos.

Decir de lo que es que no es, o de lo que no es que es, es falso, mientras que decir de lo que es que es, o de lo que no es que no es, es verdadero. Aristóteles

Por cierto, cabe señalar que OpenAlex dispone de una opción de pago, lo cual ilustra de paso la idea que a veces señalamos de que «no existen los almuerzos gratis» ni siquiera en la ciencia abierta.

Criterios para un análisis comparativo de bases de datos académicas

¿Cuáles son los criterios que manejamos para el análisis comparativo de OpenAlex con Scopus?

Lo primero que vamos a señalar es que, contrariamente a algunos análisis, no vamos a considerar la amplitud de la cobertura. El motivo lo expondremos después con cierto detalle.

En este análisis lo que nos interesa es el diseño de la interfaz y las funciones, o dicho de otro modo, lo que se puede o no se puede hacer con OpenAlex y con Scopus recurriendo a sus respectivas interfaces de usuario y en función de unos criterios determinados. El uso de criterios distintos, por supuesto, podría dar otros resultados.

En nuestro caso, vamos a utilizar los siguientes criterios:

  • Búsqueda avanzada. ¿Dispone de un formulario que permite representar la clase de necesidades de información complejas, características de una revisión de la literatura de tipo sistemático?
  • Descubrimiento de información. ¿Ofrece análisis que permiten recuperar información que no sea dependiente de las palabras clave?
  • Página de resultados. ¿Qué elementos y funciones aporta?
  • Evaluación. ¿Permite evaluar y eliminar falsos positivos del resultado en base al examen de título, resumen y palabras clave?
  • Análisis. ¿Ofrece alguna clase de análisis de los resultados en base a una diversidad de distribuciones de datos?
  • Fuentes de información. ¿Selecciona, evalúa o lleva a cabo alguna estimación de la calidad de las fuentes que aportan los inputs para sus resultados?
  • Servicios vinculados con el perfil de usuario. ¿Ofrece la posibilidad de registrar un perfil de usuario y asociar servicios al mismo, como servicios de alerta, guardar listas o búsquedas, etc.?

Por supuesto, ya hemos dicho que otros criterios pueden arrojar resultados diferentes, pero nosotros apostamos por estos porque, en nuestra opinión, representan uno de los núcleos duros del trabajo científico. En concreto, están vinculados con procesos de búsqueda para llevar a cabo revisiones de la literatura como base para nuevas investigaciones y como parte de la auténtica naturaleza acumulativa de la ciencia.

Escenario: necesitamos ciencia basada en la evidencia

Para la comparativa, usaremos Scopus (podríamos usar indistintamente Scopus o WoS, pero por facilidad de uso optamos por la primera). Lo que haremos es simular una necesidad de información muy característica de investigadores que necesitan obtener la base de la evidencia para llevar a cabo un trabajo de revisión.

En estos trabajos siempre se buscan resultados de investigaciones que hayan superado algún proceso de evaluación. Es decir, se buscan artículos publicados en revistas científicas.

Esta necesidad de información lejos de ser exótica, es de amplio espectro entre los investigadores, porque los trabajos de revisión están en la base de importantísimos escenarios:

  • Producción de tesis doctorales
  • Apertura de nuevas líneas de investigación
  • Preparación de memorias para solicitar financiación de proyectos nacionales o internacionales.
  • Revisión de la eficacia de intervenciones en el ámbito de la salud, la educación, las políticas sociales, etc.
  • Revisión de la situación y características de un ámbito de conocimiento
  • Determinación de las características de un frente de investigación

No son tareas exóticas. Miles o decenas de miles de investigadores en todo el mundo tienen que llevar a cabo tareas así de forma rutinaria. No es trivial que una base de datos esté en condiciones (o no) de darles soportes. Al contrario, es una cuestión vital para la producción de la ciencia.

Artículos de investigación

Es esta clase de escenarios, no sirve cualquier tipología documental. La que se requiere específicamente es la información que reporta resultados de investigaciones, esto es, literalmente, requiere:

artículos de investigación publicados en revistas científicas.

Necesidad de información para la comparación

Suponemos una necesidad de investigación sobre inteligencia artificial y periodismo. Vamos a suponer que el equipo de investigadores ha preparado esta simple ecuación de búsqueda (la búsqueda real requeriría una ecuación aún más compleja, pero por simplicidad para las comparaciones la consideramos suficiente):

«artificial intelligence» AND (journalism OR newspapers)

A continuación. haremos una comparación de diseño de la interfaz y de funciones disponibles entre Scopus y OpenAlex.

ANÁLISIS COMPARATIVO


Para este análisis comparativo haremos capturas de pantalla comentadas de las funciones comparables de cada sistema. La mayor parte de las capturas muestran con elocuencia las funciones respectivas, pero añadiremos anotaciones o comentarios en caso necesario.

Búsqueda avanzada · Scopus

Interfaz de consulta avanzada de Scopus

La interfaz de consulta de Scopus permite añadir tantas filas como conceptos sea necesario intersectar entre ellos. En este caso, tenemos dos conceptos como parte de la simulación. Además, el formulario permite seleccionar campos diferentes para cada concepto así como otros parámetros. Sigue un pattern muy bien asentado desde hace años en el diseño de las bases de datos, fruto de investigaciones con usuarios.

Campos búsqueda y parametrización en Scopus

Campos de búsqueda de Scopus

Cabe señalar que las opciones mostradas disponen de un desplegable. Implica que cada categoría incluye diversos campos, como vemos en la primera de ellas, que está desplegada.

Búsqueda avanzada · OpenAlex

Caja de búsqueda de OpenAlex con filtros desplegados

OpenAlex carece de un formulario de búsqueda avanzada. En su lugar el usuario debe plantear de forma directa la ecuación de búsqueda en la caja habilitada al efecto. No es posible seleccionar campos. La búsqueda siempre busca en todos los campos. Pueden ser añadidos, no obstante, los parámetros adicionales que muestra la captura.

Campos de búsqueda y parametrización de OpenAlex

Campos de OpenAlex para búsquedas de documentos

No hay elección de campos en OpenAlex. Dado que no hay un formulario donde mostrarlos, acudimos a la documentación técnica de OpenAlex.

Podemos ver que las búsquedas siempre se llevan a cabo contra el título, resumen y texto completo, esto es, en definitiva, contra todo el documento, sin posibilidad de parametrizar la búsqueda por campos.

Página de resultados · Scopus

La página de resultados de Scopus con parte de sus funciones destacadas. Podemos ver opciones de ordenación, de exportación y de descargas entre otras. También podemos ver la posibilidad de añadir los resúmenes en la página de resultados, así como una opción muy importante de buscar documentos relacionados.

Hemos de señalar que hay aún otras funciones que hemos dejado de lado, para centrarnos en las más significativas. Véase el dato del número de referencias recuperadas (203) porque lo trataremos después.

Páginas de resultados · OpenAlex

Página de resultados de OpenAlex

La página de resultados de OpenAlex no puede mostrar resúmenes. Las opciones se limitan a conmutar algunos modos de ordenación.

Véase que OpenAlex señala haber recuperado 14.630 documentos. Creemos que es imposible que haya esa cifra de investigaciones en el tema que nos ocupa. Buscar en todo el texto del documento generará siempre resultados menos precisos, con seguramente una enorme cantidad de falsos positivos. Esto se atenúa si el cálculo de relevancia es tan eficaz que podemos limitarnos a considerar solo los primeros documentos, pero nunca podremos estar seguros de este extremo.

Descubrimiento de información · Scopus

Parte de un registro (metadatos) en Scopus

La captura destaca la más importante, pero no toda la riqueza del modelo de registro que utiliza Scopus. La revisión de este registro nos aporta diferentes modos de descubrimiento de información, como «Related documents» o los enlaces bajo el encabezado Authors> Keywords> . Pero no son los únicos.

(El no) Descubrimiento de información · OpenAlex

OpenAlex carece de registro (metadatos)

No hay ningún registro visible para el usuario en el caso de OpenAlex. Aparece la información repetida del título, la publicación y al autor. El único dato nuevo es la afiliación del autor, sin correo electrónico.

Filtros – Scopus

Filtros Scopus

Filtros OpenAlex

Filtros OpenAlex

Las dos categorías de filtros con OpenAlex son Institution y Type. No hay subtipos. Lo que vemos es una distribución de resultados dentro de los dos tipos de filtros. Contrástese con la lista de tipos de Scopus de la captura precedente.

Evaluación en Scopus vs evaluación en OpenAlex

Para este apartado no necesitamos capturas adicionales (la información la tenemos en las precedentes):

  • Scopus. Podemos ver por las capturas precedentes que Scopus muestra los resúmenes, además del título y las palabras clave. El resumen, base para la evaluación, puede verse o bien como parte de la página de resultados o bien en cada registro individual. De este modo, es posible evaluar cada resultado por simple exploración de la página de resultados, y marcar para su obtención solamente los que satisfacen los criterios de inclusión.
  • OpenAlex. El resumen no está disponible en OpenAlex.

La evaluación es la fase de los trabajos de revisión, tras la búsqueda, en la que se estima si la investigación debe pasar a formar parte (o no) de la base de la evidencia. Es simplemente vital que esta evaluación se pueda hacer por inspección de título, resumen y palabras clave.

Análisis · Scopus (1)

Análisis de los resultados de búsqueda en Scopus

Análisis Scopus (2)

Análisis de citaciones en Scopus

Análisis · OpenAlex

Análisis de resultados de OpenAlex

Fuentes de información · Scopus

Las fuentes de Scopus: revistas científicas analizadas y evaluadas

Las fuentes de información de Scopus están perfectamente identificadas y analizadas en detalle, que no mostramos aquí. Son todas y cada una de las 45 mil revistas científicas que forman parte de la base de datos. Cada revista es objeto de análisis y escrutinio antes de ser aceptada, y son reevaluadas cada año.

Fuentes de información · OpenAlex

Lista de fuentes utilizadas por OpenAlex

OpenAlex es un sistema federado que importa y combina metadatos de diversas fuentes, en las que solo algunas, pero no todas, evalúan o filtran de algún modo la calidad de las publicaciones

Otros servicios de Scopus sin elementos de comparación

Mostramos a continuación algunas funcionalidades de Scopus para las que no hemos sabido encontrar opciones equivalentes en OpenAlex.

Utilidades vinculadas a un perfil de usuario

Utilidades para usuarios de Scopus

Análisis de revistas por áreas de conocimientos

Análisis de revistas de un campo

Autores

Búsqueda específica de autores con perfiles detallados como respuesta

Ficha de un autor

Ficha de un autor

Principales autores en un área

Identificación de investigadores destacados de un área

Lista de principales autores en un área

Principales autores en un área

Universidades y centros de investigación

Búsqueda de instituciones

Ficha de una universidad

Ficha de una revista

Ficha de una revista

El caso Google Scholar

Para añadir un elemento de triangulación, aportamos algunos resultados de Google Scholar. No son del todo comparables porque no se pueden replicar exactamente los mismos parámetros de búsqueda, pero tienen suficiente similitud como para ofrecer elementos de contraste.

Búsqueda avanzada

Interfaz de búsqueda avanzada de GS

El diseño del formulario de búsqueda de GS no se ajusta del todo al pattern más utilizado, pero retiene cosas esenciales del mismo En todo caso es mejor que la ausencia de formulario en OpenAlex.

Página de resultados

Página de resultados de GS

Véase que, además de las funcionalidades destacadas, que ha recuperado poco más de 200 documentos, una cifra razonable, conseguida gracias a poder parametrizar la búsqueda por el campo título, para evitar falsas coordinaciones que, a su vez, producen falsos positivos.

Otras funcionalidades

Funciones asociadas al perfil del usuario

Al permitir la creación de perfiles de usuario, GS aporta funciones adicionales notables, como las alertas y la biblioteca personal.

Tabla de síntesis

La tabla siguiente intenta sintetizar los resultados:

PreguntaS/NComentario
¿Sustituye
OpenAlex a
Scopus o WoS?
NOPresenta menos funciones según los criterios utilizados, sin que el mayor volumen actúe de compensación en el escenario planteado.
¿Substituye OpenAlex a
Google Scholar?
NOPresenta menos funciones según los criterios utilizados y el volumen de su cobertura es menor.
¿Es OpenAlex valioso
en el ecosistema
académico?
Es una base de datos intrínsecamente valiosa y nada le impide mejorar en el futuro, al contrario, tiene la base para ser un actor cada vez más influyente.

Discusión

El volumen de documentos

Ya hemos avanzado que para nuestra comparativa con Scopus y WoS, el volumen de documentos no iba a ser determinante.

En primer lugar, el número total de documentos que contiene una base de datos académica a la hora de compararla con otra base de datos, sirve de poco si la naturaleza de sus espacios de búsqueda documentales son diferentes, porque estaremos comparando cosas disímiles.

Fuente: OpenAlex. Clic para acceder

Además, el volumen por sí mismo puede ser un problema (en lugar de una solución) si el sistema no permite representar necesidades de información complejas, o de generar ordenamientos funcionales en base a un cálculo de relevancia bien diseñado. No estamos hablando de OpenAlex necesariamente. Se trata de una consideración general. De nada sirve que a un investigador le digan: «no se preocupe, en algún lugar entre este millón de documentos están los 20 o 30 que usted necesita, vaya revisandolos uno por uno».

La otra cuestión es la tipología documental que ya hemos avanzado. Si necesito noticias de prensa, necesito un espacio de búsqueda con noticias de prensa, de modo que una base de datos que mezcle noticias de prensa con páginas web no es más útil al tener más documentos, sino menos útil. Por eso existen Factiva, MyNews, Lexis/Nexis y otros productos. Si necesito un espacio de búsqueda de artículos científicos publicados en revistas de tipo peer review, una base de datos que incluya publicaciones de todo tipo puede ser un problema antes que una solución.

Vamos a probar ahora por la reducción al absurdo. Si solo importara el volumen, qué duda cabe que la mejor fuente sería siempre internet en su conjunto, y la mejor base de datos para usos académicos sería siempre Google estándar. Estaríamos perdiendo el tiempo cada vez que usáramos una base de datos académica y Google hubiera hecho el ridículo poniendo en marcha Google Scholar.

En cambio, cuando necesitamos información académica, acudimos a Google Scholar, aunque el volumen de los documentos que indexa es en varios órdenes de magnitud inferior al número de documentos que indexa Google estándar.

Entonces, para valorar el mayor o menor número de documentos, este dato se debe poner siempre en relación con algo más. A igualdad de los demás factores, puede tener sentido. En concreto, seguramente tiene sentido comparar los volúmenes respectivos de:

  • Scopus vs WoS
  • OpenAlex vs Google Scholar.

La razón de que tengan sentido esos pares de comparación es que comparamos espacios de búsqueda equiparables. Si lo que necesitamos, como en el caso que hemos simulado que es absolutamente común en el mundo de la investigación, es encontrar reportes de investigaciones publicadas en revistas científicas, entonces Google Scholar puede que NO siempre sea la mejor fuente comparada con WoS o con Scopus. En cambio, es indudable que en otros escenarios, el volumen cuenta.

Pero, en escenarios como el que hemos usado en nuestra simulación, que está en el núcleo duro de la investigación, no siempre es una ventaja buscar en un espacio documental más amplio porque puede producir falsos positivos y falsos negativos. Por eso, Scopus y WoS, en un lado, y OpenAlex y Google Scholar en el otro, tienen relaciones de complementariedad, y no de sustitución.

La oleada contra la comunicación académica

La idea de que es indiferente que el espacio de búsqueda esté formado por publicaciones evaluadas o no para cualquier escenario es producto de una (mala) cultura de los últimos años. En concreto, parece que estamos viviendo una especie de cultura anti revistas científicas a cuento de cosas que no tienen nada que ver con su función real. Permítannos señalar, que este desprecio del rol de las revistas científicas asociado al negacionismo de las métricas nos parece una forma de asalto a la razón que no puede conducir a nada bueno.

Arquitectura de la información y diseño centrado en el usuario

Volvamos a nuestro tema central. Las interfaces de Scopus y WoS, pero también el de otras plataformas como EBSCO, Emerald, ProQuest, The Lens, etc., derivan de diseños centrados en los usuarios que tuvieron lugar desde los años 2000, tras la consolidación de la web y la aparición de disciplinas como la usabilidad, la arquitectura de la información y el diseño centrado en el usuario. Estos estudios dieron lugar a una serie de patterns, que veremos repetidamente utilizados debido a su eficacia.

Interfaz ProQuest

Este diseño de la interfaz de consulta se ha convertido en un pattern por alguna razón. Fuente: base de datos ABI/INFORM de ProQuest

En su momento, hace solo unos pocos lustros, la aparición de Scopus fue una revolución en el diseño de las interfaces de usuario aplicada a sistemas documentales (hasta entonces de una pobreza legendaria). Una revolución que influyó decisivamente en la inmensa mejora de las interfaces de las bases de datos académicas.

Interfaz The Lens

The Lens también proporciona el pattern más utilizado para los formularios de búsqueda. Fuente: The Lens

Lo que no deberían hacer diseños como el de OpenAlex es retrasar el reloj. La ciencia abierta no debe ser sinónimo de diseño hecho de espaldas a las necesidades de los usuarios reales en sus contextos reales de trabajo. El esfuerzo tecnológico de OpenAlex es loable, pero puede quedar sensiblemente desperdiciado si descuidan a los usuarios a la hora de diseñar las funciones y la interfaz.

Conclusiones

OpenAlex ofrece una interfaz de usuario más limitada y con menos funcionalidades que Scopus o Web of Science según los criterios que hemos utilizado aquí. El mayor volumen de cobertura es un dato a su favor, pero no siempre actúa como compensación en los escenarios que nosotros planteamos. Aún así, por supuesto es un recurso valioso, cubre una función real y hemos de celebrar su existencia. Por este mismo motivo, merece nuestro apoyo.

Naturalmente, otros criterios de análisis deben ser posibles. P.e. algunos en los que el volumen sea decisivo y en cuyo caso la comparativa se resuelva a favor de OpenAlex. Pero determinadas características de diseño, como interfaces de usuario (formularios) que permitan expresar necesidades de información complejas, o la conveniencia de aplicar patterns de eficacia altamente probada, parecen difíciles de obviar en casi cualquier escenario.

Nuestra modestísima recomendación al equipo de desarrollo de OpenAlex, sería que consideren patterns muy bien consolidados por lo que hace a las interfaces de consulta, de páginas de resultados y de las funciones de descubrimiento a través de registro visible de cada referencia. Además, parece casi imprescindible mostrar los resúmenes como parte de la página de resultados. Son soluciones que pueden verse no solo en Scopus y WoS sino también en las bases de datos que hemos mencionado más arriba y de las que hemos puesto algos ejemplos. Es de este modo que pueden poner totalmente a su favor su mayor volumen de cobertura.

Por otro lado, en nuestra seguramente sesgada opinión, el rol de posible alternativa a Scopus y WoS está más cerca de cumplirlo Google Scholar que OpenAlex. The Lens también sería un buen candidato, y posiblemente Dimensions, que ahora alimenta a ERIH PLUS, aunque estas dos últimas tienen problemas de interfaz parecidos.

Pero siempre hay que tener en cuenta que (1) la tipología del espacio de búsqueda documental puede ser más relevante que el volumen en escenarios de investigación que están en el nucleo duro de la investigación científica; (2) sin sistemas que permitan la representación de las necesidades de información y el descubrimiento de información, el sistema más voluminoso del mundo puede ser un problema en lugar de una solución.

En todo caso, es indudable que OpenAlex cumple una función real. Es un recurso que puede aportar información muy valiosa a investigadores e instituciones. Justamente por esto hay que desear que sea un mejor producto capaz de amenazar de forma creíble la cómoda posición de los líderes actuales, con lo cual todos saldríamos ganando. En un horizonte así, tendríamos derecho a esperar mejores sistemas a costes más bajos.


Para saber más