The Lens: base de datos académica de acceso abierto y con diseño centrado en el usuario

Cabecera de la plataforma web de The Lens. Clic para acceder

The Lens es una completa base de datos académica de acceso abierto para investigadores y entidades sin ánimo de lucro. Una de sus características principales es que indexa tanto publicaciones científicas (artículos principalmente) como patentes.

También proporciona información sobre universidades y organismos de investigación. A todas estas características une el hecho destacable de que presenta una muy cuidada interfaz diseñada con el usuario en el centro, como demuestra su adhesión a los principales patterns en sus soluciones de diseño entorno a la búsqueda, el registro (metadatos) y la página de resultados. Este revisión es una puesta al día de la llevada a cabo hace unos años con ocasión de su lanzamiento en el 2018 y que se puede consultar aquí.

En esta ocasión nos vamos a centrar en aspectos funcionales, pero sobre todo del diseño de la interfaz. Revisaremos entre otras cosas, la adecuación de The Lens para dar soporte a trabajos de revisión, ya que son los más exigentes por lo que hace a los aspectos que examinaremos. Debemos avanzar que, pese a la extremada calidad del diseño de la base de datos, hemos detectado una posible disfunción con el despliegue de los resúmenes que esperamos quede pronto resuelta. Más adelante lo detallamos.

La importancia ética del diseño centrado en el usuario

Muchos trabajos como este se centran en la cobertura de la base de datos, esto es, en examinar o determinar literalmente cuántos documentos indexa cada base de datos. Ciertamente es un dato muy relevante. Nadie quiere perder el tiempo en un espacio de búsqueda limitado, habiendo otros más claramente más amplios. Parece difícil objetar a este enfoque, pero admite importantes matices:

  • La mayor cobertura puede hacerse a base de no discriminar entre tipos de documentos, como hace Google Scholar. Entonces, esto no necesariamente es una ventaja, sino que tiene tanto ventajas como inconvenientes.
  • Pero, al final, poco importa la amplitud del espacio de búsqueda si un sistema tiene una interfaz que impide a los usuarios llevar a cabo determinadas tareas críticas, o la interfaz está tan pobremente diseñada que disuade de su uso a una buena parte de sus usuarios potenciales.

Los dos puntos son igual de cruciales, pero en esta revisión nos interesa el segundo. Toda la ciencia abierta se viene abajo si una base de datos no la pueden usar usuarios sin formación tecnológica, o con perfil tecnológico pero que no tienen alma de hackers adolescentes, o usuarios que simplemente aspiran a que el sistema trabaje para ellos, no que ellos trabajen para el sistema.

No arruinar la ciencia con mala usabilidad

Un ejemplo de literatura sobre patterns para el diseño de la interacción. Fuente Amazon. Clic para acceder a información editorial

Por otro, lado costó muchos esfuerzos, y se puso en marcha mucho talento entre los años noventa y la primera década del 2000 para conseguir webs usables y con interfaces user friendly. Esos esfuerzos a base de mucha inversión de talento y dinero dieron lugar a disciplinas muy importantes para poner las tecnologías al alcance de todos, como la arquitectura de la información, la usabilidad y el diseño de la interactividad y de la experiencia de usuario o UX (User eXperience).

Wireframe del pattern de búsqueda avanzada más utilizado en bases de datos documentales. Fuente: elaboración propia. Clic para acceder a la fuente


Estos esfuerzos hicieron una web más usable, y por tanto, más abierta a todos los usuarios gracias al desarrollo de patterns de eficacia probada, como el de la búsqueda avanzada que muestra la imagen superior.

La cuestión es que una base de datos no escapa a la obligación de ser usable, y si la base de datos se pone al servicio de la difusión de la ciencia, no digamos ya al servicio de la ciencia abierta, entonces esa obligación adquiere un carácter ético.

Significado de la interfaz de usuario

Por tanto, en lo que sigue, vamos a examinar el diseño de la interfaz de The Lens, y no nos preocupará tanto su volumen, aunque está muy lejos de ser desdeñable con unos 270 millones de documentos. Obviamente, con ese volumen se sitúa claramente entre las tres o cuatro mayores bases de datos académicas del mundo. Volveremos sobre este punto más adelante.

No frivolicemos: el diseño marca lo que se puede o NO se puede hacer

El diseño de la interfaz incluye las funciones disponibles (o no)

Ahora bien, antes de seguir, déjennos decir una cosa muy clara. La palabra diseño a veces induce a confusión y se puede entender de un modo innecesariamente frívolo.

Diseño, en el caso del diseño de interfaces de plataformas digitales, no solamente señala que una cosa sea atractiva (o fea), lo que marca, y esto es fundamental, es lo que se puede o NO se puede hacer. Ni más ni menos.

Si el diseño no implementa ciertas funciones, el usuario no solo no las podrá hacer (obvio) es que ni siquiera se le ocurrirá que existiría esa posibilidad si la base de datos estuviera mejor diseñada.

Algunos ejemplos rápidos son las opciones de ordenación de la página de resultados, las de descubrimiento de la información (llegar a obtener información independientemente de las palabras clave) o las de poder hacer búsqueda booleanas complejas con formularios bien diseñados en lugar de limitarse a palabras clave o frases sueltas.

Revisiones de la literatura

Las revisiones de la literatura son dependientes del diseño del formulario de búsqueda y de la página de resultados (entre otros elementos de diseño)

Este último punto, a saber, plantear ecuaciones de búsqueda booleanas complejas con ayuda de un formulario es crucial para todos los trabajos que implican una revisión de la literatura, así que una base de datos que NO proporciona esta función a través de un buen diseño, es una base de datos inválida para uno de los principales usos de una base de datos académica.

Las ecuaciones de búsqueda con sintaxis directa también tienen directrices de usabilidad

Espacio para ecuaciones con sintaxis directa en The Lens, con abundante información de ayuda

Una forma limitada de paliar este problema es cuando la base de datos admite el uso de ecuaciones de búsqueda booleanas mediante el uso de la sintaxis directa, esto, escribiendo directamente las ecuaciones. Pero aquí hay que decir algunas cosas:

  • Primero, la base de datos entonces debe proporcionar una ayuda visible (norma de primero de usabilidad) que explique muy claramente la sintaxis de las ecuaciones de búsqueda y los comandos de búsqueda disponibles, junto con sus efectos que van a producir en la página de resultados.
  • Segundo, pese a lo anterior, una parte de los usuarios quedará irremediablemente excluida, a saber todos los usuarios que, ni tienen formación tecnológica ni están motivados para perder tiempo peleando con los entresijos de un sistema con un diseño deficiente.
  • Tercero. Los diseñadores de sistemas enfocados a usuarios finales no tienen derecho a suponer que todos los usuarios son iguales. Por el contrario, deben contemplar la simple realidad de la diversidad humana. Muchos investigadores, incluso de especialidades científicas o experimentales tan exigentes como la medicina (por poner un solo ejemplo) no desean consagrar su vida a aprender a usar un sistema user-enemy. Los médicos, por seguir con el ejemplo, tienen cosas más importantes que hacer por suerte para la humanidad que jugar a ser hackers. Pero esto se puede extender a muchas otras ramas del conocimiento, empezando por las humanidades en casi todas sus especialidades y la mismo se puede decir de las ciencias sociales.
  • Cuarto. Para cerrar la discusión: ¿debemos exigir a un investigador del derecho, p.e., o de la economía, o del periodismo, que además de sus arduas investigaciones en su campo aprendan a ser hackers para usar una base de datos? ¿En el siglo XXI? ¿Como si el reloj hubiera retrocedido a los años 90 del siglo pasado?

Por tanto, bienvenida la posibilidad de hacer búsquedas booleanas complejas con sintaxis directa. Algo es algo, y de hecho es algo intrínsecamente valioso. Pero no es suficiente si el sistema quiere llegar a toda clase de académicos e investigadores.

Aclarado todo lo anterior, pasemos a examinar las soluciones de diseño de la interfaz de una base de datos académica y gratuita de calidad ejemplar en este sentido, que es The Lens.

ANÁLISIS DEL DISEÑO DE LA INTERFAZ CENTRADA EN EL USUARIO DE THE LENS


En lo que sigue, mostraremos algunas de las soluciones en el diseño de la interfaz de la base de datos académica The Lens. Como en otras ocasiones, usaremos el método de presentar capturas de pantalla de cada solución o función, anotadas en algunos casos, con un pie de aclaración siempre, y comentarios adicionales en casos requeridos.

Inicio de la búsqueda

Caja de búsqueda en la página principal

Para la búsqueda, The Lens proporciona una caja disponible para búsqueda simple, pero también un enlace muy visible para la búsqueda avanzada, que denominan Structured Search.

Véase también que podemos elegir entre diversas opciones de búsqueda, destacando dos de ellas:

  • Patents
  • Scholarly works

En todo lo que sigue, nosotros nos centraremos en Scholarly works, esto es documentos académicos, entre los cuales artículos de revista principalmente, pero no únicamente.

Formulario de búsqueda

Formulario de búsqueda sin parametrizar

Hemos destacado la existencia de filas para expresar conceptos mediante palabras clave. Las filas permiten parametrizar la búsqueda por campos.

Formulario con una ecuación de búsqueda

Formulario con una búsqueda

Una ilustración de la capacidad de la capacidad de la interfaz de consulta para expresar la clase de necesidades de información complejas típicas de las revisiones sistemáticas.

Ecuaciones de búsqueda con sintaxis directa

Espacio para formular ecuaciones de búsqueda con sintaxis directa

Ya hemos visto esta captura más arriba, pero para ser sistemáticos la volvemos a reproducir como parte de la guía. El uso de ecuaciones de búsqueda con sintaxis directa, esto es, sin usar formularios de ayuda, no exime a los diseñadores del sistema de proporcionar una ayuda que debe estar situada junto al espacio de trabajo. A este propósito vemos que The Lens propone lo siguiente:

  • Query text editor: el espacio de trabajo para entrar las ecuaciones de búsqueda.
  • Consejos (Tips) para usar los operadores booleanos.
  • Información sobre el uso de parámetros, en especial el uso de campos.
  • Información sobre el uso de máscaras (wildcars), búsqueda difusa (términos similares) y operadores de proximidad.

Difícil mejorar la forma en la que The Lens ha resuelto este apartado.

Página de resultados: cuerpo central

Cuerpo central de una página de resultados en The Lens

La captura muestra con claridad la riqueza de funcionalidades que propone al usuario el diseño de la página de resultados. Un prodigio de funcionalidad y usabilidad combinadas.

Página de resultados: filtros | distribuciones

Vista parcial de las distribuciones de resultados, o filtros, de la página de resultados. Es fàcil apreciar las enormes posibilidades. Además, considere el lector que las flechas (>) indican posibilidades adicionales de cada criterio de distribución.

Área de trabajo

Los usuarios registrados (de modo gratuito) disponen de un espacio de trabajo personal, con el despliegue de funcionalidades ajustadas al usuario que pueden apreciarse en la captura.

Sugerencias

Otras opciones de usuario

Espacio con sugerencias de acciones para los usuarios, como crear colecciones, guardar búsquedas o exportar resultados.

Registro | Metadatos

Un buen modelo de registro es imprescindible para evaluar la relevancia de una referencia para formar parte de la base de la evidencia como resultado de una búsqueda. Véase:

  • Información completa, muy estructurada, de la fuente y la byline, así como informaciones adicionales.
  • Resumen o abstract, valiosísimo para las revisiones de la literatura.
  • Fila de funciones adicionales como compartir el artículo, incorporarlo a una colección, añadirle notas, etc.

Página de resultados: formatos de visualización

Además del formato habitual, podemos obtener la lista de documentos en forma de matriz o tabla. Esta tabla, a su vez, la podemos modificar añadiendo o quitando campos, que son las columnas.

¿Disfunciones con los resúmenes?

Vamos a ver dos tipos de disfunciones que nos ha parecido identificar con los resúmenes.

-1- Resumen no disponible

Un ejemplo de registro sin resumen

En un algunos casos hemos observado registros de artículos que indican que el resumen no está disponible. Como no parece posible que el artículo carezca de resumen, debemos atribuirlo a un posible problema de procesamiento de la información en la carga de datos por parte de The Lens o de alguna de sus fuentes. No tenemos capacidad para determinar cuál es la causa en realidad.

-2- Resúmenes en idiomas diferentes del inglés

Ejemplo de registro con resumen en idioma diferente del inglés

También aparecen con cierta frecuencia resúmenes en idiomas diferentes del inglés. Dado que todas las revistas académicas publican los artículos con resúmenes en inglés, cabe determinar que se trata de otra disfunción atribuible o bien a The Lens a los datos que importa de sus fuentes.

Juntando ambas, una parte de las ventajas de las bases de datos que proporcionan resúmenes se degrada. Si no hay resúmenes, o están en un idioma distinto del inglés que posiblemente no conoce el usuario, estamos ante un problema para misiones criticas como las búsquedas para revisiones de la literatura.

¿Es un problema pasajero? ¿Es un problema de la reciente nueva actualización de The Lens? Solo podemos dejar las preguntas. Volveremos a insistir en este aspecto pasado un tiempo a ver si podemos determinar alguna cuestión al respecto.

Ordenaciones

Opciones de ordenación de la página de resultados

La importancia de las opciones de ordenación es imposible de exagerar en el trabajo con bases de datos académicas. Cuando los resultados se cuentan por varios cientos, o varios miles, poder ordenar por relevancia, fechas, títulos, número de citas, etc. deviene crucial para resolver misiones críticas. Como podemos ver The Lens resuelve este apartado con solvencia.

Página de resultados: tipología documental

Filtro por tipología documental

Análisis de citaciones

Informe detallado de obras que citan a una referencia determinada. Esto es una forma muy potente de descubrimiento de información.

Colecciones del usuario

Colecciones para que los usuarios gestionen sus referencias

Vista de la ventana emergente para gestionar colecciones personales del usuario. Una de las funcionalidades destacadas para usuarios registrados (de forma gratuita).

Redes de citas

Citas incluyendo patentes

Redes de citas de la página de resultados. Se trata de explorar las referencias que citan a las referencias de unas búsqueda.

Análisis de la página de resultados

Análisis de las referencias de la página de resultados. Vista parcial de las distribuciones disponibles

Vista parcial del módulo de análisis de la página de resultados. En total, The Lens proporciona hasta ocho distribuciones diferentes de las referencias de la página de resultados:

  • Distribución temporal
  • Universidades más productivas
  • Tipología documental
  • Autores más productivos
  • Trabajos más citados
  • Áreas temáticas
  • Países regiones con más producción
  • Principales revistas (journals)

Véase la flecha que señala una caja de iconos sobre cada distribución. Muestra acciones adicionales que pueden hacerse con las mismas como agrupaciones o configuraciones diversas de visualización de la información. La siguiente captura muestra una de esta configuraciones:

Configuraciones de visualización de la información de las distribuciones de datos

Podemos concluir con facilidad que este módulo queda resuelto de modo extremadamente solvente.

Fuentes

Fuentes de The Lens

Este apartado merece algunas consideraciones más allá de las imponentes cifras que muestra. La primera es que la aportación principal de referencias académicas la atribuye a Microsoft Academic, con 203 millones de referencias. Pero es una base de datos que está cerrada desde 2021. Suponemos que mantienen la referencia a esta fuente para reconocer el origen del grueso de sus datos. Pero queda la duda de qué pasa con las referencias a partir de 2021.

La respuesta puede estar en la presencia de OpenAlex como otro proveedor. La duda es que pero el diagrama le asigna una cantidad de 51 millones de documentos, que está muy por debajo de los que maneja en su plataforma directa. Puede deberse a que descuentan los duplicados con la colección anterior de Microsoft Academic. Pero no hemos encontrado el detalle, y todo esto son nuestras inferencias.

Queda el dato imponente de un total de casi 270 millones de referencias. Esto es, de trabajos académicos. Pero The Lens incluye también más de 150 millones de documentos de patentes.

Universidades

Información básica de una universidad

Ficha de información básica de una institución.

Autores

Ficha de un autor

La captura muestra el ejemplo de una ficha de autor. Nos hemos tomado a nosotros mismos como caso y así sorteamos malentendidos.

Institutional Toolkit y patentes

Toolkit para instituciones

The Lens es una plataforma (la palabra base de datos le queda corta) que incluye también una división sobre patentes y un Toolkit para instituciones. Nada de esto hemos analizado aquí, pero corresponde dejar al menos una constancia de su potente realidad.

Intersecciones artículos/patentes

Datos cruzados patentes/trabajos académicos

Además, The Lens ha conseguido desarrollar una tecnología que permite cruzar datos entre artículos científicos y patentes. Esta funcionalidad también la hemos soslayado en nuestros análisis, pero de nuevo, debemos dejar constancia de ella, porque puede ser de un interés imposible de exagerar para muchos usuarios.

Abierta para cuentas personales y para instituciones sin ánimo de lucro

Tarifas de The Lens: gratis para usuarios individuales y organismos sin ánimo de lucro

El cuadro de tarifas de The Lens muestra claramente que se trata de una base de datos de tipo open access para usuarios individuales, así como para instituciones sin ánimo de lucro.

Conclusiones

Se pueden poner al alcance de los usuarios individuales y de las instituciones sin ánimo de lucro bases de datos académicas con un diseño muy avanzado centrado en los usuarios y de carácter gratuito. No hace falta tirar por la ventana décadas de diseño web y de la experiencia de usuario para poner en marcha una base de datos académica abierta.

The Lens reúne lo mejor de todos los mundos, porque tiene una base de búsqueda enorme, con casi 270 millones de documentos, un excelente diseño de la interfaz y un conjunto de funcionalidades completísimo.

Si alguna base de datos académica puede amenazar la posición de Scopus y WoS en las universidades hay que mirar más a The Lens que a cualquier otra de las que se presentan como paladines de bases de datos de acceso abierto, pero sin haber hecho los deberes mínimos en temas de diseño centrado en los usuarios.

La defensa de la ciencia abierta nunca debe ser una excusa para retrasar el reloj del diseño usable, entre otras cosas, porque el diseño usable también influye en que una base de datos académica esté abierta de facto a la mayoría de usuarios. Pero además, resulta que el diseño centrado en el usuario es el que ayuda a determinar qué cosas necesita realmente el usuario. Sin ese diseño, esas funciones están ausentes. Entonces, un supuesto sistema abierto puede ser en realidad un sistema muy cerrado.

The Lens, en cambio, es un respetable actor en el escenario de la búsqueda de información académica con ideas originales y funcionalidades muy potentes que hay que tener en cuenta por su respeto al diseño centrado en el usuario y la aplicación de los mejores patterns de diseño de eficacia probada. Para universidades que, por la razón que sea, no disponen de acceso a Scopus o WoS, es posiblemente una de las alternativas abiertas con mayores perspectivas de futuro, junto con la imprescindible Google Scholar.

No obstante, aunque esperamos que sea alguna cosa pasajera, hemos detectado una notable disfunción con los resúmenes. De ser un problema persistente (esperamos que no lo sea), una parte de sus tan bien diseñadas funcionalidades quedaría empañada, hasta el punto de hacer poco viable esta base de datos para usos muy importantes.

Limitaciones de esta revisión: nos hemos centrado en las soluciones de diseño de la interfaz. No hemos analizado otras funciones propias y, hasta donde sabemos, exclusivas de The Lens, como el Toolkit y otras soluciones basadas en la intersección de datos entre artículos científicos y patentes. Tampoco hemos valorado la eficacia de sus ordenaciones, la de relevancia en particular sería muy interesante ponerla a prueba. Nos interesaba enfocarnos en la demostración mediante un caso de que las bases de datas abiertas no están reñidas con un diseño que las haga realmente abiertas. Pero en próximas ocasiones podemos intentar resolver algunas de las limitaciones que ahora solo dejamos señaladas.


Para saber más