Metabuscador académico The Lens: solucionando el problema de la solución de problemas

Tiempo de lectura: 11 minutos
Cabecera del portal académico The Lens con la caja búsqueda en lugar destacado y sus interesantes frases de presentación. Mostramos aquí la interfaz en su idioma original, pero dispone de versiones para otras lenguas, entre ellas, el castellano.

The Lens es un buscador académico que reúne patentes y documentos académicos, como artículos, comunicaciones, libros y tesis, en un sistema unificado y separado a la vez, ya que cada tipo de documentos tiene su lugar  en la página de resultados.

Destaca por ofrecer soluciones innovadoras con las que es capaz de identificar las intersecciones entre los dos tipos de documentos señalados. También es innovador en las soluciones del diseño de su interfaz para la búsqueda y la presentación de los resultados.

Destaca igualmente por su decidida orientación hacia la ciencia abierta. que expresa de manera contundente con declaraciones como la siguiente:

The Lens serves global patent and scholarly knowledge as a public good to inform science and technology-enabled problem solving.

Se define así mismo como una infraestructura global para conseguir un sistema de innovación más eficiente, justo, transparente e inclusivo. Debemos decir que nos parece una de las definiciones de visión/misión más atractivas que nos hemos encontrado en este terreno.

La cuestión es que en el equipo de The Lens tienen algunas mentes brillantes en la definición de objetivos, si no, vean el eslogan que figura debajo de su nombre en el sitio web:

Solving the problem of problem solving

Para completar la presentación de este buscador, volvamos a la página About Us de la que podemos obtener esta declaración (los destacados son nuestros):

The Lens is building an open platform for Innovation Cartography. Specifically, the Lens serves nearly all of the patent documents in the world as open, annotatable digital public goods that are integrated with scholarly and technical literature along with regulatory and business data. The Lens will allow document collections, aggregations, and analyses to be shared, annotated, and embedded to forge open mapping of the world of knowledge-directed innovation. Ultimately, this will restore the role of the patent system as a teaching resource to inspire and inform entrepreneurs, citizens and policy makers.

Within the next two years, we expect to host over 95% of the world’s patent information and link to most of the scholarly literature, creating open public innovation portfolios of individuals and institutions. Using all open source components, we are working to create open schemas by which patent documents can be used to teach and communicate, rather than confuse and intimidate.

Finalmente, para completar la caracterización de The Lens, aprovecharemos la siguiente captura de pantalla de su sitio web en la que presentan sus tres aspectos más característicos:

Las tres principales característica de The Lens.

Tres características sumamente importantes de la filosofía de trabajo de The Lens: Free (sin cargos), Open (sin restricciones y Secure (sin seguimientos).

Contenidos de The Lens

Es importante señalar que, en esta ocasión nos ocupamos de un buscador académico que se aparta de los temas habituales de este sitio, a saber las Ciencias Humanas y Sociales ya que, como hemos señalado, se centra en patentes y en las disciplinas que típicamente las producen, desde las ingenierías hasta las ciencias biomédicas.

La razón de que nos ocupemos de The Lens es que, además de que en cualquier ámbito pueden producirse patentes (también en las Humanidades, por supuesto) nos interesan las soluciones innovadoras en los sistemas de búsqueda, independientemente de dónde se apliquen.

La simple idea es que, aquello que es innovador y funcional en un ámbito determinado de la búsqueda, puede acabar aplicándose al resto de ámbitos académicos, cosa que esperamos que suceda más pronto que tarde con las soluciones que veremos que aporta The Lens.

Tipología

The Lens utiliza dos tipologías de documentos:

  • Documentos de patentes
  • Publicaciones académicas

Del análisis de las patentes, extrae las denominadas biological sequences. Como estas últimas se alejan considerablemente del alcance de este sitio, nos limitamos a mencionarlas aquí. En lo que sigue nos centraremos en los dos tipos de documentos señalados más arriba.

Aunque es el propio buscador el que enfatiza el lugar central de las patentes en su sistema de información, con más de 100 millones de las mismas, lo cierto es que también incluyen casi 200 millones de registros de publicaciones académicas: artículos, libros, comunicaciones y tesis.

No obstante, entendemos que no necesariamente corresponde a 200 millones de documentos, ya que esta cifra resulta de sumar los registros de diversas fuentes cuyos contenidos se solapan parcialmente. No sabemos cuál es el grado de solapamiento, pero sea el que sea, con toda seguridad proporciona una cifra inmensa.

En la captura siguiente podemos ver las estadísticas detalladas:

Metabuscador

El hecho de que mencionen el término records (registros) en las expresiones Patent Records y Scholarly Records se debe a que utilizan directamente los registros de cada tipo de documentos, esto es, los metadatos en lugar de utilizar los documentos en sí mismos.

Además, vemos en la captura precedente una ecuación que indica la suma de las interelaciones (Linkages) entre los cuatro componentes: más 1,6 miles de millones en total.

Por su parte, las fuentes de datos que utiliza para todo lo anterior están identificadas en dos capturas que mostraremos a continuación, y que hemos tomado de su página About The Lens.

Fuentes de datos para patentes:

Fuentes de datos para los registros de patentes

Por su lado, las fuentes de datos para documentos académicos son las siguientes:

Fuentes de datos para los registros de documentos académicos

Lo que todo esto nos indica es que The Lens no utiliza los datos directos de cada documento, sino que unifica los metadatos de toda la serie de fuentes indicadas en las capturas anteriores. De este modo, estamos ante un metabuscador en un doble sentido de la palabra, primero porque basa su información, literalmente, en metadatos.

Segundo, porque utiliza datos proporcionados por otros buscadores y por otras bases de datos. En este sentido es la clase de sistema de información conocida técnicamente como recolectores (harvesters). Es decir, en lugar de analizar datos directos, disponen de sistemas para identificar, procesar y reunir en un sistema unificado datos procedentes de otros sistemas de información con los que es capaz de comunicarse.

La intersección de las patentes y las publicaciones académicas

La ingeniería de The Lens se aplica, entre otras cosas, a uno de sus principales signos de identidad: la intersección entre patentes y artículos académicos.  Esto proporciona diversos resultados:

  • Por un lado, las métricas de los artículos académicos ya no se limitan a las citas recibidas de otros artículos, sino que incluyen las recibidas de documentos de patentes. Esto permite identificar artículos cuya aportación seminal no se ha limitado a influir otros trabajos académicos, sino que han servido para apoyar una o más patentes.
  • Por otro lado, en su página de resultados,  hay dos pestañas cada una con un conjunto de referencias: las patentes y los documentos académicos. La búsqueda de documentos académicos genera una sección adicional con las patentes que citan a estos artículos. La búsqueda de patentes, genera un sección de documentos académicos que han sido citados por las patentes.

Con ello, ofrece una nueva clase de análisis académico de la producción científica, que denominan PatCite. Las páginas de The Lens ofrecen completa información sobre estos análisis:

PatCite: la intersección de documentos de patentes con documentos académicos

Además, de PatCite, han desarrollado lo que denominan International Innovation and Industry Influence Mapping, o In4M. Consiste en un mapeo de la capacidad de influencia de las instituciones académicas en el mundo de la innovación combinando el análisis de las publicaciones académicas y de las patentes producidas.

In4M: Ranking Institutional Influence

Los patrones de The Lens

Detrás de este innovador sistema de información está una importante organización sin ánimo de lucro denominada Cambia, que se define así misma de este modo:

Cambia is a non profit social enterprise, creating new tools, technologies, and paradigms to promote change and enable innovation. Our mission is to democratize innovation: to create a more equitable and inclusive capability to solve problems using science and technology. Our institutional ethos is built around an awareness of the need and opportunity for local commitment to achieving lasting solutions to food security, agricultural, public health and environmental problems.

Cambia, a su vez, está vinculada a diversas instituciones, la principal de las cuales es la Queensland University of Technology, de Australia.

El análisis

Para poder trabajar con un caso que puede ser de interés a diversos ámbitos, utilizaremos para nuestras pruebas palabras clave relacionadas con la realidad virtual y la realidad aumentada

The Lens
Funciones de búsqueda


Búsqueda simple

La caja disponible en la parte superior de la página de The Lens para entrar palabras clave, con sus tres opciones principales.

La búsqueda simple consiste en una caja en la que podemos entrar términos simples o compuestos. Además, hay tres botones: para focalizar la búsqueda en patentes, en documentos académicos o para desplegar opciones adicionales, entre ellas, la búsqueda avanzada, que veremos a continuación.

Búsqueda avanzada

Formulario de búsqueda avanzada

El formulario de búsqueda avanzada que permite combinar búsquedas booleanas y parametrizadas, se despliega con el tercero de los botones de la búsqueda simple.

Como se puede apreciar, permite seleccionar una de las dos colecciones principales, Patents o Scholar. Después, podemos utilizar las filas para entrar cada grupo de palabras clave de la búsqueda y seleccionar el operador de combinación. En este caso, hemos usado el OR porque queremos encontrar los documentos que se refieren o bien al primer concepto, o bien al segundo, o bien a ambos.

Finalmente, tenemos la opción de restringir los resultados a un campo determinado. En el ejemplo de la captura, hemos elegido que ambas palabras clave aparezcan en el título con el fin de aumentar la precisión. No tenemos la posibilidad de intercalar operadores diferentes entre las filas en el caso de usar más de dos de estas. También disponemos de una pestaña con consejos de búsqueda.

Filtros de la búsqueda avanzada

Filtros -Flags- de la búsqueda avanzada

En la parte inferior del formulario, disponemos de una serie de filtros que pueden resultar de una enorme utilidad. Destaca, por ser el primer de todos, la opción de limitar los resultados a publicaciones Open Access. Pero podemos ver que hay otras 11 opciones de filtrado.

Página de resultados – Cabecera

Parámetros básicos de la ciencia y botón para lanzar una nueva búsqueda

Como en la ecuación de búsqueda hemos utilizado un OR (suma lógica) el resultado es abultado: más de 43 mil documentos. Gracias a la amplia colección de filtros (que veremos después) estos se pueden reducir con mucha precisión.

La cabecera de la búsqueda incluye la información esencial, y el botón Search facilita la edición de la búsqueda sin perder la última configuración.

Página de resultados – Métricas principales

Distribución de resultados

Justo encima de la lista de referencias, que veremos después, tenemos una cinta con datos esenciales de la búsqueda. Primero vemos la cifra total de referencias, esto es 43.779, y al lado tenemos una serie de métricas relacionadas que nos permiten valorar el conjunto. Por ejemplo, nos indica que, del total de documentos encontrados, casi 1.800 han sido citados en unas 6.500 patentes. Además, son navegables varios de estos conjuntos de datos, ya que los que aparecen subrayados son enlaces.

Página de resultados – Cabecera de la lista de referencias

Encabezado de la lista de referencias

Difícil reunir más funciones en un espacio reducido. Cuando hacemos una búsqueda en publicaciones académicas, siempre hay una pestaña asociada con las patentes que citan a estas publicaciones. Podemos hacer clic en esta pestaña y navegar revisar las patentes. Recordemos que las patentes son documentos de cierta complejidad y que, entre otros apartados incluyen una descripción del estado de la situación y de lo que aporta la patente.

Además tenemos en List diversas formas de presentar la lista de resultados. También, diversas formas de ordenación siendo la ordenación por relevancia la opción por defecto.

Por último, en la derecha, bajo Scholarly Works, podemos marcar todos los resultados o solamente los de la página actual, y después tenemos opciones de exportación y de guardar la ecuación de búsqueda.

Página de resultados – Cuerpo central con la lista de referencias

Parte superior de la lista de resultados con dos resultados de ejemplo

La página de resultados de The Lens está repleta de funciones. En la parte superior, disponemos de opciones para seleccionar la página o el conjunto de resultados completo. Hay también opciones de exportación y la posibilidad de listar solamente resultados que han recibido citaciones en alguna patente.

Después, tenemos una serie de métricas que incluyen también con las patentes. Vemos, por ejemplo, que el segundo de los resultados muestra la obtención de 9 citas procedentes de patentes, y 127 de otras publicaciones académicas.

En la derecha tenemos un pequeño bloque de enlaces encabezado por el tipo de documento. Por ejemplo, el primero de la captura precedente indica Book Chaper, mientra que el segundo indica Conference Proceedings. Debajo de estas indicaciones de tipo de documento tenemos una serie de enlaces. El primero conduce al registro de la referencia en la base de datos The Lens. El segundo, a los metadatos procedentes de Microsoft Academic. El tercero es el DOI del documento y el cuarto hace una búsqueda del mismo en la base de datos WordlCat.

Registro – Parte principal

Registro. Parte principal

El registro de The Lens sigue la pauta de otras de sus funcionalidades, consistente en presentar un alto número de informaciones, metadatos y funciones, por lo que hemos separado su análisis en varias capturas. Aquí vemos la parte principal con la referencia completa, métricas diversas, enlaces relacionados y el resumen. 

Registro – Secciones

Secciones del registro

El registro se compone de varias secciones organizadas en pestañas. La principal, denominada Article Summary es la que hemos visto en la captura anterior.  Además, hay otra pestaña dedicada a las citaciones (referencias) del documento considerado, Citacions,  y otra. muy interesante, Recommended, que propone trabajos relacionados, utilizando las funciones asociadas de Microsoft Academic. Además, tenemos una captura, Collections, que nos indica si esta referencia forma parte de alguna de nuestras colecciones, ya que The Lens permite crear cuentas, y esta es una de las opciones relacionadas con la misma.

Registro -Recomendaciones

Recomendaciones

Vemos tres de las recomendaciones, esto es, tres de los documentos relacionados con la referencia examinada en el registro correspondiente. Como vemos, proceden de la colaboración de The Lens con Microsoft Academic.

Página de resultados – Filtros

Filtros de la página de resultados

Una vez examinado el registro, volvemos a prestar nuestra atención para mostrar los filtros, que forman parte de una barra de navegación lateral que se puede expandir o contraer (ver el primero de los botones señalados). Como se puede ver en esta captura parcial, la lista de filtros disponibles es impresionantemente completa.

Página de resultados – Vista global

La página de resultados de The Lens en todo su esplendor

No nos resistimos a mostrar una vista global de la parte superior de la página de resultados de The Lens, con los 11 puntos principales de la misma que hemos ido destacando antes en capturas separadas. Vemos:

  1. El resumen de datos de la búsqueda
  2. La posibilidad de editar la búsqueda
  3. Filtros
  4. La cabecera de los resultados con la ecuación de búsqueda
  5. Las métricas de los resultados, varias de ellas navegables
  6. Opciones de selección de resultados
  7. Opciones de presentación de la página
  8. Visualización de análisis
  9. Enlaces relacionados con la referencia
  10. Opciones adicionales de la página de resultados, como crear y gestionar colecciones y guardar la búsqueda
  11. Parte principal de la referencia, con enlaces diversos

Análisis de los resultados

La sección de análisis de la página de resultados

Una vista parcial de los datos de análisis de una página de resultados. Aparece en el momento en que seleccionamos Analysis entre las opciones que hemos mostrado en la captura anterior (la número 8).

Patentes

Patentes

Hasta ahora nos hemos centrado en la búsqueda de documentos académicos, pero en esta mostramos la de patentes. Vemos en la captura precedente que en estos casos, la pestaña activa muestra documentos de patentes, y la pestaña asociada, los documentos académicos citados.

Patente – Registro

Un registro de The Lens. En este caso de una patente.

El registro de una patente. Vemos la referencia de la misma en la parte superior, un resumen o Abstract, la sección Claims (la parte que describe la protección concedida a la patente) y acceso al documento completo con una vista previa tipo facsímil.

Patente – Documento

Parte de una patente sobre buscadores de Internet

Recordemos que una patente es un documento parecido a un artículo científico. Describe el funcionamiento de la patente, cita trabajos académicos relacionados y añade diagramas como veremos en la siguiente captura.

Patente – Diagrama

Diagrama: parte de una patente. Fuente: patente US 9171078 B2

Uno de los diagramas del documento de patente del registro que hemos usado más arriba como ejemplo.

In4M: Ranking Institutional InfluenceRanking Institutional Influence

In4M

Las dos instituciones que forman parte del Ranking Institutional Influence de The Lens. Para algunos países aún es muy incompleto. Como se puede ver, en el caso de España por el momento incluye solamente dos centros: el CSIC y la UPF. 

Funciones con inicio de sesión

Funciones disponibles con inicio de sesión

Si nos registramos en The Lens (opción gratuita) tenemos disponibles una serie de funciones, entre ellas las de crear colecciones, guardar búsquedas, añadir notas a las referencias.

Conclusiones

Hemos llevado a cabo una revisión relativamente detallada de las funciones de búsqueda, de la página de resultados y del registro de The Lens, además de ver de forma mucho más somera otras cuestiones. Hemos soslayado opciones de The Lens que se alejan mucho de los objetivos de análisis de este sitio, como el aspecto de los documentos de patentes.

No obstante, de la parte que nos interesa más, a saber, la búsqueda de documentos académicos (artículos, comunicaciones, etc.) hemos podido comprobar las numerosas funciones y las innovaciones que aporta este nuevo buscador.

Presenta aún limitaciones, pero su avance es constante. En los pocos días en los que hemos espaciado nuestros análisis The Lens ha incorporado  varias novedades y mejoras. Destaca por su voluntad de realizar integraciones con diversos sistemas de información académica existentes y obtener las importantes sinergias que se derivan.

Nos ha interesado mucho la colaboración con un importante buscador académico como Microsoft Academic y otros. Es innegable que una política de integración de datos con la abundante oferta actual de sistemas de información académica: repositorios, buscadores, bases de datos, etc. puede producir nuevos sistemas de búsqueda con prestaciones impensables hasta ahora. 

The Lens es un proyecto muy innovador que puede influenciar de manera positiva la forma en la que enfoquen en el futuro otros sistemas de información académicos el diseño de sus funciones e interfaces, y por este motivo nos ha interesado especialmente.  Además, su apuesta por el modelo de la ciencia abierta y el open access, no hacen más que reforzar nuestra idea de que está marcando seguramente el futuro de esta clase de sistemas.