Inteligencia artificial para usos académicos: análisis y guía de uso de Elicit AI

Elicit. Un caso de inteligencia artificial para usos académicos
Cabecera de Elicit. Clic para acceder

Elicit AI es un sistema de inteligencia artificial para usos académicos. Sirve para agilizar las tareas de búsqueda, extracción, análisis y síntesis de información científica.

El apartado de síntesis es importante porque es uno de los que marcan de forma más decisiva el uso de inteligencia artificial generativa (IAG). También el de extracción, como veremos, porque permite parametrizar la forma en la que se analizan los documentos, y aquí también interviene la IAG.

Elicit por tanto acelera los procesos relacionados con revisiones de la literatura, construcción de marcos teóricos, conceptualización de ámbitos de investigación y acciones similares.

En general aporta funcionalidades donde el análisis de las investigaciones previamente llevadas a cabo en un ámbito es importante. Desde nuestro punto de vista se sitúa por tanto, como herramienta para el diseño de nuevas investigaciones lo que incluye el soporte a la realización de tesis doctorales.

La IA y las bases de datos

De algún modo, Elicit muestra cómo serán o cómo deberían ser las futuras bases de datos académicas en la era de la inteligencia artificial. Una era que no está en el futuro, sino en el presente. Hay que decir que, aunque son empresas independientes, se alinea claramente con otros sistemas, como Scopus AI, en esta misión. Con tal panorama hay que suponer que en uno o dos años, a una base de datos académica sin IA parecerá que le falta algo esencial.

Para concluir esta primera presentación, podemos señalar que Elicit se presenta a sí misma con dos slogans a cual más interesante:

  • The AI Research Assistant
  • Elicit’s mission is to scale up good reasoning

Una última nota, para aportar información corporativa sobre Elicit, hemo probado a usar Perplexity y el resultado no podía ser mejor. Más abajo, en el apartado correspondiente, he puesto los enlaces.

Base de la evidencia

Semantic scholar es la base de datos que alimenta a Elicit

Como base de la evidencia, Elicit utiliza el buscador académico denominado Semantic Scholar (que puede utilizarse de modo independiente y del que hicimos una revisión hace algún tiempo).

En lo que sigue, mediante capturas intentaremos proporcionar una guía al respecto que también pueda servir a posibles usuarios a conocer mejor la herramienta.

ELICIT
GUÍA VISUAL DE UTILIZACIÓN


Inicio

Centro de operaciones de Elicit

En el centro de la página de Elicit tenemos caja de operaciones con tres funciones principales:

  • Find papers: para lanzar una búsqueda a partir de palabras clave o frases en lenguaje natural.
  • Extract data from PDFs: permite resumir el contenido de PDF que previamente hayamos cargado en nuestra biblioteca.
  • List of concepts: extrae conceptos a partir de una búsqueda con palabras clave o en lenguaje natural.

Mostraremos como funciona cada una de estas opciones, para lo cual empezaremos con Find papers, mediante un búsqueda en la que el prompt es una frase simple en lenguaje natural: «constructive journalism and news avoidance«. Vemos los resultados en las capturas que siguen.

Resultados · 1: vista global

Vista de la página de resultados con sus tres componentes principales

Una vez lanzada la búsqueda, la página de resultados tienen tres apartados principales:

  • Summary: es una síntesis de los 4 papers principales generada por la IAG. Es el primer elemento diferenciador de Elicit como buscados académico basado en inteligencia artificial generativa. Para producir el summary toma los 4 papers principales en la versión gratuita (aumenta a los 8 principales en las versiones de pago).
  • Página de resultados: contiene la lista de referencias encontradas organizada en dos columnas. En la primera columna de a izquierda tenemos las referencias. La columna de la derecha tiene un sumario del abstract (un resumen del resumen). Podemos ver también las opciones de ordenación y de filtrado.
  • Search or create a column: esta opción es fascinante. Permite añadir criterios de análisis para, de este modo, construir una matriz de revisión de la literatura. Aquí también vemos a la IAG en todo su esplendor.

Resultados · 2: summary

Cabecera de la página de resultados

En lugar de ofrecer solamente una lista de resultados (que veremos después), la página de resultados tras una búsqueda, se encabeza con una síntesis generada en base a las 4 u 8 (según versión) principales referencias encontradas.

Resultados · 3: referencias

Lista de referencias después de una búsqueda

Sólo después de presentar la síntesis narrativa, Summary, es cuando Elicit presenta la lista de resultados al modo convencional de las bases de datos académicas. Podemos destacar algunos elementos:

  1. Add columns: para añadir criterios de extracción de datos. Esta función está conectada con la banda vertcial de funciones de la derecha a la que hemos numero con el punto 6.
  2. Sort: opciones para ordenar la lista de resultados.
  3. Filters: para filtrar los resultados en base a determinados criterios.
  4. Papers: en esta columna aparecen las referencias.
  5. Abstract summary: un sumario del abstract.
  6. Search or create a column: para buscar entre los posibles criterios de extracción y añadirlos o extraerlos, para crear matrices de análisis.

Abordamos con cierto detalle las opciones precedentes en las capturas que siguen.

Ordenaciones

Criterios de ordenación

Filtros

Filtros

Referencias

Forma de mostrar una referencia individual

Acciones tras la selección

Acciones disponibles tras seleccionar una o más referencias

Esquemas de extracción de datos

Opción para añadir componentes de un esquema de extracción de datos diseñado por el usuario

La página de resultados puede parametrizarse de un modo realmente notable. Para ello, el usuario puede añadir (o retirar) «columnas«. Estas columna son en realidad componentes de posibles esquema de extracción de datos que cada usuario puede configurar según las necesidades de su investigación.

Equivalen a casi todos los efectos, a las matrices de análisis que pueden utilizarse en las revisiones sistemáticas.

Tipos de datos · 1

Tipos de datos que pueden añadirse la esquema de extracción

Primera parte de la lista de columnas disponibles para construir una matriz de análisis. Cabe señalar que añadir uno de estos campos no asegura los resultados. Primero, no todas las investigaciones son compatibles con todos los campos. Segundo, la identificación es de tipo probabilístico, depende del éxito del análisis de la IA en cada referencia.

Tipos de datos · 2

Más tipos de datos

Ejemplo de esquema añadido 1: Predicted variables

Resultado de añadir un campo, esto es, un componente de la matriz de análisis

Ejemplo de esquema añadido 2: Main findings

Otro ejemplo de matriz de análisis en esta ocasión con Main findings

Lista de conceptos

Lista de conceptos identificados

La lista de conceptos es otra de las aportaciones más que notables de Elicit. Consiste en una identificación y selección de conceptos que el sistema ha encontrado tras analizar las referencias, 60 en este caso.

En el ejemplo, este análisis ha producido una lista de 43 conceptos únicos, vinculados con referencias de los que han sido extraídos. Un recurso invaluable, en una sola palabra. Y una muestra de las posibilidades reales de la IA en este ámbito.

Análisis de PDF

Forma de incorporar documentos en PDF para su análisis

Análisis de PDF 1: respuesta final

Bonus: content curation in journalism

Un ejemplo adicional con resultados que involucran a este autor y colegas

Puntos de mejora

La probabilidad de que la empresa Elicit vea esta revisión es pequeña, y la probabilidad de que nos hagan caso mucho más reducida aún. No obstante, aquí van los posibles puntos de mejora en nuestra humilde opinión:

  • La gestión de los prompts debería mejorar con una biblioteca personal no solo de PDF, sino de los prompts y sus resultados. Ahora hay un workflow history donde está todo mezclado.
  • La página de resultados, presenta el summary en forma de una columna centrada y rodeada de blancos a los lados que son excesivos. Creemos que debería abarcar una mayor parte de página, eso sí dejando márgenes a los lados para que las filas de texto no sean excesivamente largas. Pero ahora desaprovecha mucho espacio.
  • El summary se exporta como texto plano, y sin las referencias completas, solo la cita parentética. Las diferentes páginas de resultados, las podemos exportar en formato de hoja de cálculo o en el de referencias bibliográficas. Pero hay mucho texto que es complicado de reutilizar en hojas de cálculo. Además, en la importación al formato de hoja de cálculo el resultado es muy confuso, aunque puede ser que no hemos sabido utilizarlo bien. Habría que introducir la posibilidad de exportar también en un formato de fichas, para que se pudieran trabajar mejor en un procesador de textos.

En todo caso, el dictamen global en nuestra opinión no puede ser mejor. Es un producto que ayuda a agilizar las tareas vinculadas con la recuperación y el análisis de la información científica, y que marca el camino sobre cómo deben ser los sistemas de información académica en un futuro que ya es ahora.

La empresa

Elicit Research PBC (como se denomina oficialmente) es una empresa independiente de (al parecer) pequeño tamaño (por el momento) que tiene su sede en California y de la que hemos puesto algunes enlaces útiles sobre ella al final de la entrada.

PBC son las siglas de Public Benefit Corporation. Según Perplexity «son un tipo de entidad corporativa con fines de lucro que, además de buscar beneficios económicos, tiene el objetivo de generar un impacto positivo en la sociedad y el medio ambiente».

Es muy interesante que una empresa centrada en la IA adopte este tipo de sociedad, porque, como sigue diciendo Perplexity «las PBC deben crear un beneficio público general, que se define como un impacto positivo material en la sociedad y el medio ambiente, o como la obligación de operar de manera responsable y sostenible». Fuente: Perplexity

Por último, sobre la empresa Elicit, los interesados pueden consultar la página sobre la misma generada tras un prompt con Perplexity.

Conclusiones

Estamos viviendo, ahora , en este justo momento y no como una previsión de futuro, un cambio decisivo en las funciones de las bases de datos y los sistemas de información académicos gracias a la inteligencia artificial. Lo que no impide que en futuro van a seguir evolucionando.

Elicit automatiza tareas en el trabajo con documentos académicos que hasta ahora, si las llevaba a cabo un humano, requerían inteligencia y habilidades cognitivas. Aporta diversos elementos. El primer es el resumen narrativo que genera como parte de los resultados, esto es, además de presentar la lista de referencias como en las bases de datos convencionales.

Otro elemento es la capacidad para extraer datos no estructurales, esto es más allá de los datos enmarcados en campos, como en el caso de los datos de autor, año, etc. Esto lo consigue mediante el sistema de columnas que puede añadirse al análisis de los resultados.

En tercer lugar tenemos la posibilidad de llevar a cabo análisis de PDF que podemos subir al sistema. y por último, presenta el hallazgo de la extracción de conceptos. Seguramente, todas las bases de datos académicas tendrán que incoporar elementos así para ser legitimadas. Es un movimiento que ya vimos en el caso de Scopus AI.

Vienen tiempos interesantes.

Enlaces sobre Elicit

Entradas relacionadas con la IA para usos académicos