Estructura y funciones de las bases de datos académicas · 1: Fundamentos generales. Los Registros


Las bases de datos académicas son una de las mejores fuentes para nuevas ideas genuinas en investigación (Fuente: Flaticon)


Las bases de datos académicas son, además del mejor instrumento para estar al día en un ámbito del conocimiento, el principal recurso de ideación para un investigador. Adicionalmente, son su mejor (¿única?) garantía de no estar replicando trabajos ya hechos, ni invirtiendo energías en métodos que ya se han probado poco útiles en investigaciones anteriores.

En este sentido, resulta oportuno recordar al menos dos de los puntos de una reciente publicación de la importante editorial Elsevier sobre cómo NO escribir un artículo. En el punto 1 de su decálogo de errores/horrores, señalan:

Refuse to read the previous literature published in your field

Y en el punto 3.1:

Omit key article components: Summary of the state of the art

Por este motivo, las bases de datos académicas (o científicas) se consideran, con razón, el principal recurso de los mejores investigadores a la hora de iniciar un nuevo proyecto (o una tesis doctoral). Entre otras cosas porque permiten conocer de forma relativamente fácil todo lo que ya se haya podido hacer en el mismo ámbito o en ámbitos vecinos.

Ahora bien, para utilizar de forma óptima un recurso necesitamos un modelo mental adecuado del mismo. En nuestro caso, no necesitamos una imagen tan precisa o detallada de una base de datos como para construir una. Pero es imprescindible tener un conocimiento conceptual y funcional que nos permita manejarla como una herramienta a nuestro servicio, y no como una barrera.

En esta serie de artículos nos proponemos presentar los componentes y funciones de las bases de datos académicas teniendo como background las necesidades características de los investigadores, por tanto, de sus usuarios. Pero también propondremos formas de concepción que pueden ser útiles a estudiosos del ámbito documental interesados en estos aspectos de la documentación científica.

Informaciones estructuradas

Ante todo, recordemos que una base de datos es una colección sistemáticamente estructurada de datos e informaciones.  En el caso de las bases de datos académicas, estos datos e informaciones consisten en documentos producidos como resultado de estudios e investigaciones, y adquieren la forma de artículos publicados en revistas científicas y de actas de congresos.

Las mejores funciones de las bases de datos se basan en este tratamiento sistemático de la información al que nos hemos referido, unido a la fuerza de los llamados metadatos, o datos que describen a otros datos. Este rol de los metadatos en el caso que nos ocupa queda asignado a la figura del registro, por lo que no es sorprendente que podamos decir que es uno de los componentes esenciales de toda base de datos.


Para esta serie de artículos, tomamos como modelo las bases de datos Scopus y Web of Science, las dos más importantes a escala internacional. No obstante, la mayor parte de lo indicado aquí se puede aplicar a la mayoría de bases de datos científicas con pocos o ningún cambio. En la segunda parte de cada artículo, se presentarán capturas de pantalla para ilustrar las funciones tratadas en cada entrega.


Bases de datos académicas: una visión sistémica

Expresado de una forma muy compacta, podemos decir que la función principal de una base de datos es producir personas informadas. En el caso concreto de las bases de datos académicas su función principal es conseguir que los investigadores dispongan en cada caso de la información más relevante para el éxito de sus investigaciones.

Un examen más detallado de sus funciones, nos lleva a considerar que, en primer lugar, una base de datos es un sistema que debe ser capaz de satisfacer las necesidades de información de sus usuarios, relacionando preguntas con documentos.

Composición

Todo sistema se caracteriza por el tipo de entradas que acepta y la clase de salidas que produce gracias a una determinadas funciones de transformación. Por tanto, también podemos decir que una base de datos es un sistema de información documental que se puede caracterizar de este modo:

  • Entradas que acepta:
    • Documentos
    • Preguntas de los usuarios
  • Salidas que produce:
    • Conjuntos de documentos relevantes

Funciones

Además, todo sistema se puede caracterizar por las funciones de transformación que tiene lugar en el interior del mismo, y que son las responsables de que las entradas aceptadas se transformen en las salidas características de cada sistema.

En el caso de una base de datos documental, a las que se pueden asimilar las de tipo académico, tienen lugar estas funciones de transformación:

  • Comparación de preguntas con documentos
  • Selección de los documentos más parecidos a las preguntas
  • Ordenación por relevancia de los documentos seleccionados

Otras funciones relacionadas con las bases de datos académicas consisten en la generación de análisis de las propiedades de los documentos contenidas en la misma, típicamente en forma de análisis bibliográficos, de impacto, de citaciones, etc.

bdd

Representación, mediante teoría de sistemas, de una base de datos basándonos en sus entradas, salidas y una de sus funciones, la de comparación (Fuente: elaboración propia)

Vamos a considerar con algo más de detalle los dos tipos de entradas y la salida.

Entrada 1: artículos de revistas científicas

Los documentos más característicos de las bases de datos académicas y, por tanto, su contenido más importante son artículos publicados en revistas científicas. En este caso, no obstante, el término “revista científica” se ajusta una definición precisa: se trata de revistas que utilizan el llamado sistema peer review para evaluar, seleccionar y, eventualmente, aceptar contenidos para sus publicaciones.

Entrada 2: preguntas de los usuarios

Normalmente, los usuarios son investigadores que necesitan fundamentar su trabajo, típicamente en las fases iniciales de cada nueva investigación, buscando artículos publicados anteriormente sobre su nuevo tema de investigación.

Esto no excluye investigadores que mantienen buenas prácticas de información y regularmente llevan a cabo revisiones para asegurarse de que se mantienen informados y al día en su campo.

Las preguntas de los usuarios, entonces, adquieren la forma de expresiones de búsqueda más o menos formalizadas en las que se combinan palabras claves y, eventualmente, operadores de búsqueda, según veremos más adelante.

Salida: conjuntos de documentos relevantes

Lógicamente, la base de datos no cumplirá su función si no proporciona documentos que se ajusten a la necesidad de información de cada usuario. Para conseguir esto, las bases de datos disponen de formas para comparar el perfil semántico de cada pregunta con el perfil de cada documento.

Una forma de hacer esto consiste en comparar las palabras clave de la pregunta con las palabras clave presentes en los distintos documentos de la base de datos, gracias al uso de índices analíticos de contenidos. De este modo, se filtra y se selecciona el mejor contenido para cada pregunta.

Además, para reforzar la calidad de la salida, los documentos suelen entregarse ordenados en función de grado relativo de cada documentos para satisfacer la necesidad de información concreta, o su grado de relevancia.

Las salidas de más calidad producen entonces una página de resultados en las que los primeros documentos, al ser con diferencia, los más relevantes, hacen innecesaria la lectura de todo el conjunto, si éste último es demasiado extenso.

Bases de datos académicas: una visión pragmática

Además de la visión anterior, basada en la teoría de sistemas necesitamos una visión más pragmática y menos formal, lo que (así esperamos) no significa que no pueda ser igualmente rigurosa.

En esta visión, podemos decir que la función principal de las bases de datos académicas es permitir a los investigadores estar al día de una forma fiable en relación con las publicaciones y los avances más importantes de su disciplina académica o especialidad científica.

Hace muchos años que ningún investigador en ningún ámbito del conocimiento que merezca este nombre puede leer todo lo que se publica internacionalmente sobre el mismo. No es solamente un problema de acceso a las publicaciones respectivas.

Desbordamiento cognitivo

Principalmente, es un problema de volumen de información. Hace tiempo que se ha calculado que, aunque los investigadores dedicaran 24 horas al día a leer, aún así no tendrán tiempo de leer todo lo que se publica en su ámbito.

Una de las soluciones consiste en la utilización de bases de datos. En lugar de pretender leer todo cuanto se publica en tiempo real, la mayor parte de los investigadores atienden regularmente a unas pocas revistas y, a cambio, cada vez que deben iniciar un nuevo proyecto, llevan a cabo una revisión sistemática de la producción científica usando bases de datos.

Esto último suele combinarse con la utilización de sistemas de alerta, que también proporcionan las bases de datos, y gracias a los cuales, reciben notificaciones puntuales en sus cuentas de correo cada vez que publican trabajos relevantes en el núcleo de sus especialidades.

Componentes estructurales

Para poder llevar a cabo las funciones formales y pragmáticas anteriores, una base de datos académica necesita, al menos, estos cuatro componentes:

  • Registros
  • Sistema de Búsqueda
  • Página de Resultados
  • Utilidades

En esta primera entrega de la serie, además de presentar una visión general de cómo se integran estos cuatro componentes, nos centraremos en el primero de ellos: los Registros, quedando los otros tres para futuras entregas.

Visión de conjunto de una base de datos académica incluyendo al usuario. Las relaciones entre componentes del sistema se representan con líneas continuas. Las del usuario con el sistema, con líneas discontinuas. Se representa la idea de que todo el conjunto de funciones se pone en marcha a partir de una pregunta del usuario. (Fuente: elaboración propia)

Cómo se une todo

Los registros, mediante el uso de metadatos representan la información clave de cada documento o artículo que forma parte de las bases de datos. El sistema de búsqueda, compara las palabras clave de la consulta de los usuarios con las palabras clave del registro. La página de resultados, por su parte, presenta, generalmente, ordenados por relevancia, los documentos seleccionados.

Por último, las utilidades consisten en un grupo heterogéneo de funciones que incluye facilidades para exportar información en diversos formatos, definir perfiles de búsqueda reutilizables u obtener análisis diversos. 

En este artículo nos centramos, como hemos indicado, en  presentar de forma más detallada los Registros y sus Metadatos y queda para las próximas entregas examinar el resto de componentes.

Registros

Un registro, ficha o record es el componente que permite que una base de datos exhiba su principal característica: el tratamiento sistemático, fiable y seguro de la información que contiene. En el caso de las bases de datos académicas ya hemos dicho que esta información consiste principalmente (pero no únicamente) en artículos de revistas científicas.

El registro como ficha

En una base de datos académica, cada artículo está representado en una ficha o registro, y esto en una relación de 1:1. Por tanto, si una base de datos contiene información sobre un millón de artículos, entonces, esa base de datos tiene un millón de registros.

Los registros, a su vez, se estructuran en unas zonas llamadas campos. En el caso que nos ocupa estos campos corresponden a atributos tan reconocibles como éstos:

  • Título del artículo
  • Fuente (revista)
  • Idioma
  • Fecha de publicación
  • Autor(es)
  • Palabras clave
  • Categorías
  • Resumen
  • etc.

Una parte de estos campos (Título, Autor, Resumen, Fecha) consisten en la transcripción de partes del documento, pero otras (Palabras clave, Categorías) pueden consistir en informaciones añadidas por la base de datos, bien de forma automática o mediante algún sistema asistido.

El registro como metadato

Recordemos que en el contexto de las bases de datos, los metadatos son datos sobre datos o dicho de otro modo, informaciones sobre documentos. En este caso, informaciones sobre artículos de revista. Por tanto, cada registro describe y, a la vez, proporciona acceso a un documento; bien de forma directa mediante un enlace, si tal documento existe en forma electrónica, o de forma virtual al proporcionar los datos bibiográfico-referenciales del mismo.

De este modo, el conjunto del registro actúa como un conjunto de metadatos que cumple una triple función:

  • Representar de forma muy precisa y muy sintética el contenido del artículo
  • Proporcionar formas lo más selectivas y precisas posible de recuperar información
  • Proporciona acceso directo o indirecto al documento orginal (artículo)

Los metadatos representan y a la vez facilitan el acceso al documento original. (Fuente: elaboración propia)

En este último sentido, debemos recordar que algunas de las bases de datos más importantes, como Web of Science y Scopus no realizan búsquedas en el contenido íntegro del documento, sino en el contenido del registro, de aquí la doble consideración del registro como representación y como medio de recuperación de información.

Otra forma de entender los metadatos es como documento secundario, es decir, como documento cuya misión es proporcionar información sobre otro documento, que en este caso, recibe el nombre de documento primario.

El rol múltiple de los registros en las bases de datos

Los documentos secundarios han sido siempre de importancia vital en los sistemas de información, porque no se considera eficiente buscar la información directamente, sino que es mucho más eficiente hacerlo a través de sus metadatos, como cuando buscamos en una biblioteca primero consultando su catálogo en línea, antes de recorrer las estanterías aleatoriamente. 

Aunque no nos demos cuenta, lo mismo sucede cuando buscamos páginas web a través de un buscador. Lo que hacemos es consultar los metadatos que este buscador ha elaborado de cada página, así que buscamos (casi) siempre en metadatos, no en los datos originales.

Ahora, podemos (re)considerar cuál es el rol de los registros, entendidos en su doble función de ficha descriptiva y de metadatos, en una base de datos académica:

  • Mediante el uso de una estructura regular basada en campos, aseguran la coherencia y la consistencia de la información contenida en la misma. Todos los artículos de la base se tratan igual.
  • Proporcionan una manera compacta y muy precisa de representar la información, en este caso artículos de revista.
  • Agrupan informaciones útiles relacionadas con cada artículo, por ejemplo, datos de contacto de los autores, artículos citados, artículos citantes (que citan a éste), artículos semánticamente o categorialmente relacionados, datos de descargas, etc.
  • Los diferentes campos (autor, título, palabras clave, etc,) generan a la vez los diferentes índices buscables de la base de datos.

Ilustraciones
Modelo de registro según la base de datos Scopus


Modelo de Registro – Scopus. Captura 1

Modelo de registro en Scopus

Primera parte del modelo de registro de Scopus

En la captura 1 vemos la primera parte del modelo de registro de la base de datos académica Scopus, denominado Document details. Vemos un primer fila de utilidades, como exportar, descargar o añadir a una lista. A continuación los datos básicos del documento, como el título del artículo, la fuente, el nombre del autor, datos de contacto y su afiliación.

Modelo de Registro – Scopus. Captura 2

Segunda parte del modelo de registro en Scopus

En esta segunda captura podemos ver otros componentes del modelo de registro de la base de datos Scopus. Destaca el resumen, las palabras clave y una serie de datos de categorización del artículo, como el tipo de fuente, tipo de documento y el idioma. También podemos ver la lista de los documentos que cita este artículo.

Modelo de Registro – Scopus. Captura 3

Tercera parte del modelo de registro de Scopus

En esta tercera parte del modelo de registro de Scopus, vemos una buena colección de informaciones asociadas al artículo representado, como otros artículos que lo citan, la posibilidad de activar una alerta sobre este artículo, documentos relacionados y la posibilidad de lanzar búsquedas de otros artículos del mismo autor o por las palabras clave del mismo.

Modelo de registro según la base de datos Web of Science


Modelo de Registro – Web of Science. Captura 1

Web of Science

Web of Science

Parte principal de un registro en Web of Science. Vemos los datos de identificación y referenciales del artículo (autor, fuente, afiliación), así como resumen palabras clave y algunas utilidades (en la parte superior). Por cierto, podemos apreciar que aparece destacadas las palabras clave utilizadas en la búsqueda.

Modelo de Registro – Web of Science. Captura 2

Parte de un registro en Web of Science

Informaciones relacionadas en un registro de Web of Science

Informaciones complementarias en un registro de Web of Science. Tenemos acceso a datos de citaciones y a un, así llamado, Mapa de citas.

Conclusiones

La forma más eficiente de explorar una base de datos consiste entonces en revisar primero con atención los registros antes de acceder al artículo o al documento completo, ya que, por ejemplo, es posible que la lectura del resumen sustituya la lectura del artículo (mostrando ya lo que queríamos saber o haciéndonos ver que no cubre nuestros intereses).

La revisión del registro nos ayuda también a encontrar informaciones relacionadas que, posiblemente, de otro modo no podríamos encontrar, ni por navegación ni por recuperación de información. Además, nos proporcionará ideas para nuevas investigaciones o para usar otros criterios de exploración.

La consulta de los artículos que citan al artículo representado, si es el caso, es otra fuente valiosísima de información para un investigador. Si estamos interesados en este artículo, es lógico que nos interesen los artículos que citan a éste, y como hemos señalado antes es posible que, ni por palabras clave, ni por navegación los hubiéramos encontrado.

Si bien todos los componentes de una base de datos académica o científica tiene un rol importante, hemos empezado por considerar el registro por su lugar central en el proceso de búsqueda. No obstante, el sistema de consulta es, en realidad, el punto de partida de todo, y por ello, será objeto de nuestra atención en la próxima entrega de esa serie de artículos.


Icon made by Freepik from www.flaticon.com