Estructura y funciones de las bases de datos académicas · 1: Fundamentos generales | El registro

Diagrama de componente y funciones del registro en una base de datos académica
Diagrama de componente y funciones del registro en una base de datos académica. Fuente: Elaboración propia.

Edición agosto 2020

Las bases de datos académicas son, además del mejor instrumento para estar al día en un ámbito del conocimiento, uno de los mejores recursos de ideación para un investigador. ¿El motivo? Dado el carácter acumulativo de la ciencia, examinar los trabajos que se han llevado a cabo en un ámbito determinado, son una de las mejores formas de diseñar nuevas investigaciones.

Adicionalmente, son la mejor garantía de no estar replicando trabajos ya hechos, ni invirtiendo energías en métodos que ya se han probado poco útiles en investigaciones anteriores. Por último, de forma concurrente con lo anterior, son el recurso principal para llevar a cabo revisiones bibliográficas de tipo sistematizado.

Contexto: revisiones bibliográficas y estados de la cuestión

Como sabemos, las revisiones bibliográficas tienen la misión, entre otras, de servir de apoyo para elaborar estados de la cuestión con las mejores garantías y con el menor sesgo posible.

Pero si estamos en el inicio de un nuevo proyecto, esto es, justo donde más necesario nos resulta conocer el ámbito en el que vamos a trabajar ¿cómo podemos identificar a los principales autores y las mejores investigaciones previas? Sin una base de datos académica, es una misión imposible.

De este modo, las revisiones bibligráficas, en especial las de tipo sistematizado, los estados de la cuestión (state of the art) y las bases de datos académicas forman un triángulo inseparable.

En este sentido, resulta oportuno recordar al dos de los puntos de una reciente publicación de la importante editorial Elsevier sobre cómo NO escribir un artículo. En concreto, en la captura siguiente destacamos dos de los 10 puntos clave en la calidad de un artículo, por su relación con las bases de datos:

Dos problemas fundamentales: no leer publicaciones previas y omitir componentes clave

Problemas principales de los artículos científicos
Dos de los principales errores al escribir un artículo tienen relación con no llevar a cabo una revisión de antecedentes en el tema del artículo. Fuente: Elsevier (clic para ir al artículo)

Componente clave: el estado de la cuestión

En el punto 3 del anterior decálogo de errores a evitar, cuando el autor lo desarrolla, incluye el estado de la cuestión (state of the art) como uno de los componentes clave de un artículo científico (de hecho, es el primero que señala):

El estado de la cuestión como componente clave
El estado de la cuestión es uno de lo componentes clave (key article components) de un artículo académico. Su omisión, uno de los principales errores. Fuente: Elsevier

Por citar una segunda fuente de autoridad, recordemos la estructura recomendada de un artículo científico según las prestigiosas normas APA para publicaciones académicas.

En concreto, las normas APA sobre la composición y estructura de la Introducción de un artículo científico, tanto de tipo cuantitativo como cualitativo, señalan lo siguiente (los destacados son nuestros):

Quantitative
– Provide a succinct review of relevant scholarship, including relation to previous work, [and] differences between the current report and earlier reports if some aspect of this study have been reported on previously.
(…)

Qualitative
Review, critique, and synthesize the applicable literature to identify key issues/debates/theoretical frameworks in the relevant literature to clarify barriers, knowledge gaps, or practical needs.
(…)
Fuente: APA Style (7a. ed.)

Esta necesidad de llevar a cabo una revisión bibliográfica (tradicional o sistemática) afecta no solamente a la producción de artículos científicos, como hemos visto, sino que afecta también y muy especialmente a la elaboración de tesis doctorales. 

Por todas estas razones, las bases de datos académicas se consideran, con razón, el principal recurso de los investigadores a la hora de iniciar un nuevo proyecto por su importancia para poder encontrar, seleccionar y manejar los antecedentes más significativos del mismo.

Conocer las bases de datos académicas

Ahora bien, para utilizar de forma óptima un recurso necesitamos un modelo mental adecuado del mismo. Es imprescindible tener un conocimiento conceptual y funcional que nos permita manejarla como una herramienta a nuestro servicio, y no como una barrera.

En esta serie de artículos nos proponemos presentar los componentes y funciones de las bases de datos académicas teniendo como background las necesidades características de los investigadores, por tanto, de sus usuarios. Pero también propondremos formas de concepción que pueden ser útiles a estudiosos del ámbito documental interesados en estos aspectos de la documentación científica.

¿Qué es una base de datos académica?

Antes de proseguir, no obstante, parece obligado presentar una definición del concepto de base de datos académica, lo que hacemos en el cuadro siguiente:

Una base de datos académica es un sistema de información que registra documentos que resultan de actividades académico-científicas, tales como artículos, actas de congresos y capítulos de libros. Los términos base de datos académica y base de datos científica son equivalentes.

Su objetivo es doble:
– por un lado apoyar la producción de nuevo conocimiento, gracias a la naturaleza acumulativa de la ciencia, que se beneficia de los trabajos anteriores;
proporcionar métricas e informaciones sobre las características de la producción científica que permita a los gestores de la ciencia tomar decisiones informadas.

La estructura de una base de datos académica consta de tres módulos interrelacionados para cubrir al primero de los objetivos:

– Sistema de búsqueda
– Página de resultados
– Registro

Además, disponen de un cuarto módulo para el segundo objetivo:

– Sistema de análisis y métricas de la producción científica
Fuente: elaboración propia

Es sabido que, además de por comprensión (como hemos hecho en el recuadro precedente) podemos presentar definiciones por extensión, esto es nombrando los componentes de una clase. Entre las más importantes de tipo generalista podemos citar las siguientes:

Entre las especializadas en Ciencias Humanas y Sociales, podemos mencionar las siguientes:

En lo que sigue, examinaremos la principal característica de toda base de datos: la información estructurada.

Informaciones estructuradas

Una base de datos también se puede caracterizar como una colección estructurada de datos e informaciones.  En el caso de las bases de datos académicas, estos datos e informaciones, como ya sabemos, consisten en descripciones de documentos producidos como resultado de estudios e investigaciones. Estos documentos suelen consistir en:

  • artículos publicados en revistas científicas,
  • actas de congresos y
  • capítulos de libro.

Las mejores funciones de las bases de datos son posible gracias al tratamiento sistemático de la información al que nos hemos referido, unido a la fuerza de los llamados metadatos, o datos que describen a otros datos. Este rol de los metadatos en el caso que nos ocupa, queda asignado a la figura del registro, por lo que no es sorprendente que podamos decir que es uno de los componentes esenciales de toda base de datos.

Visión sistémica de las bases de datos académicas

Expresado de una forma muy compacta, podemos decir que la función principal de una base de datos académica es producir investigadores informados. Concretamente, su función principal es conseguir que los investigadores dispongan en cada caso de la información más relevante para el éxito de sus investigaciones.

Un examen más detallado de sus funciones, nos lleva a considerar que, en primer lugar, una base de datos es un sistema que debe ser capaz de satisfacer las necesidades de información de sus usuarios, relacionando preguntas con documentos.

Composición

Todo sistema se caracteriza por el tipo de entradas que acepta y la clase de salidas que produce gracias a una determinadas funciones de transformación. Por tanto, también podemos decir que una base de datos académcia es un sistema de información documental que se puede caracterizar de este modo:

  • Entradas que acepta:
    • Documentos
    • Necesidades de información. Esto es, preguntas de los investigadores
  • Salidas que produce:
    • Conjuntos de documentos relevantes a la necesidad de información de los investigadores
    • Distribuciones temáticas, por países, etc., u otros tipos de análisis de los documentos recuperados

Funciones

Además, todo sistema se puede caracterizar por las funciones de transformación que tiene lugar en el interior del mismo, y que son las responsables de que las entradas aceptadas se transformen en las salidas características de cada sistema.

En el caso de una base de datos documental, a las que se pueden asimilar las de tipo académico, tienen lugar estas funciones de transformación:

  • Comparación de preguntas con documentos, para poder efectuar la función que sigue.
  • Selección de los documentos más parecidos a las preguntas, esto es, aquellos que coinciden con las preguntas o que superan un umbral de semejanza.
  • Ordenación por relevancia de los documentos seleccionados, a fin de mostrarlos de una forma lo más útil posible, o que haga irrelevante el número total de documentos encontrados, ya que incluso con una enorme número de documentos, el examen de los N primeros (p.e., los 10 o los 20 primeros) sea suficiente.

Otras funciones relacionadas con las bases de datos académicas consisten en la generación de análisis de las propiedades de los documentos contenidas en la misma, típicamente en forma de análisis de impacto, de citaciones, etc.

Diagrama de una base de datos académica
Representación, mediante teoría de sistemas, de una base de datos basándonos en sus entradas, salidas y una de sus funciones, la de comparación. Fuente: elaboración propia

Vamos a considerar con algo más de detalle los dos tipos de entradas y la salida.

Entrada 1: documentos académicos

Los documentos más característicos de las bases de datos académicas y, por tanto, su contenido más importante, como ya hemos señalado, son artículos publicados en revistas científicas. Las principales bases de datos académicas, añaden a esta tipología comunicaciones publicadas en actas de congresos y capítulos de libros. Aún otras, pueden añadir patentes. Pero estas cuatro clases de documentos no cierran la tipología, aunque sin duda constituyen la inmensa mayoría.

En el caso de la tipología de revista científica, esta suele ajustarse a una definición precisa: se trata de revistas que utilizan el llamado sistema peer review para evaluar, seleccionar y, eventualmente, aceptar contenidos para sus publicaciones.

Entrada 2: preguntas de los usuarios

Normalmente, los usuarios son investigadores que necesitan fundamentar su trabajo, típicamente en las fases iniciales de cada nueva investigación, buscando artículos publicados anteriormente sobre su nuevo tema de investigación.

Esto no excluye investigadores que mantienen buenas prácticas de información y regularmente llevan a cabo revisiones para asegurarse de que se mantienen informados y al día en su campo.

Las preguntas de los usuarios, entonces, adquieren la forma de expresiones de búsqueda más o menos formalizadas en las que se combinan palabras claves y, eventualmente, operadores de búsqueda, según veremos más adelante.

Salida: conjuntos de documentos relevantes

Lógicamente, la base de datos no cumplirá su función si no proporciona documentos que se ajusten a la necesidad de información de cada usuario. Para conseguir esto, las bases de datos disponen de formas para comparar el perfil semántico de cada pregunta con el perfil de cada documento.

Una forma de hacer esto consiste en comparar las palabras clave de la pregunta con las palabras clave presentes en los distintos documentos de la base de datos, gracias al uso de índices analíticos de contenidos. De este modo, se filtra y se selecciona el mejor contenido para cada pregunta.

Además, para reforzar la calidad de la salida, los documentos suelen entregarse ordenados en función de grado relativo de cada documentos para satisfacer la necesidad de información concreta, o su grado de relevancia.

Las salidas de más calidad producen entonces una página de resultados en las que los primeros documentos, al ser con diferencia, los más relevantes, hacen innecesaria la lectura de todo el conjunto, si éste último es demasiado extenso.

Bases de datos académicas: una visión pragmática

Además de la visión anterior, basada en la teoría de sistemas necesitamos una visión más pragmática y menos formal, lo que (así esperamos) no significa que no pueda ser igualmente rigurosa.

En esta visión, podemos decir que las funciones principales de las bases de datos académicas son:

  • seguir, de una forma especialmente fiable, los avances más importantes de una disciplina académica o especialidad científica.
  • seleccionar y recopilar con (relativamente) poco esfuerzo, las principales investigaciones que se han llevado a cabo en un ámbito determinado, cada vez que inicia un nuevo proyecto.

Desbordamiento cognitivo

Hace muchos años que ningún investigador en ningún ámbito del conocimiento que merezca este nombre puede leer todo lo que se publica internacionalmente sobre el mismo. No es solamente un problema de acceso a las publicaciones respectivas.

Principalmente, es un problema de volumen de información. Hace tiempo que se ha calculado que, aunque los investigadores dedicaran 8 horas al día a leer, siete días a la semana, aún así no tendrían tiempo de leer todo lo que se publica en su ámbito.

Una de las soluciones consiste en la utilización de bases de datos. En lugar de pretender leer todo cuanto se publica en tiempo real, la mayor parte de los investigadores atienden regularmente a unas pocas revistas y, a cambio, cada vez que deben iniciar un nuevo proyecto, llevan a cabo una revisión sistemática de la producción científica usando bases de datos.

Esto último suele combinarse con la utilización de sistemas de alerta, que también proporcionan las bases de datos, y gracias a los cuales, reciben notificaciones puntuales en sus cuentas de correo cada vez que publican trabajos relevantes en el núcleo de sus especialidades.

Componentes estructurales de las bases de datos académicas

Para poder llevar a cabo las funciones formales y pragmáticas anteriores, una base de datos académica necesita, como sabemos, de estos tres componentes:

Además, distribuidas por los anteriores componentes, en especial por el sistema de búsqueda y la página de resultados, tenemos una serie de:

En esta primera entrega de la serie, además de presentar una visión general de cómo se integran estos cuatro componentes, nos centraremos en el primero de ellos: los Registros, quedando los otros tres para futuras entregas.

Visión de conjunto de los componentes principales de las bases de datos académicas
Visión de conjunto de una base de datos académica incluyendo al usuario. Las relaciones entre componentes del sistema se representan con líneas continuas. Las del usuario con el sistema, con líneas discontinuas. Se representa la idea de que todo el conjunto de funciones se pone en marcha a partir de una pregunta del usuario. (Fuente: elaboración propia)

Cómo se une todo

Los registros, mediante el uso de metadatos representan la información clave de cada documento o artículo que forma parte de las bases de datos. El sistema de búsqueda compara las palabras clave de la consulta de los usuarios con las palabras clave del registro. La página de resultados, por su parte, presenta, generalmente, ordenados por relevancia, los documentos seleccionados.

Por último, las utilidades consisten en un grupo heterogéneo de funciones que incluye facilidades para exportar información en diversos formatos, definir perfiles de búsqueda reutilizables u obtener análisis diversos. 

En este artículo nos centramos, como hemos indicado, en  presentar de forma más detallada los Registros y sus Metadatos y queda para las próximas entregas examinar el resto de componentes.

El registro

Un registro, ficha o record es el componente que permite que una base de datos exhiba su principal característica: el tratamiento sistemático, fiable y seguro de la información que contiene. En el caso de las bases de datos académicas ya hemos dicho que esta información consiste principalmente (pero no únicamente) en artículos de revistas científicas.

El registro como ficha

En una base de datos académica, cada artículo está representado en una ficha o registro, y esto en una relación de 1:1. Por tanto, si una base de datos contiene información sobre un millón de artículos, entonces, esa base de datos tiene un millón de registros.

Los registros, a su vez, se estructuran en unas zonas llamadas campos. En el caso que nos ocupa estos campos corresponden a atributos tan reconocibles como éstos:

  • Título del documento
  • Fuente
  • Autor(es)
  • Afiliación
  • Idioma
  • Fecha de publicación
  • Resumen
  • Palabras clave
  • Categorías
  • Referencias
  • Métricas
  • Altmétricas

Una parte de estos campos (Título, Autor, Fuente, Resumen, Fecha) consisten en la transcripción de partes del documento, pero otras (Palabras clave, Categorías) pueden consistir en informaciones añadidas por la base de datos, bien de forma automática o mediante algún sistema asistido.

El registro como metadato

Recordemos que en el contexto de las bases de datos, los metadatos son datos sobre datos o dicho de otro modo, informaciones sobre documentos. En este caso, informaciones sobre artículos de revista. Por tanto, cada registro describe y, a la vez, proporciona acceso a un documento; bien de forma directa mediante un enlace, si tal documento existe en forma electrónica, o de forma virtual al proporcionar los datos bibiográfico-referenciales del mismo.

De este modo, el conjunto del registro actúa como un conjunto de metadatos que cumple una triple función:

  • Describir e identificar de forma inequívoca el documento (título, autor, afiliación, fuente, etc.)
  • Representar el contenido esencial del documento mediante resúmenes y palabras clave y otras formas de categorización. Estas formas de representación cumplen funciones de descubrimiento de la información, ya que aportan formas adicionales de acceso a la información que no dependen de las palabras clave utilizadas en la fase de búsqueda.
  • Proporcionar utilidades relacionadas con el documento, principalmente, opciones de exportación y de definición de alertas (p.e. recibir una notificación cada vez que el artículo sea citado).
Los registros o metadatos en las bases de datos académias
Los metadatos representan y a la vez facilitan el acceso al documento original. (Fuente: elaboración propia)

En este último sentido, debemos recordar que algunas de las bases de datos más importantes, como Web of Science y Scopus no necesariamente realizan búsquedas en el contenido íntegro del documento, sino en el contenido del registro, de aquí la doble consideración del registro como representación y como medio de recuperación de información.

Otra forma de entender los metadatos es como documento secundario, es decir, como documento cuya misión es proporcionar información sobre otro documento, que en este caso, recibe el nombre de documento primario.

El rol múltiple de los registros en las bases de datos académicas

Los documentos secundarios han sido siempre de importancia vital en los sistemas de información, porque no se considera eficiente buscar la información directamente, sino que es mucho más eficiente hacerlo a través de sus metadatos, como cuando buscamos en una biblioteca primero consultando su catálogo en línea, antes de recorrer las estanterías aleatoriamente. 

Aunque no nos demos cuenta, lo mismo sucede cuando buscamos páginas web a través de un buscador. Lo que hacemos es consultar los metadatos que este buscador ha elaborado de cada página, así que buscamos (casi) siempre en metadatos, no en los datos originales.

Ahora, podemos (re)considerar cuál es el rol de los registros, entendidos en su doble función de ficha descriptiva y de metadatos, en una base de datos académica:

  • Mediante el uso de una estructura regular basada en campos, aseguran la coherencia y la consistencia de la información contenida en la misma. Todos los artículos y documentos de la base de datos se tratan igual.
  • Proporcionan una manera compacta y muy precisa de representar la información, en este caso artículos de revista, comunicaciones a congresos y (cada vez más) capítulos de libro.
  • Agrupan informaciones útiles relacionadas con cada artículo, por ejemplo, datos de contacto de los autores, artículos citados, y componentes de descubrimiento de la información, como artículos citantes (que citan a éste), artículos semánticamente o categorialmente relacionados, datos de descargas, etc.
  • Proporcionan utilidades como opciones de exportación y de creación de alertas.
  • Proporciona la base para las búsquedas parametrizadas. Los diferentes campos (autor, título, palabras clave, etc,) generan a la vez los diferentes índices buscables de la base de datos.

Todo lo anterior podemos representarlo también mediante este diagrama:

Diagrama de funciones de las bases de datos académicas
Diagrama de las funciones principales del registro en una base de datos académica. Fuente: elaboración propia.

Una vez revisados los aspectos conceptuales y las funciones principales del registro en una base de datos, podemos pasar a ver ejemplos concretos gracias a dos de las más importantes bases de datos de todo el mundo, Scopus y Web of Science.

Modelo de registro en la base de datos Scopus


Modelo de Registro – Scopus 1

Modelo de registro en Scopus, una de las principales bases de datos académicas.
Primera parte del modelo de registro de Scopus

En la captura 1 vemos la primera parte del modelo de registro de la base de datos académica Scopus, denominado Document details. Vemos un primer fila de utilidades, como exportar, descargar o añadir a una lista. A continuación los datos básicos del documento, como el título del artículo, la fuente, el nombre del autor, datos de contacto y su afiliación.

Modelo de Registro – Scopus 2

Componentes del modelo de registro de Scopus, una de las principales bases de datos académicas
Segunda parte del modelo de registro en Scopus

En esta segunda captura podemos ver otros componentes del modelo de registro de la base de datos Scopus. Destaca el resumen, las palabras clave y una serie de datos de categorización del artículo, como el tipo de fuente, tipo de documento y el idioma. También podemos ver la lista de los documentos que cita este artículo.

Modelo de Registro – Scopus 3

Tercera parte del modelo de registro de Scopus

En esta tercera parte del modelo de registro de Scopus, vemos una buena colección de informaciones asociadas al artículo representado, como otros artículos que lo citan, la posibilidad de activar una alerta sobre este artículo, documentos relacionados y la posibilidad de lanzar búsquedas de otros artículos del mismo autor o por las palabras clave del mismo.

Modelo de registro en la base de datos Web of Science


Modelo de Registro – Web of Science 1

Web of Science, una de las principales bases de datos académicas
Web of Science

Parte principal de un registro en Web of Science. Vemos los datos de identificación y referenciales del artículo (autor, fuente, afiliación), así como resumen palabras clave y algunas utilidades (en la parte superior). Por cierto, podemos apreciar que aparece destacadas las palabras clave utilizadas en la búsqueda.

Modelo de Registro – Web of Science 2

Parte de un registro en Web of Science, una de las principales bases de datos académicas
Informaciones relacionadas en un registro de Web of Science

Informaciones complementarias en un registro de Web of Science. Tenemos acceso a datos de citaciones y a un, así llamado, Mapa de citas.

Conclusiones

La forma más eficiente de explorar una base de datos consiste entonces en revisar primero con atención los registros antes de acceder al artículo o al documento completo, ya que, por ejemplo, es posible que la lectura del resumen sustituya la lectura del artículo (mostrando ya lo que queríamos saber o haciéndonos ver que no cubre nuestros intereses).

La revisión del registro nos ayuda también a encontrar informaciones relacionadas que, posiblemente, de otro modo no podríamos encontrar, ni por navegación ni por recuperación de información. Además, nos proporcionará ideas para nuevas investigaciones o para usar otros criterios de exploración.

La consulta de los artículos que citan al artículo representado, si es el caso, es otra fuente valiosísima de información para un investigador. Si estamos interesados en este artículo, es lógico que nos interesen los artículos que citan a éste, y como hemos señalado antes es posible que, ni por palabras clave, ni por navegación los hubiéramos encontrado.

Si bien todos los componentes de una base de datos académica o científica tiene un rol importante, hemos empezado por considerar el registro por su lugar central en el proceso de búsqueda. No obstante, el sistema de consulta es, en realidad, el punto de partida de todo, y por ello, será objeto de nuestra atención en la próxima entrega de esa serie de artículos.


Otros artículos de la serie Estructura y funciones de las bases de datos académicas:

Referencias citadas

American Psychological Association. Publication manual of the American Psychological Association (7th edition). Washington, DC: American Psychological Association, 2020. [Información: Apastyle]

Bert Blocken. «10 tips for writing a truly terrible journal article». Elsevier Authors’ Update. Janary 11, 2017.
[Acceso: 10-tips-for-writing-a-truly-terrible-journal-article]