Estructura y funciones de una base de datos académica · 1: Fundamentos generales. El registro

Las bases de datos académicas son la mejor fuente para nuevas ideas genuinas en investigación (Fuente: Flaticon)

Edición diciembre 2018

Las bases de datos académicas son, además del mejor instrumento para estar al día en un ámbito del conocimiento, el principal recurso de ideación para un investigador. ¿El motivo? Dado que la ciencia es acumulativa, examinar los trabajos que se han llevado a cabo en un ámbito determinado, son una de las mejores fuentes de ideas para nuevas investigaciones.

Adicionalmente, son la mejor garantía de no estar replicando trabajos ya hechos, ni invirtiendo energías en métodos que ya se han probado poco útiles en investigaciones anteriores. Por último, de forma concurrente con lo anterior, son el recurso principal para llevar a cabo revisiones bibliográficas de tipo sistematizado.

Contexto: los estados de la cuestión

Como sabemos, las revisiones bibliográficas tienen como misión servir de apoyo para elaborar y presentar estados de la cuestión con garantías de rigor y con el menor sesgo posible, esto es, estados de la cuestión que no se limiten a citar los trabajos que confirman nuestras ideas.

Pero si estamos en el inicio de un nuevo proyecto, esto es, justo donde más necesario nos resulta conocer el estado de la cuestión, ¿como podemos saber cuáles son los principales autores y los mejores trabajos previos? Sin una base de datos académica, es una misión imposible.

De este modo, las revisiones bibligráficas, en especial las de tipo sistematizado, los estados de la cuestión (state of the art) y las bases de datos académicas forman un triángulo inseparable.

En este sentido, resulta oportuno recordar al menos dos de los puntos de una reciente publicación de la importante editorial Elsevier sobre cómo NO escribir un artículo. En el punto 1 de su decálogo de los principales errores, señalan:

Dos de los principales errores al escribir un artículo tienen relación con no llevar a cabo una revisión de antecedentes en el tema del artículo. Fuente: Elsevier (clic para ir al artículo)

Y en el punto 3, cuando el autor lo desarrolla, incluye el estado de la cuestión (state of the art) como el primero de los componentes clave de un artículo científico:

El estado de la cuestión es uno de lo componentes clave (key article components) de un artículo académico. Su omisión, uno de los principales errores. Fuente: Elsevier

Por citar una segunda fuente de autoridad, recordemos la estructura recomendada de un artículo científico según las prestigiosas normas APA para publicaciones académicas.

En concreto, con relación a los contenidos de la sección de  Introducción de un artículo científico, señalan lo siguiente:

Requirements

  • Give background. This section gives the history behind your research question. Identify the key research done in the area so far and the value of your study.
  • Cite all relevant research, not just the studies whose results you agree with. Identify studies that support contadictory findings, and suggest what might underline the differences (look specially at the introducction and discussion sections of the articles you are comparing).

Fuente: APA. Publication manual of the American Psychological Association. Washington DC: American Psychological Association, 2010.

Por todas estas razones, las bases de datos académicas (o científicas) se consideran, con razón, el principal recurso de los investigadores a la hora de iniciar un nuevo proyecto, ya que hemos visto la importancia de encontrar, seleccionar y manejar los antecedentes más significativos del mismo.

Esta necesidad de llevar a cabo una revisión bibliográfica (de estilo sistemático, preferentemente) y de demostrar que se ha llevado a cabo mediante un apartado de estado de la cuestión, afecta no solamente a la producción de artículos científicos, sino que afecta también muy especialmente a la elaboración de tesis doctorales. 

Conocer las bases de datos académicas

Ahora bien, para utilizar de forma óptima un recurso necesitamos un modelo mental adecuado del mismo. Es imprescindible tener un conocimiento conceptual y funcional que nos permita manejarla como una herramienta a nuestro servicio, y no como una barrera.

En esta serie de artículos nos proponemos presentar los componentes y funciones de las bases de datos académicas teniendo como background las necesidades características de los investigadores, por tanto, de sus usuarios. Pero también propondremos formas de concepción que pueden ser útiles a estudiosos del ámbito documental interesados en estos aspectos de la documentación científica.

Antes de proseguir, no obstante, parece obligado presentar una definición del concepto de base de datos académica, lo que hacemos en el cuadro siguiente:

Una base de datos académica es un sistema de información que registra documentos y sus propiedades, que resultan de actividades académico-científicas, tales como artículos, actas de congresos y capítulos de libros. Los términos base de datos académica y base de datos científica son equivalentes.

Su objetivo es doble:

  • por un lado apoyar la producción de nuevo conocimiento, gracias a la naturaleza acumulativa de la ciencia, que se beneficia de los trabajos anteriores;
  • proporcionar métricas e informaciones sobre la producción científica que permita a los gestores de la ciencia tomar decisiones informadas.

La estructura principal de una base de datos académica consta de tres módulos interrelacionados para dar respuesta al primero de los objetivos:

  • Sistema de búsqueda
  • Página de resultados
  • Registro

Además, disponen de un cuarto módulo para el segundo objetivo:

  • Sistema de análisis y métricas de la producción científica

(Fuente: elaboración propia)

Es sabido que, además de por comprensión (como hemos hecho en el recuadro precedente) podemos presentar definiciones por extensión, esto es nombrando los componentes de una clase, en este caso, las bases de datos académicas. Entre las más importantes de tipo generalista podemos citar las siguientes:

Entre las especializadas en Ciencias Humanas y Sociales, podemos mencionar las siguientes:

En lo que sigue, examinaremos la principal característica de toda base de datos: la información estructurada.

Informaciones estructuradas

Una base de datos también se puede caracterizar como una colección sistemáticamente estructurada de datos e informaciones.  En el caso de las bases de datos académicas, estos datos e informaciones, como ya sabemos, consisten en documentos producidos como resultado de estudios e investigaciones, y adquieren la forma de artículos publicados en revistas científicas, de actas de congresos y de capítulos de libro.

Las mejores funciones de las bases de datos se basan en este tratamiento sistemático de la información al que nos hemos referido, unido a la fuerza de los llamados metadatos, o datos que describen a otros datos. Este rol de los metadatos en el caso que nos ocupa queda asignado a la figura del registro, por lo que no es sorprendente que podamos decir que es uno de los componentes esenciales de toda base de datos.

Una visión sistémica

Expresado de una forma muy compacta, podemos decir que la función principal de una base de datos es producir personas informadas. En el caso concreto de las bases de datos académicas su función principal es conseguir que los investigadores dispongan en cada caso de la información más relevante para el éxito de sus investigaciones.

Un examen más detallado de sus funciones, nos lleva a considerar que, en primer lugar, una base de datos es un sistema que debe ser capaz de satisfacer las necesidades de información de sus usuarios, relacionando preguntas con documentos.

Composición

Todo sistema se caracteriza por el tipo de entradas que acepta y la clase de salidas que produce gracias a una determinadas funciones de transformación. Por tanto, también podemos decir que una base de datos es un sistema de información documental que se puede caracterizar de este modo:

  • Entradas que acepta:
    • Documentos
    • Preguntas de los usuarios
  • Salidas que produce:
    • Conjuntos de documentos relevantes

Funciones

Además, todo sistema se puede caracterizar por las funciones de transformación que tiene lugar en el interior del mismo, y que son las responsables de que las entradas aceptadas se transformen en las salidas características de cada sistema.

En el caso de una base de datos documental, a las que se pueden asimilar las de tipo académico, tienen lugar estas funciones de transformación:

  • Comparación de preguntas con documentos
  • Selección de los documentos más parecidos a las preguntas
  • Ordenación por relevancia de los documentos seleccionados

Otras funciones relacionadas con las bases de datos académicas consisten en la generación de análisis de las propiedades de los documentos contenidas en la misma, típicamente en forma de análisis bibliográficos, de impacto, de citaciones, etc.

Diagrama de una base de datos académica
Representación, mediante teoría de sistemas, de una base de datos basándonos en sus entradas, salidas y una de sus funciones, la de comparación. Fuente: elaboración propia

Vamos a considerar con algo más de detalle los dos tipos de entradas y la salida.

Entrada 1: documentos académicos

Los documentos más característicos de las bases de datos académicas y, por tanto, su contenido más importante son artículos publicados en revistas científicas. Algunas bases de datos añaden a esta tipología algunas otras, como comunicaciones publicadas en actas de congresos y capítulos de libros.

En el caso de la tipología de “revista científica” se ajusta a una definición precisa: se trata de revistas que utilizan el llamado sistema peer review para evaluar, seleccionar y, eventualmente, aceptar contenidos para sus publicaciones.

Entrada 2: preguntas de los usuarios

Normalmente, los usuarios son investigadores que necesitan fundamentar su trabajo, típicamente en las fases iniciales de cada nueva investigación, buscando artículos publicados anteriormente sobre su nuevo tema de investigación.

Esto no excluye investigadores que mantienen buenas prácticas de información y regularmente llevan a cabo revisiones para asegurarse de que se mantienen informados y al día en su campo.

Las preguntas de los usuarios, entonces, adquieren la forma de expresiones de búsqueda más o menos formalizadas en las que se combinan palabras claves y, eventualmente, operadores de búsqueda, según veremos más adelante.

Salida: conjuntos de documentos relevantes

Lógicamente, la base de datos no cumplirá su función si no proporciona documentos que se ajusten a la necesidad de información de cada usuario. Para conseguir esto, las bases de datos disponen de formas para comparar el perfil semántico de cada pregunta con el perfil de cada documento.

Una forma de hacer esto consiste en comparar las palabras clave de la pregunta con las palabras clave presentes en los distintos documentos de la base de datos, gracias al uso de índices analíticos de contenidos. De este modo, se filtra y se selecciona el mejor contenido para cada pregunta.

Además, para reforzar la calidad de la salida, los documentos suelen entregarse ordenados en función de grado relativo de cada documentos para satisfacer la necesidad de información concreta, o su grado de relevancia.

Las salidas de más calidad producen entonces una página de resultados en las que los primeros documentos, al ser con diferencia, los más relevantes, hacen innecesaria la lectura de todo el conjunto, si éste último es demasiado extenso.

Bases de datos académicas: una visión pragmática

Además de la visión anterior, basada en la teoría de sistemas necesitamos una visión más pragmática y menos formal, lo que (así esperamos) no significa que no pueda ser igualmente rigurosa.

En esta visión, podemos decir que la función principal de las bases de datos académicas es permitir a los investigadores estar al día de una forma fiable de los avances más importantes de su disciplina académica o especialidad científica. Una variación de esta función es permitir a los investigadores recopilar con poco esfuerzo, las principales investigaciones que se han llevado a cabo en un ámbito determinado, cada vez que inicia un nuevo proyecto.

Hace muchos años que ningún investigador en ningún ámbito del conocimiento que merezca este nombre puede leer todo lo que se publica internacionalmente sobre el mismo. No es solamente un problema de acceso a las publicaciones respectivas.

Desbordamiento cognitivo

Principalmente, es un problema de volumen de información. Hace tiempo que se ha calculado que, aunque los investigadores dedicaran 24 horas al día a leer, aún así no tendrán tiempo de leer todo lo que se publica en su ámbito.

Una de las soluciones consiste en la utilización de bases de datos. En lugar de pretender leer todo cuanto se publica en tiempo real, la mayor parte de los investigadores atienden regularmente a unas pocas revistas y, a cambio, cada vez que deben iniciar un nuevo proyecto, llevan a cabo una revisión sistemática de la producción científica usando bases de datos.

Esto último suele combinarse con la utilización de sistemas de alerta, que también proporcionan las bases de datos, y gracias a los cuales, reciben notificaciones puntuales en sus cuentas de correo cada vez que publican trabajos relevantes en el núcleo de sus especialidades.

Componentes estructurales

Para poder llevar a cabo las funciones formales y pragmáticas anteriores, una base de datos académica necesita, como sabemos, de estos tres componentes:

Además, distribuidas por los anteriores componentes, en especial por el sistema de búsqueda y la página de resultados, tenemos una serie de:

En esta primera entrega de la serie, además de presentar una visión general de cómo se integran estos cuatro componentes, nos centraremos en el primero de ellos: los Registros, quedando los otros tres para futuras entregas.

Visión de conjunto de una base de datos académica incluyendo al usuario. Las relaciones entre componentes del sistema se representan con líneas continuas. Las del usuario con el sistema, con líneas discontinuas. Se representa la idea de que todo el conjunto de funciones se pone en marcha a partir de una pregunta del usuario. (Fuente: elaboración propia)

Cómo se une todo

Los registros, mediante el uso de metadatos representan la información clave de cada documento o artículo que forma parte de las bases de datos. El sistema de búsqueda, compara las palabras clave de la consulta de los usuarios con las palabras clave del registro. La página de resultados, por su parte, presenta, generalmente, ordenados por relevancia, los documentos seleccionados.

Por último, las utilidades consisten en un grupo heterogéneo de funciones que incluye facilidades para exportar información en diversos formatos, definir perfiles de búsqueda reutilizables u obtener análisis diversos. 

En este artículo nos centramos, como hemos indicado, en  presentar de forma más detallada los Registros y sus Metadatos y queda para las próximas entregas examinar el resto de componentes.

Registros

Un registro, ficha o record es el componente que permite que una base de datos exhiba su principal característica: el tratamiento sistemático, fiable y seguro de la información que contiene. En el caso de las bases de datos académicas ya hemos dicho que esta información consiste principalmente (pero no únicamente) en artículos de revistas científicas.

El registro como ficha

En una base de datos académica, cada artículo está representado en una ficha o registro, y esto en una relación de 1:1. Por tanto, si una base de datos contiene información sobre un millón de artículos, entonces, esa base de datos tiene un millón de registros.

Los registros, a su vez, se estructuran en unas zonas llamadas campos. En el caso que nos ocupa estos campos corresponden a atributos tan reconocibles como éstos:

  • Título del documento
  • Fuente
  • Autor(es)
  • Afiliación
  • Idioma
  • Fecha de publicación
  • Resumen
  • Palabras clave
  • Categorías
  • Referencias
  • Métricas
  • Altmétricas

Una parte de estos campos (Título, Autor, Fuente, Resumen, Fecha) consisten en la transcripción de partes del documento, pero otras (Palabras clave, Categorías) pueden consistir en informaciones añadidas por la base de datos, bien de forma automática o mediante algún sistema asistido.

El registro como metadato

Recordemos que en el contexto de las bases de datos, los metadatos son datos sobre datos o dicho de otro modo, informaciones sobre documentos. En este caso, informaciones sobre artículos de revista. Por tanto, cada registro describe y, a la vez, proporciona acceso a un documento; bien de forma directa mediante un enlace, si tal documento existe en forma electrónica, o de forma virtual al proporcionar los datos bibiográfico-referenciales del mismo.

De este modo, el conjunto del registro actúa como un conjunto de metadatos que cumple una triple función:

  • Describir e identificar de forma inequívoca el documento (título, autor, afiliación, fuente, etc.)
  • Representar el contenido esencial del documento mediante resúmenes y palabras clave y otras formas de categorización. Estas formas de representación cumplen funciones de descubrimiento de la información, ya que aportan formas adicionales de acceso a la información que no dependen de las palabras clave utilizadas en la fase de búsqueda.
  • Proporcionar utilidades relacionadas con el documento, principalmente, opciones de exportación y de definición de alertas (p.e. recibir una notificación cada vez que el artículo sea citado).
Los metadatos representan y a la vez facilitan el acceso al documento original. (Fuente: elaboración propia)

En este último sentido, debemos recordar que algunas de las bases de datos más importantes, como Web of Science y Scopus no necesariamente realizan búsquedas en el contenido íntegro del documento, sino en el contenido del registro, de aquí la doble consideración del registro como representación y como medio de recuperación de información.

Otra forma de entender los metadatos es como documento secundario, es decir, como documento cuya misión es proporcionar información sobre otro documento, que en este caso, recibe el nombre de documento primario.

El rol múltiple de los registros en las bases de datos

Los documentos secundarios han sido siempre de importancia vital en los sistemas de información, porque no se considera eficiente buscar la información directamente, sino que es mucho más eficiente hacerlo a través de sus metadatos, como cuando buscamos en una biblioteca primero consultando su catálogo en línea, antes de recorrer las estanterías aleatoriamente. 

Aunque no nos demos cuenta, lo mismo sucede cuando buscamos páginas web a través de un buscador. Lo que hacemos es consultar los metadatos que este buscador ha elaborado de cada página, así que buscamos (casi) siempre en metadatos, no en los datos originales.

Ahora, podemos (re)considerar cuál es el rol de los registros, entendidos en su doble función de ficha descriptiva y de metadatos, en una base de datos académica:

  • Mediante el uso de una estructura regular basada en campos, aseguran la coherencia y la consistencia de la información contenida en la misma. Todos los artículos y documentos de la base de datos se tratan igual.
  • Proporcionan una manera compacta y muy precisa de representar la información, en este caso artículos de revista, comunicaciones a congresos y (cada vez más) capítulos de libro.
  • Agrupan informaciones útiles relacionadas con cada artículo, por ejemplo, datos de contacto de los autores, artículos citados, y componentes de descubrimiento de la información, como artículos citantes (que citan a éste), artículos semánticamente o categorialmente relacionados, datos de descargas, etc.
  • Proporcionan utilidades como opciones de exportación y de creación de alertas.
  • Proporciona la base para las búsquedas parametrizadas. Los diferentes campos (autor, título, palabras clave, etc,) generan a la vez los diferentes índices buscables de la base de datos.

Todo lo anterior podemos representarlo también mediante este diagrama:

Diagrama de las funciones principales del registro en una base de datos académica. Fuente: elaboración propia.

Una vez revisados los aspectos conceptuales y las funciones principales del registro en una base de datos, podemos pasar a ver ejemplos concretos gracias a dos de las más importantes bases de datos de todo el mundo, Scopus y Web of Science.

Ilustraciones
Modelo de registro según la base de datos Scopus


Modelo de Registro – Scopus 1

Modelo de registro en Scopus
Primera parte del modelo de registro de Scopus

En la captura 1 vemos la primera parte del modelo de registro de la base de datos académica Scopus, denominado Document details. Vemos un primer fila de utilidades, como exportar, descargar o añadir a una lista. A continuación los datos básicos del documento, como el título del artículo, la fuente, el nombre del autor, datos de contacto y su afiliación.

Modelo de Registro – Scopus 2

Segunda parte del modelo de registro en Scopus

En esta segunda captura podemos ver otros componentes del modelo de registro de la base de datos Scopus. Destaca el resumen, las palabras clave y una serie de datos de categorización del artículo, como el tipo de fuente, tipo de documento y el idioma. También podemos ver la lista de los documentos que cita este artículo.

Modelo de Registro – Scopus 3

Tercera parte del modelo de registro de Scopus

En esta tercera parte del modelo de registro de Scopus, vemos una buena colección de informaciones asociadas al artículo representado, como otros artículos que lo citan, la posibilidad de activar una alerta sobre este artículo, documentos relacionados y la posibilidad de lanzar búsquedas de otros artículos del mismo autor o por las palabras clave del mismo.

Modelo de registro según la base de datos Web of Science


Modelo de Registro – Web of Science 1

Web of Science
Web of Science

Parte principal de un registro en Web of Science. Vemos los datos de identificación y referenciales del artículo (autor, fuente, afiliación), así como resumen palabras clave y algunas utilidades (en la parte superior). Por cierto, podemos apreciar que aparece destacadas las palabras clave utilizadas en la búsqueda.

Modelo de Registro – Web of Science 2

Parte de un registro en Web of Science
Informaciones relacionadas en un registro de Web of Science

Informaciones complementarias en un registro de Web of Science. Tenemos acceso a datos de citaciones y a un, así llamado, Mapa de citas.

Conclusiones

La forma más eficiente de explorar una base de datos consiste entonces en revisar primero con atención los registros antes de acceder al artículo o al documento completo, ya que, por ejemplo, es posible que la lectura del resumen sustituya la lectura del artículo (mostrando ya lo que queríamos saber o haciéndonos ver que no cubre nuestros intereses).

La revisión del registro nos ayuda también a encontrar informaciones relacionadas que, posiblemente, de otro modo no podríamos encontrar, ni por navegación ni por recuperación de información. Además, nos proporcionará ideas para nuevas investigaciones o para usar otros criterios de exploración.

La consulta de los artículos que citan al artículo representado, si es el caso, es otra fuente valiosísima de información para un investigador. Si estamos interesados en este artículo, es lógico que nos interesen los artículos que citan a éste, y como hemos señalado antes es posible que, ni por palabras clave, ni por navegación los hubiéramos encontrado.

Si bien todos los componentes de una base de datos académica o científica tiene un rol importante, hemos empezado por considerar el registro por su lugar central en el proceso de búsqueda. No obstante, el sistema de consulta es, en realidad, el punto de partida de todo, y por ello, será objeto de nuestra atención en la próxima entrega de esa serie de artículos.


Otros artículos de la serie Estructura y funciones de una base de datos académica:

Referencias citadas

American Psychological Association. Publication manual of the American Psychological Association (6th edition). Washington, DC: American Psychological Association, 2010. [Información editor: Apastyle]

Bert Blocken. “10 tips for writing a truly terrible journal article”. Elsevier Authors’ Update. Janary 11, 2017.
[Acceso: 10-tips-for-writing-a-truly-terrible-journal-article]


Icon made by Freepik from www.flaticon.com