Cómo explotar una base de datos académica en 6 fases bien definidas: el caso de Scopus

Tiempo de lectura: 19 minutos
El formulario de búsqueda avanzada de Scopus, listo para atender nuestras consultas

Utilizar de forma adecuada una base de datos académica puede convertir un buen proyecto en un proyecto excelente. En este trabajo mostraremos cómo aprovechar a fondo las posibilidades de una base de datos académica a través de 6 fases bien definidas.

Para ilustrar cada paso, utilizaremos Scopus ya que, además de ser una de las bases de datos más importantes del mundo, presenta una de las mejores interfaces de usuario de su categoría. No obstante, las fases que vamos a ver mediante esta base de datos se pueden aplicar a cualquier otra, incluyendo algunas de máxima importancia, como Web of Science y la mayoría de otras bases de datos académicas. 

Las 6 fases que presentaremos con más detalle después, y descritas ahora de modo somero, son las siguientes:

1. Preparación, o fase de ideación y provisión de palabras clave. Probablemente, la más importante de las 6 fases. Sin una buena resolución de esta fase, todas las demás pueden conducir a una simple pérdida de tiempo. Por suerte, esta preparación se puede llevar a cabo por ensayo y error. Otra cosa es que, para que no requiera una inversión de tiempo exagerada, nos convendrá partir de buenos cimientos.
2. Búsqueda, preferentemente utilizando un formulario de búsqueda avanzada a fin de poder representar con precisión nuestra necesidad de información.
3. Página de resultados, donde procedemos a un primer testeo de resultados, evaluando la relevancia de los mismos en base al título. La obtención del documento completo (generalmente en formato pdf) es una subfase flotante ya que podemos proceder a obtenerlo aquí, si es el caso, o en las dos siguientes.
4. Metadatos o Registro, donde determinamos con mayor precisión la relevancia de cada resultado en base al resumen. También obtendremos otros datos y podremos activar funciones de descubrimiento. Esta es otra de las fases donde podemos optar por acceder al documento completo si los datos del registro confirman la relevancia del documento.
5. Exportaciones, operación que llevamos a cabo con las referencias más relevantes y que necesitaremos poder recuperar en el futuro en cualquier momento. La exportación se realiza a un gestor de referencias como Mendeley o Zotero. Normalmente, la exportación afecta a los datos referenciales. En algunos casos es posible que afecte también al documento completo si está disponible en pdf.
6. Alertas, mediante las cuales aseguramos que, en el futuro, estaremos conveniente informados de las novedades sin necesidad de repetir las mismas búsquedas. Dejaremos a un bot encargado de tales tareas.

Orden de proceso

Fases de explotación de una base de datos académica
Diagrama idealizado de las 6 fases en modo lineal/secuencial. Fuente: elaboración propia

Fases implica la idea de un orden secuencial y más si se numeran como hemos hecho nosotros. El diagrama precedente, además de presentar las 6 fases en la que hemos divido el proceso completo de utilización y explotación de una base de datos refleja esta idea. 

Pero cabe señalar que solo tienen un comportamiento genuino como proceso secuencial las fases las que van de la 1 a la 3. Las fases 4 a 6 pueden intercambiar el orden entre ellas. Además, en un proceso real de búsqueda, es posible que tengamos que volver de cualquiera de las fases a otra anterior.

El siguiente diagrama, mantiene las mismas 6 fases pero intenta recoger las ideas precedentes. Adicionalmente, hemos marcado con otro color la primera de las fases por dos razones. Primero, porque es una fase en la que aún no utilizamos la base de datos en sí misma. Segundo porque pese a esto, probablemente es la más importante de todas. Como sea, el nuevo diagrama, ahora un poco más complicado, es el siguiente:

Diagrama de las fases de una búsqueda en una base de datos académica
Diagrama realista de las 6 Fases de una búsqueda en bases de datos académicas. Fuente: elaboración propia

La base de datos Scopus

Scopus es una de las bases de datos más importantes del mundo, y es comúnmente utilizada, junto con Web of Science por universidades, centros de investigación y agencias de gestión científica de todo el mundo. Por la amplitud y la diversidad de su cobertura puede ser utilizada como una de las fuentes principales para investigación científica en cualquier ámbito, lo que incluye el dominio que nos interesa aquí, a saber las Humanidades y las Ciencias Sociales.

Se presenta a sí misma de este modo en su página de información:

Scopus is the largest abstract and citation database of peer-reviewed literature: scientific journals, books and conference proceedings. Delivering a comprehensive overview of the world’s research output in the fields of science, technology, medicine, social sciences, and arts and humanities, Scopus features smart tools to track, analyze and visualize research.

As research becomes increasingly global, interdisciplinary and collaborative, you can make sure that critical research from around the world is not missed when you choose Scopus.

Who uses Scopus?

The A&I research discovery solution for academia, business and government. From researchers pursuing scientific breakthroughs to academic institutions and government agencies evaluating research, Scopus is the abstract and indexing database of choice. Worldwide, Scopus is used by more than 3,000 academic, government and corporate institutions and is the main data source that supports the Elsevier Research Intelligence portfolio.

Como la mayor parte de bases de datos, requiere una suscripción institucional para su utilización, pero dispone de una versión, denominada Scopus Preview que es de libre acceso y permite la consulta de títulos de revistas (métricas principales y otros datos) y de perfiles de autor.

El sitio Scopus Preview permite conocer las características de la base de datos Scopus y hacer búsquedas en títulos de revistas y perfiles de autores

En lo que sigue, presentaremos las 6 fases vistas anteriormente, pero ahora con más detalle y apoyaremos su descripción con capturas de pantalla siguiendo un caso típico de necesidad de información académica.

El escenario que utilizaremos es el siguiente: supondremos que necesitamos encontrar los mejores estudios publicados en revistas científicas sobre el fenómeno conocido como desinformación (fake news), y para ello, nos disponemos a utilizar la base de datos Scopus.

Diagrama de la Fase 1: Preparación

FASE 1. Preparación

Antes de utilizar una base de datos académica, se requiere una fase de preparación, en la que, entre otras cosas, debemos proveernos de un conjunto inicial de palabras clave.

Sin tener esta fase bien resuelta es imposible utilizar bien las bases de datos académicas, y todo el tiempo invertido en una base de datos puede ser una lastimosa pérdida de tiempo y, lo que es aún peor, de oportunidades.

Conjunto de palabras clave

Lo primero que vamos a necesitar es diferenciar las ideas de concepto y palabra clave. Los seres humanos utilizamos conceptos, pero los ordenadores necesitan palabras clave. Partiremos, por tanto, de los conceptos que definen nuestra necesidad de información, y los transformaremos en un grupo de palabras clave.

Un concepto es un constructo que tenemos en nuestra cabeza. Cuando lo expresamos mediante cadenas de caracteres es una palabra clave, pero sucede que diferentes palabras claves expresan el mismo concepto. Por ejemplo las palabras clave desinformación y bulo expresan el mismo concepto (al menos a nivel documental)  por eso en general para expresar cada concepto necesitaremos n palabras clave.

Diagrama de conceptos y palabras clave
Para una base de datos, un concepto es un conjunto de palabras clave

Para obtener un conjunto inicial de palabras clave, podemos utilizar el procedimiento o framework que denominamos FDC, por las siglas Facetar, Derivar, Combinar. Consiste en facetar los aspectos más importantes del nuevo proyecto para el que necesitamos utilizar las bases de datos (objeto de estudio, objetivos, métodos, etc.), derivar palabras clave de estas facetas y eventualmente, combinarlas en ecuaciones previas que podemos tener preparadas para iniciar la explotación de las bases de datos.



No obstante, nada nos impide comenzar de un modo más intuitivo si estamos tan al inicio de  un proyecto que aún no estamos en condiciones de facetarlo de la forma que propone el Framework FDC, y tal vez es justo por eso por lo que queremos buscar ideas en una base de datos. En estos casos típicos de pez-que-se-muerde-la-cola, podemos empezar por proveernos justo de un pequeño grupo de palabras clave que sean muy características del proyecto en el que estamos empezando.

Por ejemplo, supongamos un investigador que necesita empezar a diseñar un proyecto de investigación alrededor del fenómeno de la desinformación y las redes sociales.  Ya tiene entonces al menos dos conceptos iniciales con los cuales empezar a preparar su conjunto de palabras clave.

La tabla siguiente recoge estas palabras clave, tanto en castellano como en inglés, ya que muchas de las mejores bases de datos internacionales utilizan el inglés como lengua de trabajo (independientemente de la lengua de los documentos):

EspañolInglés
desinformacióndisinformation
información erróneamisinformation
noticias falsasfake news
redes socialessocial networks
facebookfacebook
twittertwitter

En la tabla precedente hemos marcado en negritas la primera palabra clave de cada concepto, y debajo de ellas, hemos ubicado los sinónimos documentales.

De este modo, a efectos de la búsqueda, desinformación, información errónea y noticias falsas, son un solo concepto expresado con tres palabra clave, y así sucesivamente con los otros dos conceptos. Dado que las tres palabras clave mostradas no son sinónimos desde un punto de vista filológico, decimos que son sinónimos documentales.

Concepto nuclear y conceptos de anclaje

Cuando tenemos dos o más conceptos o palabras clave, puede ser útil diferenciar entre el concepto nuclear y los conceptos de anclaje. El concepto nuclear es el que identifica nuestro objeto de estudio o interés principal. Aquí suponemos que es el concepto de la desinformación.

Los conceptos de anclaje sirven para precisar a qué se aplica, literalmente, para anclar el sentido del objeto de estudio. En nuestro caso, nuestros conceptos de anclaje son redes sociales y verificación.

Lo podemos expresar también con las ideas de foco y complemento. Esto significa que nuestro foco es la desinformación, pero siempre que esté vinculado con las redes sociales, con lo cual esta última palabra clave es el complemento.

La diferencia entre el concepto nuclear y los de anclaje, la usaremos en la búsqueda avanzada de este modo:

  • Palabras clave del concepto nuclear: limitado al título de los documentos, para lograr documentos con el máximo enfoque en este concepto. No nos interesan documentos que traten superficialmente la desinformación, por lo tanto, exigiremos que las palabras clave aparezcan en el lugar de la máxima relevancia, en el título.
  • Palabras clave de los conceptos de anclaje: sin especificar campos, o incluyendo varios campos si la base de datos lo permite. La razón es que deseamos anclar el concepto nuclear con estas otras palabras clave, pero sin ajustarlo tanto que podamos perder información. 

Una vez armados con un conjunto como el anterior ya podremos hacer nuestras primeras pruebas, combinando dos o más de estas palabras (del grupo en inglés) con operadores como los que veremos en las próximas capturas.

No hace falta partir de tantas palabras clave como en este ejemplo. En general. necesitaremos al menos dos conceptos, como en desinformación y redes sociales, y a poder ser uno o dos sinónimos para cada concepto, por lo tanto, podemos empezar en una fase realmente inicial con entre 2 y 4 palabras clave.

Cuentas y gestor de referencias

Forma parte también de esta fase abrir una cuenta de usuario en la base de datos que vayamos a utilizar, sin la cual, a una parte muy importante de las funciones de la misma no podríamos acceder, por ejemplo, las fases 5 y 6.

Por esta razón, damos por sentado que las bases de datos se utilizan tras iniciar una sesión (login) con nuestra cuenta ya que la mayoría permiten este doble uso, a saber, sin o con inicio de sesión. Por lo dicho, se entiende que para nosotros, usar bases de datos sin inicio de sesión carece de sentido.

Además, necesitaremos un gestor de referencias al cual poder exportar los resultados a medida que los vayamos obteniendo.

Dado que es el que se utiliza en diversos sistemas universitarios (como el que afecta a este autor, el de Cataluña) y dado que es una aplicación gratuita, nosotros recomendamos utilizar Mendeley, pero también es muy popular por sus buenas prestaciones, Zotero, que es igualmente gratuito. Para quien lo prefiera, hay además gestores comerciales como EndNote o Papers.

Diagrama de la Fase 2: Búsqueda

FASE 2. Búsqueda

Cuando tenemos dos cantidades expresadas por números, por ejemplo, el número 4 y el número 6, y dos operadores aritméticos, p.e., la suma (+) y la multiplicación (x), podemos hacer dos operaciones y cada una de ellas dará un tercer número distinto en cada caso:

  • La suma, como en 4+6=10
  • La multiplicación, como en 4×6=24

Búsqueda booleana

Para utilizar la búsqueda avanzada es importante entender que cuando tenemos dos o más palabras clave,  cada palabra clave representa un conjunto, concretamente representa el conjunto de los documentos que contienen esa palabra clave. (o que han sido indizados con esa palabra clave).

La cuestión es que podemos hacer operaciones con dos conjunto distintos usando diferentes operadores booleanos  (en lugar de aritméticos), p.e. el OR , el AND y el NOT cada una de ellas dará un resultado distinto. Por ejemplo:

  • OR: suma lógica, como en disinformation OR misinformation
  • AND: intersección lógica como en disinformation AND misinformation
  • NOT: resta lógica, como en disinformation NOT misinformation

Ya que operamos con conjuntos de documentos, el resultado será un tercer conjunto de documentos que cumplirá la ecuación en cada caso y por tanto, en cada caso, el conjunto de documentos será distinto. De las tres opciones, solamente la primera, por cierto, tiene sentido, dadas las palabras clave elegidas. En lo que sigue, explicamos el motivo.

OR o suma lógica

La suma reune en un mismo conjunto todos los documentos  que tiene alguna de las palabras clave que estamos sumando. Se expresa mediante el operador OR (a veces se usa el símbolo +).

Por ejemplo, si sumo las palabras clave disinformation, misinformation, con un OR, tendré un conjunto formado por todos los documentos que utilizan la palabra clave disinformation, todos los que utilizan la palabra clave misinformation y todos los que usan ambas. Entonces podemos decir que el operador OR nos sirve para unir los diferentes sinónimos documentales de un mismo concepto para evitar la pérdida de información debido a que diferentes autores se refieren a los mismos temas con diferentes términos, debido a la riqueza característica del lenguaje natural.

Por tanto, la ecuación disinformation OR misinformation tiene pleno sentido, porque nos ayuda a reunir documentos que tratan del mismo tema aunque usen términos (sinónimos) diferentes.

AND o intersección lógica

La intersección crea un conjunto con los documentos que tienen todas las palabras clave que estamos combinando con un AND.

Por ejemplo, si intersectamos  con un AND las palabras clave disinformation, facebook, tendremos un conjunto formado por los documentos que tienen ambas palabras clave. Si un documento contiene disinformation, pero no facebook, no formará parte del conjunto, y a la inversa también, esto es, si un documento contiene facebook, pero no disinformation, no formará parte del resultado. La intersección expresada con el operador AND exige que todas las palabras clave estén presentes en el mismo documento.

Por tanto, la ecuación más adecuada aquí seria: disinformation AND facebook, porque nos permitirá encontrar los documentos que tratan del fenómeno de la desinformación, siempre que también traten de Facebook.

NOT o resta lógica

Además, tenemos un tercer operador, el NOT, que retira del conjunto final los documentos que contienen la palabra clave. A veces se indica mediante el mismo símbolo que la resta aritmética (-). También se representa a veces como AND NOT, ya que en realidad es un operador compuesto. Entonces aparece así:  disinformation AND NOT misinformation.

La ecuación más adecuada aquí podría ser disinformation NOT rusia, si por alguna razón queremos documentos que traten del fenómeno de la desinformación, pero siempre que NO traten también de Rusia.

Como resumen, podemos presentar este útil diagrama que resume el significado de cada operador para operar con dos conjuntos:

Operadores booleanos
Operaciones booleanas con conjuntos. Fuente: School Districs of Onalaska

En el figura superior, podemos ver mediante diagramas de Venn los diferentes resultados de combinar los mismos conjuntos con diferentes operadores. Con AND, solamente los elementos que pertenecen a ambos conjuntos, resultan seleccionados. Con OR, quedan seleccionados todos, los que solo pertenecen a uno cualquiera de los conjuntos, y los que pertenecen a ambos. Con NOT, todos los elementos que pertenecen al segundo conjunto, resultan excluidos.

Uniéndolo todo

Lo mejor de los operadores lógicos o booleanos es que se pueden combinar sin límite, igual que podemos combinar diversos operadores aritméticos en una misma ecuación.

En el caso que nos ocupa, una posible ecuación podría ser esta:

  • ((disinformation OR misinformation) AND (facebook OR twitter)) NOT (Rusia OR EEUU)

Seguramente, el lector está adivinando el sentido de esta ecuación, pero por si acaso, vamos a exponerlo en lenguaje natural: 

documentos que traten o bien de desinformación, o bien de información errónea, siempre que a la vez traten o bien de Facebook o bien de Twitter, y siempre que no traten ni de Estados Unidos, ni de Rusia.

Hemos explicado con cierto detalle el funcionamiento de los operadores booleanos para entender mejor todo el proceso, pero el uso de formularios lo facilita todo mucho. Podemos olvidarnos del tema de los paréntesis, por ejemplo, así como de cuestiones como si el NOT se expresa así, o mediante AND NOT, etc.

Búsquedas booleanas mediante formulario

Primero, examinemos el formulario de la base de datos Scopus, tal como aparece antes de su utilización:

Scopus. Formulario de bñusqueda
Formulario de búsqueda avanzada aguardando para su uso

En el formulario anterior, hemos destacado estos componentes:

  • Una fila, señalada por Search donde podremos entrar las diferentes palabras clave de cada concepto. La idea principal es que cada fila servirá para entrar los diferentes sinónimos del mismo concepto.
  • Un desplegable, señalado con All fields donde podremos elegir uno o más campos en el que limitar la búsqueda, por ejemplo, el campo título.
  • Un botón, señalado con el símbolo + para añadir más filas según convenga añadir nuevos conceptos. Nosotros, por simplicidad usamreos dos conceptos en los próximos ejemplos, pero podría convenir cruzar tres o más. El límite se agota pronto, porque cuantos más conceptos añadimos, más se reduce el resultado y más se incrementa el riesgo de pérdida de información, así tres que conceptos distintos debe estar cerca del límite. Donde tenemos menos limitaciones es en el número de palabra clave que actúan como sinónimos de cada concepto.
  • Un desplegable, señalado con > Limit que nos permitirá añadir límites, por ejemplo un rango de fechas, por ejemplo, documentos publicados en los últimos 5 años.

Pare ver cómo se expresan búsquedas booleanas en el formulario, vamos a trasladar al mismo esta ecuación relativamente sencilla, obviando los campos y los rangos de fechas (por el momento) para que sea una búsqueda booleana pura:

  • (disinformation OR misinformation) AND (facebook OR twitter)
Búsqueda booleana con el formulario de búsqueda avanzada de Scopus

Como podemos ver, hemos utilizado dos filas del formulario para poner en cada una de ellas, cada uno de los dos conceptos, cada uno de ellos, a su vez, con dos sinónimos.

El resultado los tenemos reflejado en la siguiente captura.

Los datos de la búsqueda por Scopus

La captura precedente muestra los resultados obtenidos, 1.654 documentos, y sobre todo, que es lo que nos interesa aquí, la traducción que ha hecho Scopus de los datos que ha encontrado en el formulario. Podemos ver que los ha convertido en una ecuación de búsqueda a la que ha añadido paréntesis, los dos operadores booleanos y un operador ALL que significa, «todos los campos del documento».

El resultado, a los efectos de una revisión bibliográfica es muy abultado. Podemos explotar los resultados de forma cuantitativa con las herramientas de análisis que proporciona Scopus. Pero estos análisis se refieren a citaciones, distribuciones por años, por países, etc.

Si el nuestro es un escenario en el que debemos evaluar y analizar el contenido de cada documento y después sintetizar los resultados en forma, por ejemplo, de un estado de la cuestión, esta cifra es excesiva. Debemos refinar nuestra búsqueda y conseguir un conjunto más manejable, que se mueva entre varias decenas y uno o dos centenares como máximo, so pena de morir de éxito. Pero al mismo tiempo, no podemos perder relevancia ni rigor en la forma de selección.

Búsqueda parametrizada

Además de las búsquedas booleanas, podemos llevar a cabo búsquedas parametrizadas si aplicamos un filtro o parámetro exigiendo que la palabra clave aparezca en una zona determinada del documento, por ejemplo, en el título, o que el documento se haya publicado en un determinado rango de fechas, por ejemplo, en los últimos 5 años.

Lo normal es hacer en realidad búsquedas mixtas, en las que intervienen tanto la búsqueda booleana como la búsqueda parametrizada. Además, es también habitual incluir una limitación por un rango de fechas de publicación.

Vamos a hacer intervenir de nuevo al formulario de búsqueda avanzada de Scopus para poder mostrar esta clase de búsquedas mixtas en la siguiente captura incluyendo ahora también un rango de fechas:

Formulario de búsqueda en Scopus
El formulario avanzado de una base de datos académica en plena acción. Scopus en este caso.

El formulario de la captura precedentes nos muestra el siguiente uso:

  • Hemos usado dos de nuestros conceptos principales: desinformación y redes sociales.
  • Hemos usado dos filas de palabras clave, cada una para uno de los dos conceptos: desinformación, en una fila, y redes sociales en la otra.
  • En cada una de las filas, hemos combinado los sinónimos de cada concepto con el operador OR, lo que nos permite obtener la suma de todos los documentos que tratan de cualquiera de ellos.
  • Hemos asignado cada una de las filas a un campo o grupo de campos, con lo cual hemos llevado a cabo una búsqueda parametrizada.
  • El primer concepto (primera fila), el que hemos decidido que es el más importante o concepto nuclear de nuestro proyecto, lo hemos asignado al título.
  • El segundo concepto (segunda fila) que ayuda a centrar el tema de investigación, o conceptos de anclaje, lo hemos asignado a un grupo de campos que incluye el resumen, lo que permite ampliar un poco más los resultados.
  • Hemos cruzado las dos filas, esto es los dos conceptos, mediante un AND, lo que nos permite realizar la intersección de  conceptos y obtener solamente los documentos que tratan de ambos concepto a la vez.
  • Por último, hemos limitado el conjunto de resultados a publicaciones posteriores al 2015 ya que queremos trabajar solamente con investigaciones recientes. Esto es algo que no siempre podemos hacer, al menos, no con una limitación tan clara, pero en general, es conveniente trabajar con documentos publicados en los últimos 5 o 10 años, aunque esto depende  de los objetivos de cada investigación. Y por supuesto, esto no niega citar obras seminales de cualquier época en los trabajos. Nuestro ejemplo preferido es que, en un trabajo sobre retórica, además de las investigaciones de los últimos 5 años, siempre tendrá sentido citar a Aristóteles.
  • Tres observaciones importantes más: hemos usado comillas para enmarcar palabras clave compuestas por dos o más términos. Esto evitará falsas coordinaciones de términos, y dará mayor precisión. Hemos truncado con un asterisco uno de los términos para no perder variables de la palabra clave en plural. Por último, se suelen indicar los operadores en mayúsculas (AND, OR, NOT) para que no se confundan con términos de búsqueda, como en «to be or not to be».

La cuestión es que, dependiendo del proyecto, tendremos que llevar a cabo una o más búsquedas como la anterior para poner a prueba la eficiencia de las diferentes palabras clave seleccionadas para evitar ruido y seleccionar referencias relevantes. 

La historia de búsqueda

Ejemplo de una historia de búsqueda en Scopus tras varias sesiones

También es posible que nos convenga revisar la historia de búsqueda si no hemos podido planificar una estrategia de búsqueda bien definida al principio y hemos necesitado ir probando con diversas estrategias.

O si, incluso sabiendo desde el principio qué queríamos buscar, optamos por una manera progresiva de ir buscando en base a lanzar primero búsquedas generales, por palabras clave más bien genéricas, para luego irlas combinando entre sí.

Como sea, utilizar la historia de búsqueda en aquellas bases de datos que presentan esta opción es un modo alternativo a utilizar bases de datos que no requiere combinar de entrada todas las facetas de nuestra búsqueda.

En lugar de esto, podemos plantear búsquedas separadas por cada concepto, usando sinónimos, y por tanto, un OR, y después podemos combinar los conjuntos de resultados con un AND para explorar los conjuntos resultantes.



    Diagrama de la Fase 3: Página de resultados

FASE 3. Página de resultados

La página de resultados es el lugar donde, como indica su nombre, aparece la lista de resultados, esto es, la lista de documentos que se supone que son relevantes para la necesidad de información que ha sido expresada con la ecuación de búsqueda.

Cabecera de la página de resultados

Parte superior de la página de resultados

La cabecera de la página de resultados es muy importante porque nos informa del número total de resultados obtenidos. Además, presenta la ecuación realizada por el sistema de manera que podemos comprobar que ha sido bien interpretada. Por último, tenemos dos opciones de alto valor, la de guardar la búsqueda y la de editarla sin perder la configuración original. 

Hemos obtenido una cifra de referencias que no es óptima, pero no es ningún problema. Aunque no encontrásemos formas de refinación posterior, cosa muy improbable, revisar esa cantidad de documentos en base al título, es una tarea al alcance, que nos permitiría, eventualmente, reducir mucho la cifra final sobre la base de evaluar la adecuación real de cada referencia a los objetivos de la investigación. 

Cuerpo de la página de resultados

Página de resultados de Scopus
Página de resultados

En la página de resultados, los puntos que deben requerir nuestra atención son los siguientes:

  • Formas de ordenación de la lista de resultados. En el caso de la captura precedente, la ordenación es por relevancia. Pero podrían interesarnos los más citados, o los más recientes.
  • Posibilidades de filtrado de la información si hemos obtenido un número de documentos poco manejable. Esta operación de filtrado, los reducirá al mismo tiempo que aumentará su relevancia.
  • Naturalmente, los resultados en sí mismos, pero si son excesivamente numerosos o aparece ruido por algún motivo, los filtros y los sistemas de ordenación nos ayudarán a explorar mejor estos resultados.

Acceso al documento completo

Esta es la primera de las fases donde podemos optar por acceder al documento completo si la inspección del título y la fuente nos permite determinar la relevancia del mismo. Hay varias opciones: si se trata de un documento en open access, podremos acceder al enlace de descarga de forma directa.

En otros casos, podemos utilizar el botón que permite consultar la disponibilidad en nuestra universidad o centro de trabajo. Por último, podemos utilizar el enlace View at Publisher para consultar las opciones de acceso.

Scopus: acceso al documento
Opciones de acceso al documento completo

En la captura precedente vemos la opción View at Publisher, que en el caso de una revista open access, nos permite la descarga directa del documento en pdf. También vemos la opción de consultarlo en el catálogo de la biblioteca de nuestro centro de trabajo si es una revista tradicional.

Esta consulta nos informará de la disponibilidad del documento (o no) según forme parte de las revisas suscritas por nuestro centro. Si no fuera el caso, entonces se abren otras posibilidades: buscarlo en Google Scholar, p.e., por si el autor ha procedido a su autoarchivo, o solicitarlo por préstamos interbiblitecario si es una opción disponible en la biblioteca de nuestro centro.

Filtros

Filtros en la búsqueda con la base de datos Scopus
Filtros adicionales en la página de resultados. Estamos usando siempre la base de datos Scopus.

La captura precedente muestra filtros adicionales (vista parcial) en la página de resultados. Con una serie de filtros adicionales, como los que podemos ver en la captura precedente, podemos refinar aún el conjunto final en caso que el número de referencias sea muy alto inicialmente.

Por ejemplo, reducir por Social Science y Arts and Humanities, reduce considerablemente el resultado. Incluso podría suceder que nos interesara reducir por Psychology, lo que nos permitiría reducir los resultados a un número muy manejable, como podemos ver por la captura.

Diagrama de la Fase 4: el registro

FASE 4. Metadatos (Registro)

En el registro aparecen los metadatos que nos ayudan a evaluar el documento, principalmente gracias al resumen. En el caso de una revisión sistematizada, la lectura del resumen nos permite incluir o excluir referencias. Ademas,en el registro tenemos otras informaciones que nos pueden ayudar a descubrir información relacionada.

Registro de la base de datos Scopus
El registro aporta un importante conjunto de metadatos que facilitan el descubrimiento de relaciones.

En el caso del registro, los puntos que debemos atender son los siguientes:

  • La filiación de los autores, por si por algún motivo contemplamos la posibilidad de contactar a expertos en el área de nuestra investigación.
  • El resumen y la terminología utilizada en el mismo, que puede aportarnos ideas de búsqueda, además de que nos ayuda a determinar la relevancia de la investigación para nuestro proyecto.
  • Las palabras clave, por la misma razón.

Descubrimiento 1

Parte de un registro en Scopus
El modelo de registro de Scopus aporta numerosas fuentes de información adicional.

Vemos en esta captura que la revisión atenta del registro de un documento en Scopus aporta numerosas fuentes adicionales de información.

Descubrimiento 2

Las referencias citadas por un documento relevante suelen ser, a su vez, muy relevantes.

Nunca debemos olvidar revisar las referencias citadas por los documentos que nos parezcan más relevantes. Pueden comportarse como documentos-semilla que nos conducen a otros documentos de interés.

Acceso al documento completo

El acceso al documento completo, lo hemos definido como una subfase flotante porque es una opción disponible desde diversas fases. En el caso del registro, al acceder a la ficha del mismo, solemos tener enlaces de descarga o de consulta en el catálogo de la biblioteca de nuestro centro.

Scopus: acceso al documento desde el registro
Opciones de acceso al documento desde el registro

En la captura precedente, vemos las dos opciones básicas de acceso al documento: el enlace que realiza la consulta al catálogo de nuestra biblioteca, Consulta’l, y el enlace que nos lleva al editor, View at publisher. La opción Save to pdf, no es para descargar el artículo completo, sino la ficha del registro en formato pdf.

Diagrama de la Fase 5: Exportaciones

FASE 5. Exportación

Una vez hemos identificado referencias útiles para nuestro proyecto, lo más lógico es proceder a la exportación de las mismas, bien como tales referencias a través de un gestor bibliográfico, o bien descargando un archivo con los datos. Para ello, volvemos a nuestra página de resultados, y si no lo habíamos hecho antes, ahora podemos ir marcando las referencias que nos ha parecido relevantes.

Puntos vinculados con la exportación en una página de resultados

Puntos de atención en la página de resultados, una vez hemos identificado referencias relevantes para nuestra investigación:

  • En la parte lateral: casillas de selección individual para cada documento. También hay una casilla que permite seleccionar todos las referencias de la página en caso que la búsqueda haya sido muy precisa.
  • En la parte superior, una vez hemos seleccionado uno o más documentos, se activan las diferentes opciones de exportación y descarga. Con la opción Save to Mendeley, podemos mandar las referencias marcadas a nuestra base de datos personal en este gestor. Si utilizamos otro gestor, no es problema, porque si desplegamos la lista de opciones, aparecen otras posibilidades de exportación, incluyendo formatos estándar que aceptan todos los gestores bibliográficos.
  • Si instalamos una extensión de Scopus para el navegador, podemos descargar directamente los documentos (el pdf completo) si se trata de artículos publicados en open access, o tenemos acceso por suscripción. En todo caso, cabe recordar que estas opciones también las tenemos desde el registro (aunque no usemos una extensión del navegador).
  • Se activan, adicionalmente, otras opciones que también son de interés, como ver datos de citación de los documentos seleccionados (View citation overview), crear un bibliografía, imprimir la lista, descargar una lista de las referencias en pdf, etc.

Importación desde plugin del navegador

Adicionalmente, el plugin o extensión de Mendeley en nuestro navegador nos permite capturar las referencias y los pdf correspondientes, si es el caso. Entonces, como es una opeeración que hacemos desde nuestro gestor de referencias, es una operación de importación.

Mendeley plugin
La extensión del navegador de Mendeley en plena acción

En la captura precedente vemos el trabajo de la extensión de Mendeley desde el navegador. Al activar la extensión en la barra del navegador, detecta la serie de referencias. Podemos seleccionar la carpeta de destino, incluir el pdf si es el caso, y podemos marcar o desmarcar referencias individuales para su importación selectiva.

Diagrama de la Fase 6: Alertas

FASE 6. Alertas

Si la ecuación de búsqueda ha sido exitosa, esto es, nos ha proporcionado referencias valiosas, y nuestro proyecto tiene una duración media o larga (meses o años) o es de duración indefinida, lo lógico es repetir la misma búsqueda cada cierto tiempo.

Pero este caso, lo mejor es programar una alerta, de modo que sea un bot el que se ocupe de llevarla a cabo de manera periódica, sin nuestra intervención, y que cada vez que haya resultados, nos lo haga llegar a nuestro correo.

Alerta de búsqueda

Alerta de búsqueda en Scopus

La alerta de búsqueda se activa desde la página de resultados, mediante una opción situada en la parte superior izquierda. Con la alerta de búsqueda programamos un bot que guarda la búsqueda y la ejecuta automáticamente de forma periódica. Los resultados, los enviará por correo. 

Alerta de citación

Alerta de citación

La alerta de citación, o de documento, se activa desde el registro. Recibiremos un correo con los documentos que citen a esta referencia en el futuro. Una explicación de cómo definir alertas en bases de datos académicas se puede consultar aquí.

La selección de las bases de datos

Para poder concentrarnos en lo esencial de este trabajo, a saber, la forma más eficiente de utilizar una base de datos, hemos obviado una especie de Fase 0 que sería la selección de la base de datos. En el caso de algunas disciplinas, la selección de la base de datos puede ser algo obvio, y seguramente pasa por usar Scopus, sin perjuicio de alguna otra, muy notablemente Web of Science.

En Ciencias Humanas y Sociales, en lugar de una base de datos óptima, tenemos un conjunto de bases de datos óptimo cuya composición, aparte de algunas bases de datos imposibles de obviar, como las varias veces mencionadas Scopus y Web of Science, depende de cada proyecto. De aquí el concepto de grupo óptimo de base de datos que hemos acuñado para este propósito. Se puede consultar este concepto y la forma de generar el grupo óptimo en el caso de proyectos de investigación en Comunicacion Socialaquí.

Estados de la cuestión

La búsqueda en bases de datos puede tener lugar en varios contextos. Uno de los más significativos, y es el que hemos tenido in mente al preparar este trabajo son las revisiones bibliográficas.

Para ubicar la búsqueda en un contexto más amplio, podemos referirnos a los trabajos de revisión y los estados de la cuestión, que son los escenarios más exigentes para una revisión bibliográfica que, en este caso, debería adoptar una aproximación sistemática. Se pueden consultar aspectos de contexto como los referidos a las revisiones sistemáticas aquí.

Conclusiones

Hemos presentado, mediante 6 fases, un procedimiento general para utilizar bases de datos académicas. Aunque el uso de las bases de datos en sí misma comienza en la fase 2, resulta que la fase 1 es posiblemente la más importante de todas, porque es la proporciona la lista de palabras clave con las cuales podemos construir nuestras ecuaciones de consulta.

Del conjunto de las 6 fases, solamente las que van de la 1 a la 3 siguen el orden secuencial que sugiere el término «fase». Las otras tres pueden intercambiar su orden sin ningún problema. Nosotros hemos presentado un orden posible pensando más en la lógica de su exposición que en el realismo de su realización, así que, como decimos, nada impide intercambiar entre sí las 3 últimas.

Lo más importante es tener presentes la totalidad de las 6 fases y entender bien las posibilidades a nuestro alcance en cada una de ellas, con el fin de poder obtener un rendimiento óptimo de nuestra capacidad de explotación de las mismas, a fin de poder convertir buenos proyectos en proyectos excelentes.


Más información

Sobre bases de datos académicas -ir inicio-

Una base de datos académica es un sistema de información que registra documentos y sus propiedades. Estos documentos resultan de actividades académico-científicas, y pueden adquirir la forma de artículos, actas de congresos, capítulos de libros y tesis, entre otros. Los términos base de datos académica y base de datos científica son equivalentes.

Su objetivo es doble:

  • por un lado apoyar la producción de nuevo conocimiento, gracias a la naturaleza acumulativa de la ciencia, que se beneficia de los trabajos anteriores;
  • por otro lado, proporcionar métricas e informaciones sobre la producción científica que permita a los gestores de la ciencia tomar decisiones informadas.

La estructura principal de una base de datos académica consta de tres módulos interrelacionados para dar respuesta al primero de los objetivos:

  • Sistema de búsqueda
  • Página de resultados
  • Registro

Además, disponen de un cuarto módulo para el segundo objetivo:

  • Sistema de análisis y métricas de la producción científica

(Fuente: elaboración propia)