
Edición Agosto 2020
Utilizadas de forma adecuada, las base de datos académicas pueden ayudar a que una buena tesis sea una tesis excelente, afirmación que se puede generalizar a casi cualquier tipo de trabajo o proyecto académico.
En este artículo mostraremos cómo aprovechar al máximo las posibilidades de las bases de datos académicas a través de 6 pasos o fases bien definidas.
Para ilustrar el procedimiento, utilizaremos Scopus ya que, además de ser una de las bases de datos más importantes del mundo, presenta una de las mejores interfaces de usuario de su categoría.
No obstante, las fases que vamos a ver mediante esta base de datos concreta se pueden aplicar a Web of Science (WoS) así como, en general, a las mejores bases de datos académicas, ya que suelen contar con interfaces de búsqueda muy completas y, hasta cierto punto, muy similares.
Bases de datos académicas y tesis doctorales
Hemos adoptado la realización de una tesis doctoral como background preferente para mostrar el uso eficiente de bases de datos académicas, ya que es uno de los contextos más exigentes en cuanto a la búsqueda y examen de la producción científica previa.
En concreto, se espera de una tesis doctoral (pero también de un trabajo final de máster, o de la memoria de petición de financiación de un proyecto de investigación) que demuestre un conocimiento amplio de la producción académica anterior.
Aunque existen otras fuentes y modos de obtención de información, la única forma segura de garantizar una revisión sistemática de la bibliografía es mediante el uso de bases de datos académicas.
Aunque aparentemente no presentan dificultades de uso especiales, también es cierto que es muy fácil utilizar mal las bases de datos o utilizarlas de forma incompleta. Esta es la motivación de este trabajo, a saber, presentar un procedimiento detallado, basado en fases bien definidas, para estar seguros de no perder oportunidades.
Usuarios y estructura de una base de datos académica
Vamos a empezar por considerar qué estructura tienen las bases de datos, pero antes necesitamos presentar una breve aclaración sobre sus dos grupos principales de usuarios.
Usuarios
Las mejores bases de datos académicas tienen un componente que aquí no trataremos: un sistema de métricas sobre las producción científica dirigido principalmente a analistas o gestores de la ciencia (pueden obtener información sobre este componente aquí).
Por eso mismo, las bases de datos académicas tienen al menos dos grandes grupos de usuarios: los autores de futuros trabajos académicos y los analistas, gestores y estudiosos de la comunicación científica.

Las dos figuras pueden coincidir en algunos casos, pero aún así tienen necesidades distintas. Los autores, normalmente utilizarán el sistema de recuperación de información. Los gestores o analistas, el sistema de análisis y métricas. Nosotros nos centraremos en el primer caso, a saber, el de los autores de futuros trabajos (por ejemplo, de una tesis de máster o de doctorado).
Componentes
La forma eficiente de utilizar una base de datos académica debe comenzar por el reconocimiento de sus tres componentes principales:
- Búsqueda
- Página de resultados
- Registro
Estos componentes tienen la misión de proveer información para la creación de nuevo conocimiento, y están dirigidos, por tanto, a los autores de nueva producción científico-académica: artículos de revista, tesis doctorales, etc.
Primera versión de los 6 pasos: presentación resumida

Presentamos ahora los 6 pasos de modo somero, con tal de tener una visión de conjunto, y más adelante los examinaremos por separado:
1. Preparación, o fase de ideación y provisión de palabras clave. Probablemente, la más importante de las 6 fases. Sin una buena resolución de esta fase, todas las demás pueden conducir a una simple pérdida de tiempo. Esta fase, como casi todo en esta vida, se puede llevar a cabo por ensayo y error, pero si no queremos que demande una inversión de tiempo exagerada, nos convendrá partir de buenos cimientos y esto requiere preparación «con papel y lápiz» (o más exactamente, con ordenador y editor de textos).
2. Búsqueda. La búsqueda se puede hacer de diferentes modos, por ejemplo, mediante el uso de comandos y la sintaxis directa del lenguaje de interrogación de la base de datos, pero nosotros recomendamos utilizar el formulario de búsqueda avanzada .
3. Examen de la página de resultados, donde procedemos a un primer examen de resultados, evaluando la relevancia de los mismos en base al título. La obtención del documento completo (generalmente en formato pdf) es una subfase flotante ya que podemos proceder a obtenerlo aquí, si es el caso, o en cualquiera de las siguientes.
4. Examen del registro, donde determinamos con mayor precisión la relevancia de cada resultado en base al resumen. También obtendremos otros datos y podremos activar funciones de descubrimiento. Esta es otra de las fases donde podemos optar por acceder al documento completo si los datos del registro confirman la relevancia del documento.
5. Exportaciones, operación que llevamos a cabo con las referencias más relevantes y que necesitaremos poder recuperar y en su caso incorporar a nuestro banco de documentos. La exportación se puede realizar a un gestor de referencias (es la opción recomendada) como Mendeley o Zotero.
6. Definición de alertas, mediante las cuales aseguramos que, en el futuro, estaremos conveniente informados de las novedades sin necesidad de repetir las mismas búsquedas. En su lugar, dejaremos a un bot encargado de tales tareas.
Orden de procedimiento: opción posible

Fases implica la idea de un orden secuencial y más si se numeran como hemos hecho nosotros. El diagrama precedente, además de presentar las 6 fases en la que hemos divido el proceso completo de utilización y explotación de una base de datos, refleja esta idea.
Pero cabe señalar que solo tienen un comportamiento genuino como proceso secuencial las fases las que van de la 1 a la 3. Las fases 4 a 6 pueden intercambiar sin ningún problema el orden entre ellas.
Por si fuera poco, en un proceso real de búsqueda, lo más normal es que tengamos que volver de cualquiera de las fases a otra anterior en una cierta reiteración del proceso.
Orden de procedimiento: variación con alternativas
Por este motivo, el siguiente diagrama, mantiene las mismas 6 fases pero intenta recoger las ideas precedentes. Aprovecharemos para explicar porqué hemos marcado con otro color la primera de las fases.
Primero, porque es una fase orientada al uso de la base de datos pero en la que aún no utilizamos la base de datos (en sí misma).
Segundo porque pese a esto mismo, probablemente es la más importante de todas. Como sea, el nuevo diagrama, ahora un poco más complicado, queda de la siguiente forma:

La interpretación es la siguiente: a partir de la fase 3, esto es, una vez ante la página de resultados puede resultar igual de eficiente proceder, en cualquier orden a ejecutar cualquiera de las otras tres fases.
Nosotros, a fin de presentar un método concreto, procederemos a utilizar la versión que vemos en el primer diagrama, pero queríamos dejar claro que otras secuencias son posibles en función de cada caso.
Bases de datos académicas: el caso de Scopus
Scopus es una de las bases de datos académicas más importantes del mundo, y es comúnmente utilizada, junto con Web of Science por universidades, centros de investigación y agencias de gestión científica de todo el mundo.
Por la amplitud y la diversidad de su cobertura puede ser utilizada como una de las fuentes principales para investigación científica en cualquier ámbito, lo que incluye el dominio que nos interesa aquí, a saber las Humanidades y las Ciencias Sociales en general, y por tanto, en la Comunicación en particular.
Se presenta a sí misma de este modo en su página de información:
Scopus is the largest abstract and citation database of peer-reviewed literature: scientific journals, books and conference proceedings. Delivering a comprehensive overview of the world’s research output in the fields of science, technology, medicine, social sciences, and arts and humanities, Scopus features smart tools to track, analyze and visualize research.
As research becomes increasingly global, interdisciplinary and collaborative, you can make sure that critical research from around the world is not missed when you choose Scopus.
Who uses Scopus?
The A&I research discovery solution for academia, business and government. From researchers pursuing scientific breakthroughs to academic institutions and government agencies evaluating research, Scopus is the abstract and indexing database of choice. Worldwide, Scopus is used by more than 3,000 academic, government and corporate institutions and is the main data source that supports the Elsevier Research Intelligence portfolio.
Como la mayor parte de bases de datos, requiere una suscripción institucional para su utilización, pero dispone de una versión, denominada Scopus Preview que es de acceso gratuito (aunque requiere registro previo) y permite la consulta de títulos de revistas (métricas principales y otros datos) y de perfiles de autor.

En lo que sigue, presentaremos las 6 fases vistas anteriormente, pero ahora con más detalle y apoyaremos su descripción con capturas de pantalla siguiendo un caso típico de necesidad de información académica resuelto con Scopus.
Escenario
A efectos de esta exposición, usaremos un escenario relativamente sencillo. En concreto, el escenario que utilizaremos es el siguiente: supondremos que necesitamos encontrar los mejores estudios publicados en revistas científicas sobre el fenómeno conocido como desinformación (fake news), y para ello, nos disponemos a utilizar la base de datos Scopus.
LAS 6 FASES DE UTILIZACIÓN DE BASES DE DATOS ACADÉMICAS: LA PRESENTACIÓN COMPLETA
A continuación mostraremos de modo detallado los seis pasos o fases para usar bases de datos académicas. Como ya hemos señalado, tomamos el background de la necesidad de llevar a cabo una revisión bibliográfica (sistematizada o no) con el fin, a su vez, de preparar un estado de la cuestión.
FASE 1. Preparación
Antes de utilizar una base de datos académica, se requiere una fase de preparación, en la que, entre otras cosas, debemos proveernos de un conjunto inicial de palabras clave.
Sin tener esta fase bien resuelta es imposible utilizar bien las bases de datos académicas, y todo el tiempo invertido en una base de datos puede ser una lastimosa pérdida de tiempo y, lo que es aún peor, de oportunidades.
Conjunto de palabras clave
Lo primero que vamos a necesitar es diferenciar las ideas de concepto y palabra clave. Los seres humanos utilizamos conceptos, pero los ordenadores necesitan palabras clave. Partiremos, por tanto, de los conceptos que definen nuestra necesidad de información, y los transformaremos en un grupo de palabras clave.
Un concepto es un constructo que tenemos en nuestra cabeza. Cuando lo expresamos mediante cadenas de caracteres es una palabra clave, pero sucede que diferentes palabras claves expresan el mismo concepto. Por ejemplo las palabras clave desinformación y bulo expresan el mismo concepto (al menos a efectos de búsqueda documental) por eso en general para expresar cada concepto necesitaremos n palabras clave.

Para obtener un conjunto inicial de palabras clave, podemos utilizar el procedimiento o framework que denominamos FDC, por las siglas Facetar, Derivar, Combinar. Consiste en facetar los aspectos más importantes del nuevo proyecto para el que necesitamos utilizar las bases de datos (objeto de estudio, objetivos, métodos, etc.), derivar palabras clave de estas facetas y eventualmente, combinarlas en ecuaciones previas que podemos tener preparadas para iniciar la explotación de las bases de datos.
No obstante, nada nos impide comenzar de un modo más intuitivo si estamos tan al inicio de un proyecto que aún no estamos en condiciones de facetarlo de la forma que propone el Framework FDC, y tal vez es justo por eso por lo que queremos buscar ideas en una base de datos. En estos casos típicos de pez-que-se-muerde-la-cola, podemos empezar por proveernos justo de un pequeño grupo de palabras clave que sean muy características del proyecto en el que estamos empezando.
Por ejemplo, supongamos un investigador que necesita empezar a diseñar un proyecto de investigación alrededor del fenómeno de la desinformación y las redes sociales. Ya tiene entonces al menos dos conceptos iniciales con los cuales empezar a preparar su conjunto de palabras clave.
La tabla siguiente recoge estas palabras clave, tanto en castellano como en inglés, ya que muchas de las mejores bases de datos internacionales utilizan el inglés como lengua de trabajo (independientemente de la lengua de los documentos):
Español | Inglés |
desinformación | disinformation |
información errónea | misinformation |
noticias falsas | fake news |
bulos | hoaxes |
redes sociales | social networks |
En la tabla precedente hemos marcado en negritas la primera palabra clave de cada concepto, y debajo de ellas, hemos ubicado los sinónimos documentales.
De este modo, a efectos de la búsqueda, desinformación, información errónea, noticias falsas y bulos son un solo concepto expresado con cuatro palabra clave, y así sucesivamente con el otro concepto. Dado que las tres palabras clave mostradas no son sinónimos desde un punto de vista filológico, decimos que son sinónimos documentales.
Concepto nuclear y conceptos de anclaje
Cuando tenemos dos o más conceptos o palabras clave, puede ser útil diferenciar entre el concepto nuclear y los conceptos de anclaje. El concepto nuclear es el que identifica nuestro objeto de estudio o interés principal. Aquí suponemos que es el concepto de la desinformación.
Los conceptos de anclaje sirven para precisar a qué se aplica; literalmente sirve para anclar el sentido del objeto de estudio. En nuestro caso, nuestros conceptos de anclaje pueden ser los de redes sociales y verificación.
Lo podemos expresar también con las ideas de foco y complemento. Esto significa que nuestro foco es la desinformación, pero siempre que esté vinculado con las redes sociales o con verificación, con lo cual esta última palabra clave es el complemento.
La diferencia entre el concepto nuclear y los de anclaje, la usaremos en la búsqueda avanzada de este modo:
- Palabras clave del concepto nuclear: limitado al título de los documentos, para lograr documentos con el máximo enfoque en este concepto. No nos interesan documentos que traten superficialmente la desinformación, por lo tanto, exigiremos que las palabras clave aparezcan en el lugar de la máxima relevancia, en el título.
- Palabras clave de los conceptos de anclaje: sin especificar campos, o incluyendo varios campos si la base de datos lo permite. La razón es que deseamos anclar el concepto nuclear con estas otras palabras clave, pero sin ajustarlo tanto que podamos perder información.
Una vez armados con un conjunto como el anterior ya podremos hacer nuestras primeras pruebas, combinando dos o más de estas palabras (del grupo en inglés) con operadores como los que veremos en las próximas capturas.
No hace falta partir de tantas palabras clave como en este ejemplo. En general. necesitaremos al menos dos conceptos, como en desinformación y redes sociales, y a poder ser uno o dos sinónimos para cada concepto, por lo tanto, podemos empezar en una fase realmente inicial con entre 2 y 4 palabras clave.
Cuentas y gestor de referencias
Forma parte también de esta fase abrir una cuenta de usuario en la base de datos que vayamos a utilizar, sin la cual, a una parte muy importante de las funciones de la misma no podríamos acceder, por ejemplo, las fases 5 y 6.
Por esta razón, damos por sentado que las bases de datos se utilizan tras iniciar una sesión (login) con nuestra cuenta ya que la mayoría permiten este doble uso, a saber, sin o con inicio de sesión. Por lo dicho, se entiende que para nosotros, usar bases de datos sin inicio de sesión carece de sentido.
Además, necesitaremos un gestor de referencias al cual poder exportar los resultados a medida que los vayamos obteniendo.
Dado que es el que se utiliza en diversos sistemas universitarios (como el que afecta a este autor, el de Cataluña) y dado que es una aplicación gratuita, nosotros recomendamos utilizar Mendeley, pero también es muy popular por sus buenas prestaciones, Zotero, que es igualmente gratuito. Para quien lo prefiera, hay además gestores comerciales como EndNote o Papers.
FASE 2. Búsqueda avanzada
En el núcleo de la búsqueda avanzada está la lógica booleana, que consiste en un pequeño número de operadores y las reglas para su manipulación. Puede parecer excesivo tener que conocer la lógica booleana (sus bases más elementales, en realidad) para usar una base de datos, pero si le sirve de consuelo, lo mismo sucede en realidad con el uso de una hoja de cálculo: si no conocemos las bases de la lógica aritmética y al menos los estadísticos más básicos tampoco usaremos bien una simple hoja de cálculo.
Aprovechando esta analogía, antes de presentar los operadores booleanos, haremos una analogía con la lógica aritmética para entenderlos mejor.
Analogía
Cuando tenemos dos cantidades expresadas por números, por ejemplo, el número 4 y el número 6, y algunos operadores aritméticos, p.e., la suma (+) y la multiplicación (x), podemos hacer dos operaciones diferentes con los mismos números y cada una de ellas dará un tercer número en cada caso:
- La suma, como en 4+6=10
- La multiplicación, como en 4×6=24
La lógica booleana se rige por el mismo principio, pero en lugar de números opera con conceptos, que se expresan con palabras clave, y en lugar de operadores aritméticos como la suma o la multiplicación utiliza la suma lógica o la intersección lógica, según veremos a continuación.
Búsqueda booleana
La cuestión es que podemos hacer operaciones con tales conjunto usando operadores booleanos (en lugar de aritméticos), en concreto, usando OR , AND y NOT:
- OR o suma lógica, como en disinformation OR misinformation
- AND o intersección lógica como en disinformation AND facebook
- NOT o resta lógica, como en disinformation NOT facebook

Como operamos con conjuntos de documentos, el resultado será un tercer conjunto de documentos que cumplirá la ecuación en cada caso y por tanto, en cada caso, el conjunto de documentos será distinto. Los vamos a ver con detalle a continuación.
OR o suma lógica
La suma reúne en un mismo conjunto todos los documentos que tiene alguna de las palabras clave que estamos sumando (una u otra, o ambas). Se expresa mediante el operador OR (a veces se usa el símbolo +).
Por ejemplo, si sumo las palabras clave disinformation, misinformation, con un OR, tendré un conjunto formado por todos los documentos que utilizan la palabra clave disinformation, todos los que utilizan la palabra clave misinformation y todos los que usan ambas.
Entonces podemos decir que el operador OR sirve para unir los diferentes sinónimos documentales de un mismo concepto para evitar la pérdida de información debido a que diferentes autores se refieren a los mismos temas con diferentes términos, debido a la riqueza característica del lenguaje natural.
Por tanto, la ecuación disinformation OR misinformation tiene pleno sentido, porque nos ayuda a reunir documentos que tratan del mismo tema aunque usen términos (sinónimos) diferentes.
AND o intersección lógica
La intersección crea un conjunto con los documentos que tienen todas las palabras clave que estamos utilizando.
Esto es, al usar un AND para combinar, p.e., dos palabras clave, las dos palabras clave deben estar presentes en el documento y no es suficiente con que haya solo una de ellas. Lo mismo sucede si usamos tres palabras clave: las tres deben estar presentes, y no es suficiente con que haya una o dos palabras clave, etc.
Por ejemplo, si intersectamos con un AND las palabras clave disinformation, facebook, tendremos un conjunto formado por los documentos que tienen ambas palabras clave. Si un documento contiene disinformation, pero no facebook, no formará parte del conjunto, y a la inversa también, esto es, si un documento contiene facebook, pero no disinformation, no formará parte del resultado.
Como ya hemos dicho, la intersección expresada con el operador AND exige que todas las palabras clave estén presentes en el mismo documento.
NOT o resta lógica
Además, tenemos un tercer operador, el NOT, que retira del conjunto final los documentos que contienen la palabra clave. A veces se indica mediante el mismo símbolo que la resta aritmética (-).
También se representa a veces como AND NOT, ya que en realidad es un operador compuesto. Entonces aparece así: disinformation AND NOT facebook. En este caso, tendríamos como resultado el conjunto de documentos que tratan sobre desinformación, siempre que no traten de facebook.
Resumen operadores booleanos
Como resumen, podemos presentar este útil diagrama que resume el significado de cada operador para operar con dos conjuntos:
En el figura superior, podemos ver mediante diagramas de Venn los diferentes resultados de combinar los mismos conjuntos con diferentes operadores:
- Con AND, solamente los elementos que pertenecen a ambos conjuntos, resultan seleccionados.
- Con OR, quedan seleccionados todos, los que solo pertenecen a uno cualquiera de los conjuntos, y los que pertenecen a ambos.
- Con NOT, todos los elementos que pertenecen al segundo conjunto, resultan excluidos.
Uniéndolo todo
Lo mejor de los operadores lógicos o booleanos es que se pueden combinar sin límite, igual que podemos combinar diversos operadores aritméticos en una misma ecuación.
En el caso que nos ocupa, una posible ecuación podría ser esta:
- ((disinformation OR misinformation) AND (facebook OR twitter)) NOT (Rusia OR China)
Seguramente, el lector está adivinando el sentido de esta ecuación, pero por si acaso, vamos a exponerlo en lenguaje natural:
documentos que traten o bien de desinformación, o bien de información errónea, siempre que a la vez traten o bien de Facebook o bien de Twitter, y siempre que no traten ni de Rusia ni de China. |
Hemos explicado con cierto detalle el funcionamiento de los operadores booleanos para entender mejor todo el proceso, pero el uso de formularios lo facilita todo mucho. Podemos olvidarnos del tema de los paréntesis, por ejemplo, así como de cuestiones como si el NOT se expresa así, o mediante AND NOT, etc.
Búsquedas booleanas mediante formulario
Primero, examinemos el formulario de la base de datos Scopus, tal como aparece antes de su utilización:
En el formulario anterior, hemos destacado estos componentes:
- Una fila, señalada por Search donde podremos entrar las diferentes palabras clave de cada concepto. La idea principal es que cada fila servirá para entrar los diferentes sinónimos del mismo concepto.
- Un desplegable, señalado con All fields donde podremos elegir uno o más campos en el que limitar la búsqueda, por ejemplo, el campo título.
- Un botón, señalado con el símbolo + para añadir más filas según convenga añadir nuevos conceptos. Nosotros, por simplicidad usamreos dos conceptos en los próximos ejemplos, pero podría convenir cruzar tres o más. El límite se agota pronto, porque cuantos más conceptos añadimos, más se reduce el resultado y más se incrementa el riesgo de pérdida de información, así tres que conceptos distintos debe estar cerca del límite. Donde tenemos menos limitaciones es en el número de palabra clave que actúan como sinónimos de cada concepto.
- Un desplegable, señalado con > Limit que nos permitirá añadir límites, por ejemplo un rango de fechas, por ejemplo, documentos publicados en los últimos 5 años.
Pare ver cómo se expresan búsquedas booleanas en el formulario, vamos a trasladar al mismo esta ecuación relativamente sencilla, obviando los campos y los rangos de fechas (por el momento) para que sea una búsqueda booleana pura:
- (disinformation OR misinformation) AND (facebook OR twitter)
Como podemos ver, hemos utilizado dos filas del formulario para poner en cada una de ellas, cada uno de los dos conceptos, cada uno de ellos, a su vez, con dos sinónimos.
El resultado los tenemos reflejado en la siguiente captura.
La captura precedente muestra los resultados obtenidos, 1.654 documentos, y sobre todo, que es lo que nos interesa aquí, la traducción que ha hecho Scopus de los datos que ha encontrado en el formulario. Podemos ver que los ha convertido en una ecuación de búsqueda a la que ha añadido paréntesis, los dos operadores booleanos y un operador ALL que significa, «todos los campos del documento».
El resultado, a los efectos de una revisión bibliográfica es muy abultado. Podemos explotar los resultados de forma cuantitativa con las herramientas de análisis que proporciona Scopus. Pero estos análisis se refieren a citaciones, distribuciones por años, por países, etc.
Si el nuestro es un escenario en el que debemos evaluar y analizar el contenido de cada documento y después sintetizar los resultados en forma, por ejemplo, de un estado de la cuestión, esta cifra es excesiva. Debemos refinar nuestra búsqueda y conseguir un conjunto más manejable, que se mueva entre varias decenas y uno o dos centenares como máximo, so pena de morir de éxito. Pero al mismo tiempo, no podemos perder relevancia ni rigor en la forma de selección.
Búsqueda parametrizada
Además de las búsquedas booleanas, podemos llevar a cabo búsquedas parametrizadas si aplicamos un filtro o parámetro exigiendo que la palabra clave aparezca en una zona determinada del documento, por ejemplo, en el título, o que el documento se haya publicado en un determinado rango de fechas, por ejemplo, en los últimos 5 años.
Lo normal es hacer en realidad búsquedas mixtas, en las que intervienen tanto la búsqueda booleana como la búsqueda parametrizada. Además, es también habitual incluir una limitación por un rango de fechas de publicación.
Vamos a hacer intervenir de nuevo al formulario de búsqueda avanzada de Scopus para poder mostrar esta clase de búsquedas mixtas en la siguiente captura incluyendo ahora también un rango de fechas:
El formulario de la captura precedentes nos muestra el siguiente uso:
- Hemos usado dos de nuestros conceptos principales: desinformación y redes sociales.
- Hemos usado dos filas de palabras clave, cada una para uno de los dos conceptos: desinformación, en una fila, y redes sociales en la otra.
- En cada una de las filas, hemos combinado los sinónimos de cada concepto con el operador OR, lo que nos permite obtener la suma de todos los documentos que tratan de cualquiera de ellos.
- Hemos asignado cada una de las filas a un campo o grupo de campos, con lo cual hemos llevado a cabo una búsqueda parametrizada.
- El primer concepto (primera fila), el que hemos decidido que es el más importante o concepto nuclear de nuestro proyecto, lo hemos asignado al título.
- El segundo concepto (segunda fila) que ayuda a centrar el tema de investigación, o conceptos de anclaje, lo hemos asignado a un grupo de campos que incluye el resumen, lo que permite ampliar un poco más los resultados.
- Hemos cruzado las dos filas, esto es los dos conceptos, mediante un AND, lo que nos permite realizar la intersección de conceptos y obtener solamente los documentos que tratan de ambos concepto a la vez.
- Por último, hemos limitado el conjunto de resultados a publicaciones posteriores al 2015 ya que queremos trabajar solamente con investigaciones recientes. Esto es algo que no siempre podemos hacer, al menos, no con una limitación tan clara, pero en general, es conveniente trabajar con documentos publicados en los últimos 5 o 10 años, aunque esto depende de los objetivos de cada investigación. Y por supuesto, esto no niega citar obras seminales de cualquier época en los trabajos. Nuestro ejemplo preferido es que, en un trabajo sobre retórica, además de las investigaciones de los últimos 5 años, siempre tendrá sentido citar a Aristóteles.
- Tres observaciones importantes más: hemos usado comillas para enmarcar palabras clave compuestas por dos o más términos. Esto evitará falsas coordinaciones de términos, y dará mayor precisión. Hemos truncado con un asterisco uno de los términos para no perder variables de la palabra clave en plural. Por último, se suelen indicar los operadores en mayúsculas (AND, OR, NOT) para que no se confundan con términos de búsqueda, como en «to be or not to be».
La cuestión es que, dependiendo del proyecto, tendremos que llevar a cabo una o más búsquedas como la anterior para poner a prueba la eficiencia de las diferentes palabras clave seleccionadas para evitar ruido y seleccionar referencias relevantes.
La historia de búsqueda
También es posible que nos convenga revisar la historia de búsqueda si no hemos podido planificar una estrategia de búsqueda bien definida al principio y hemos necesitado ir probando con diversas estrategias.
O si, incluso sabiendo desde el principio qué queríamos buscar, optamos por una manera progresiva de ir buscando en base a lanzar primero búsquedas generales, por palabras clave más bien genéricas, para luego irlas combinando entre sí.
Como sea, utilizar la historia de búsqueda en aquellas bases de datos que presentan esta opción es un modo alternativo a utilizar bases de datos que no requiere combinar de entrada todas las facetas de nuestra búsqueda.
En lugar de esto, podemos plantear búsquedas separadas por cada concepto, usando sinónimos, y por tanto, un OR, y después podemos combinar los conjuntos de resultados con un AND para explorar los conjuntos resultantes.
- Revisión detallada de los operadores de búsqueda: booleanos, de proximidad y de delimitación
- Revisión detallada del uso de la historia de búsqueda en Scopus y Web of Science
FASE 3. Página de resultados
La página de resultados es el lugar donde, como indica su nombre, aparece la lista de resultados, esto es, la lista de documentos que se supone que son relevantes para la necesidad de información que ha sido expresada con la ecuación de búsqueda.
Cabecera de la página de resultados
La cabecera de la página de resultados es muy importante porque nos informa del número total de resultados obtenidos. Además, presenta la ecuación realizada por el sistema de manera que podemos comprobar que ha sido bien interpretada. Por último, tenemos dos opciones de alto valor, la de guardar la búsqueda y la de editarla sin perder la configuración original.
Hemos obtenido una cifra de referencias que no es óptima, pero no es ningún problema. Aunque no encontrásemos formas de refinación posterior, cosa muy improbable, revisar esa cantidad de documentos en base al título, es una tarea al alcance, que nos permitiría, eventualmente, reducir mucho la cifra final sobre la base de evaluar la adecuación real de cada referencia a los objetivos de la investigación.
Cuerpo de la página de resultados
En la página de resultados, los puntos que deben requerir nuestra atención son los siguientes:
- Formas de ordenación de la lista de resultados. En el caso de la captura precedente, la ordenación es por relevancia. Pero podrían interesarnos los más citados, o los más recientes.
- Posibilidades de filtrado de la información si hemos obtenido un número de documentos poco manejable. Esta operación de filtrado, los reducirá al mismo tiempo que aumentará su relevancia.
- Naturalmente, los resultados en sí mismos, pero si son excesivamente numerosos o aparece ruido por algún motivo, los filtros y los sistemas de ordenación nos ayudarán a explorar mejor estos resultados.
Acceso al documento completo
Esta es la primera de las fases donde podemos optar por acceder al documento completo si la inspección del título y la fuente nos permite determinar la relevancia del mismo. Hay varias opciones: si se trata de un documento en open access, podremos acceder al enlace de descarga de forma directa.
En otros casos, podemos utilizar el botón que permite consultar la disponibilidad en nuestra universidad o centro de trabajo. Por último, podemos utilizar el enlace View at Publisher para consultar las opciones de acceso.
En la captura precedente vemos la opción View at Publisher, que en el caso de una revista open access, nos permite la descarga directa del documento en pdf. También vemos la opción de consultarlo en el catálogo de la biblioteca de nuestro centro de trabajo si es una revista tradicional.
Esta consulta nos informará de la disponibilidad del documento (o no) según forme parte de las revisas suscritas por nuestro centro. Si no fuera el caso, entonces se abren otras posibilidades: buscarlo en Google Scholar, p.e., por si el autor ha procedido a su autoarchivo, o solicitarlo por préstamos interbiblitecario si es una opción disponible en la biblioteca de nuestro centro.
Filtros
La captura precedente muestra filtros adicionales (vista parcial) en la página de resultados. Con una serie de filtros adicionales, como los que podemos ver en la captura precedente, podemos refinar aún el conjunto final en caso que el número de referencias sea muy alto inicialmente.
Por ejemplo, reducir por Social Science y Arts and Humanities, reduce considerablemente el resultado. Incluso podría suceder que nos interesara reducir por Psychology, lo que nos permitiría reducir los resultados a un número muy manejable, como podemos ver por la captura.
FASE 4. Metadatos (Registro)
En el registro aparecen los metadatos que nos ayudan a evaluar el documento, principalmente gracias al resumen. En el caso de una revisión sistematizada, la lectura del resumen nos permite incluir o excluir referencias. Ademas,en el registro tenemos otras informaciones que nos pueden ayudar a descubrir información relacionada.

En el caso del registro, los puntos que debemos atender son los siguientes:
- La filiación de los autores, por si por algún motivo contemplamos la posibilidad de contactar a expertos en el área de nuestra investigación.
- El resumen y la terminología utilizada en el mismo, que puede aportarnos ideas de búsqueda, además de que nos ayuda a determinar la relevancia de la investigación para nuestro proyecto.
- Las palabras clave, por la misma razón.
Descubrimiento 1
Vemos en esta captura que la revisión atenta del registro de un documento en Scopus aporta numerosas fuentes adicionales de información.
Descubrimiento 2
Nunca debemos olvidar revisar las referencias citadas por los documentos que nos parezcan más relevantes. Pueden comportarse como documentos-semilla que nos conducen a otros documentos de interés.
Acceso al documento completo
El acceso al documento completo, lo hemos definido como una subfase flotante porque es una opción disponible desde diversas fases. En el caso del registro, al acceder a la ficha del mismo, solemos tener enlaces de descarga o de consulta en el catálogo de la biblioteca de nuestro centro.
En la captura precedente, vemos las dos opciones básicas de acceso al documento: el enlace que realiza la consulta al catálogo de nuestra biblioteca, Consulta’l, y el enlace que nos lleva al editor, View at publisher. La opción Save to pdf, no es para descargar el artículo completo, sino la ficha del registro en formato pdf.
FASE 5. Exportación
Una vez hemos identificado referencias útiles para nuestro proyecto, lo más lógico es proceder a la exportación de las mismas, bien como tales referencias a través de un gestor bibliográfico, o bien descargando un archivo con los datos. Para ello, volvemos a nuestra página de resultados, y si no lo habíamos hecho antes, ahora podemos ir marcando las referencias que nos ha parecido relevantes.
Puntos de atención en la página de resultados, una vez hemos identificado referencias relevantes para nuestra investigación:
- En la parte lateral: casillas de selección individual para cada documento. También hay una casilla que permite seleccionar todos las referencias de la página en caso que la búsqueda haya sido muy precisa.
- En la parte superior, una vez hemos seleccionado uno o más documentos, se activan las diferentes opciones de exportación y descarga. Con la opción Save to Mendeley, podemos mandar las referencias marcadas a nuestra base de datos personal en este gestor. Si utilizamos otro gestor, no es problema, porque si desplegamos la lista de opciones, aparecen otras posibilidades de exportación, incluyendo formatos estándar que aceptan todos los gestores bibliográficos.
- Si instalamos una extensión de Scopus para el navegador, podemos descargar directamente los documentos (el pdf completo) si se trata de artículos publicados en open access, o tenemos acceso por suscripción. En todo caso, cabe recordar que estas opciones también las tenemos desde el registro (aunque no usemos una extensión del navegador).
- Se activan, adicionalmente, otras opciones que también son de interés, como ver datos de citación de los documentos seleccionados (View citation overview), crear un bibliografía, imprimir la lista, descargar una lista de las referencias en pdf, etc.
Importación desde plugin del navegador
Adicionalmente, el plugin o extensión de Mendeley en nuestro navegador nos permite capturar las referencias y los pdf correspondientes, si es el caso. Entonces, como es una opeeración que hacemos desde nuestro gestor de referencias, es una operación de importación.
En la captura precedente vemos el trabajo de la extensión de Mendeley desde el navegador. Al activar la extensión en la barra del navegador, detecta la serie de referencias. Podemos seleccionar la carpeta de destino, incluir el pdf si es el caso, y podemos marcar o desmarcar referencias individuales para su importación selectiva.
FASE 6. Alertas
Si alguna de las ecuaciones de búsqueda han sido exitosa, esto es, nos ha proporcionado referencias valiosas, y nuestro proyecto tiene una duración media o larga (meses o años o indefinido), lo lógico es repetir la misma búsqueda cada cierto tiempo.
Pero este caso, lo mejor es programar una alerta, de modo que sea un bot el que se ocupe de llevarla a cabo de manera periódica, sin nuestra intervención, y que cada vez que haya resultados, pero solamente resultados nuevos, nos lo haga llegar a nuestro correo.
Alerta de búsqueda
La alerta de búsqueda se activa desde la página de resultados, mediante una opción situada en la parte superior izquierda. Con la alerta de búsqueda programamos un bot que guarda la búsqueda y la ejecuta automáticamente de forma periódica. Los resultados, los enviará por correo.
Alerta de citación
La alerta de citación, o de documento, se activa desde el registro. Recibiremos un correo con los documentos que citen a esta referencia en el futuro. Una explicación de cómo definir alertas en bases de datos académicas se puede consultar aquí.
La selección de las bases de datos académicas
Para poder concentrarnos en lo esencial de este trabajo, a saber, la forma más eficiente de utilizar una base de datos, hemos obviado una especie de Fase 0 que sería la selección de la base de datos.
En el caso de algunas disciplinas, la selección de la base de datos puede ser algo obvio, y seguramente pasa por usar Scopus, sin perjuicio de alguna otra, muy notablemente Web of Science.
En Ciencias Humanas y Sociales, en lugar de una base de datos óptima, tenemos un conjunto de bases de datos óptimo cuya composición, aparte de algunas bases de datos imposibles de obviar, como las varias veces mencionadas Scopus y Web of Science, depende de cada proyecto.
De aquí el concepto de grupo óptimo de base de datos que hemos acuñado para este propósito. Se puede consultar este concepto y la forma de generar el grupo óptimo en el caso de proyectos de investigación en Comunicación Social aquí.
Estados de la cuestión y bases de datos académicas
La búsqueda en bases de datos puede tener lugar en varios contextos. Uno de los más significativos, y es el que hemos tenido in mente al preparar este trabajo, son los estados de la cuestión, para lo cual necesitamos llevar a cabo una revisión bibliográfica.
Las bases de datos académicas son el instrumento privilegiado para realizar tales revisiones porque permiten llevarlas a cabo de una forma sistematizada.
Además de las bases de datos académicas es aconsejable utilizar otras fuentes de información (por ejemplo, buscadores como Google Scholar), pero nunca podemos prescindir de las bases de datos académicas.
Se pueden consultar aspectos de contexto como los referidos a las revisiones sistemáticas aquí.
Conclusiones
Hemos presentado, mediante 6 fases, un procedimiento general para utilizar bases de datos académicas. Aunque el uso de las bases de datos en sí misma comienza en la fase 2, resulta que la fase 1 es posiblemente la más importante de todas, porque es la proporciona la lista de palabras clave con las cuales podemos construir nuestras ecuaciones de consulta.
Del conjunto de las 6 fases, solamente las que van de la 1 a la 3 siguen el orden secuencial que sugiere el término «fase». Las otras tres pueden intercambiar su orden sin ningún problema. Nosotros hemos presentado un orden posible pensando más en la lógica de su exposición que en el realismo de su realización, así que, como decimos, nada impide intercambiar entre sí las 3 últimas.
Lo más importante es tener presentes la totalidad de las 6 fases y entender bien las posibilidades a nuestro alcance en cada una de ellas, con el fin de poder obtener un rendimiento óptimo de nuestra capacidad de explotación de las mismas, a fin de poder convertir, como hemos señalado al principio, buenos proyectos en proyectos excelentes.
Más información sobre bases de datos académicas
- Tutoriales detallados de:
- Otras entradas y tutoriales sobre bases de datos académicas
- Las 6 fases aplicadas a Web of Science
- Cómo utilizar la historia de búsqueda en Scopus y en Web of Science
- Cómo analizar resultados de búsqueda en las bases de datos académicas Scopus y Web of Science
- Bases de datos académicas: guía general de uso
- Nunca publiques aquí: revistas depredadoras y cómo identificarlas
Sobre bases de datos académicas -ir al inicio-
Una base de datos académica es un sistema de información que registra documentos resultantes de la actividad científica y sus propiedades. Estos documentos pueden adquirir la forma de artículos, actas de congresos, capítulos de libros, patentes y tesis, entre otros. Los términos base de datos académica y base de datos científica son equivalentes, solo cambia donde se pone el acento. Su objetivo es doble: – Por un lado apoyar la producción de nuevo conocimiento, gracias a la naturaleza acumulativa de la ciencia, que se beneficia de los trabajos anteriores. – Por otro lado, proporcionar métricas e informaciones sobre la producción científica que permita a los gestores de la ciencia tomar decisiones informadas. Las mejores bases de datos disponen de un módulo adicional, que aquí no hemos tratado, para el segundo objetivo: – Sistema de análisis y métricas de la producción científica |