Web of Science y Scopus: cómo evitar los errores más frecuentes en revisiones de la literatura

Principales problemas en el uso correcto de bases de datos

Algunos académicos usan mal o muy mal bases de datos científicas como Web of Science o Scopus. Mi experiencia como revisor y lector de artículos me demuestra que incluso investigadores experimentados cometen errores en el uso de las estas bases de datos.

Estos errores pueden ser ser triviales, como poner comillas en términos simples, que probablemente no tienen ningún efecto. Pero que vale la pena evitarlos para no enviar el mensaje a los evaluadores de que los autores no conocen bien el sistema. O pueden ser inhabilitantes, como usar mal los operadores de búsqueda. En tal caso, los errores pueden tener el efecto de anular toda la investigación ya que podría ser que la base de la evidencia haya sido mal seleccionada.

Como sea, mi lista de los tres principales errores detectados por la frecuencia en la que se presentan, son los siguientes:

  • Uso de comillas
  • Idioma de las palabras clave
  • Operadores booleanos

En lo que sigue, intento clarificarlos uno por uno.

Uso de comillas

Las comillas sirven para identificar términos compuestos, esto es, palabras clave compuestas por más de un término, o también para buscar frases literales. Vamos a ver casos de uso correcto e incorrecto, Seguiremos la convención de marcar los ejemplos incorrectos con un asterisco (*).

Ejemplos de uso correcto:

  • «immersive journalism»
  • «united nations millennium development goals»
  • journalism

En los dos primeros ejemplos usamos comillas para que los documentos recuperables tengan esas cadenas de caracteres y en el mismo orden. Si no usamos comillas, el sistema puede buscar cada término por separado, y puede proporcionar mucho ruido. Técnicamente se dice que no usar comillas produce falsas coordinaciones en estos casos. En el tercer ejemplo, lo correcto es justamente NO usar comillas, ya que es un término simple y por tanto no aportarían nada. Veamos ahora ejemplos incorrectos.

Ejemplos de uso incorrecto

  • immersive journalism *
  • «ChatGPT» *

El primer ejemplo es incorrecto porque NO lleva comillas, y sin embargo debería llevarlas para evitar falsas coordinaciones.

El segundo es incorrecto porque lleva comillas de forma innecesaria ya que se trata de una sola palabras, o más exactamente de una única cadena de caracteres.

En el primer caso el error puede ser grave, porque proporcionará documentos que tengan ambas palabras, pero con cada una por su lado, lo cual puede generar un enorme ruido.

El segundo ejemplo seguramente no tiene consecuencias. Es de esperar que tanto Scopus como WoS darán los mismos resultados con o sin comillas. Me falta hacer pruebas sistemáticas, pero las que he hecho demuestran que no afectan al resultado. Entonces, ¿cuál es el problema? Pues que envía el mensaje de que los autores conocen mal el uso del sistema. Por eso también es importante evitarlo.

Idioma de las palabras clave

He visto artículos publicados en revistas científicas (fallo de los evaluadores) que contienen ecuaciones con palabras clave en español para buscar artículos científicos en Scopus o Web of Science, en alguno de los campos de Title, Abstract, Keywords. A veces he visto combinar las mismas palabras clave en español y en inglés con un OR (se supone para asegurarse de encontrar ambas variaciones).

Debemos recordar que las revistas indexadas tanto Scopus como WoS incluyen obligatoriamente título, resumen y palabras clave en inglés. Y tanto Scopus como WoS indexan esos campos en inglés de forma sistemática, junto a otros datos, como el idioma del artículo.

Por tanto, si usamos palabras clave en inglés cuando usamos los campos indicados, encontraremos artículos en todos los idiomas. Encontraremos artículos tanto en inglés como en español (y otros idiomas). En cambio, si usamos palabras clave en español encontraremos solo artículos en español y no me comprometería mucho respecto a su fiabilidad.

¿Qué pasa si lo que queremos es encontrar artículos publicados en español y solo en español? Es raro, pero pongamos que haya una buena razón para esto. Mi opinión es que incluso en este caso debemos usar palabras clave en inglés, y después en la página de resultados filtrar por idioma español. No estoy seguro de que haya diferencias, pero al proceder así nos acostumbramos a seguir la buena práctica recomendada por las propias bases de datos.

Veamos ahora algunos ejemplos concretos para ilustrar el uso correcto e incorrecto. Nos ayudará suponer un caso concreto. Sea una revisión de la literatura sobre periodismo inmersivo y derechos humanos. Los investigadores están interesados en artículos escritos en inglés así como en otros idiomas que pueden leer. P.e, los investigadores pueden leer también en español, francés y catalán, y les interesa examinar artículos que reporten investigaciones en cualquiera de estos idiomas.

Ejemplo de uso correcto para la búsqueda de artículos

  • «immersive journalism» AND «human rights»

El uso correcto es el que vemos para el caso de la búsqueda de artículos en cualquiera de los campos Title, Abstract, Keywords. En la página de resultados podemos filtrar por los idiomas que nos interesen: ingles, francés, español, catalán, etc. Los que queramos, pero las palabras clave a la hora buscar, siempre en inglés.

Ejemplo de uso incorrecto para la búsqueda de artículos

  • («immersive journalism» AND «human rights») OR («periodismo inmersivo» AND «derechos humanos») *
  • «periodismo inmersivo» AND «derechos humanos» *

Dado el mismo contexto, en estos ejemplos el primer caso es incorrecto porque la duplicación de palabras clave en dos idiomas es innecesaria (la navaja de Ockham tiene muchas lecturas). Previsiblemente puede proporcionar la misma respuesta que usar solamente inglés, pero formalmente es incorrecta por reiteración innecesaria. Como en el caso anterior, envía el mensaje de que los investigadores conocen mal el uso de las bases de datos Web of Science o Scopus.

El segundo ejemplo podría aceptarse si se desea buscar solo documentos en español, pero formalmente también es incorrecto. Es mejor acostumbrarse a la buena práctica de usar siempre el idioma de trabajo oficial, que es el inglés, y filtrar después por el idioma interesado. Ignoro en el caso de Scopus, pero en el de WoS, recomiendan expresamente que aunque se busquen documentos en otros idiomas, se use el inglés, ya que al parecer no se comprometen con la indexación de esos campos en otros idiomas.

Además, el segundo ejemplo, puede ser un error garrafal si los investigadores creen que con esas palabras clave en español encontrarán también artículos en otros idiomas.

¿Excepciones?

En el caso de Scopus, ignoro si tiene sentido usar idiomas nacionales específicos cuando se usan campos que NO sean Title, Abstract, Keywords o cuando se buscan documentos que NO sean artículos (como actas de congresos o capítulos de libro). La documentación oficial y los tutoriales dan por supuesto el idioma inglés, pero no he encontrado una afirmación específica al respecto. Tal vez lo dan por supuesto que no ven necesario señalarlo. Es mi hipótesis.

En cambio, los tutoriales de WoS indican expresamente que siempre hay que usar el idioma inglés, incluso cuando buscamos documentos en otros idiomas (lo podemos ver en esta presentación).

En todo caso, lo que está claro tanto para Scopus como WoS es que si buscamos artículos científicos por temas, con el uso de cualquiera de los campos Title, Abstract, Keywords, debemos usar el inglés únicamente y luego refinar en la página de resultados por idioma según nos convenga.

Operadores booleanos

Sobre el uso de los operadores booleanos por suerte hay muchos tutoriales y en esta misma web puede encontrar algunos. Pero si quiere conocer la clave para usar bien los operadores booleanos, lo más básico es pensar de la manera que indica la siguiente tabla:

OperadorUsoEjemplo
ANDPara la intersección
de conceptos
journalism AND economy
ORPara la suma de
sinónimos
journalism OR newspapers
NOTPara retirar resultados
de la lista final
journalism NOT sports

A continuación una lista de ejemplos correctos e incorrectos.

Ejemplos correctos

  • (journalism OR newspapers) AND economy
  • «immersive journalism» AND («human rights» OR minorities)

Los dos ejemplos son correctos porque en ambos casos usan un AND para intersectar dos conceptos diferentes, el de periodismo y la economía en el primer caso, y el del periodismo inmersivo y los derechos humanos en el segundo.

Además, usan bien el operador OR para sumar sinónimos, el de periodismo y diarios, en el primer caso, y del de derechos humanos y minorías en el segundo.

Ejemplos incorrectos

  • journalism AND newspapers AND economy AND sustainability *
  • «immersive journalism» OR «human rights» OR minorities *

En el primer caso, al usar AND donde debería haber OR, se puede dar una enorme pérdida de información.

En el segundo caso, habrá un enorme cantidad de ruido por usar siempre un OR cuando en algunos casos se necesitaría un AND.

Uso en el formulario

Mi consejo es que a la hora de usar el formulario de Scopus o de WoS, se haga de la siguiente forma si tenemos dos (o más) conceptos para intersectar:

  • Filas diferentes: conceptos diferentes
  • Interior de cada fila: sinónimos de cada concepto
  • Operador intermedio: para combinar las filas

La captura siguiente ilustra este uso:


Ejemplo de uso de un formulario de búsqueda en Scopus

En la captura hemos destacado:

  • El uso de dos filas, ya que queremos intersectar dos conceptos.
  • El uso del operador booleano AND en la zona central para expresar esta intersección.
  • El uso del operador OR dento de cada fila para sumar sinónimos.

Hemos visto en la captura, el caso de Scopus, pero la base de datos Web of Science tiene un funcionamiento idéntico por lo que hace a su formulario de búsqueda.

Por supuesto, hay otros operadores, por lo que se recomienda a los interesados que usen las muy eficaces ayudas de cada sistema por si le pudiera interesa usar otros. En lo que sigue, el lector interesado tiene una lista de recursos relacionados para profundizar tanto como necesiten.

Idiomas en otras bases de datos

Hemos tratado el caso de Web of Science y de Scopus, y espero haber dejado claro que el idioma oficial de trabajo en estas es el inglés. Pero hay otras bases de datos, y en cada caso puede tener sentido utilizar idiomas diferentes. Por mencionar dos casos ilustres, en DialnetPlus el español es la lengua de trabajo oficial, y en Google Scholar no hay un idioma oficial sino que el uso del idioma determinar la respuesta. Tiene sentido usar el inglés (si queremos acceder a mucha información), pero también cualquier otro idioma (si necesitamos producción académica en un lengua determinada), ya que usar el inglés nos dará únicamente documentos en inglés, el español, en español, etc.

Otras garantías de calidad para diseñar el proceso de búsqueda

Si se trata de llevar a cabo una revisión sistemática o una scoping review, dependiendo de la complejidad del proceso, puede ser necesario tener en cuenta elementos adicionales que garantizen la calidad del proceso.

Los puntos anteriores intentan solucionar los errores más frecuentes, pero si queremos asegurar la solidez de todo el proceso, hay otros recursos que pueden ser de interés. Uno de los más importantes es el framework PRISMA para diseñar procesos de búsqueda:

Igualmente, si el lector está interesado en una comprensión más avanzada de los operadores booleanos, quiere entender la lógica en la que se basan y cómo se relacionan con cada proyecto, puede consultar esta entrada:

Conclusiones

Hemos mostrado tres errores frecuentes al usar Scopus o WoS que podemos encontrar en artículos cuando incluyen explicaciones sobre la forma en la que han desarrollado una revisión de la literatura (generalmente de tipo sistemático).

Son errores con consecuencias dispares. El peor, con diferencia es usar mal los operadores booleanos. Pero todos envían el mensaje de que los autores del artículo conocen mal estas bases de datos, con lo que su trabajo pierde credibilidad.

Lo mejor es que se trata de errores fáciles de evitar. Para las comillas y los idiomas, las reglas no pueden ser más simples. Para los operadores booleanos, tal vez se requiere algo más de formación pero tampoco es ciencia espacial. Un o dos buenos tutoriales deberían servir. En el siguiente apartado de Recursos presentamos algunos. En todo caso, la norma sencilla que dice que los sinónimos se relacionan con un OR y los conceptos diferentes con un AND, funciona muy bien cuando necesitamos buscar por temas.

Recursos