
En este trabajo vamos a presentar un análisis comparativo, de tipo eminentemente visual, de las interfaces de búsqueda de las cuatro bases de datos académicas más importantes del mundo.
Interfaces de búsqueda analizadas
Analizaremos los formularios de búsqueda asistida de las siguientes bases de datos (para los interesados, los enlaces remiten a estudios en profundidad de cada base de datos):
Procedimiento
Para llevar a cabo los análisis de las interfaces de búsqueda, procederemos a presentar una captura de pantalla anotada de cada una de las bases de datos mencionadas. La captura de pantalla se centrará en la búsqueda avanzada y mediante anotaciones gráficas en la misma destacaremos los elementos principales. Uno o más párrafos tras cada captura presentará de forma sucinta las características principales.
Objetivos
El objetivo es, no solamente, llevar a cabo el análisis comparativo mencionado sino intentar determinar cuáles de las cuatro bases de datos proporcionan un mejor soporte para llevar a cabo revisiones bibliográficas tradicionales o sistemáticas. Este último análisis lo haremos después de presentar las interfaces respectivas.
La ecuación de búsqueda canónica
Para entender las funciones que debe resolver una interfaz de consulta, debemos considerar cuál es la que podríamos llamar la ecuación de búsqueda canónica. Se trata de aquella que combina dos o más conceptos, con al menos uno de ellos con la necesidad de ser representado dos o más sinónimos.
Intersecciones
La mayor parte de los proyectos de investigación consiste en la intersección de dos o más temas (conceptos), cada uno de los cuales suele necesitar de varios sinónimos para ser adecuadamente representado.
Por ejemplo, temas como la protección a la infancia y los anuncios de televisión. O como el periodismo inmersivo y el engagement del público con quienes sufren injusticias. O como la experiencia de búsqueda y los portales de cibermedios, etc. De esta necesidad tan característica de intersectar al menos dos temas procede lo que llamamos la búsqueda canónica.
Caso general
Si tomamos el caso de una investigación que intersecta dos temas, cada uno con dos sinónimos, como uno de los casos más característicos, entonces tenemos el diagrama siguiente representativo de la búsqueda canónica:

El esquema abstracto anterior se puede ejemplificar con una ecuación de búsqueda mediante sintaxis directa como la siguiente (como aclaración, los sinónimos en el diagrama se refieren a sinónimos funcionales o documentales):
(journalism OR newspapers) AND (facebook OR twitter) |
En el cuadro anterior hemos visto la búsqueda canónica en forma de sintaxis directa a fin de ilustrar su utilización. No obstante, en este trabajo nos interesa el uso de interfaces de usuario, esto es, la búsqueda asistida.
En este caso, en un formulario de búsqueda que sigue el pattern de las filas adaptativas, la ecuación anterior quedaría así:

El esquema de la búsqueda canónica incluye casos con al menos dos conceptos, y el uso de dos o más sinónimos en uno en todos los conceptos, como hemos mostrado en los ejemplos. Pero recordemos que hay otras variaciones.
Lo que incluye siempre la búsqueda canónica es la intersección de temas (conceptos) y la necesidad de que al menos uno de los temas (frecuentemente, todos) necesiten ser representados mediante varios sinónimos.
Información adicional
Remitimos al lector a los anexos para clarificar los conceptos búsqueda asistida y búsqueda por sintaxis directa, así como para los de bases de datos y de revisiones bibliográficas. En los anexos hemos compilado también un conjunto de enlaces que llevan a análisis más detallados de los temas tratados aquí de forma sucinta.
Búsqueda avanzada en Scopus

En el formulario de búsqueda avanzada de Scopus, convenientemente señalado, destacamos la búsqueda booleana y la búsqueda parametrizada, que están dispuestas de modo que las búsquedas combinadas se pueden hacer con toda facilidad. También hemos destacado filtros adicionales que son una forma de añadir opciones parametrizadas. Permite la ejecución sin problemas de la búsqueda canónica.
Búsqueda avanzada en Web of Science (WoS)

Como podemos ver en el formulario de WoS tenemos las opciones de búsqueda booleana y de búsqueda parametrizada, y al igual que en el caso de Scopus, la búsqueda combinada está presentada de una forma natural. Como filtros adicionales, vemos la opción de establecer rangos de fechas.
Cabe señalar que en WoS, la búsqueda avanzada recibe el nombre de búsqueda simple. El término búsqueda avanzada lo reservan para la búsqueda con sintaxis directa (ver Anexo para terminología).
Tanto WoS como Scopus (captura anterior) al utilizar el sistema de filas ampliable como pattern para el diseño de su interfaz, permiten todas las combinaciones lógicas, entre ellas, la búsqueda canónica.
Búsqueda avanzada en Google Scholar

Como podemos ver, el formulario de Google Scholar permite las tres formas de búsqueda (booleana, parametrizada y combinada), al igual que en los dos casos anteriores considerados.
No obstante, al no utilizar el sistema de filas adaptativas para cada concepto, no podemos representar todos los casos de la búsqueda canónica. En concreto, no podemos representar dos o más conceptos, cada uno de los cuales con dos o más sinónimos.
Tampoco es fiable el uso de sintaxis directa. No solamente no está documentada la utilización de operadores booleanos en la misma, sino que algunas pruebas (no sistemáticas) muestran inconsistencias que impiden confiar en esta opción.
Formulario de búsqueda en Microsoft Academic

Microsoft Academic no presenta nada parecido a un formulario de búsqueda avanzada. En su lugar tenemos una simple caja de búsqueda que nos anima a entrar conceptos o nombres propios, o cualquier combinación de ellos.
Es evidente que no permite nada parecido a la ecuación canónica con este formulario. El aspecto positivo es que parece (decimos parece porque no está documentado) que mediante sintaxis directa, sí podemos usar búsquedas avanzadas, como mostramos a continuación:

Mostramos esta posibilidad a fin de dar una visión más completa de Microsoft Academic, pero lo cierto es que no es relevante a efectos de la comparación que pretendemos hacer, ya que estamos comparando las interfaces de búsqueda asistida, no los lenguajes de consulta. Además, el hecho de que no haya una documentación oficial sobre la sintaxis de búsqueda hace que no podamos estar seguros de su funcionamiento.
Análisis comparativo
La siguiente tabla comparativa muestra un resumen de lo anterior, así como hemos añadido una columna donde se indica la utilidad relativa de cada base de datos para trabajos de revisión:
Base de Datos | BA | SD | TdR |
Scopus | SÍ | SÍ | **** |
WoS | SÍ | SÍ | **** |
Google Scholar | SÍ (parcial) | NO | ** |
Microsoft Academic | NO | Sí | *** |
La interpretación de la tabla es la siguiente:
- BA: Búsqueda asistida. Indica si la base de datos proporciona un formulario de búsqueda avanzada que permita las búsquedas booleanas, parametrizadas y combinadas, de modo que sea posible mediante búsqueda asistida utilizar la búsqueda canónica.
- SD: Sintaxis directa. Indica si la base de datos proporciona un lenguaje de consulta completo para componer ecuaciones de búsqueda canónicas.
- TdR: Trabajos de revisión. Indica mediante estrellas (1 a 4) la idoneidad de cada base de datos para dar soporte a revisiones bibliográficas tradicionales o sistemáticas. La siguiente tabla indica el significado de las estrellas.
Número de estrellas | Significado |
* | Búsqueda simple por palabras clave. No hay formulario de búsqueda avanzada ni tampoco permite el uso de sintaxis directa. No se puede llevar a cabo búsquedas parametrizadas. No permite la búsqueda canónica. |
** | Búsqueda avanzada soportada por formulario. Permite búsqueda booleana y parametrizada, pero no permite todas las variaciones de la ecuación canónica |
*** | Búsqueda simple por palabras clave. Búsqueda avanzada mediante sintaxis directa. Permite la ejecución plena de la ecuación canónica, pero solamente mediante sintaxis directa. |
**** | Búsqueda avanzada tanto por formulario como por sintaxis directa. Permite la ejecución plena de la ecuación canónica en las dos formas: búsqueda asistida o por sintaxis directa. |
Conclusiones
Las bases de datos académicas deben proporcionar instrumentos suficientes a los investigadores. El sacrificio de funciones de búsqueda avanzada en aras de una supuesta simplicidad de las interfaces es un paso atrás en el desarrollo de la ciencia, en tanto en cuanto esta es una actividad acumulativa. Si los investigadores no pueden expresar de forma precisa sus necesidades de información, el sistema es disfuncional.
El análisis comparativo que hemos llevado a cabo muestra que las dos bases de datos que proporcionan un soporte pleno a los trabajos de revisión, gracias tanto a sus interfaces de búsqueda avanzada como al uso de sintaxis directa son Scopus y Web of Science.
Esto no significa que podamos prescindir de Google Scholar o de Microsoft Academic. Es posible que algunos trabajos de revisión necesiten la tipología de documentos más amplia que encontramos concretamente en estas otras bases de datos.
Además, puede haber trabajos de revisión que no necesiten de la intersección de temas. Por ejemplo, una revisión bibliográfica puede tratar de un solo concepto, como en el caso de periodismo inmersivo, por poner un ejemplo cualquiera. En estas situaciones, tanto Google Scholar como Microsoft Academic pueden prestar un buen servicio.
En cambio, en los casos en los que los trabajos de revisión se sustenten de forma preferente en artículos de investigación como base de la evidencia, lo que es una opción frecuente, las únicas bases de datos generalistas (aquí no hemos comparado bases de datos especializadas) que permiten las búsquedas canónicas de forma plena son Scopus o WoS.
A igualdad de otros factores, son por tanto, las que, en principio, debemos considerar de forma preferente al abordar el diseño de un trabajo de revisión. Esto es sin perjuicio de casos específicos en los que, por algún motivo, como los señalados, a los que podemos añadir la necesidad de literatura gris, puede ser Google Scholar o Microsoft Academic las que resulten adecuadas.
Además, hay una serie de bases de datos especializadas que aquí no hemos considerado, como es el caso de las bases de datos de ProQuest, por citar un ejemplo. Para esta clase de bases de datos, sirve la misma consideración. Salvo casos especiales, aquellas que presentan una interfaz de búsqueda avanzada son las que se deben considerar de forma preferente para llevar a cabo trabajos de revisión.
Anexos
Formas de expresión de búsquedas
Existen varias formas de expresar una ecuación de búsqueda. Repasemos las cuatro principales.
- Lenguaje natural: «necesito información sobre periodismo y crisis, pero no sobre temas deportivos». Es la expresión humana de una necesidad de información. Es por tanto, la forma en la que alguien expresa a otra persona esta necesidad.
- Pseudocódigo: [(periodismo AND crisis) NOT deporte]. Es la forma para representar ecuaciones de búsqueda independientemente del sistema o de la base de datos que vayamos a usar.
- Sintaxis directa: Es la forma concreta y específica de cada base de datos. En Scopus, por ejemplo, se debe indicar AND NOT para la negación. En Google, el AND se representa como un espacio en blanco y el NOT como el símbolo menos o guión alto, etc. Por tanto, en Scopus la ecuación del punto 2 se expresaría así:
[(periodismo AND crisis ) AND NOT deporte], pero en Google, sería así:
[periodismo crisis -deporte]. - Búsqueda asistida. Es la que podemos llevar a cabo mediante una interfaz de usuario que, mediante un formulario, facilita la búsqueda avanzada de un modo asistido. En los mejores casos, el pattern de filas adaptativas permite la expresión plena de la búsqueda canónica.
Trabajos de revisión
Llamamos así tanto a las revisiones bibliográficas tradicionales, pero con aproximación sistematizada, como a las revisiones sistemáticas o meta-análisis. Todos ellos se basan en la búsqueda y análisis de referencias bibliográficas en bases de datos.
Bases de datos
En una concepción estrictamente técnica, todos los sistemas tratados aquí son bases de datos. No obstante, a veces se diferencia entre bases de datos y buscadores, cuando la colección de documentos no forma parte del sistema. En este caso, Google Scholar sería un buscador, y Microsoft Academic un híbrido. Para evitar confusiones, en este trabajo usamos la visión técnica y tratamos a todos los sistemas como bases de datos.
Entradas relacionadas
- Entradas de la categoría de Bases de datos académicas
- Entradas de la categoría Revisiones bibliográficas
- Búsqueda avanzada en bases de datos académicas
- Operadores booleanos en bases de datos académicas
- Operadores de búsqueda parametrizada en bases de datos académicas
- Interfaces de búsqueda en bases de datos académicas (patterns)
- Bases de datos para investigar en Comunicación Social: propuesta y caracterización del grupo óptimo