Interfaces de búsqueda avanzada y patterns: las propuestas de Scopus y Web of Science

Fuente: Flaticon

Las bases de datos científicas son, razonablemente, los sistemas de información documental que presentan las interfaces de búsqueda avanzada más completas y, en ocasiones, más sofisticadas del ecosistema de la búsqueda académica, en dura competencia con algunos OPACS de bibliotecas universitarias.

En este artículo, nos proponemos examinar las soluciones de diseño de la interfaz de este importante componente que han adoptado dos de las más importantes bases de datos: Scopus y Web of Science. El objetivo es triple:

  • En primer lugar, examinar el pattern o solución de diseño que denominaremos filas adaptativas, considerando las dos propuestas que cada base de datos aporta para su aplicación correspondiente.
  • En segundo lugar, proporcionar una ilustración de uso de los formularios de búsqueda avanzada para investigadores y usuarios de estos sistemas de información. Dada su especial significancia, conocer el uso de estas dos bases de datos cubre así una parte importantísima de las necesidades de la mayor parte de investigadores académicos.
  • En tercer lugar, disponer de unos elementos iniciales para trabajos posteriores de comparación y análisis de tales interfaces.

Análisis comparativo

Como sea, a continuación mostraremos, mediante capturas de pantalla las soluciones de diseño de la búsqueda avanzada de:

Se trata, con diferencia las bases de datos científicas más importantes del mundo, en cualquier análisis de este tipo no pueden dejar de formar parte.

Otro punto de unión (cualitativo) es que  estas dos bases de datos son muy representativas del estado de la cuestión por lo que hace al diseño de interfaces de búsqueda, con lo cual con su conocimiento hacemos economía de escala.

Por motivos de comparación, consideraremos también las soluciones adoptadas por Google Scholar y Dialnet Plus.

Terminologia

De acuerdo con una de las terminologías aceptadas disponemos de dos tipos de búsqueda, simple y avanzada, con la segunda de ellas, a su vez, con dos variables, según lo que sigue:

  • Simple: uso de palabras o frases clave, sin utilización de operadores. Suele representarse mediante una caja alargada sin indicaciones especiales, aparte de invitar a entrar palabras clave.
  • Avanzada: uso de palabras clave más el uso de operadores booleanos, de proximidad, de parametrización, etc. Esta, a su vez, puede llevarse a cabo de dos formas:
    • Por formulario
    • Por sintaxis directa
Un ejemplo de búsqueda simple lo tenemos en la página principal de Google Scholar

Nosotros nos adherimos a esta terminología ya que consideramos que una ecuación de búsqueda que utiliza alguna clase de operadores forma parte de la búsqueda avanzada, ya sea mediante formulario asistido o mediante sintaxis directa.

La búsqueda avanzada por formulario es, con diferencia, la más fácil de utilizar, ya que no exige el conocimiento de la sintaxis específica de cada sistema para combinar los elementos de una ecuación de búsqueda. Es de suponer que es la más utilizada, ya que es la que aparece por defecto.

En todo caso, es la que mejor admite el uso de patterns, al estar basada en un formulario que puede asumir los principios del diseño de la interfaz. Es a esta clase de búsquedas, a saber, búsqueda avanzada por uso de formulario, a la que se puede aplicar el pattern de las filas adaptativas.

La búsqueda por sintaxis directa consiste en general en una caja donde debemos añadir, usando los términos exactos y siguiendo la sintaxis exacta del sistema los diferentes componentes de una ecuación de búsqueda. El pattern, si es que se puede considerar así, consiste en esta caja y, en el mejor de los casos, una serie de ayudas para escribir las ecuaciones.

Pattern de filas adaptativas

A continuación, examinaremos este pattern mediante sus características principales y sus componentes, las ventajas que aporta y por último la representaremos mediante un wireframe. Después, tal como hemos avanzado lo revisaremos en su aplicación real a dos casos.

Problema

El problema que debe resolver este pattern es el siguiente: el uso de operadores, en especial los booleanos es anti intuitivo, sin embargo son necesarios para expresar con precisión la semántica de una búsqueda.

Como consecuencia, para poder minimizar los falsos negativos (documentos relevantes que no se recuperan) y los falsos positivos (documentos que se recuperan pero no son relevantes) es necesario utilizar ecuaciones de búsqueda que combinen diversas palabras clave con diversos operadores. 

Para solucionar este problema se han probado diversas soluciones, algunas de las cuales, como la que utiliza, por ejemplo, Google Scholar limita las posibilidades reales de búsqueda, al no permitir utilizar la lógica booleana con toda su potencia.

En cambio, el pattern de las filas adaptativas parece ser el que mejor combina la máxima potencialidad funcional con la máxima facilidad de uso no limitante.

Características

El pattern de filas adaptativas presenta las siguientes características: 

  • El formulario admite un número modificable de filas. Un elemento en forma de botón adhoc permite agregar o eliminar filas.
  • Cada fila incluye una zona de introducción de palabras clave y una zona de selección de campos.
  • Las palabras clave de cada fila quedan asignadas a los campos seleccionados de la misma fila. De este modo, se lleva a cabo una búsqueda parametrizada.
  • Cuando se usan dos o más filas, se pueden combinar entre sí mediante selección de operadores booleanos. De este modo, se lleva a cabo una búsqueda mixta: booleana y parametrizada a la vez.
  • El selector de operadores de búsqueda puede quedar asignado a la segunda fila (y siguientes) o puede aparecer como un elemento situado entre las filas, sugiriendo así su función combinatoria.
  • Adicionalmente, una misma fila puede contener palabras clave y operadores booleanos en caso que el usuario se sienta con confianza para utilizarlos de modo directo.

La repetida aplicación de este pattern es, plausiblemente, una prueba de su eficacia ya que combina en un solo formulario adaptable tanto la búsqueda booleana como la búsqueda parametrizada.

Además, admite con facilidad el añadido de filtros adicionales, generalmente, de rangos de fechas y/o de tipos de documentos, y otros.

Componentes

En su formulación más amplia, puede contener estos elementos:

  1. Tipo de búsqueda: permite conmutar entre diferentes tipos de búsqueda si es el caso, p.e. entre documentos, autores un otras.
  2. Una zona en cada fila para añadir palabras clave: permite añadir palabras o frase clave que expresan el tema de la búsqueda.
  3. Una zona en cada fila para selección de campos: mediante esta zona el usuario puede elegir los campos a los que afectará la búsqueda. A veces, esta zona permite elegir en realidad un grupo de campos a la vez, típicamente, título, resumen y palabras clave. Los componentes 2 y 3 forman parte de una misma fila.
  4. Una zona asociada a la fila 2 en adelante, o en una fila separada, para seleccionar operadores booleanos: permite elegir el operador con el cual se combinarán las filas en caso de dos o más filas.
  5. Una opción para modificar el número de filas: el número de filas es modificable en este pattern, por tanto debe existir una opción para agregar o eliminar filas. Esta opción se suele presentar rotulada como “Añadir campos” (o “Eliminar campos”)  aunque en realidad lo que se añade (o elimina) es toda la fila, ya que implica tanto la zona de palabras clave como la de campos.
  6. Filtros adicionales: suele existir la posibilidad de activar otros filtros, en general, rangos de fechas y tipos de documentos.

Los componentes 2 a 5 forman el núcleo principal del pattern, siendo los componentes 1 y 6 opciones que, con frccuencia, acompañan a los otros elementos.

La ventaja principal de este pattern es que está basado más en el reconocimiento que en la memoria. Permite representar mediante opciones de selección (reconocimiento) tanto la búsqueda parametrizada (búsquedas limitadas a un campo o a un grupo de campos) como la búsqueda booleana (uso de operadores booleanos AND, OR, NOT). A la vez, resulta intuitivamente simple la búsqueda mixta (booleana + parametrizada) porque de nuevo se lleva a cabo mediante una opción de selección.

Wireframes

En forma de wireframe, el pattern de búsqueda avanzada por formulario que hemos denominado filas adaptativas se puede representar así:

El pattern del formulario de búsqueda avanzada con filas adaptativas. En este caso en forma de wireframe.  Fuente: elaboración propia

Hemos representado en el wireframe precedente los componentes 2 a 5. Vemos la zona de introducción de datos (Palabras clave) y la zona de selección de campos (Campo) como parte de cada fila. Además, hemos añadido entre las filas (izquierda) un selector de operadores booleanos (And) así como un botón Añadir fila (derecha) bajo la primera de ellas. La segunda fila presenta tanto el botón de Añadir como el de Eliminar fila.

Por su parte, el (pseudo)pattern de búsqueda avanzada por sintaxis directa es mucho más simple:

El (pseudo)pattern de la búsqueda avanzada por sintaxis directa. Vemos una caja para entrar las ecuaciones y zonas de ayuda. Fuente: elaboración propia.

Por último, aunque solamente sea por amor a la simetría, el pattern de la búsqueda simple:

El pattern de la búsqueda simple. La principal recomendación es que tenga anchura suficiente para poder entrar diversas palabras clave o frases sin perderlas de vista, lo que evita errores de deletreo. Fuente: elaboración propia.

A continuación, mostraremos cómo se aplica el pattern de la búsqueda avanzada mediante un formulario de filas adaptativas tanto en el caso de Scopus como de Web of Science. También veremos el caso del (pseudo)pattern de la búsqueda avanzada por sintaxis directa.

Búsqueda avanzada en SCOPUS


Scopus – Formulario

Formulario de búsqueda avazanda de Scopus. Clic para ver la imagen a tamaño completo.

Scopus aplica el pattern de filas adaptables mediante una solución de diseño basada en los principios de simplicidad y de máxima claridad visual de la interfaz. En la captura vemos los componentes principales en los cuales Scopus ha adaptado este pattern.

Scopus – Sintaxis directa

La búsqueda por sintaxis directa en Scopus con algunos de sus componentes más destacados

Búsqueda avanzada en Web of Science


WoS 1 – Formulario

El formulario de búsqueda avanzada en el caso de WoS

Vemos en la captura precedente, como en el caso de Scopus, una interfaz muy funcional, basada también en la simplicidad. que es perfectamente capaz de recoger los elementos principales del pattern.

WoS 2 – Sintaxis directa

La sintaxis directa en el caso de WoS con sus componentes más destacados.

Otros modelos

Para poder contrastar, presentaremos otros modelos, en concreto, el de Google Scholar y el de la base de datos Dialnet Plus.

Se trata de dos modelos más simples, que se caracterizan por utilizan formularios convencionales, de tipo estático, sin filas articuladas ni ampliables, pero que sin duda cumplen bien con sus funciones. En todo caso, se trata de la elección de dos sistemas de información académica del máximo prestigio y tiene sentido considerar también sus opciones.

Google Scholar

La búsqueda avanzada según Google Scholar

Dialnet Plus

La búsqueda avanzada en DialnetPlus

Conclusiones

Hemos visto que las dos principales bases de datos académicas aplican de forma muy eficaz el pattern (que hemos denominado) de filas adaptativas. Este pattern se compone de siete elementos, al menos en el análisis que nosotros hacemos del mismo, y hemos comprobado que se utiliza de esta forma tanto en Scopus como en Web of Science.

En ambos casos, la adaptación destaca por su eficacia y su simplicidad que como es sabido son siempre valores muy importantes en el diseño de la interfaz.

Sin duda, puede parecer que la necesidad de utilizar un mínimo de 5 componentes en un pattern queda lejos de la simplicidad, pero hemos de valorar esta con relación a las funciones que cumple, que son de alta complejidad cognitiva, ya que involucran el uso de operadores lógicos, así como selecciones de parametrización y de filtrado.

Todo ello, al servicio de otra operación cognitiva que puede revestir gran complejidad, como es la de transformar una necesidad de búsqueda muy sofisticada en ecuaciones de búsqueda exitosas. Es entonces cuando podemos apreciar el valor de esta solución que ha llegado a convertirse en pattern por algún motivo.

Por supuesto, hay otros modelos como los dos que hemos examinado, correspondientes a Google Scholar y DialnetPlus que sin ninguna duda cumplen bien su función, aunque creemos que sin aportar el grado superior de potencia que presenta el de filas adaptativas.

No podemos saber, sin estudios de usuarios qué opción prefieren estos, por tanto, no pretendemos hacer aquí una valoración en tales términos, sino de heurísticas, según el cual es el modelo de filas adaptables es el que permite la máxima fidelidad para representar necesidades de información complejas, propias del entorno de la investigación académica, y en consecuencia la máxima potencia en la explotación de la información que contienen las bases de datos académicas.

En un contexto convencional, de comercio electrónico, por ejemplo, sin duda el criterio dominante debe ser la usabilidad, es decir aquello que los usuarios prefieran (determinado mediante pruebas).

Pero en un contexto de investigación, donde los falsos negativos (NO encontrar documentos que SÍ existen) puede tener consecuencias incluso legales, la máxima simplicidad debe tener su límite, ya que no debe poner en riesgo la precisión de la búsqueda. Es en este punto, en el cruce con la máxima funcionalidad y la máxima simplicidad (que no arriesga resultados) donde parece que tiene su pleno sentido el pattern que ha centrado nuestra atención.

Anexo

Patterns

Un pattern, según Wikipedia es:

(…) una solución a un problema de diseño. Para que una solución sea considerada un patrón debe poseer ciertas características. Una de ellas es que debe haber comprobado su efectividad resolviendo problemas similares en ocasiones anteriores. Otra es que debe ser reutilizable, lo que significa que es aplicable a diferentes problemas de diseño en distintas circunstancias.

Wireframe

Un wireframe, según Wikipedia es:

Un wireframe para un sitio web, también conocido como un esquema de página o plano de pantalla, es una guía visualque representa el esqueleto o estructura visual de un sitio web.1​ El wireframe esquematiza el diseño de página u ordenamiento del contenido del sitio web, incluyendo elementos de la interfaz y sistemas de navegación, y cómo funcionan en conjunto.2​ Usualmente este esquema carece de estilo tipográfico, color o aplicaciones gráficas, ya que su principal objetivo reside en la funcionalidad, comportamiento y jerarquía de contenidos.3​ En otras palabras, se enfoca en “qué hace la pantalla, no cómo se ve.”4​ Los esquemas pueden ser dibujados con lápiz y papel o esquemas en una pizarra, o pueden ser producidos con medios de diseño de aplicaciones de software libre o comerciales.

 


Análisis relacionados


Icon made by Freepik from www.flaticon.com