El proceso de búsqueda en revisiones de la literatura: cómo asegurar su consistencia lógica y su adecuación pragmática

La lógica de los procesos de búsqueda
La lógica de los procesos de búsqueda

El proceso de búsqueda en las revisiones de la literatura proporciona la base de la evidencia en esta clase de metodologías. Por este motivo, si no ha sido bien diseñado, la validez de toda la investigación queda comprometida.

En la construcción del proceso de búsqueda intervienen al menos dos componentes:

  • La elección las fuentes. Esto es, de dónde tomaremos la base de la evidencia. En general, adoptará la forma de artículos de revistas científicas, pero pueden utilizarse toda clase de formatos documentales en función del proyecto, como libros y capítulos de libro, informes, etc.
  • El diseño de la estrategia de búsqueda, que debe ser adecuada a la naturaleza de las fuentes utilizadas. En particular, las bases de datos académicas impondrán estrategias muy determinadas.

El escenario de las bases de datos académicas

En el escenario más habitual, el primero de los componentes consiste en una o más bases de datos académicas. La razón es que son la fuente que con mayor seguridad y menor riesgo de sesgos, proporciona acceso a las investigaciones recientes y pasadas sobre un determinado campo.

De aquí se desprende que, en tales casos, el segundo de los componentes consistirá en el uso de una o más ecuaciones de búsqueda. Y es justo en este punto donde la planificación del proceso puede presentar deficiencias. No importa el acierto en la selección de la base de datos, si la ecuación de búsqueda es inconsistente.

Ecuaciones de búsqueda
Ecuaciones de búsqueda y bases de datos

En lo que sigue, en la primera parte examinaremos qué es un ecuación de búsqueda, y como se debe construir para que la validez del proceso quede asegurada. También examinaremos aspectos de adecuación pragmática. En la segunda parte, usaremos ejemplos con bases de datos académicas. Concretamente, Communication Source, Scopus y Web of Science.

PRIMERA PARTE
La lógica de los procesos de búsqueda documental


¿Qué es una ecuación de búsqueda?

Una ecuación de búsqueda es la formalización de una necesidad de información. Para llevar a cabo esta formalización, una ecuación de búsqueda combina palabras clave con operadores lógicos, concretamente con operadores booleanos. Igualmente, puede incluir otros operadores de búsqueda tales como los operadores de campo, fecha, etc. (denominados operadores de parametrización).

Ahora bien, sabemos que una ecuación es una igualdad. En concreto, se compone de dos miembros que deben estar unidos por el signo igual. Por esta razón, para merecer su nombre, las ecuaciones de búsqueda también tienen dos miembros, que llamaremos parte A y parte B. El miembro de la izquierda, o parte A, es el que está formado por el grupo de palabras clave y operadores.

A su vez, el miembro de la derecha o parte B, se compone de los documentos que satisfacen la ecuación, y que son los documentos relevantes. Es lo que indica el diagrama siguiente. El miembro de la derecha no suele representarse, pero nosotros examinaremos ambos.

Miembros de una ecuación de búsqueda
Miembros de una ecuación de búsqueda

Parte A: palabras clave y operadores

El miembro de la izquierda, o parte A de una ecuación de búsqueda es la que contiene las palabras clave y los operadores lógicos. Ejemplo:

periodismo AND verificación

Es fácil ver que las palabras clave son [periodismo, verificación] y el operador es AND. Esta parte nos dice que primero tomemos el conjuntos formado por los documentos que contienen la palabra clave [periodismo] y el conjunto de los documentos que tienen la palabra clave [verificación]. El AND nos dice que después debemos aplicar la operación lógica de la intersección a estos dos conjuntos

Parte B: conjunto de documentos que satisfacen la ecuación

La parte B de la ecuación de nuestro ejemplo será necesariamente un nuevo conjunto. En este ejemplo concreto, el de aquellos documentos que cumplen la propiedad de tener a la vez las dos palabras clave.

La forma en la que se manifiesta la parte B cuando usamos una base de datos es como página de resultados. Si queremos representar los dos miembros de la ecuación del ejemplo como conjuntos, podría ser algo algo así:

conjunto 1 AND conjunto 2 = conjunto 3

El conjunto 3 es el que tiene los documentos relevantes. En esta ecuación, los elementos de este conjunto, en virtud de AND, son los que pertenecen a la vez al conjunto 1 y al conjunto 2.

El lector puede preguntarse por el caso de una ecuación de búsqueda que arroje 0 resultados. Recordemos que en teoría de conjuntos existe el conjunto vacío, y este sería el caso.

Todo esto necesitamos hacerlo así porque tratamos con una base de datos, esto es, con un ordenador, y para ello necesitamos usar lógica booleana, no podemos usar directamente lenguaje natural.

Volviendo a la lógica booleana, el operador, en lugar de AND, podría ser OR o NOT. Con cada operador, los elementos del tercer conjunto resultante serían distintos porque cada operador impone condiciones distintas. Examinamos estos operadores más adelante.

Consistencia lógica

La consistencia lógica de una ecuación de búsqueda se produce cuando expresa de forma exacta la necesidad de información a la que se supone que representa.

Un ejemplo es el siguiente. Supongamos la siguiente necesidad de información (NIN), que llamaremos NIN1:

relación del periodismo y la comunicación con los bulos y la desinformación

La siguiente búsqueda, intenta formalizar NIN1 mediante palabras clave y operadores, pero lo hace de forma incorrecta (el asterisco indica que es incorrecta):

periodismo AND comunicación AND bulos AND desinformación (*)

Antes de seguir con otras cuestiones, formalizamos de forma adecuada la necesidad de información NIN1 en una forma que SÍ es correcta al ser lógicamente consistente:

(periodismo OR comunicación) AND (bulos OR desinformación)

La clave estaba en no adaptar mecánicamente cada «y» gramatical a un AND lógico, porque no siempre coinciden. Más adelante examinamos esto con atención.

La adecuación pragmática en el proceso de búsqueda

En el anterior ejemplo, hemos mostrado ejemplos de ecuaciones que son inconsistentes y consistentes respectivamente con una necesidad de información.

Pero esto nos lleva a señalar que una cosa es la consistencia lógica, que depende de la lógica booleana y de su consistencia con la necesidad de información.

Pero otra cosa es la adecuación pragmática, que depende de diversos factores estrechamente vinculados con las características de cada proceso de búsqueda concreto. Por mencionar dos casos con el mismo ejemplo de antes:

  • En una base de datos con lengua de trabajo en español, como Dialnet, el idioma de las palabras clave utilizadas en el ejemplo es adecuado. Pero si el proceso de búsqueda se ha diseñado para obtener artículos publicados por revistas de todo el mundo, necesitaremos una base de datos internacional, y en tal caso será inadecuado. En tales bases de datos corresponde usar palabras clave en inglés (y obtendremos resultados en cualquier idioma).
  • El concepto de «comunicación» puede resultar demasiado amplio. Esto significa que nos dará mucho ruido. Posiblemente, si consideramos con cuidado la necesidad de información a la luz del proyecto concreto, tal vez convendría convertirlo en otro como «medios de comunicación». O «news media» en una base de datos internacional.

Condición de validez de una ecuación de búsqueda

Todo lo anterior, nos lleva a definir la validez de una ecuación de búsqueda en el seno de un proceso de búsqueda que, a su vez, forma parte de un trabajo de revisión. La definición que proponemos es la siguiente:


Para que una estrategia de búsqueda sea válida debe presentar, a la vez, consistencia lógica y adecuación pragmática.


El siguiente diagrama expresa esta idea de una forma gráfica:

Validez de una ecuación de búsqueda en un proceso de búsqueda
Condiciones de validez de una ecuación de búsqueda

Adecuación pragmática

Los dos componentes principales que condicionan la adecuación pragmática son los siguientes:

  • Características de la fuente: el idioma de trabajo u otras características intrínsecas. Por ejemplo, si utilizamos una base de datos como Dialnet, debemos utilizar palabras clave en español. Pero en Scopus, deben ser en inglés. Otro ejemplo, si usamos WoS seguramente lo más adecuado es usar la Core Collection, y no otras colecciones, pero podría ser justo al revés en otros casos, etc. Las características del sistema de búsqueda pueden presentar otros requerimientos. Algunas permiten usar tesauros, otras no, etc. Pero hay aún otros aspectos (lo malo de esto es que no hay una lista cerrada), como el uso de operadores. Algunas fuentes puede que no tengan determinado operador, y otras sí, de modo que esto hay que contemplarlo también como parte de esta adecuación a la fuente utilizada.
  • Características del proyecto: elección de las palabras clave o del rango de fechas, por ejemplo. En un trabajo de revisión podemos estar utilizando una palabra clave que no suelen usar la mayor parte de los autores que trabajan en ese ámbito. La ecuación podría ser lógicamente consistente, pero pragmáticamente inadecuada. Una solución siempre a mano es combinar todos los sinónimos relevantes mediante un OR. Otra cuestión es usar un rango de años que no quede justificado por la definición estratégica del proyecto. Por ejemplo, tal vez el estudio de determinado fenómeno se analiza mejor con publicaciones de un período determinado que con las últimas publicaciones y al revés, etc.

Consistencia lógica

Por su parte, la consistencia lógica es, por un lado, menos intuitiva, ya que requiere algo de formación previa, como es el conocimiento de los operadores booleanos y de las fuentes utilizables, pero a cambio es algo que se puede determinar con seguridad y es, por así decirlo, de carácter universal.

En lo que sigue nos centraremos en esta clase de validez. La clave, como venimos señalando, es adquirir las competencias para convertir necesidades de información en ecuaciones de búsqueda, y la clave de la clave, es la lógica booleana, así que es lo primero que consideraremos a continuación. No es un conocimiento complicado, de hecho, debería formar parte del corpus de conocimientos de una persona medianamente culta, como el conocimiento básico de la aritmética o de la gramática, por poner un par de ejemplos dispares.

Operadores booleanos

Para explicar estos operadores partiremos de una ecuación simple con dos palabras clave y un operador. Luego, ya generalizaremos a tres o más palabras y a más de un operador.

De momento, interpretaremos el sentido de cada operador mediante una ecuación con esta forma general relativamente simple:

palabra-clave-1 OPERADOR palabra-clave-2
=
conjunto de documentos relevantes

A partir de esta forma general, podemos explicar el sentido de cada operador de este modo:

  • AND o intersección lógica: genera conjuntos de documentos que tienen tanto la primera como la segunda palabra clave.
  • OR o suma lógica: genera conjuntos de documentos que tienen una u otra o ambas palabras clave.
  • NOT o resta lógica: genera conjuntos de documentos que tienen la primera palabra clave, pero no la segunda.

Un ejemplo sencillo lo aclarará aún más. Sea una base de datos con 4 documentos, cada uno de ellos con una serie de palabras clave asociadas, según indica la tabla siguiente:

DocumentoPalabras clave
D1periodismo, verificación, facebook, twitter
D2medios de comunicación, periodismo, verificación
D3fact-cheking, verificación, televisión
D4periodismo, televisión

Sean entonces la siguientes ecuaciones de búsqueda y sus resultados respectivos:

EcuaciónDocumentos
periodismo AND verificaciónD1, D2
periodismo OR verificaciónD1, D2, D3, D4
periodismo NOT verificaciónD4

Como es fácil de ver, incluso en una base de datos de solamente 4 documentos, cada operador puede generar conjuntos de documentos muy distintos. La ecuación con AND selecciona D1 y D2 porque son los que tienen ambas palabras clave. En cambio, la ecuación con OR los selecciona todos, porque todos tienen o bien una, o bien otra o bien ambas palabras. Por último, en la ecuación con NOT solo hay un resultado, porque solo un documento contiene la primera palabra pero no la segunda,

El problema con AND y OR

En la práctica algunos investigadores confunden los operadores booleanos AND, OR con las partículas gramaticales Y, O. El problema es que a veces coinciden, pero a veces no. Si no tuvieran nada que ver sería más fácil.

Para desambiguar la relación, necesitamos estas tres cosas: (1) conceptos, (2) palabras y (3) sinónimos. Los conceptos en sí mismos son inobservables, necesitamos expresarlos con palabras. Un mismo concepto se puede expresar con diferentes palabras, lo que las convierte en sinónimos. Por ejemplo, las palabras terremoto y movimiento sísmico expresan el mismo concepto.

A partir de aquí, la regla práctica es la siguiente:

  • Los sinónimos se relacionan entre ellos con OR, esto es, con una suma lógica.
  • Los conceptos se relacionan entre ellos con AND, esto es, con una intersección lógica.

Ejemplo: ¿cómo combinamos las palabras clave de la siguiente necesidad de información?:

relación del periodismo y los medios de comunicación con la desinformación y los bulos

Veamos:

  • La pareja [periodismo, medios de comunicación], representan un mismo concepto, el concepto 1. Luego, cada una de estas palabras son sinónimos funcionales o documentales. Las uniremos entre ellas con un OR. No nos debe importar que en la frase en lenguaje natural aparezcan unidos con una «y». El «y» gramatical se parece, pero no es el AND booleano
  • La pareja [desinformación, bulos], representa el concepto 2, luego cada una de las palabras son también sinónimas. Las uniremos también con un OR.
  • Nos queda representar la intersección de los conceptos. Lo haremos con un AND.

A partir de lo anterior, la única ecuación lógicamente consistente con la necesidad de información es la siguiente:

(periodismo OR medios de comunicación) AND (desinformación OR bulos)

Obsérvese que hemos usado paréntesis para indicar que la suma lógica (OR) se calcule primero y después, se haga la intersección (AND). Es lo mismo que hacemos en aritmética cuando queremos dejar claro qué debe calcularse primero en una operación como en (3+4)x5, que da un resultado distinto que 3+(4×5). Además, gráficamente nos ayuda a nosotros mismos a entender qué estamos queriendo decir con operadores booleanos. De todos modos, si usamos formularios no tendremos que preocuparnos por estos paréntesis, ya que los generará de forma automática el sistema, al interpretar el formulario.

Nos queda el tercer operador, el NOT con el que no suele haber problemas, la regla intuitiva dice así:

  • Si necesitamos retirar un concepto del conjunto, por exceso de ruido o para aumentar la precisión, usamos un NOT, esto es, una resta lógica.

Su aplicación, en un ejemplo en el que podríamos queremos retirar resultados sobre deportes de una búsqueda sobre Barcelona y fotoperiodismo, sería así:

(barcelona AND fotoperiodismo) NOT deportes

Como se puede ser se trata de recuperar documentos de periodismo siempre que no traten de deporte. Es un operador con pocos problemas de interpretación.

En lo que sigue, por su mayor dificultad y por su uso extensivo a la vez, nos centraremos en el uso de los operadores OR y AND.

Forma canónica de una ecuación para dos conceptos y dos operadores

Todo lo anterior, nos da lo que podemos llamar la forma canónica de una ecuación de búsqueda para dos conceptos, cuando cada uno de ellos tiene dos palabras clave, y usamos dos operadores diferentes:

(pc1 OR pc2) AND (pc3 OR pc4)

Donde pc1 y pc2 son los sinónimos del primer concepto, y pc3 y pc4 son los sinónimos del segundo concepto. Por su parte, OR suma los sinónimos de cada concepto, y AND intersecta los dos conceptos. Este es un modelo simple para ilustrar el funcionamiento de las ecuaciones de búsqueda, pero en lo que sigue, lo generalizamos, ya que no hay ninguna restricción al respecto del ni del número de palabras clave ni del número de conceptos.

Generalizando

Lo que hemos visto con dos conceptos y dos palabras para cada uno de estos, lo podemos generalitzar a tres o más conceptos, cada uno de ellos con una o más palabras, así como con dos o más operadores. Ejemplo:

(vacunas
AND
(desinformación OR bulos)
AND
(facebook OR twitter OR youtube))
NOT
covid

Como vemos, no hace falta que las ecuaciones sean simétricas. Uno de los conceptos puede tener una sola palabra, otro tres, y otro cuatro, por decir algo. También podemos usar paréntesis anidados (el de nivel superior, lo hemos marcado con negrita para destacarlo), y por último, podemos utilizar más de dos operadores diferentes. En este caso, hemos añadido NOT para mostrar también esto.

En el ejemplo anterior, la ecuación nos dice que buscamos información que relacione vacunas y bulos en redes sociales, pero siempre que no traten de la vacuna del covid. Podría ser una investigación que necesitase estudiar el movimiento anti vacunas antes del covid.

¿Cuántos operadores?

¿De cuántos operadores booleanos disponemos? En principio, los operadores básicos son tres: AND, OR y NOT. Hay otro operador, el XOR que es poco habitual, pero algunos sistemas de información lo contienen. En realidad, es un operador formado por combinación de los anteriores.

Aunque sea por curiosidad, digamos que el significado de XOR u OR eXcluyente, como se denomina, es el siguiente: dadas dos palabras clave, XOR selecciona documentos que tengan una u otra, pero no ambas. Por ejemplo, sea la siguiente ecuación:

bulos AND twitter XOR facebook

Esta ecuación recupera documentos que traten sobre bulos en twitter o sobre bulos en facebook, mientras rechaza documentos que traten sobre bulos tanto en twitter como en facebook -hasta donde recuerdo, no he necesitado nunca (o no he creído necesitar) este operador en ningún trabajo de revisión-.

Observaciones importantes

  • La regla práctica que nos dice que el OR es para unir sinónimos, y el AND para cruzar conceptos, es de aplicación, y funciona muy bien, en búsquedas documentales. Pero los operadores booleanos se usan en otros contextos, por ejemplo, en programación, y en ellos esta regla puede carecer de significado.
  • En la mayor parte de las bases de datos, los términos compuestos hay que señalarlos usando comillas, como en [«medios de comunicación»]. Esto evita falsas coordinaciones.
  • Los sistemas de búsqueda suelen tratar por igual palabras en singular o en plural. De hecho, algunas tratan igual todas las variaciones de la misma palabra, y por defecto usan la raíz de la palabra. Por ejemplo, [vacuna, vacunas y vacunación] puede ser la misma palabra, a partir de la raíz [vacuna], al menos en algunas bases de datos. Cuando no es el caso, se puede usar de forma explícita el símbolo de truncamiento, como en [vacuna*]. Un consejo aparente sería usar siempre truncamientos, pero nunca podemos estar seguros de que el sistema que usamos los utilice, porque el truncamiento está muy extendido, pero no es universal. Hay que consultar la ayuda, si está disponible, cosa que no siempre sucede. En otro caso, no hay más remedio que hacer pruebas.
  • Cuando se utiliza sintaxis directa, en lugar de un formulario, los operadores booleanos suelen representarse en mayúsculas para diferenciarlos de las palabras clave, como en esta ecuación, p.e.: «to be or not to be» AND Shakespeare.
  • En los formularios no es necesario usar paréntesis. Basta con utilizar las filas del mismo como mostraremos, y el sistema genera la sintaxis directa con uso de paréntesis donde corresponda.

Síntesis del proceso de búsqueda

Antes de pasar a ilustrar la forma de utilizar ecuaciones de búsqueda en bases de datos académicas repasemos la síntesis del proceso:

  1. Partimos de un protocolo de investigación donde, entre otros parámetros, establecemos una pregunta o un problema de investigación. Desde el punto de vista lógico esta es nuestra necesidad de información que tendremos que convertir en una ecuación de búsqueda que sea válida.
  2. Determinamos una o más fuentes para obtener la base de la evidencia, esto es, el conjunto de documentos sobre los llevaremos a cabo el trabajo de revisión.
  3. Si una o más de las fuentes son bases de datos, prepararemos una o más ecuaciones de búsqueda con las palabras clave derivadas de la pregunta o del problema de investigación.
    • Es esencial que esta ecuación sea lógicamente consistente con la necesidad de información.
    • La regla práctica, como ya sabemos, nos dice que los diferentes sinónimos los sumaremos con un OR y los diferentes conceptos los intersectaremos con un AND, hasta tener la forma canónica (PC1 OR PC2) AND (PC3 OR PC4), que como sabemos es generalizable a más de dos conceptos, cada uno de ellos con uno o más sinónimos, etc.
    • También debe tener adecuación pragmática. Debemos asegurarnos de que la ecuación se ajuste a la fuente, por ejemplo, en el idioma usado, pero también en los operadores utilizados, las palabras clave elegidas deben ser las más usadas efectivamente en el ámbito que queremos cubrir, etc. Por supuesto, en este último aspecto el uso de sinónimos y del operador OR puede ser decisivo.
Diagrama con la síntesis del proceso de búsqueda
Síntesis del proceso de búsqueda

Para todo lo que sigue, nos situaremos en el supuesto del punto 3, representado con los rectángulos de color azul en el diagrama, en el que tenemos al menos una ecuación de búsqueda que debemos suponer es consistente con nuestra necesidad de información.

SEGUNDA PARTE
Ejemplos con bases de datos


Vamos a usar en los tres casos que hemos elegido para ilustrar el uso de operadores booleanos, de la siguiente ecuación

(verification OR fact-checking) AND (journalism OR newspapers)

Es fácil imaginar un escenario en el que el investigador lo que planea hacer es un trabajo de revisión sobre verificación y fact-checking en periodismo y medios diarios (de nuevo: las «y» de esta frase no son un AND booleano).

Usaremos los siguientes sistemas para mostrar cómo usar los formularios de búsqueda para utilizar operadores booleanos:

  • Communication Source (EBSCO)
  • Scopus
  • Web of Science

Usaremos en las tres bases de datos la ecuación que mostramos más arriba. Otros parámetros, como el rango de fechas y el tipo de documentos, los vamos a configurar igual en las tres bases de datos. En concreto, usaremos una parametrización típica, tal como situar el rango en cinco años y centrar la búsqueda en artículos como el formato documental (lo que incluye artículos de revisión).

En Scopus y WoS, podremos usar un grupo de campos que reúnen el título, el resumen y las palabras clave. En Communication Source tendremos que usar el resumen, ya que no existe la posibilidad de enviar la consulta varios campos a la vez (salvo a todos). Pero evitamos expresamente usar todos los campos parte de la buena práctica habitual para evitar el ruido y aumentar la precisión.

Communication Source

Formulario de búsqueda

Formulario de búsqueda de Communication Source

Parametrización

Opciones de parametrización en Communication Source

Página de resultados

Cabecera de la página de resultados de Communication Source

Observaciones

El formulario de Communication Source (común a todas las bases de datos de EBSCO) incluye cajas de búsqueda pequeñas, cosa que va contra la usabilidad. No podemos ver todas las palabras clave, así que un error de tecleo nos puede pasar inadvertido. Por otro lado, lo cierto es que su sistema de consulta y la página de resultados son excelentes, pero lo anterior es una limitación que no queremos dejar de señalar.

Otra limitación es que no permite usar la agrupación de campos [título + resumen + palabras clave]. Por eso, hemos optado por usar resumen. Vemos entonces, que la búsqueda genera un conjunto de 47 documentos. Veremos que son menos que en los otros dos casos, pero seguramente también ganamos en especificidad. Existe el importante punto a considerar que todos los documentos son publicaciones de revistas especializadas en comunicación.

También cabe decir, que sin limitación de campos, el resultado fue de 135 documentos, pero, como en los demás casos hemos usado limitación de campos, hemos dejado en la captura el resultado de los 47 documentos. También corresponde señalar que hemos limitado la respuesta a publicaciones académicas, para mantener ese elemento de igualdad con las otras bases de datos. Esto es debido a Communication Source incluye publicaciones no académicas, cosa que en esta ocasión no hemos explotado, pero de lo que vale la pena dejar constancia.

Scopus

Formulario de búsqueda

Formulario de búsqueda en Scopus que incluye la parametrización por rango de años

Página de resultados

Cabecera de la página de resultados de Scopus

Observaciones

El diseño del formulario es el óptimo. Una caja de búsqueda grande que deja ver todas las palabras clave, y la opción de parametrización por años como parte del mismo formulario. La de tipo de documentos se puede hacer en la página de resultados, ya que es uno de los numerosos filtros. Nosotros lo hemos aplicado así.

En total, 174 documentos recuperados. Esto puede estar mostrando la amplitud de la cobertura de esta base de datos comparada con la anterior. Lo cierto es que no hace al caso para lo que estamos considerando, pero es un dato siempre relevante.

Web of Science

Formulario de búsqueda

Formulario de búsqueda de WoS

Página de resultados

Página de resultados de WoS

Observaciones

Actualmente, la base de datos mejor diseñada, desde el punto de vista funcional y de usabilidad, seguramente es WoS. Por alguna razón, Scopus le ha cedido este puesto después de ser la base de datos que primero invirtió seriamente en este aspecto. En todo casos, ambas están realmente en la excelencia. Como en el caso de Scopus, la parametrización del tipo de documentos lo hemos hecho en la página de resultados.

Observamos que proporciona el mayor número de artículos de las tres bases de datos, con un total de 190, demostrando su continua mejora en la amplitud y diversidad de su cobertura.

No hemos hecho en ninguno de los tres casos un análisis de la relevancia relativa de los resultados, cosa que nos llevaría por derroteros distintos de los que hemos propuesto para este trabajo. También cabe considerar que no hemos usado una ecuación totalmente homogénea en los tres casos, pero no es relevante para los objetivos de esta entrada que se centran en mostrar tres ejemplos de cómo se aplican ecuaciones de búsqueda en bases de datos (no compararlas entre ellas).

Bonus: PRISMA Searching

PRISMA Searching es un marco de trabajo compuesto por 16 componentes que ayuda a diseñar y a documentar el proceso de búsqueda de una revisión sistemática. Varios de sus puntos se refieren a los temas que hemos tratado aquí. En concreto, aquellos que se refieren a las fuentes y a la estrategia de búsqueda.

A los lectores interesados, les recomendamos la entrada dedicado por entero a PRISMA Searching, y en la que además de una amplia explicación del mismo, tienen enlaces relacionados con este importante marco de trabajo.

La fase de evaluación

Para evitar malentendidos, cabe recordar que los resultados de una búsqueda como los mostrados aquí no pueden proporcionar de modo directo la base de la evidencia. Antes de llegar a ella, los resultados deben ser evaluados. De este proceso puede suceder que N, el número final de documentos que formen la base de la evidencia, sea mucho menor que el número total ofrecido por la página de resultados.

Para ello, los resultados deben ser examinados, uno a uno, mediante el escrutinio del título y del resumen para retirar falsos positivos, entre otras cosas, o para determinar si cumplen con determinados criterios de inclusión y exclusión previamente definidos en el protocolo del proyecto. En fases posteriores de análisis será necesario examinar los documentos completos para extraer los datos.

Todos los marcos de trabajo relativos a revisiones sistemáticas o a scoping reviews incluyen la fase de evaluación, y en especial forma parte del framework SALSA que es una propuesta significativa para entender el correcto desarrollo de un trabajo de revisión.

Este no es el lugar para desarrollar la manera de definir y aplicar estos criterios, pero puede encontrarse información en la lista de recursos que hemos recogido al final.

Conclusiones

Asegurar la calidad de un trabajo de revisión exige llevar a cabo un proceso de búsqueda bien diseñado. Esto incluye seleccionar de forma adecuada las fuentes y asegurar la validez de la estrategia de búsqueda, que debe ser consistente desde el punto de vista lógico, y adecuada desde el punto de vista pragmático.

Para los autores, todo esto supone que deben asegurar la validez de las ecuaciones de búsqueda teniendo en cuenta elementos como los presentados aquí. Para los evaluadores, significa que deben esperar procesos de búsqueda debidamente documentados.

En esta entrada hemos revisado las principales condiciones de esta validez, en especial la consistencia lógica para lo cual hemos tratado con detalle las ecuaciones de búsqueda y los operadores booleanos.

Son competencias que todo equipo que considere el uso de bases de datos debe poseer. En otro caso, lo mejor es que consulte con colegas expertos, o que pida asesoramiento a personal especializado de una biblioteca universitaria si tiene la posibilidad.

Lo que carece de sentido es hacer búsquedas sin garantías en el contexto de un trabajo de revisión, porque los resultados globales pueden quedar seriamente dañados.

No estamos diciendo que todos los investigadores deban llevar a cabo revisiones sistemáticas, estamos diciendo que si hacen una revisión de la literatura, esta sea de tipo sistematizado. Y el uso correcto de bases de datos es la base principal en este empeño.

El framework PRISMA Searching es a la vez una llamada de atención y una ayuda para que los procesos de búsqueda sean diseñados de forma cada vez mejor. Y esta entrada es un modesto intento de contribución en esta misma estela.

Para saber más