Utilizar con Éxito Bases de Datos Académicas en Tesis Doctorales: El Método Facetar-Derivar-Combinar

Página de resultados de la base de datos científica Scopus

Parte de la página de resultados de una búsqueda efectuada en la base de datos académica Scopus

En una tesis doctoral o en un trabajo final de máster, la utilización de bases de datos académicas como Web of Science o Scopus, es esencial porque necesitamos conocer qué investigaciones han sido llevadas a cabo anteriormente en el mismo ámbito temático o sobre el mismo objeto de estudio de nuestro proyecto, aunque sea simplemente para no hacer el ridículo. Pero además, podemos obtener ideas clave para nuestra investigación. 

Necesitamos saber, por ejemplo, si el sistema de análisis que pensamos aplicar se ha utilizado antes y en este caso, con qué resultados. O cuáles son las últimas aportaciones en relación con determinado marco teórico o metodológico, o incluso si determinada teoría se considera válida o han aparecido teorías rivales, etc. Los ejemplos se podrían multiplicar fácilmente, pero una cierta base ética y lógica a la vez es común a todos los caso: por un lado, hemos de evitar redescubir la rueda y por otro, hemos de demostrar a nuestros interlocutores que no pierden el tiempo con nosotros, porque conocemos bien el terreno en el que se supone que queremos innovar con nuestro trabajo de investigación. 

Ahora bien, en una tesis doctoral, o en un trabajo final de máster, las garantías metodológicas lo son todo. No se trata de usar fuentes de información o bases de datos, sin más. Hemos de planificar nuestra búsqueda de forma que responda a las exigencias propias de una revisión sistemática, cosa que incluye la necesidad de ser transparente, la única manera, a su vez, de poder alegar que nuestra exploración de la mejor producción científica ha sido llevada a cabo con garantías.

Todo esto tiene una doble utilidad. En primer lugar, qué duda cabe que seremos más sabios y haremos una mejor investigación cuando hayamos examinado la información obtenida de este modo. Esto nos proporcionará una seguridad que nos será muy útil cuando hayamos de defender nuestros resultados.

Además, vamos a incrementar las garantías de éxito de nuestra tesis o trabajo final de máster (TFM) delante de los miembros del tribunal, que, a su vez, tienen la obligación de cuestionar cada paso de nuestra investigación; y una parte muy importante de este éxito depende de las señales de solvencia y de transparencia que seamos capaces de incorporar a nuestra tesis, y demostrar que hemos llevado a cabo una revisión sistematizada envía una señal muy potente. 

La idea esencial

Solamente si somos capaces de identificar y analizar la mejor investigación previa tenemos derecho a esperar superarla

En esta entrada, presentamos el Framework FDC para asegurar al máximo tales garantías ya que si lo usamos de forma consistente podremos invocarlo como parte del aparato metodológico de nuestro trabajo. Nos apresuramos a aclara que las siglas FDC responden a las tres fases recomendadas por este procedimiento para planificar una búsqueda:

  • Facetar
  • Derivar
  • Combinar

Los componentes de este framework son dos. En primer lugar, la invocación a su fundamento conceptual: las revisiones sistemáticas; y en segundo lugar un procedimiento que da nombre al framework y que se materializa, entre otras cosas, en una tabla que proporciona una matriz de relación entre facetas de la investigación y palabras clave, así como un conjunto de ecuaciones de búsqueda como resultado.

En primer lugar, presentaremos el fundamento conceptual de este Framework, que está enclavado en la teoría de las revisiones sistemáticas (o sistematizadas), a fin de poder pasar enseguida a mostrar los procedimientos.

annual reviews

Annual Reviews es una base de datos científica íntegramente destinada a trabajos basados en estados de la cuestión o revisiones

 

El Fundamento: las Revisiones Sistemáticas

Está ampliamente documentada en la bibliografía sobre cómo llevar a cabo investigaciones de tipo académico, la necesidad llevar a cabo un estado de la cuestión como paso previo a un nuevo proyecto. Es, además, una exigencia marcada por la propia de la estructura de tales trabajos, ya sean artículos de revista o tesis doctorales, ya que de todos ellos se espera que comiencen con una sección (de extensión variable según el caso: entre una y dos páginas en un artículo, hasta varias decenas de página en una tesis) que exponga los principales logros (o limitaciones) anteriores en la investigación que se va a presentar.

Además, al menos desde los años 90, gracias a la influencia de la llamada “medicina basada en la evidencia“, está plenamente legitimado un género científico con identidad propia que consiste en sintetizar resultados a partir del análisis de un corpus de investigaciones previas o en presentar estados de la cuestión de forma autónoma.

En ambos escenarios, es necesario aplicar lo que se conoce con la denominación de revisiones sistemáticas (sytematic reviews en la terminología internacional). Esta clase de revisiones disponen de sus propios frameworks para asegurar la calidad de tal sistematicidad, el más utilizado de los cuales deriva de las llevadas a cabo en el ámbito de las ciencias de la salud, y es conocido como SALSA Framework, cuyas siglas responden a lo siguiente:

  • Search
  • AppraisaL
  • Synthesis
  • Analysis

En este caso, Search se refiere a la necesidad de que la búsqueda se realice de la única forma aceptada actualmente en el ámbito académico: a saber, utilizando bases de datos de referencia, como WoS o Scopus en el ámbito multidisciplinar o como Taylor and Francis o Sage en el de Comunicación y Humanidades.

Por supuesto, la S del framework se refiere también a que la búsqueda debe hacerse con criterios bien definidos de inclusión y de exclusión de los trabajos a analizar. Normalmente, estos criterios se expresarán mediante la elección de las palabras clave y se transformarán en ecuaciones de búsqueda, sin perjuicio de aplicar otros criterios de selección pragmáticos (por ejemplo, solo artículos en determinados idiomas y publicados en los últimos años) o metodológicos (por ejemplo, solo artículos que hayan utilizado un tipo de muestreos determinado, etc.).

Para esta entrada, nos bastará centrarnos en la primera de las dos S del SALSA, la que corresponde, como hemos visto a la de Search

Los lectores interesados en el significado de los demás términos del acrónimo SALSA: Appraisal, Synthesis y Analysis, puede revisar la entrada dedicada al mismo en este sitio web.

Frameworks

Recordemos que un framework, de acuerdo con Wikipedia, “es un conjunto estandarizado de conceptos, prácticas y criterios para enfocar un tipo de problemática particular que sirve como referencia, para enfrentar y resolver nuevos problemas de índole similar”.

Antecedentes

En nuestro caso, los antecedentes de este framework son, entre otros, y como ya hemos señalado, los estudios sobre las revisiones sistemáticas (ver bibliografía); nuestros propios trabajos sobre el ámbito, como consecuencia de una asignatura en el Máster Universitario en Comunicación Social, en la cual, en los últimos tres cursos, los estudiantes de la misma lo han venido aplicando para sus TFM y, por último (pero no menos importantes), los seminarios de investigación de nuestro Grupo (DigiDoc).

Procedimientos: las tres fases

Como las siglas que dan nombre a nuestro Framework corresponde a tres fases sucesivas (que pueden ser reiteradas en caso necesario), también se pueden representar así:

framework-FDC

Las tres fases, representadas como rectángulos, que dan nombre al Framework FDC. El diagrama muestra que a la vista de los resultados, y tras un análisi de los mismos, suele ser necesario reconsiderar la derivación de palabras clave

Tabla 1: Los componentes del Framework FDC

Término/FaseExplicación
FacetarConsiste en considerar todas las facetas características de una investigación académica, tales como el objeto de estudio, el marco teórico, el marco metodológico, etc., según veremos con detalle en la tabla correspondiente más adelante.
DerivarDe cada faceta corresponde derivar las palabras clave que la representen, incluyendo sinónimos y variaciones en la lengua de trabajo y en inglés.
CombinarUna vez disponemos de un grupo de palabras clave obtenidas en las dos fases anteriores, podemos proceder a combinarlas en un grupo de ecuaciones de búsqueda.

La F de Facetas

Para estar seguro de que no obviamos ningún aspecto clave de nuestra investigación, necesitamos considerar una serie de facetas, cada una de las cuales nos proporcionará la manera de derivar un conjunto de palabras clave. ¿De dónde hemos obtenido estas facetas?

Corresponden al examen de las siguientes clases de documentos y fuentes con los que, por otro lado, debe habituarse un investigador:

  • Los componentes de un proyecto de investigación característico, como los que deben presentarse para optar a un proyecto financiado competitivo.
  • Las partes en las que se recomienda articular la rubrica de evaluación de un proyecto de final de máster (ver por ejemplo, el de la Agencia para la Calidad del Sistema Universitario de Cataluña).
  • Las partes en las que se recomienda articular un proyecto de tesis doctoral para su aprobación en la mayor parte de los programas de doctorado.
  • Los componentes de una investigación según la mayoría de tratados académicos sobre el tema (ver bibliografía al final).
  • La propia praxis habitual de comunicación de resultados científicos en los apartados de Introducción y Conclusiones (ver bibliografía al final).

Como sea, en nuestra propuesta procedimental, los componentes de estas facetas son los que indica la tabla siguiente.

Tabla 2: Matriz de Facetas para caracterizar un proyecto de investigación

FacetaExplicación y Ejemplos (del campo de la Comunicación Social)
Objeto de EstudioIdentifica el objeto material o conceptual en el que centramos la investigación. Ejemplos: Televisión, sitios web, twitter, cibermedios, comunicación política, redes temáticas, posicionamiento web, etc.
Tipo de AcciónQué clase de actividad investigadora identifica mejor nuestro proyecto. Ejemplos: Análisis, Síntesis, Testeo, Comparación, Evaluación, etc.
Marco TeóricoTeorías o disciplinas que informan y aportan los constructos conceptuales principales de nuestro enfoque. Ejemplos: Teoría de la comunicación, Semiótica, Sociología, Psicología, Antropología, etc.
Técnicas de Obtención de DatosTécnicas concretas con las que pensamos obtener datos para nuestra investigación. Ejemplos: Focus group, Delphi, Entrevistas, Encuestas, Minería de datos, Estudios de caso, Análisis comparativos, Análisis experto, Análisis heurístico, Revisiones sistemáticas, Observación participante, Estudios de usuario, Tests, etc.
Estrategias MetodológicasIdentifica cuál(es) de las tres grandes estrategias metodológicas utilizaremos: cuantitativa, cualitativa, conceptual.
TopónimosNombre de lugares, regiones o países que intervengan en el estudio. España, Cataluña, Europa, Portugal, Brasil, México, etc.
Nombres PropiosNombres de autores destacados o representantes de corrientes teóricas que intervengan en el estudio. Nombres propios de empresas o corporaciones que tengan algún relación con el estudio.
Software o HerramientasDenominaciones de paquetes de software o de instrumentos o herramientas que pensamos utilizar en nuestra investigación. Ejemplos: NVivo, Eyetracker, Card sorting, Personas y escenarios, wireframes, etc.

Al utilizar una matriz como la anterior nos estamos asegurando de disponer del conjunto de palabras clave que nos permitirá encontrar la mejor producción científica previa a nuestra investigación. Sin esta matriz podríamos fácilmente centrarnos “solo” en el objeto de estudio, y perder, por ejemplo, buenos trabajos anteriores sobre la metodología que queremos utilizar. Ese pérdida podría jugar un papel negativo clave en nuestra investigación si, por ejemplo, existieran antecedentes de un uso determinado muy importante y alguien que evalúe nuestro trabajo considera que hemos sido negligentes al ignorar esos antecedentes.

Naturalmente, no hace falta utilizar todas las facetas en todas las investigaciones. Al contrario, algunas facetas pueden no tener sentido en según qué investigaciones. La función de la tabla es servir de elemento de chequeo que nos ayuda a ser sistemáticos

La D para Derivar Palabras Clave

Si tratamos de caracterizar nuestro proyecto de investigación con la Tabla 2, obtendremos algo como lo que mostramos a continuación.

Ejemplo: sea una revisión sistemática sobre interactividad en cibermedios (medios de comunicación digitales o en la web). La Matriz de Facetas/Palabras Clave resultante podría ser la siguiente:

Tabla 3. Ejemplo de aplicación de la matriz de facetas a un proyecto concreto

FacetaPalabras Clave
Objeto de EstudioCibermedios, prensa electrónica, diarios digitales, interactividad, interacción
Tipo de AcciónAnálisis, Comparación, Evaluación
Marco TeóricoUsabilidad, Diseño de la Interfaz, Experiencia de Usuario
Técnicas de Obtención de DatosEstudio de caso, Análisis comparativo, Análisis experto
Estrategías MetodológicasInvestigación conceptual
TopónimosNo corresponde en este caso
Nombre PropiosNo corresponde en este caso
Software o HerramientasSistrix, SemRUSH

Como observación importante, resaltar que en esta tabla utilizamos la lengua de trabajo de la investigación (hemos supuesto que en este caso es el castellano). Por tanto, necesitaremos también obtener las palabras clave equivalentes en inglés (lengua de trabajo de las bases de datos internacionales), cosa que no siempre es fácil, por cierto, ya que no suele haber una correspondencia directa entre términos especializados. Por ejemplo, ni soñar con traducir cibermedios a cibermediums, o prensa electrónica por electronic press, etc.

busquedaBoolena

En esta captura del formulario de búsqueda de Scopus hemos incluido una búsqueda boolena en base a combinar dos conceptos con un AND, al mismo tiempo que hemos parametrizado la búsqueda al restringirla a un grupo de campos que arroja siempre resultados muy precisos. También hemos limitado el rango de fechas a trabajos publicados en los últimos 6 años, y por último puede verse que hemos limitado los resultados a publicaciones de Ciencias Sociales o Humanidades

La C para Combinar Palabras Clave

La última parte de este procedimiento consiste en combinar grupos de palabras clave mediante operadores booleanos para disponer de ecuaciones de búsqueda con las cuales llevar a cabo la exploración en las bases de datos. La lógica con la que combinaremos palabras clave vendrá determinada por la naturaleza relacional de tales palabras.

Por ejemplo, con palabras clave que sean sinónimas reales o funcionales (como la pareja televisión, audiovisual) las combinaremos mediante un OR booleano, mientras que las que representen conceptos diferenciados pero con capacidad para cruzarse para formar temáticas sintéticas (como periodismo, interactividad), las combinaremos con un AND booleano. Finalmente, cuando queramos excluir artículos basándonos en algún concepto no deseado, como en el caso de desear encontrar artículos sobre interactividad, pero siempre que no traten sobre juegos, usaremos NOT.

Además, deberemos considerar el uso de búsquedas parametrizadas, casi seguro (y cómo mínimo), para establecer rangos de fechas. Por ejemplo, probablemente nos interesará encontrar artículos publicados en los últimos 6 años. Otra parametrización habitual puede consistir, para evitar ruido, en restringir los resultados a un grupo de campos (título, resumen y palabras clave, típicamente).

Ejemplo de una de las posibles ecuaciones (en pseudo código, sin incluir parametrización y suponiendo una base de datos con la lengua de trabajo en castellano):

(interactividad OR interacción) AND (cibermedios OR “prensa electrónica” OR “diarios digitales”) AND (análisis OR “análisis comparativo” OR “estudio de caso”)

Cuántas ecuaciones como la anterior necesitaremos es una cuestión que solo podemos responder mediante ensayo y error. En esta fase del framework no hay recetas fijadas (o si las hay, nosotros las desconocemos). Es cuestión de empezar con una ecuación más o menos ambiciosa como la que hemos usado de ejemplos y examinar y valorar la calidad de los resultados.

Solamente del resultado de tal inspección podremos deducir si hemos estado afortunados con nuestra elección de palabras clave y de operadores o bien hemos de proceder a su revisión y modificación.

Elección de las bases de datos académicas y otros aspectos

Naturalmente, forma parte de la primera S del Framework SALSA que, recordemos, a su vez, forma parte del marco conceptual del Framework FDC que ahora estamos considerando, saber identificar la(s) base(s) de datos que debemos usar así como poseer competencias en el uso eficiente de tales bases.

Ocuparnos de tales cosas con detalle queda fuera del alcance (y las intenciones) de esta entrada, salvo que quisiéramos ahuyentar a todo posible lector interesado ante las dimensiones que adquiría. Por tanto, solamente señalaremos un par de cosas a propósito de los dos aspectos.

La primera es que habitualmente, necesitaremos utilizar al menos las dos bases de datos científicas generalistas e internacionales mencionadas al inicio de esta entrada: WoS y Scopus. Pero también las bases de datos científicas generalistas equivalentes a nivel nacional. En el caso español necesitaríamos utilizar la base de datos del CSIC y, cada vez es más útil incorporar a la caja de herramientas de un investigador de nuestro país la base de datos Dialnet. Además, seguramente, tendremos que añadir alguna base de datos especializada internacional. En el caso de la Comunicación y de las Humanidades, podrían ser Sage y Taylor and Francis. El uso de tal conjunto de bases de datos, aunque producirán resultados redundantes, es imprescindible si queremos los beneficios metodológicos de las revisiones sistemáticas.

La segunda es que, obviamente, necesitaremos una adecuada familiaridad con el funcionamiento de tales bases de datos, así como conocer las bases teórico/funcionales de las búsquedas avanzadas, en particular las búsquedas parametrizadas y booleanas

De ambos aspectos, nos hemos venido ocupando en este sitio. El lector interesado puede explorarlo usando las opciones de navegación (ver las opciones superiores y a la izquierda) o el buscador disponible en la parte superior derecha.

¿Cuántos artículos o trabajos de investigación se supone que forman un corpus suficiente para una revisión sistematizada que después nos permita escribir una buena síntesis o un buen estado de la cuestión? El número varía bastante, pero al mismo tiempo debe permanecer dentro de parámetros abarcables en una investigación que siempre tiene un límite temporal. Leer con atención artículos científicos para extraer de ellos la información que después queremos sintetizar o comparar es una actividad que consume mucho tiempo. La cuestión es que este número también depende del ámbito y del objetivo de la revisión. No es lo mismo preparar una revisión sistemática para preparar una comunicación a un congreso o para un artículo de revista que para afrontar una tesis doctoral.

Teniendo en cuenta lo anterior, este número puede variar entre, al menos, unas cuantas decenas de artículos (pongamos, al menos 15 o 20) y, cómo máximo, unos pocos centenares (digamos no más de 150 o 200 artículos), pero no hay reglas fijas.

 

dialnet

La Base de Datos Dialnet de publicaciones científicas españolas ha conseguido volverse imprescindible

Conclusiones

Podemos aprovechar en nuestro favor, y de una manera especialmente útil, la necesidad de llevar a cabo un estado de la cuestión para nuestra tesis si aplicamos procedimientos y estándares aceptados como los que nos proporcionan las revisiones sistematizadas. Además de llevar a cabo tal estudio de una forma mucho más segura, podremos invocar el propio desarrollo de tal estado de la cuestión como parte de las metodologías aplicadas en nuestra investigación, cosa que ayudará en los necesarios factores de credibilidad y persuabilidad que todo autor de una investigación que debe ser evaluada debe cuidar de forma especialmente cuidadosa.

En esta entrada hemos visto un procedimiento que garantiza la eficacia de una parte esencial de las revisiones sistemáticas, a saber la búsqueda (el Search del framework SALSA) en bases de datos académicas y que nada casualmente es la primera fase en una revisión sistemática, por la simple razón de que es aquella parte que determinará de manera absoluta los siguientes pasos.

La cuestión principal es que la idea de que esta S de Search a la que nos referimos corresponde a la búsqueda no nos debe confundir. Buscar no es algo ni fácil ni intuitivo, y mucho menos si queremos invocar garantías metodológicas y queremos beneficiarnos del plus de solvencia y persuabilidad que nos proporciona seguir un framework o un modelo bien establecido.

Dicho de otro modo, y aún siendo MUY reiterativos: solamente si somos capaces de identificar y analizar la mejor investigación previa tenemos derecho a esperar superarla.

Bibliografía recomendada

  • Alana James E; H. Slater, Tracesea. Writing your Doctoral Dissertation or Thesis Faster. London: Sage, 2014.
  • Bell, Judith ;  Waters, Stephen. Doing your Research Project: A Guide for first-time Researchers. Berkshire: McGraw Hill, 2014.
  • Blaxter, Loraine; Hugues, Christina ; Tight, Malcolm. How to Research. Berkshire: McGraw Hill, 2010.
  • Boland, Angela; Cherry, M. Gemma; Dickson, Rumona. Doing a Systematic Review: A Student’s Guide. London: Sage, 2014.
  • Booth, Andrew; Papaionnou; Sutton, Anthea. Systematic Approaches to a Successful Literature Review. London: Sage, 2012.
  • Fink, Arlene. Conducting Research Literature Review. London: Sage, 2014.
  • Gouch, David et al. An Introduction to Systematics Reviews. London: Sage, 2012.
  • Grant, Maria J.; Booth, Andrew. “A typology of reviews: an analysis of 14 review types and
    associated methodologies”. Health Information and Libraries Journal, 26, pp.91–108, 2009.
  • Jesson, Jill K.; Matheson, Lydia; Lacey, Fiona M. Doing your Literature Review: Traditional and Systematic Techniques. London: Sage, 2011.
  • Machi, Lawrence A.; McEvoy, Brenda T.. The Literature Review: Six Steps to Success. Thousand Oaks, California: Corwin, 2012.
  • Oliver, Paul. Writing your Thesis. London: Sage, 2014.
  • Ridley, Diana. The Literature Review. London: Sage, 2012.
  • Rodríguez, Maria Luisa; Llanes, Juan (coords.) Cómo Elaborar, Tutorizar y Evaluar un Trabajo de Fin de Máster. Barcelona:  Agència per a la Qualitat del Sistema Universitari de Catalunya, 2013
  • Sandelowski, Margarete; Barroso, Julie. Handbook for Synthesizing Qualitative Research. New York: Springer, 2007 

Descargar entrada en formato PDF: framework-FDC-tesis-doctorales


Forma recomendada de citación

Lluís Codina. Utilizar con Éxito Bases de Datos Académicas en Tesis Doctorales: El Sistema Facetar-Derivar-Combinar. El Framework FCD. Barcelona. UPF. Departamento de Comunicación. Julio de 2016. Acceso: https://www.lluiscodina.com/busqueda-bases-de-datos-academicas/