Periodismo en Bases de Datos y Buscabilidad de la Información: Análisis Comparativo de 6 Bases de Datos


cubiertabdbprensa
Cubierta del Informe que incluye el protocolo y los resultados del análisis de seis bases de datos de prensa nacionales e internacionales

El Periodismo en Bases de Datos utiliza principalmente sistemas de información documental, tales como bases de datos (de aquí su nombre) y hemerotecas digitales. Su núcleo consiste en la búsqueda, descubrimiento y análisis de informaciones periodísticas retrospectivas para comprender mejor, complementar o enriquecer una historia o un evento actual.

El Periodismo en Base de Datos está relacionado también con formas periodísticas como el Periodismo de Precisión, en el sentido que no es dependiente de los sucesos de actualidad. La enorme riqueza que proporcionan las bases de datos de prensa y las hemerotecas digitales permiten un periodismo independiente de los sucesos puntuales.

Al mismo tiempo, el uso de informaciones retrospectivas, que es la principal característica de este periodismo, proporciona, al menos, tres funciones de calidad a la producción periodística en general:

  • Proporciona opciones de verificación
  • Añade credibilidad a las producciones periodísticas
  • Enriquece y complementa las noticias

1.1 Objetivos del estudio

Para que el Periodismo en Bases de Datos pueda cumplir con sus objetivos es imprescindible que tanto las bases de datos como las hemerotecas digitales proporcionen opciones de búsqueda y descubrimiento bien diseñadas.

Sin interfaces de usuario que faciliten la transformación de las necesidades de información del periodista en estrategias de búsqueda efectivas, los sistemas de información no cumplen bien con su misión.

En este trabajo, nos hemos propuesto dos objetivos principales que, a la vez, son fases metodológicas, ya que cada una de ellas refuerza a su vez a la otra, como en un típico proceso inspirado en la grounded theory. Se trata de las siguientes:

  • Diseñar un sistema de análisis de la calidad de interfaces de búsqueda en bases de datos periodísticas
  • Aplicar este sistema de análisis a las principales bases de datos periodísticas internacionales:
    • Google News UK
    • Factiva
    • MyNews
    • LexisNexis
    • Prensa Histórica
    • Periodicals Index Online

A partir de estos dos objetivos principales, hemos perseguido los siguientes sub-objetivos:

  • Identificar y caracterizar un grupo de indicadores para el análisis evaluativo de la calidad de la representación y recuperación de información periodística
  • Evaluar con reglas heurísticas derivadas de los indicadores la calidad y las posibilidades funcionales de los sistemas analizados para dar soporte a:
    • Periodismo en Bases de Datos,
    • Investigadores en Comunicación Social
    • Historiadores del Periodismo, etc.
  • Realizar una aportación al análisis de la Buscabilidad de las Informaciones Periodísticas.
  • Realizar propuestas para el diseño de la interacción y de componentes de un sistema de recuperación de información en el ecosistema de la información periodística

En relación a los mismos, cabe señalar que existe una notable tradición de bibliografía tanto a nivel internacional como en España sobre descripción, análisis y evaluación de sistemas de información documental en general, y de productos de información periodística en particular, que a su vez se pueden enmarcar en la bibliografía más genérica de análisis y evaluación de recursos digitales: sitios web, bases de datos y motores de búsqueda.

De entre estos últimos estudios se pueden citar, entre otros, los trabajos de Abadal (2002), Pedraza-Jiménez, Codina y Guallar (2016). También disponemos de los trabajos de Morville en relación al concepto de findability o buscabilidad (Morville, 2005 y 2010) y de los trabajos más centrados en aspectos teóricos de las interfaces de usuario de los sistemas de búsqueda, como los de Russell-Rose y Tate (2013) y Hearst (2009).  

Además, sobre productos de información periodística, existen al menos otros dos tipos de estudios: aquellos cuyo objetivo fundamental es la descripción y clasificación del sector (por ejemplo,  Guallar y Abadal, 2009; Guallar, Abadal y Codina, 2013; Abadal, Guallar y Codina, 2014) y aquellos cuyo objetivo es presentar metodologías de análisis y evaluación sobre los productos del sector.

Nos ha interesado especialmente este segundo enfoque desde el punto de vista de este estudio, en cuya línea se inscribe. En este grupo se deben citar los estudios de análisis de cibermedios de Linares et al (2016), Linares, Codina y Freixa (2015), Linares, Codina y Pedraza-Jiménez (2015) y los de análisis de los sistemas de búsqueda de dichos cibermedios, conocidos usualmente como hemerotecas digitales en el caso de los sitios web de prensa  (Jiménez, González y Fuentes, 2000; Abadal y Guallar, 2008; Guallar y Abadal, 2009a, 2010; Guallar, Abadal y Codina, 2013 a y b) o videotecas digitales en el caso de los webs de televisión. En este sentido, también podemos mencionar una línea de trabajos más reciente sobre evaluación de la organización de la información en sitios intensivos en contenido, como en Pérez-Montoro y Codina (2016).

En cambio existe una menor tradición de estudios evaluativos específicos sobre bases de datos de prensa, aunque tenemos los trabajos de Weaver y Bimber (2008); Guallar y Redondo (2010) y  Codina (2016).  

Por lo que respecta al estudio que presentamos aquí, entendemos que puede ser una aportación útil y novedosa a la vez para la evaluación y el análisis de las interfaces de usuario de sistemas de información en general, pero especialmente, con las bases de datos de prensa. Dado el impacto en la producción periodística de calidad que un buen sistema de búsqueda y obtención de información puede tener, creemos sinceramente no solo en la oportunidad, sino en la necesidad de esta línea de investigaciones.

Por otro lado, dado el carácter de metodología accionable del protocolo de análisis que presentamos, creemos que no solamente  es un instrumento de trabajo para nuevas investigaciones, sino también puede ser utilizado por otros grupos de investigación, o por parte de desarrolladores profesionales, que puedan estar interesados en analizar aspectos de buscabilidad de las noticias periodísticas.

1.2. Propuesta terminológica

A efectos de este protocolo, presentamos la guía/propuesta terminológica que aparece en la siguiente tabla, y para la cual nos acogemos al procedimiento lógico según el cual resulta metodológicamente aceptable proponer definiciones que cumplan al menos con las siguientes condiciones:

  • Los términos se definen de manera no ambigua
  • Se utilizan de forma consistente a lo largo de todo el trabajo

Propuesta/guía de término para este trabajo

Término

Explicación

Práctica Periodística

Una práctica periodística está formada por un grupo de procedimientos y de técnicas específicas que ayudan a la generación de noticias, o a la mejora de su calidad. Ejemplos de prácticas periodísticas son El Periodismo de Datos o el Periodismos de Precisión.

Periodismo de Datos Periodismo de Bases de Datos (sinónimos)

Una práctica periodística basado en la explotación e interpretación de colecciones de datos, generalmente de datos abiertos de origen público, aunque también pueden proceder de filtraciones, como en el caso WikiLeaks y Panamá Papers. Suele presentar una orientación de denuncia, aunque no es un requerimiento imprescindible.

Database journalism

De acuerdo con la Wikipedia: “Database Journalism or structured journalism is a principle in information management whereby news content is organized around structured pieces of data, as opposed to news stories”. Sinónimo: Structures journalism

Periodismo en Bases de Datos

Una derivación muy característica y con una fuerte identidad propia, del periodismo de datos, que se basa en el conocimiento y la explotación de informaciones periodísticas y de actualidad disponibles en hemerotecas digitales y bases de datos de prensa.

Utiliza técnicas documentales de análisis de necesidades de información periodística y su conversión en estrategias de búsqueda avanzadas.

Es una dimensión del periodismo de datos que pone en juego competencias informáticas e informacionales especializadas, así como el conocimiento de fuentes de información digitales especializadas, como las mencionadas, pero también bancos de imágenes, repositorios y archivos históricos y otros recursos especializados en información periodística textual o gráfica

El Periodismo en Bases de Datos utiliza los sistemas de información documental y en general, cualquier fuente digital de información retrospectiva, para producir un periodismo de mayor calidad.

A los medios, les aporta opciones de verificación, ideas para nuevos enfoques, conocimiento de cómo ha sido tratada una historia en el pasado y qué se ha publicado ya sobre ella, materiales para documentar y enriquecer las noticias, etc.

A los ciudadanos, les aporta un periodismo responsable, contrastado, fundamentado, enriquecido y, en general, mucho más creíble y de mayor calidad.

A partir de las definiciones anteriores, podemos establecer lo siguiente: el Periodismo en Base de Datos es una dimensión del Periodismo de Datos con características propias y muy bien diferenciadas, por eso proponemos una denominación específica para el mismo (para el descanso del lector, dejaremos de destacar a partir de ahora la partícula “en” de la denominación de Periodismo en Base de Datos).

Por su parte, el Database Journalism se refiere a una modalidad de estructuración de las producciones periodísticas de cara a su más eficaz reutilización, por tanto, pese a su similitud no es equiparable al Periodismo en Bases de Datos.

1.3. Periodismo en Bases de Datos y Medios de Comunicación

A partir de la consulta de bases de datos de prensa, un periodista puede:

  • Saber qué se ha publicado antes sobre un tema o una historia o secuencia de hechos noticiables determinado.
  • Saber cómo ha sido tratado este tema.
  • Identificar actores sociales, entidades y posibles fuentes de información para un determinado tema o línea de temas.
  • Encontrar antecedentes o datos biográficos que hayan generado noticias con anterioridad de un determinado personaje de actualidad: un político, un artista, un empresario, etc., al que (por ejemplo), queremos entrevistar.
  • Derivar ideas, enfoques y nuevas dimensiones de un ámbito noticioso que el periodista se haya propuesto tratar, o al que le hayan asignado en el medio para el que trabaja.

Naturalmente, la lista anterior es necesariamente una lista abierta, únicamente mostrada a título orientador, puesto que en realidad es algo que puede ser muy distinto para cada tema, historia, periodista, audiencia, etc.

1.4. Inputs para la Comunicación Audiovisual

Lo cierto es que estas bases de datos tienen sentido también en el sector de la comunicación audiovisual como parte de sus inputs de producción. La comunicación tiene muchas vinculaciones con la información de actualidad, incluso en su vertiente de obra creativa o de ficción, no digamos en la dimensión de los géneros del documental. En cualquier caso, para un profesional del audiovisual estas bases de datos pueden aportar:

  • Informaciones muy precisas sobre sucesos e historias de épocas anteriores, que en ningún libro de historia podrá encontrar.
  • Datos y nombres de personas, entidades, lugares, eventos, etc., para producciones televisivas vinculadas a hechos reales, ya sea para producciones tipo documentales.
  • Ideas para guiones y producciones audiovisuales, ya sea para cine o televisión.
  • Informaciones de personajes, historias, sucesos, etc., para proporcionar realismo a la ambientación de una historia o narración audiovisual.
  • Identificación de actores sociales, entidades, etc. que pueden ser fuentes para una producción audiovisual de tipo reportaje o documental.
  • Ideas para obras de creación, ya sea spots o anuncios como tramas de obras de ficción.

Como hemos dicho en el caso de su papel en la producción periodística, las anteriores son solamente meras indicaciones del papel que pueden jugar, a título indicativo.

2.Protocolo de Análisis

A continuación se definen los parámetros e indicadores que se incluyen en el Protocolo de Análisis. Se emplean 3 parámetros, cada uno de ellos con un número de indicadores para su operacionalización.

N.

Parámetro

Definición/Explicación

1

Consulta

La consulta es el componente de la interfaz de usuario que permite expresar la necesidad de información. Si el sistema de consulta es ineficiente, el usuario no podrá articular ni expresar su necesidad de información de forma precisa, y los resultados obtenidos, necesariamente, se resentirá de este problema. El usuario puede perder oportunidades como consecuencia final.

2

Página de Resultados

En la página de resultados el usuario debe tener la capacidad de llevar a cabo una serie de opciones de ordenación y de exportación de resultados para poder aprovechar sus ecuaciones de búsqueda. Idealmente, en la Página de Resultados, el sistema puede ofrecer opciones de filtrado y/o de minería de datos. De nuevo, un ineficiente diseño por falta de funciones de ordenación, explotación, etc.,  conducirá a pérdida de oportunidades.

3

Ficha de la Noticia

En la ficha de noticia aparecen metadatos y opciones adicionales de análisis y explotación de la información que pueden ayudar de forma significativa al usuario a comprender el contexto de la noticia.

Figura 1. Definición de parámetros utilizados

(…)

A continuación se detallan las Bases de Datos de Prensa que ha sido objeto de estudio de este análisis:

N.

Nombre

Acceso

1

Google News UK

Abierto

2

Factiva

Restringido

3

MyNews

Restringido

4

LexisNexis

Restringido

5

Prensa Histórica

Abierto

6

Periodicals Index Online

Restringido

(…)

 


Descargar pdf con informe completo: Indicadores y Resultados


Referencias

  • Abadal, Ernest; Guallar, Javier; Codina, Lluís. (2014). Sistemi di documentazione della stampa periodica: quali sono e come valutarli?. AIB Studi, 54(1)
  • http://aibstudi.aib.it/article/view/9486/9414 Versión española: “Sistemas de documentación de prensa ¿cuáles son y cómo evaluarlos?“ https://www.lluiscodina.com/wp-content/uploads/AIB-studi_1_14_Abadal-Guallar-Codina_SPA.pdf
  • Abadal, Ernest y Guallar, J. (2008). Les hemeroteques digitals de la premsa catalana: anàlisi dels diaris catalans de més difusió. In 11es Jornades Catalanes d’Informació i Documentació, Barcelona (Spain), 22-23 May 2008. [Conference paper].  http://eprints.rclis.org/11696/
  • Abadal, Ernest. (2002). Elementos para la evaluación de interfaces de consulta de bases de datos web. El profesional de la información, 11(5), 349-360. http://www.elprofesionaldelainformacion.com/contenidos/2002/septiembre/3.pdf
  • Anton, L. y Guallar, Javier. (2014). Análisis de los archivos audiovisuales en internet de las televisiones autonómicas españolas.Revista Española De Documentación Científica, 37(1), e033. Retrieved 7 September 2016 from http://redc.revistas.csic.es/index.php/redc/article/viewArticle/836
  • Bruno, N., Chaudhuri, S., y Gravano, L. (2002). “Top-k selection queries over relational databases: Mapping strategies and performance evaluation”. ACM Transactions on Database Systems (TODS), 27(2), 153-187.
  • Codina, Lluís. (2000). “Evaluación de recursos digitales en línea: conceptos, indicadores y métodos”. Revista española de documentación científica, 23 (1), 9-44.
  • Codina, Lluís; Pedraza-Jiménez; Rafael; Díaz-Noci, Javier; Rodríguez-Martínez, Ruth; Pérez-Montoro, Montoro; Cavaller-Reyes, Víctor. (2014). “Sistema Articulado de Análisis de Cibermedios (SAAC): Una propuesta sobre el qué y el cómo para estudiar medios de comunicación digitales”. Hipertext. net, (12).
  • Codina, Lluís. (2016). Periodismo en Bases de Datos: Características y Funciones de Búsqueda. El caso de Factiva y de LexisNexis
  • https://www.lluiscodina.com/periodismo-bases-datos-factiva-lexisnexis/
  • Díaz-Noci, Javier. (2013). “A History of Journalism on the Internet: A state of the art and some methodological trends”. Revista internacional de Historia de la Comunicación, (1), 253-272.
  • Díaz-Noci, Javier. (2008). “Definición teórica de las características del ciberperiodismo: elementos de la comunicación digital”. Doxa Comunicación, (6), 53-91.
  • Freixa, Pere; Soler-Adillon, Joan; Sora, Carles y Ribas, J. I. (2014). Aportaciones del découpage interactivo en la lectura y análisis de audiovisuales interactivos de los cibermedios. Hipertext.net, 12. http://raco.cat/index.php/Hipertext/article/view/274410/364411
  • Freixa, Pere; Sora, Carles; Soler-Adillon, Joan; Ribas y J. Ignasi. (2014). “Snow Fall and A Short History of the Highrise: two approaches to interactive communication design by The New York Times”. Textual & Visual Media. (7)
  • Garcia-Carretero, Laura; Codina, Lluís; Díaz-Noci, Javier; Iglesias-García, Mar. (2016). “SEO tools and indicators: characteristics and application to online media analysis”. El Profesional de la Información, 25(3), 497-504.
  • Gonzalo-Penela, Carlos. Posicionamiento web y dinámicas de información en motores de búsqueda: propuestas de análisis y estudio comparativo de visibilidad de contenidos digitales en el caso de procesos electorales. [Tesis doctoral] 2015.  http://hdl.handle.net/10230/23621
  • Guallar, Javier; Abadal, Ernest. (2010). “The digital press archives of the leading Spanish online newspapers”. Information research, 15(1)
  • http://www.informationr.net/ir/15-1/paper424.html
  • Guallar, Javier; Abadal, Ernest; Codina, Lluís. (2012). “Hemerotecas de prensa digital. Evolución y tendencias”. El profesional de la información, 21(6), 595-605
  • http://eprints.rclis.org/18199/
  • Guallar, Javier; Abadal, Ernest y Codina, Lluís. (2013a). “Sistema de análisis de hemerotecas de prensa digital”. Trípodos, (31), 37-64
  • http://eprints.rclis.org/19929/
  • Guallar, Javier; Abadal, Ernest y Codina, Lluís. (2013b). “Sistemas de acceso a la información de prensa digital: tipología y evolución”. Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, 27(61), 29-52
  • http://eprints.rclis.org/21044/
  • Guallar, Javier y Abadal, Ernest (2009). “Evaluación de hemerotecas de prensa digital: indicadores y ejemplos de buenas prácticas”. El profesional de la información, 18 (3), 255-269
  • http://eprints.rclis.org/13048/
  • Guallar, Javier y Abadal, Ernest (2009b). “Fuentes de información sobre prensa digital: una propuesta de clasificación”. I Congreso internacional de ciberperiodismo y web 2.0. Bilbao, 11-13 noviembre 2009 http://eprints.rclis.org/13767/
  • Guallar, Javier y Abadal, Ernest (2010). “The digital press archives of the leading Spanish online newspapers”. Information research, 15 (1).
  • Guallar, Javier y Redondo, S. (2010). “Fonts d’informació professionals de premsa. Una panoràmica”. 12es Jornades Catalanes d’Informació i Documentació, Barcelona, 19-20 May 2010.
  • Hearts, Marti A. Search user interfaces. New York: Cambridge Univ. Press, 2009
  • Jiménez, Àngels; González, Agustí; Fuentes y Pujol, Eulàlia. (2000). “Las hemerotecas digitales de la prensa en internet”. El profesional de la información, 9(5),15-22
  • http://www.elprofesionaldelainformacion.com/contenidos/2000/mayo/2.pdf
  • Linares, Juan; Codina, Lluís; Vàllez, Mari y Rodríguez-Martínez, Ruth. (2016). Interactividad, Buscabilidad y Visibilidad en Cibermedios: Sistema de Análisis y Resultados. Barcelona: Departamento de Comunicación (Universitat Pompeu Fabra). Serie Editorial DigiDoc http://repositori.upf.edu/bitstream/handle/10230/26280/Linares_inter_2016.pdf?sequence=1
  • Linares, Juan; Codina, Lluís y Freixa, Pere. (2015). Tendencias en cibermedios: análisis de la interactividad. Barcelona: Departamento de Comunicación (Universitat Pompeu Fabra). Serie Editorial DigiDoc, 2015 http://hdl.handle.net/10230/24636
  • Linares, Juan; Codina, Lluís y Pedraza-JIménez, Rafael. (2015). Interactividad en cibermedios: propuesta nuclear de protocolo de análisis. Barcelona: Departamento de Comunicación (Universitat Pompeu Fabra). Serie Editorial DigiDoc, https://repositori.upf.edu/handle/10230/23167
  • Martín, A. D. M.; Guallar, Javier. (2014). “Análisis de las videotecas de las principales televisiones en España”. Cuadernos de documentación multimedia,25, 69-89
  • http://revistas.ucm.es/index.php/CDMU/article/view/47472
  • Morville, Peter. (2005). Ambient Findability. Sebastopol: O’Reilly.
  • Morville, Peter; Callender, Jeffery.  (2010). Search patterns. Sebastopol: O’Reilly.
  • Pedraza-Jiménez, Rafael; Codina, Lluís y Guallar, Javier (eds). (2016). Calidad en sitios web: método de análisis general, e-comerce, imágenes, hemerotecas y turismo. Barcelona: Editorial UOC.
  • Pedraza-Jiménez, Rafael;  Codina, Lluís y Rovira, Cristòfol. (2008). “Semantic Web adoption: online tools for web evaluation and metadata extraction”. In Ruan D, Montero J, Lu J, Martínez L, D’hondt P, Kerre EE, editors. Computational Intelligence in Decision and Control: proceedings of the 8th International FLINS Conference, Madrid 21-24 september 2008. Madrid: World Scientific Publishing; 2008. p. 121-126. World Scientific Publishing.
  • Pérez-Altable, Laura. (2015-2016). The Arab Spring before the Arab Spring. A case study of digital activism in Tunisia. Global Media Journal (Arab Edition), 4(1-2), 19-32.
  • Pérez-Montoro, Mario y Codina, Lluís. (2016). Navigation Design and SEO for Content-Intensive Websites: A Guide for an Efficient Digital Communication. Oxford: Chandos Publishing (Elsevier)
  • Rodríguez-Martínez, Ruth; Codina, Lluís y Pedraza-Jiménez, Rafael. (2010). “Cibermedios y web 2.0: modelo de análisis y resultados de aplicación”. El profesional de la información, 19(1), 35-44.
  • Rodríguez Yunta, Luis y Giménez Toledo, Elea. (2004). Más allá de la usabilidad: características mínimas exigibles para las interfaces de bases de datos web
  • http://bid.ub.edu/13rodri2.htm
  • Rodríguez Yunta, Luis. (1998). Evaluación e indicadores de calidad en bases de datos. Revista española de documentación científica, 21(1), 9-23.
  • Rovira, Cristòfol; Capdevila, Jofre y Marcos, Mari-Carmen (2014). “La importancia de las fuentes en la selección de artículos de prensa online: estudio de Google Noticias mediante eye-tracking”. Investigación Bibliotecológica, 28 (63).
  • Russell-Rose, Tony y Tate, Tayler. (2013). Designing the search experience. Waltham: Morgan Kaufmann.
  • Sora, C. (2014). El nuevo audiovisual de la web: procedimental, de datos e inmersivo: webdocs y videoclips interactivos, 81-95. En: Jornadas científicas: Animotion Days / Typoweek 2014, Quaderns BAU.  Barcelona: BAU Press / GREDITS
  • Weaver, D. A. y Bimber, B. (2008). “Finding news stories: a comparison of searches using LexisNexis and Google News”. Journalism y Mass Communication Quarterly, 85(3), 515-530.

 


 


Referencia

Juan Linares; Lluís Codina; Ernest Abadal; Javier Guallar. Periodismo en Bases de Datos y Buscabilidad de la Información. Protocolo de análisis y resultados de aplicación. Barcelona: Departamento de Comunicación (Universitat Pompeu Fabra). Serie Editorial DigiDoc, 2016.
Acceso: hdl.handle.net/10230/27310