Resumen
El nuevo modelo de ciencia abierta requiere de una infraestructura adecuada para preservar y compartir los datos de investigación. Ello ha implicado un desafío tanto para los investigadores como para las universidades y centros. Como respuesta se han creado más de dos mil repositorios de datos en el mundo, un cuarto por parte de estas instituciones, con diferentes softwares especializados.
El presente trabajo tiene como objetivo proponer atributos de calidad web para evaluar la interfaz de este tipo de sitios. Para ello se realizó una revisión sistematizada de literatura con directrices internacionales, requisitos técnicos y recomendaciones de expertos, detectando coincidencias.
Como resultado se ofrece un protocolo de análisis especialmente formulado para repositorios de datos de investigación, con parámetros e indicadores sobre la interfaz de usuario, localización, acceso y reutilización, conservación, difusión, evaluación y compromiso institucional.
A modo de conclusión se observa la necesidad de atender los aspectos específicos de este tipo de datos, relevando el papel de las bibliotecas universitarias para gestionarlos.
Introducción
Ciencia abierta y datos de investigación
Nos encontramos frente a una época de cambio en la forma de hacer ciencia que implica un desafío tanto para los investigadores como para las universidades y otras instituciones involucradas. Se trata de un nuevo paradigma fundamentado en que la ciencia debe ser abierta, colaborativa y hecha con y para la sociedad (Anglada y Abadal, 2018).
Es la llamada ciencia abierta, que se relaciona con los conceptos de datos abiertos, open peer review, software libre y acceso abierto. Este último se refiere a la práctica de proporcionar el acceso en línea a información científica reutilizable y gratuita.
Lo novedoso es que dicha información ya no se expresa solo en artículos de investigación revisados por pares y publicados en revistas académicas, sino también en los propios datos de investigación, ya sea editados o en bruto (European Commission, 2017).
Los datos de investigación se definen como registros de hechos –puntuaciones numéricas, textos, imágenes y sonidos– utilizados como fuentes primarias para la investigación y cada vez son más aceptados en la comunidad científica como necesarios para validar los resultados (OECD, 2007).
Ejemplos de estos datos son las estadísticas, mediciones, respuestas a encuestas, grabaciones de entrevistas, fotografías y observaciones resultantes del trabajo de campo. En concreto, Arano et al. (2011) distinguen como datos primarios a los experimentos científicos; los modelos y simulaciones; las observaciones; los datos derivados, tanto del proceso como de la combinación de datos sin procesar (raw data); los datos referenciales (por ejemplo, estructuras químicas o secuencias genómicas); y el material complementario, como instrucciones de codificación y guías para entrevistadores, entre otros.
Al estar disponibles en formato digital, los usuarios pueden acceder, extraer, explotar, reproducir y difundir datos de inves-tigación de acceso libre y de forma gratuita. Y, por cierto, al estar en abierto pueden reutilizarse también por otros cien-tíficos, transformarse mediante nuevos métodos o agregarse a otras fuentes, evitando así la duplicidad de ensayos, dando transparencia a su forma de obtención y permitiendo su vali-dación (Melero y Hernández-San-Miguel, 2014)
Ahora bien, aunque es una tendencia emergente, principalmente en las ciencias naturales, no todas las áreas del conocimiento la han adoptado con la misma extensión. La idiosincrasia particular de los investigadores de ciencias sociales y humanidades podría explicar que pocos de ellos dejen sus datos accesibles (Gómez, Méndez y Hernández-Pérez, 2016).Esto se puede deber también al desconocimiento de dónde y cómo compartir datos de investigación.
La ciencia abierta requiere de una infraestructura tecnológica adecuada (RECODE, 2014) y de un modelo de gestión (OpenAire, 2017). La falta de un marco para organizar, preservar y hacer que los datos estén disponibles a largo plazo, ha resultado en la pérdida o el descarte de valiosos datos de investigación (Witt, 2008).
Es por ello que en los últimos años diversas naciones y organismos internacionales determinantes para la política científica han puesto sus incentivos en el manejo y difusión de los datos. En Estados Unidos, el año 2003 los National Institutes of Health (NIH) instaron a que los investigadores compartiesen las fuentes primarias y otros materiales (Peset, Aleixandre-Benavent, Blasco-Gil y Ferrer-Sapena, 2017). Diez años más tarde, pasó a ser una exigencia por parte de la National Science Foundation (NSF) en sus instrucciones para la financiación de proyectos.
En 2004 los miembros de la Organización para la Cooperación y el Desarrollo Económicos (OECD), junto a China, Rusia y Sudáfrica, aprobaron una declaración sobre el acceso a los datos de investigación generada con fondos públicos (OECD, 2004). En la misma línea, la comunidad de académicos, bibliotecarios y editores FORCE11 redactó un manifiesto propugnando un cambio en el modelo de creación y el intercambio de conocimientos para mejorar el enlace a los datos (FORCE11, 2011).
Así mismo, universidades e instituciones científicas del Reino Unido han establecido un concordato sobre datos abier-tos (UKRI, 2016) que busca garantizar que estén disponibles para su uso por parte de otros miembros de su comunidad de investigación, de acuerdo a los marcos legales, éticos, discipli-narios y regulatorios.
Por su parte, la Unión Europea (UE) promueve activamente hacer públicos los datos de investigación desde la primera convocatoria del programa marco Horizonte 2020. A través de su Open Research Data Pilot obliga a liberar los datos, las publicaciones y sus metadatos tan pronto como sea posible (European Commission, 2017).
En la próxima convocatoria 2021-2027 será obligatorio que se confeccione un plan de gestión de datos (Data Management Plan, DMP) y que se depositen los datos en abierto con el fin de incrementar la transparencia y la eficiencia, a través de una rápida diseminación de los resultados y de facilitar su reutilización (Alcalá y Anglada, 2019).
Este depósito de los datos debe hacerse siguiendo los principios FAIR (Findable, Accesible, Interoperable y Reusable), publicados inicialmente como un artículo científico de la revista Scientific Data, de Nature, los cuales detallan cualidades precisas y medibles que una publicación de datos debería seguir (Wilkinson et al., 2016). En tanto, el Plan S de Science Europe, si bien se refiere a publicaciones, obliga a las revistas a incorporar enlaces a datos y código en repositorios externos (López-Borrull, Ollé-Castellà, Abadal y García-Grimau, 2019)
(…)
Acceso al artículo completo
Referencia
Morales-Vargas, Alejandro; Codina Lluís. «Atributos de calidad web para repositorios de datos de investigación en universidades». Hipertext.Net, [en línea], 2019, n.º 19, pp. 49-62, https://raco.cat/index.php/Hipertext/article/view/3609061-12-2019
Referencias incluidas en el artículo
- Aguillo, I. F. (2009). Métrica de repositorios y evaluación de la investigación. Anuario ThinkEPI, 3, 40-41.
- Aguillo, I. F. (2011). Building web indicators for the EU OA repository. En Workshop on New Research Lines in Informetrics. Madrid: IPP-CCHS (CSIC).
- Aguillo, I. F. (2018). Altmetrics of the Open Access Institutional Repositories: A Webometrics Approach. En STI 2018 Conference Proceedings (pp. 159-169). Leiden: Centre for Science and Technology Studies (CWTS).
- Aguillo, I. F., Ortega, J. L., Fernández, M., & Utrilla, A. M. (2010). Indicators for a webometric ranking of open access repositories. Scientometrics, 82(3), 477-486. http://doi.org/10.1007/s11192-010-0183-y
- Alcalá, M., & Anglada, L. (2018). Gestió de dades de recerca en les biblioteques de les Universitats de Catalunya. En 15es Jornades Catalanes d’Informació i Documentació (p. 12). Barcelona: Àrea de Ciència Oberta, Consorci de Serveis Universitaris de Catalunya (CSUC).
- Alcalá, M., & Anglada, L. (2019). FAIR x FAIR: Requisitos factibles, alcanzables e implementables para un repositorio de datos de investigación FAIR (Consorci de Serveis Universitaris de Catalunya, CSUC).
- Amorim, R. C., Castro, J. A., da Silva, J. R., & Ribeiro, C. (2015). A Comparative Study of Platforms for Research Data Management: Interoperability, Metadata Capabilities and Integration Potential. En A. Rocha, A. M. Correia, S. Costanzo, & L. P. Reis (Eds.), New Contributions in Information Systems and Technologies. Advances in Intelligent Systems and Computing (pp. 101-111). Springer, Cham. http://doi.org/10.1007/978-3-319-16486-1_10
- Anglada, L., & Abadal, E. (2018). ¿Qué es la ciencia abierta? Anuario ThinkEPI, 12(0), 292. http://doi.org/10.3145/thinkepi.2018.43
- Arano, S., Martínez, G., Losada, M., Villegas, M., Casaldàliga, A., & Bel, N. (2011). La comunidad «Recursos y datos primarios» de la Universitat Pompeu Fabra: los repositorios institucionales como infraestructuras científicas: estudio de caso. Revista Española de Documentación Científica, 34(3), 385-407. http://doi.org/10.3989/redc.2011.3.834
- Austin, C. C., Brown, S., Fong, N., Humphrey, C., Leahey, A., & Webster, P. (2015). Research Data Repositories: Review of Current Features, Gap Analysis, and Recommendations for Minimum Requirements. IASSIST Quarterly, 39(4), 24-38.
- Bach, K., Schäfer, D., Enke, N., Seeger, B., & Gemeinholzer, B. (2012). A comparative evaluation of technical solutions for long-term data repositories in integrative biodiversity research. Ecological Informatics, 11, 16-24. http://doi.org/10.1016/J.ECOINF.2011.11.008
- Banzi, R., Canham, S., Kuchinke, W., Krleza-Jeric, K., Demotes-Mainard, J., & Ohmann, C. (2019). Evaluation of repositories for sharing individual-participant data from clinical studies. Trials, 20(1), 169. http://doi.org/10.1186/s13063-019-3253-3
- Barrueco Cruz, J. M., Andrés Rodríguez, A., Rico Castro, P., Coslado Bernabé, M. Á., Azorín Millaruelo, C., Bernal, I., … Prats Prat, J. (2017). Guía para la evaluación de repositorios institucionales de investigación. FECYT, RECOLECTA, CRUE y REBIUN.
- Bugaje, M., & Chowdhury, G. (2018). Identifying Design Requirements of a User-Centered Research Data Management System. En M. Dobreva, A. Hinze, & M. Žumer (Eds.), Maturity and Innovation in Digital Libraries. ICADL 2018 (pp. 335-347). Cham: Springer International Publishing. http://doi.org/10.1007/978-3-030-04257-8_35
- Bustos-González, A., & Fernández Porcel, A. (2008). Directrices para la creación de repositorios institucionales en universidades y organizaciones de educación superior.
- Callaghan, S., Tedds, J., Kunze, J., Khodiyar, V., Lawrence, R., Mayernik, M. S., … Whyte, A. (2014). Guidelines on Recommending Data Repositories as Partners in Publishing Research Data. International Journal of Digital Curation, 9(1), 152-163. http://doi.org/10.2218/ijdc.v9i1.309
- Casal Reyes, M., Borgoños Martínez, M. D., Casaldàliga, A., Gómez Castaño, J., Guijarro, C., Ortiz Uceta, E., … Terroba Pascual, I. (2013). El acceso abierto en las universidades españolas: estado de la cuestión y propuestas de mejora. Métodos de informacion, 4(6), 55-90. http://doi.org/10.5557/IIMEI4-N6-055090
- Casal Vidal, S. (2018, junio 24). Evaluación de repositorios institucionales y bibliotecas digitales de centros no universitarios en España. Universidad Carlos III de Madrid.
- Chaves Café, L., & Kafure Muñoz, I. (2017). Evaluación de la Usabilidad del Repositorio Institucional de la Universidad de Brasília. Revista General de Información y Documentación, 27(1), 87-106. http://doi.org/10.5209/RGID.56563
- Codina, L. (2008). Sistema general de análisis y evaluación de sitios web: parámetros e indicadores. Metodología de análisis y evaluación de recursos digitales en línea (Vol. 1). Barcelona.
- Codina, L. (2018). Revisiones bibliográficas sistematizadas: procedimientos generales y framework para ciencias humanas y sociales. Barcelona: Departamento de Comunicación, Universitat Pompeu Fabra.
- Codina, L. (2019). SEO académico: significación, componentes y fases. En EDICIC 2019. Barcelona.
- Codina, L., & Pedraza-Jiménez, R. (2016). Características y componentes de un sistema de análisis de medios digitales el SAAMD. En R. Pedraza-Jiménez, L. Codina, & J. Guallar (Eds.), Calidad en sitios web: Método de análisis general, e-commerce, imágenes, hemerotecas y turismo (pp. 15-39). Barcelona: Editorial UOC.
- CSUC. (2016). Recomanacions per seleccionar un repositori per al dipòsit de dades de recerca. RECERCAT (Dipòsit de la Recerca de Catalunya).
- Edmunds, R., L’Hours, H., Rickards, L., Trilsbeek, P., Vardigan, M., & Mokrane, M. (2016). Core Trustworthy Data Repositories Requirements.
- European Commission. (2016). Guidelines on FAIR Data Management in Horizon 2020.
- European Commission. (2017). Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020.
- Fernández-Luna, A., Pérez-Montoro, M., & Guallar, J. (2019). Metodología para la mejora arquitectónica de repositorios universitarios. Anales de Documentación, 22(2). http://doi.org/10.6018/ANALESDOC.356431
- FORCE11. (2011). FORCE11 Manifiesto: Improving Future Research Communication and e-Scholarship. Recuperado a partir de https://www.force11.org/about/manifesto
- Gómez, N. D., Méndez, E., & Hernández-Pérez, T. (2016). Datos y metadatos de investigación en ciencias sociales y humanidades: una aproximación desde los repositorios temáticos de datos. El Profesional de la Información, 25(4), 545-555.
- González-Pérez, L. I., Ramírez-Montoya, M. S., García-Peñalvo, F. J., & Quintas Cruz, J. E. (2017). Usability evaluation focused on user experience of repositories related to energy sustainability: A Literature Mapping. En Proceedings of the 5th International Conference on Technological Ecosystems for Enhancing Multiculturality – TEEM 2017 (pp. 1-11). New York, New York, USA: ACM Press. http://doi.org/10.1145/3144826.3145385
- Gough, D., Oliver, S., & Thomas, J. (2017). An introduction to systematic reviews (2nd edition). London: SAGE Publications Ltd.
- Grant, M. J., & Booth, A. (2009). A typology of reviews: an analysis of 14 review types and associated methodologies. Health Information & Libraries Journal, 26(2), 91-108. http://doi.org/10.1111/j.1471-1842.2009.00848.x
- Hernández-Pérez, T., & García-Moreno, M.-A. (2013). Datos abiertos y repositorios de datos: nuevo reto para los bibliotecarios. El Profesional de la Información, 22(3), 259-263. http://doi.org/10.3145/epi.2013.may.10
- Kim, S. (2018). Functional Requirements for Research Data Repositories. International Journal of Knowledge Content Development & Technology, 8(1), 25-36. http://doi.org/10.5865/IJKCT.2018.8.1.025
- Kindling, M., Pampel, H., van de Sandt, S., Rücknagel, J., Vierkant, P., Kloska, G., … Scholze, F. (2017). The Landscape of Research Data Repositories in 2015: A re3data Analysis. D-Lib Magazine, 23(3/4). http://doi.org/10.1045/march2017-kindling
- Kraft, A., Razum, M., Potthoff, J., Porzel, A., Engel, T., Lange, F., … Furtado, F. (2016). The RADAR Project—A Service for Research Data Archival and Publication. ISPRS International Journal of Geo-Information, 5(3), 28. http://doi.org/10.3390/ijgi5030028
- Kramer, S. (2016). Matrix of use cases and functional requirements for research data repository platforms. Repository Platforms for Research Data Interest Group.
- López-Borrull, A., Ollé-Castellà, C., Abadal, E., & García-Grimau, F. (2019). Plan S: oportunidades y amenazas para las revistas de Humanidades y Ciencias Sociales. En E. P. de la I. y F. Dialnet (Ed.), 9a Conferencia internacional sobre revistas de Ciencias Sociales y Humanidades (pp. 1-22). Logroño: El Profesional de la Información y Fundación Dialnet.
- Malo de Molina, T. (2018). De datos y otros demonios: nuevos retos de la biblioteca universitaria en la investigación. En Consorcio Madroño (Ed.), Jornada Madroño/InvestigaM de buenas prácticas en el apoyo a la investigación. Madrid: Universidad Carlos III de Madrid.
- Melero, R., & Hernández-San-Miguel, J. (2014). Acceso abierto a los datos de investigación, una vía hacia la colaboración científica. Revista Española de Documentación Científica, 37(4), e066. http://doi.org/10.3989/redc.2014.4.1154
- Morales Vargas, A. (2019). Datos abiertos y visualización de información en sitios web de universidades chilenas: una asignatura pendiente. En L. Brossi & T. Dodds (Eds.), Visualización de datos: Periodismo y Comunicación en la era de la información visual (pp. 15-26). Santiago de Chile: Editorial Universitaria.
- OECD. (2007). OECD Principles and Guidelines for Access to Research Data from Public Funding. Paris.
- OpenAire. (2017). Research data management. Understanding research data management. Briefing paper.
- OpenAire. (2018). How to select a data repository? Recuperado 4 de septiembre de 2019, a partir de https://www.openaire.eu/opendatapilot-repository-guide
- Orduña-Malea, E., & Aguillo, I. F. (2014). Cibermetría: midiendo el espacio red. Barcelona: UOC.
- Ortúzar, G. (2014). Publicación digital en las universidades y el nuevo papel de las bibliotecas. Anales de la Universidad de Chile, (6), Pág. 175-186. http://doi.org/10.5354/0717-8883.2014.31831
- Pedraza-Jiménez, R., Codina, L., & Guallar, J. (2016). Calidad en sitios web: Método de análisis general, e-commerce, imágenes, hemerotecas y turismo. Barcelona: Editorial UOC.
- Pérez-Montoro, M. (2010). Arquitectura de la información en entornos web. Gijón: Ediciones Trea.
- Peset, F., Aleixandre-Benavent, R., Blasco-Gil, Y., & Ferrer-Sapena, A. (2017). Datos abiertos de investigación. Camino recorrido y cuestiones pendientes. Anales de Documentación, 20(1). http://doi.org/10.6018/analesdoc.20.1.272101
- RECODE. (2014). Infrastructure and technology challenges (Policy RECommendations for Open Access to Research Data in Europe). London.
- Rousidis, D., Garoufallou, E., Balatsoukas, P., & Sicilia, M.-A. (2014). Data Quality Issues and Content Analysis for Research Data Repositories: The Case of Dryad.
- Rovira, C., Marcos, M.-C., & Codina, L. (2007). Repositorios de publicaciones digitales de libre acceso en Europa: análisis y valoración de la accesibilidad, posicionamiento web y calidad del código. El Profesional de la Información, 16(1), 24. http://doi.org/10.3145/epi.2007.ene.03
- Santos-Hermosa, G., Ferran-Ferrer, N., & Abadal, E. (2012). Recursos educativos abiertos: repositorios y uso. El Profesional de la Información, 21(2), 136-145. http://doi.org/10.3145/epi.2012.mar.03
- Santos-Hermosa, G., Ferran-Ferrer, N., & Abadal, E. (2015). Evaluación de repositorios educativos. En XIV Workshop REBIUN sobre proyectos digitales. VI Jornadas OS-Repositorios (p. 14). Córdoba: REBIUN.
- Sayão, L. F., & Sales, L. F. (2016). Algumas considerações sobre os repositórios digitais de dados de pesquisa. Informação & Informação, 21(2), 90. http://doi.org/10.5433/1981-8920.2016v21n2p90
- Schleußinger, M., & von Rekowski, T. (2018). Research Data Repositories: Overview of the properties, functions, and types of repositories (FoDaKo project – Forschungsgemeinschaft in Kooperation).
- Scientific Data. (2019). Recommended Data Repositories. Recuperado 29 de agosto de 2019, a partir de https://www.nature.com/sdata/policies/repositories
- Serrano Vicente, R. (2017). Evaluación de los repositorios institucionales de acceso abierto en España. TDX (Tesis Doctorals en Xarxa). Universitat de Barcelona.
- Serrano Vicente, R., Melero, R., & Abadal, E. (2014). Indicadores para la evaluación de repositorios institucionales de acceso abierto. Anales de Documentación, 17(2). http://doi.org/10.6018/analesdoc.17.2.190821
- Serrano Vicente, R., Melero, R., & Abadal, E. (2017). Evaluación de repositorios de acceso abierto de instituciones de investigación españolas. Propuestas para el éxito. En ECA 2017 Ecosistemas del Conocimiento Abierto. Salamanca.
- Texas Digital Library [TDL]. (2015). TDL Data Management Working Group Report.
- UKRI. (2016). Concordat on Open Research Data.
- Uzwyshyn, R. (2016). Research Data Repositories: The What, When, Why and How. Computers in Libraries, 2016., 36(3).
- van Wyk, J., & van der Walt, I. (2017). Criteria and evaluation of research data repository platforms at the University of Pretoria, South Africa. En eResearch Africa 2017. Cape Town: University of Pretoria. http://doi.org/10.13140/RG.2.2.13736.47366
- Westell, M. (2006). Institutional repositories: proposed indicators of success. Library Hi Tech, 24(2), 211-226. http://doi.org/10.1108/07378830610669583
- Whyte, A. (2015). Where to keep research data: DCC Checklist for Evaluating Data Repositories. Edinburgh.
- Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., … Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. http://doi.org/10.1038/sdata.2016.18
- Witt, M. (2008). Institutional Repositories and Research Data Curation in a Distributed Environment. Library Trends, 57(2), 191-201. http://doi.org/10.1353/lib.0.0029
- Xie, Z., Speer, J., Chen, Y., Jiang, T., Brittle, C., & Mather, P. (2016). Developing Institutional Research Data Repository: A Case Study. http://doi.org/10.1007/978-3-319-49304-6_7