www.learn-rdm.eu RESUMEN EJECUTIVO Gestionar los activos del conocimiento para la investigación y la innovación en el siglo XXI El problema Los datos de investigación son la nueva divisa de la era digital. Desde sonetos a datos estadísticos, y desde genes a datos geoespaciales, la cantidad de material que se crea y se almacena crece de manera exponencial. Sin embargo, la Hoja de Ruta para los Datos de Investigación de la LERU1 identifica una brecha significativa en relación al nivel de preparación entre las instituciones donde se realizan actividades de investigación. La brecha es considerable en áreas como el desarrollo de políticas, el conocimiento de los temas de actualidad, el desarrollo de habilidades, la formación, los costes, la creación de comunidades, la gobernanza, las diferencias disciplinarias/legales/ terminológicas y geográficas. La solución Este Resumen Ejecutivo de LEARN ayudará a quien debe tomar decisiones y elaborar políticas a identificar buenas soluciones. Además, todas las partes interesadas pueden seguir el Documento de LEARN de Instrumentos de Buenas Prácticas creado a partir de casos prácticos, que ayudarán a las organizaciones a capear el diluvio de datos. LEARN también ofrece una herramienta de autoevaluación2. Política sobre datos de investigación Cada institución que realiza actividades de investigación debería tener una política sobre datos de investigación, que establezca un marco para gestionar y conservar los datos de investigación. Las organizaciones que financian la investigación también deberían tener una política sobre datos, estipulando las obligaciones que deben cumplir los investigadores al recibir financiación. LEARN ha creado un modelo de Política de Gestión de Datos de Investigación para las organizaciones que realizan actividades de investigación, junto con una guía para su implementación. El modelo de política de LEARN puede ser adaptado y adoptado de manera individual por instituciones que realizan investigación y por consorcios regionales, nacionales y/o internacionales. Datos según los principios FAIR Las buenas prácticas indican que los datos de investigación deberían seguir los principios FAIR3: • Findable (Encontrables) – Accessible (Accesibles) – Interoperable (Interoperables) – Reusable (Reutilizables) Para poder ser encontrados, los datos deberían ser descritos de una manera adecuada, utilizando taxonomías y ontologías estándar cuando fuera posible. Para ser accesibles, los datos de investigación, idealmente deberían ser datos abiertos, es decir estar disponibles para ser compartidos y reutilizados. 1 http://www.leru.org/files/publications/AP14_LERU_Roadmap_for_Research_data_final.pdf 2 Disponibles en http://learn-rdm.eu; último acceso 07/01/17 3 Consultar https://www.force11.org/group/fairgroup/fairprinciples; último acceso 07/01/17 www.learn-rdm.eu No todos los datos de investigación pueden ser abiertos, pero las buenas prácticas muestran que los datos deberían ser “tan abiertos como sea posible, y tan cerrados como sea necesario”4. Los datos de investigación deberían ser también interoperables, pudiendo ser procesados por máquinas utilizando vocabularios que sigan los principios FAIR. Para ser reutilizables, los metadatos que describen los datos deberían seguir los estándares de cada comunidad relevante en el dominio. Administración de los datos de investigación Es importante que los investigadores planifiquen la recopilación, conservación, descripción y difusión de sus datos al inicio de su actividad investigadora. La mejor manera de registrar esta información es mediante un Plan de Gestión de Datos, que ofrece una buena estructura para la administración de los datos de investigación5. Infraestructuras Para conservar los datos de investigación, los investigadores y las instituciones que desarrollan actividades de investigación, necesitan acceder a ecosistemas digitales adecuados. Pueden ser mantenidos localmente, o bien pueden ser servicios comerciales, estar dirigidos a dominios científicos específicos o ser plataformas regionales/nacionales/internacionales. Cada comunidad temática o cada territorio puede optar por ofrecer estas instalaciones de forma diferente. En principio, la(s) plataforma(s) deben ofrecer los siguientes servicios comunes: • Almacenamiento, para los investigadores que están recopilando datos de manera activa; • Una plataforma de publicación, que ofrezca al público los datos de investigación y el software relacionado para ser compartidos y reutilizados; • Servicios de archivo, para poder conservar los datos a largo plazo, a menudo como respuesta a los requerimientos de los financiadores de la investigación; • Un servicio de localización, que permita a los investigadores y a la ciudadanía buscar los repositorios de datos de investigación a nivel local y a través de Internet. La Comisión Europea promueve la Nube Europea de Ciencia Abierta (EOSC)6. La EOSC es una metáfora para ayudar a transmitir tanto la fluidez, como la idea de un bien común creado a partir de los datos científicos. La EOSC será un entorno federado para compartir y reutilizar datos científicos, a partir de elementos ya existentes e incipientes en los estados miembro, que contará con pautas internacionales y gobernanza ligeras, así como un amplio grado de libertad en relación a su implementación práctica. Formación El predominio de los datos de investigación requiere que todos los investigadores, los nuevos y los ya establecidos, se doten de las habilidades y las herramientas para sentirse seguros en este entorno orientado a los datos. Las instituciones donde se desarrolla la investigación deben encargarse de esta formación, y en muchos casos, desde sus bibliotecas institucionales. 4 http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf, p. 4 5 Para más información, consultar http://www.dcc.ac.uk/resources/data-management-plans; último acceso 07/01/17. 6 Consultar http://ec.europa.eu/research/openscience/index.cfm?pg=open-science-cloud; último acceso 07/01/17. www.learn-rdm.eu Este proyecto ha sido financiado por el Programa Marco de Investigación e Innovación Horizonte 2020 de la Unión Europea mediante el Acuerdo de Subvención No 654139. Financiación Existen costes asociados a la gestión de datos de investigación. No hay un único método para analizar estos costes pero existen varios modelos que pueden ayudarnos, por ejemplo el que propone el Proyecto 4C.7 Riesgos Si no se siguen las buenas prácticas establecidas para una gestión adecuada de los datos de investigación pueden surgir algunos riesgos para los participantes en esta gestión tales como: la pérdida del financiamiento debido al incumplimiento de los requerimientos establecidos por los financiadores; la pérdida, por negligencia, de resultados importantes del trabajo de investigación, dificultando o imposibilitando la validación de los frutos de la misma. Además, las alianzas y las colaboraciones que pudiesen establecerse, corren el riesgo de no prosperar cuando no se comparten los resultados de una investigación. Beneficios Los beneficios de una buena gestión de los datos de investigación son múltiples como por ejemplo: la integridad de los hallazgos de la investigación mejora cuando se siguen las buenas prácticas; las organizaciones que desarrollan actividades de investigación pueden participar en importantes iniciativas globales como la European Open Science Cloud. De hecho, los datos de investigación pueden convertirse en la nueva divisa de la comunicación científica, junto con las publicaciones científicas, contribuyendo a solucionar los grandes retos que afronta la sociedad: pobreza, enfermedades, calentamiento global, etc. Conclusión Los datos de investigación pueden impulsar la innovación y estimular nuevos descubrimientos en beneficio de la sociedad. Todos los participantes en el proceso de la investigación tienen un papel que desempeñar. Este resumen ejecutivo resalta lo que los investigadores y las instituciones que desarrollan actividades de investigación necesitan para abordar este apasionante reto. 7 Para más información, consultar http://www.4cproject.eu/summary-of-cost-models; último acceso 07/01/17