OpenAIRE et H2020 André Dazy andre.dazy@couperin.org 2 1 Europe, publications et données de la recherche. Recommandations de 2012. Guidelines pour H2020 1.1 Grands principes 1.2 Historique des projets 1.2.1 Qu’est-ce qu’OpenAIRE ? 1.2.2 OpenAIRE 1.2.3 OpenAIREPlus 1.3 H2020 et obligation de dépôt 1.3.1 Publications 1.3.2 Données de la recherche 2 OpenAirePlus du FP7 : entrepôt de données Zenodo, recommandations 2.1 Entrepôt de données Zenodo 2.2 Recommandations 3 OpenAire du programme H2020 : développement prévus, actions de Couperin 3.1 Les « work packages » d’OpenAIRE2020 concernant les données de la recherche Références 2 Au programme… 1.1 Grands principes 3 La recherche moderne se construit sur un dialogue scientifique approfondi et progresse en s'appuyant sur les travaux antérieurs. De plus, la stratégie Europe 2020 pour une économie intelligente, durable et inclusive souligne le rôle central de la connaissance et de l’innovation dans la génération de la croissance. Un accès plus complet et plus vaste aux publications et données scientifiques aide donc à : • s'appuyer sur les résultats de précédentes recherches (amélioration de la qualité des résultats); • promouvoir les collaborations et éviter la duplication des efforts (plus grande efficacité); • accélérer l’innovation (mise sur le marché plus rapide = croissance plus rapide); • impliquer les citoyens et la société (amélioration de la transparence du processus scientifique). Pour ces raisons, l’Union européenne (UE) déploie tous ses efforts pour améliorer l’accès à l’information scientifique et pour dynamiser les bénéfices des investissements publics pour la recherche financée grâce au programme-cadre de l’UE pour la recherche et l’innovation Horizon 2020 (2014-2020) Pourquoi un libre accès aux publications et données de recherche scientifiques dans Horizon 2020? 1.2 Historique des projets 4 OpenAIRE (Open Access Infrastructure for Research in Europe) est un projet européen dont le but est d’accompagner l’obligation de dépôt en accès libre (deposit mandates) décidée par la Commission Européenne et le Conseil Européen de la Recherche (ERC). Couperin est National OpenAIRE Desk (NOAD) pour la France pour ce projet. Trois volets : •OpenAIRE pour les articles financés par la CE (pilote) •OpenAIREPlus pour les articles et pour les données de la recherche de toute l’Europe •openAIRE2020 : obligation pour publications, pilote pour données de la recherche [et FOSTER] 1.2.1 Qu’est-ce qu’OpenAIRE ? 5 OpenAIRE : déc. 2009-déc. 2012 Objectif : accompagner les chercheurs concernés par l’obligation de dépôt (Special Clause 39) Publication des Guidelines for repositories : HAL est compatible très rapidement : la France est bien représentée. Un groupe de travail Couperin identifie les projets européens concernés par l’obligation de dépôt (avec le WoS). Vidéo expliquant les procédures pour repérer (via le web of science) et collecter (dans Zotero) les publications issues des projets FP7 concernés par la clause 39. https://vimeo.com/17323937 En deuxième phase, un workshop organisé par Couperin en 2011, a permis de rassembler une centaine de personnes dont une majorité de chercheurs, de coordonnateurs et de membres des Points de Contacts Nationaux (PCN) pour l’ERC, afin d’informer et de sensibiliser ces acteurs qui sont devenus des relais pour le projet. Alexandra Deniot, contrat d’un an (juillet 2011-juillet 2012) pour contacter systématiquement tous les chefs de projets et les chercheurs financés par des fonds européens (grâce au WoS notamment). 1.2.2 OpenAIRE 6 Volet technique : mise en place d’une e-infrastructure • Architecture distribuée • Impératif d’interopérabilité… c’est possible ! • publications : OpenAIRE guidelines v 2.0 (oct. 2012) • datasets : schéma Datacite (avec DOI) Résultats pour la compliance des Archives Ouvertes : EU : variable selon les pays FR : compatibilité des principales archives (HAL, OATAO, Archimer, ProdINRA…) 7 Volet communication : travail en réseau • Empreinte européenne : 27 pays de l’UE + Croatie, Islande, Norvège, Suisse, Turquie • Présentations : 4e journées Open Access Couperin (mars 2011) 5e journées Open Access Couperin (janvier 2013), SELL, ICOLC • Veille et prise de contact systématique : coordinateurs de projet 7e PCRD et lauréats ERC 8 OpenAIRE Plus : déc. 2011- juin 2014 Elargissement aux données de la recherche et périmètre de toutes les publications mêmes celles non financées par l’UE, travail de dissémination en 2012 et 2013. (par Jean-Francois Lutz d’abord). Novembre 2013 : publication des Guidelines for data manager : https://guidelines.openaire.eu/wiki/OpenAIRE_Guidelines:_For_D ata_Archives 28 janvier 2014 : lancement du nouveau site en version beta : https://beta.openaire.eu/ (nouveautés : text mining, statistiques, lien vers les données) • plusieurs archives françaises sont moissonnées par OpenAire : Hal, Archimer, CIRAD, INRA, OATAO, Dauphine ; 1.2.3 Qu’est-ce qu’OpenAIREPlus Fonctionnalités du site https://www.openaire.eu/ •Chercheurs •Gestionnaires d’archives •Coordinateurs de projets •Pilotes de la recherche •Autres acteurs 9 A qui profite OpenAIRE ? Chercheurs En plus des bénéfices habituels de l’Open Access… 10 • Visibilité des travaux de recherche pour les financeurs • Lien entre les publications et les données de la recherche • Rapports sur les citations, l’usage, l’impact (développements à venir) Lien entre la publication et les données Lien entre les données et la publication Information sur les obligations de dépôt H2020 - ERC Programmes nationaux Les différentes options et les problèmes de copyright -FAQ Dans la partie « Support » Gestionnaires d’archives Rendre interopérable les dépôts 14 • Augmentation de la visibilité des données • Meilleure interopérabilité à travers l’utilisation de standards • Bénéfice d’une information enrichie Coordinateurs de projets • F acilitation du reporting Facilitation des workflows 15 16 Produire des rapports en un clic Faciliter la production de rapports Toutes les publications en HTML ou CSV 17 Coordinateurs de projets • Guides dans la partie open access in Europe puis open access in H2020 18 Promouvoir le projet Copier/coller le code Pilotes de la recherche Mesure de l’impact 19 • Connaissance de la production scientifique d’un pays et de son impact (citation, usage) • Lien avec les outils de gestion de la recherche (CRIS) • Outils pour connaître les tendances de la recherche 20 Suivi des projets Post project-end monitoring Pubs location OA mandate conformance Statistiques et schémas 21 Pour les financeurs 22 Suivi des politiques OA 66K pubs – 7.5K projects FP7 8.5K pubs –725 projects SC39: FP7 OA Pilot 2 3 Mesures des résultats de la recherche FP7 timeline - total FP7 breakdowns 23 Autres acteurs • Agrégation des statistiques d’usages sur les objets numériques • Mendeley, PLOS, archives ouvertes et revues en Open Access • Outils de gestion des références et réseaux sociaux de chercheurs • Mendeley, Zotero, CiteULike …. 2 4 24 25 26 Résultat : le portail OpenAIRE : 12 millions de publications provenant de 665 fournisseurs 1.3 Horizon2020 et obligation de dépôt 27 Avec Horizon2020, chaque bénéficiaire doit assurer un libre accès à toutes les publications évaluées par les pairs en lien avec ses résultats. 1.3.1 Publications 29.2 Libre accès aux publications scientifiques Chaque bénéficiaire doit assurer un libre accès (accès en ligne gratuit pour tout utilisateur) à toutes les publications scientifiques évaluées par les pairs en lien avec ses résultats. Il doit en particulier: (a) Le plus tôt possible, et au plus tard lors de la parution, déposer une copie électronique, lisible par machine, de la version publiée ou du manuscrit final évalué par les pairs et accepté pour publication dans un réservoir dédié à des publications scientifiques. De plus, le bénéficiaire doit s'attacher à déposer dans les mêmes temps les données de recherche nécessaires à la validation des résultats présentés dans les publications scientifiques déposées. 1.3.1.1 Extrait du Modèle de convention de subvention – Publication H2020 28 (b) Assurer le libre accès aux publications déposées – via le réservoir– au plus tard : (i) Au moment de la parution, si l'éditeur met une version électronique à disposition gratuitement, ou (ii) Dans les six mois suivant la parution (douze mois pour des publications en sciences humaines et sociales) dans tous les autres cas. (c) Assurer un libre accès –via le réservoir– des métadonnées bibliographiques servant à identifier la publication déposée. 1.3.1.1 Extrait du Modèle de convention de subvention – Publication H2020 29 Les métadonnées bibliographiques doivent être dans un format standard et doivent comporter tous les éléments suivants : -Les termes [«Union européenne (UE)» et «Horizon2020»] [«Euratom» et «programmeEuratom de recherche et de formation 2014-2018»]; -Le nom de l’action, son acronyme et son numéro de subvention ; -La date de publication et la durée de l’embargo (le cas échéant) ; -Un identifiant pérenne. 1.3.1.1 Extrait du Modèle de convention de subvention – Publication H2020 30 31 H2020 en résumé 32 H2020 en résumé 1.3.2 Données de la recherche Projet pilote Libre accès aux données issues de la recherche Le projet pilote Libre accès aux données issues de la recherche est une innovation du programme Horizon2020. Son but est d’améliorer et d'optimiser l’accès et la réutilisation des données de recherche générées par des projets. Les obligations juridiques des projets participant à ce pilote sont stipulées dans l’article optionnel 29.3 du Modèle de convention de subvention. 33 Champs de recherche ciblés pour participer au pilote : • Future and Emerging Technologies • Research infrastructures – part e-Infrastructures • Leadership in enabling and industrial technologies – Information and Communication Technologies • Societal Challenge: Secure, Clean and Efficient Energy – part Smart cities and communities • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – with the exception of raw materials topics • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society 34 Sur la base du volontariat, les projets participants pourront mettre leurs données de recherche à disposition, en fonction des dispositions de leurs plans de gestion des données (PGD ou DMP data management plan) Il leur sera aussi demandé de rendre accessibles les données nécessaires à la validation des résultats présentés dans les publications scientifiques. Les projets participants recevront un soutien dédié. En particulier, tous les coûts liés à la mise en œuvre du pilote seront remboursés, et ils recevront des services de soutien et d'aide professionnelle et technique spécifiques. 35 L’utilisation de plans de gestion des données (PGD) ou data management plan (DMP) est une autre innovation d’Horizon 2020. Ces PGD explicitent • quelles données seront générées par le projet • leurs éventuelles modalités d'exploitation et de mise à disposition pour vérification et réutilisation • et celles relatives à leur curation et leur conservation. L’emploi d’un PGD est exigé pour les projets participants au pilote. Les autres projets sont invités à soumettre un PGD si les travaux de recherches prévus le justifient. 36 1.3.2.1 Extrait du Modèle de convention de subvention – Données H2020 OPTION pour les actions participant au projet pilote Libre accès aux données issues de la recherche : concernant les données de recherche numériques générées par l’action (les «données»), les bénéficiaires doivent : (a) Les déposer dans un entrepôt de données de recherche et prendre les mesures nécessaires afin de rendre possible à un tiers l’accès, la fouille de données, l’exploitation, la reproduction et la diffusion des éléments ci-après, à titre gratuit pour tout utilisateur: (i) données, y compris les métadonnées associées, nécessaires à la validation des résultats présents dans les publications scientifiques, et ce le plus tôt possible; (ii) autres données, y compris les métadonnées associées, comme spécifié et avant la date limite indiquée dans le plan de gestion des données. (b) Fournir des informations –via l’entrepôt– sur les outils et instruments à la disposition des bénéficiaires nécessaires à la validation des résultats (et, quand cela est possible, fournir les outils et instruments eux-mêmes) 37 38 Cela ne change en rien • l’obligation de protéger les résultats (article 27), • les obligations de confidentialité (article 36), • les obligations de sécurité (article 37) • ou les obligations de protéger les données personnelles (article 39) À titre exceptionnel, les projets peuvent se retirer du pilote dans un certain nombre de cas : En cas de conflit avec l’obligation de protéger les résultats • Pour des raisons de confidentialité • Pour des raisons de sécurité • Pour des raisons de protection de données personnelles Ils peuvent se retirer également si la publication des données met en péril les résultats finaux du projet. Dans ce cas le plan de gestion des données doit exposer les raisons de cette restriction d’accès, Restrictions d’accès – Données H2020 39 40 41 42 2 OpenAire Plus du FP7 : entrepôt de données Zenodo, recommandations (guidelines), 43 2.1 Entrepôt de données Zenodo http://www.zenodo.org/ Un nouveau service développé par le CERN et OpenAIRE pour les chercheurs où ils peuvent partager leur publications, leurs posters, leurs vidéos, leurs présentations, les données de leurs recherches L’idée est que les chercheurs ou les institutions créent des communautés qui peuvent créer des collections qu’ils modèrent et où ils déposent ce qu’ils veulent et notamment les données de la recherche, qu’ils organisent, modèrent, qu’ils peuvent partager et exporter en OAI-PMH. 44 Rappel 45 Que déposer ? La version publiée ou Le manuscrit final accepté pour publication Où déposer ? Les chercheurs doivent déposer la version finale des articles ou les manuscrits dans : Le répertoire institutionnel de l'institution de recherche à laquelle ils sont rattachés OU Le répertoire sujet/thématique approprié OU L'archive orpheline sur zenodo (http://zenodo.org/) pour les articles qui ne peuvent être stockés ni dans un répertoire institutionnel ni dans un répertoire sujet/thématique 46 Zenodo et web 2.0 Zenodo et web 2.0 47 • Partage avec Mendeley, CitULike, Twitter, facebook, etc. • Export possible vers BibTeX, DataCite, DC, EndNote, NLM, RefWorks MARC, MARCXML 48 OpenAIRE s’appuie sur le DataCite Metadata Schema v3.0 https://guidelines.openaire.eu/wiki/OpenAI RE_Guidelines:_For_Data_Archives L’article ou les données doivent avoir leurs métadonnées au format Datacite pour être moissonnés. 2.2.1 Datacite 49 Recommandations DataCite est un consortium international, dont l’administrateur général est la Bibliothèque Nationale de science et technologie allemande (TIB). Il opère en particulier comme agence d’enregistrement de DOI. Il est membre de la Fondation Internationale de DOI (IDF), instance dirigeante du système DOI. Il s’appuie sur des institutions membres dans différents pays à travers le monde. Ces institutions collaborent avec des centres de données (institutions de recherche, bibliothèques…) pour attribuer des DOI à la recherche. L’Inist-CNRS est l’institution membre de DataCite pour la France. 50 L’Europe, OpenAIRE et les données de la recherche, Agropolis, octobre 2015 51 Les données de la recherche sont identifiées par DOI L’INIST est habilité à délivrer les DOIs (Digital Object Identifier) pour la France (Coût d’un DOI Pour les membres de la communauté de l’Enseignement Supérieur et de la Recherche française, le coût se limite à une cotisation annuelle de 180 € quel que soit le nombre de DOI.) Les recommandations pour les identifiants noms propres sont ORCID ou ISNI Name identifier : ORCID ou ISNI International Standard Name Identifier http://www.isni.org/ http://www.inist.fr/?Attribution-de-DOI 2.2.2 DOI, ORCID ou ISNI 52 3 OpenAIRE du programme H2020 : développements prévus, actions de Couperin) 3.1 Les « work packages » d’OpenAIRE2020 concernant les données de la recherche 53 Une étude sera menée sur les questions juridiques posées par le pilote données de la recherche et notamment sur les barrières juridiques quant au partage des données de la recherche. L’étude se focalisera sur deux aspects juridiques soulevés par le pilote : • la protection des données • et l’information du secteur public. • Pour le premier aspect, la protection des données personnelles et de la vie privée seront examinées dans le cadre de leur utilisation dans OpenAIRE et particulièrement dans le pilote sur les données de la recherche et notamment pour le partage des données. Des recommandations juridiques et techniques seront formulées. Quant au deuxième aspect, l'étude évaluera si les usages des données par OpenAIRE tombent sous le coup des obligations du secteur public sur l'accès et la réutilisation de celles-ci. Des recommandations seront là aussi formulées. Par exemple : « quand est-il nécessaire, possible, souhaitable pour certains projets de se retirer du pilote (« opt out ») ? 3.1.1 WP7 Questions juridiques 54 3.1.2 WP9 Zenodo et anonymisation Zenodo fournira des services pour aider les chercheurs qui n’ont pas de réservoirs appropriés pour partager et conserver leurs données issues de programmes financés par l’UE. Zenodo sera aussi le lieu permettant de tester de nouveaux concepts comme • les liens entre données et recherche, • les citations, • l’anonymisation • et le lieu pour décrire et conserver les logiciels. Enfin, Zenodo établira des connexions avec d’autres réservoirs afin de s’aligner sur les normes émergentes en matière d’identification des chercheurs, des financeurs et d’autres entités. Zenodo 55 Anonymisation Le service d'anonymisation des données permettra aux scientifiques de divulguer et publier leurs données en rendant effectivement anonymes des informations sensibles. Cela sera fait par • les nouvelles techniques d'anonymisation des microdonnées (on enlève une partie des données) • doublées par un mécanisme de sécurité capable de détecter les publications multiples des mêmes données qui éviteront aux éditeurs de partager des données qui n'ont pas les protections voulues. Ce service technique sera accompagné d'une étude juridique prévue dans le WP7. 56 C’est le module de travail où Couperin fera le plus d’efforts. Ce module de travail apportera son support au pilote sur les données de la recherche, promouvra et diffusera des ressources pour aider à mener les plans de gestion des données. Un kit d’aide sera rédigé à destination des responsables de projet, des chercheurs, des administrations pour les informer des obligations du pilote et les aider dans le management. Ce travail se fera en étroite collaboration avec le projet FOSTER qui créera du contenu spécifiquement pour ce pilote (webinars, présentations, cours en présentiel, documentation, FAQ). 3.1.3 WP4 Formation et aide à la gestion des données de la recherche, recommandations, helpdesk, NOADs 57 58 Recommandations (guidelines) Des mises à jour seront effectuées en direction des administrateurs de réservoirs de données. OpenAIRE cherchera aussi à s’aligner et à converger avec les pratiques d’autres organisations et initiatives (comme EuroCRIS, COAR , UK-RIOXX and V4OA, CASRAI, etc.) Helpdesk Les NOADs répondront aux questions posées par les chercheurs (par un système de tickets) –ou les redirigeront aux personnes susceptibles de savoir y répondre. WP4 Formation et aide à la gestion des données de la recherche, recommandations, helpdesk, NOADs 59 WP4 Formation et aide à la gestion des données de la recherche, recommandations, helpdesk, NOADs Les actions concrètes de Couperin pour la France • Identification et recensement des projets ayant choisi l’option pilote données de la recherche • Identification des publications et des données qui leur sont liées • Contact des responsables de projets • Contact avec les responsables d’archives pour une mise en compatibilité de leur archive • Dissémination et promotion : • Organisation d’un atelier OpenAIRE en 2016 ou 2017 • Grâce au GTAO de Couperin : 60 professionnels actifs pour promouvoir l’OA • Openaccessweek et FOSTER • GTAO : journée identifiants en juillet 2015 (pour la France mais en lien avec les recommandations européennes) • GTAO : organisation de la 6e journée OA en octobre 2015, etc, • Site web : http://openaccess.couperin.org/ Site Couperin open access 61 • Loi numérique en discussion • La reconnaissance par le législateur de l’importance de l’open access est primordiale mais elle n’est pas suffisante. • Le succès de l’open access dépend d’un changement radical des habitudes de la communauté scientifique et sans doute d’une obligation de dépôt. Site d’openAIRE https://www.openaire.eu/ Zenodo http://zenodo.org/ Modèle de convention de subvention (traduction française) Version 1.0 11 décembre 2013 http://cache.media.education.gouv.fr/file/Affaires_juridiques_et_financieres/20/5/Convention_de_subvention_ve rsion_francaise_v1_376205.pdf Lignes directrices pour le libre accès aux publications scientifiques et aux données de recherche dans Horizon 2020 http://openaccess.inist.fr/IMG/pdf/14086_lignes_directrices_la_horizon_2020_tr_fr_version-oct2014.pdf Lignes directrices pour la gestion des données dans Horizon 2020 http://openaccess.inist.fr/IMG/pdf/lignes_directrices_pgd_horizon_2020_tr_fr.pdf Les détails des différentes tâches à accomplir (Work packages) par les différents partenaires sont présentés dans la proposition déposée auprès de la Commission Européenne en septembre 2014. http://www.couperin.org/images/stories/openaire/Proposal-SEP-210148861.pdf Open access to research data: the Open Research Data Pilot https://www.openaire.eu/oa-in-h2020/h2020/h2020-oa-data-pilot DOI et DataCite http://www.inist.fr/?Attribution-de-DOI OpenAIRE Guidelines: For Data Archives https://guidelines.openaire.eu/wiki/OpenAIRE_Guidelines:_For_Data_Archives Digital curation center http://www.dcc.ac.uk/resources/data-management-plans Vidéo expliquant les procédures pour repérer (via le web of science) et collecter (dans Zotero) les publications issues des projets FP7 concernés par la clause 39: https://vimeo.com/17323937 Références 62 Des questions ? andre.dazy@couperin.org Merci pour votre attention 63