1 L’inventaire de jeux de données scientifiques: une démarche d’aide à la décision vers l’ouverture de données Open Access & Open Science Agropolis International, Montpellier 23 octobre 2015 Sophie Fortuno - Cirad / UMR Tetis Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Sommaire  Un inventaire de jeux de données scientifiques, pourquoi ?  Objectif et périmètre  Démarche  Résultats  Perspectives Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Un inventaire jeux de données scientifiques pourquoi ? Pour (re)découvrir un capital de données scientifiques produit depuis des années par les unités de recherche du Cirad capital utile, utilisé, utilisable ; patrimoine passé/courant/à venir  Objectifs :  Dresser un premier panorama et un premier diagnostic sur ces données  Gérer, valoriser et sécuriser ce capital  Anticiper les demandes des tutelles, des éditeurs , se préparer à des politiques d’état ou de bailleurs (H2020)  Aider à la prise de décision sur : Favoriser l’ouverture de données vers la communauté scientifique, vers la société… Comment ? open data ou non, accès sous condition… Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Objet et périmètre « Principes et lignes directrices de l'OCDE pour l'accès aux données de la recherche financée sur fonds publics, avril 2007 » "L’Organisation de coopération et de développement économiques (OCDE) définit les « données de la recherche » comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. " Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Objet et périmètre Tableaux de données : texte, excel, csv … Collection de photos (numérique/ à numériser ?) Image virtuelle générée, document graphique… Film, vidéo virtuelle, cartographie dynamique etc. Enregistrement numérique [/anal gique] Bases de données, SIG Cartes (format numérique) cartes de sols, pâturage, historiques… Exemples Ressources numériques considérées Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Objet et périmètre Fenêtre temporelle inventaire unité de recherche Avril 15 Signalement de jeux de données en continu >>> Unités pilotes Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Démarche de mise en œuvre de l’inventaire 1) Identifier l’ensemble des jeux de données d’intérêt scientifique, in situ (UR) et ex situ (en partenariat) et/ou présentant un intérêt patrimonial - UR pilotes - 2) Décrire leurs caractéristiques 3) Etablir des notices descriptives des jeux de données 4) Valider les jeux de données ayant un intérêt scientifique/patrimonial, évaluer leur vulnérabilité et les éventuels besoins de protection 5) Etablir un premier bilan des jeux de données validés (famille/thématiques/géographie/temporalité…) 6) Vers une généralisation de la démarche… Description à l’aide de métadonnées (MD) Choix DublinCore + MD Cirad + MD qualitatives Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Résultats Rechercher par mots clés, naviguer par critères Un base de données catalogue d’inventaire Un annuaire web de jeux de données consultable en intranet PROJET PATRIMOINE NUMERIQUE SCIENTIFIQUE . Une méthodologie . Une organisation . Un guide inventaire . Un outillage informatique . Un accompagnement (groupes de travail, ateliers…) Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Perspectives Mise à jour en continu de l’inventaire L’inventaire des jeux de données est un inventaire continu (modification, retrait, ajout de notices descriptives…). L’inventaire continu vise ainsi à garantir des informations fiables et actualisées Valorisation des données Etudier le(s) trajectoire(s) de réutilisation possible(s) pour ces jeux de données, pour quel public cible? Enseignement | Recherche | Partenariat | Privé | Citoyen OPEN DATA | ACCES SOUS CONDITION | EMBARGO SANCTUARISATION… Sophie Fortuno – Open Access & Open Science Agropolis Internationale, Montpellier , 23 octobre 2015 Des questions … Retrouvez toutes les informations concernant les photos présentes dans ce document, ainsi que l’ensemble des images de la photothèque du Cirad auprès du Pôle Image du Cirad polimage@cirad.fr