O piloto de dados científicos abertos no H2020 DADOS ABERTOS NO HORIZONTE 2020 Pedro Principe, University of Minho 27 April 2016 Tópicos 1. Do piloto Open Access no 7ºPQ ao piloto dos Dados Abertos no H2020 2. Resumo do projeto piloto dos dados de investigação abertos no H2020 3. Planos de Gestão de Dados no piloto de dados abertos do H2020 4. Repositórios de dados e o Zenodo 5. Dados científicos e os serviços de apoio da infraestrutura OpenAIRE Evolução do mandato OA da CE Piloto OA do 7ºPQ (2008) • Acordos com Claúsula Especial 39 • 20% das áreas do programa • Depósito em repositórios • Orientações OA do ERC: Depósito em repositórios e periodo de embargo. Horizonte 2020 (2014) • Todos os acordos • 100% das áreas do programa • Depósito em Repositórios •Projeto-piloto de Dados Abertos Open Access no Horizonte 2020 Open Access definido como princípio geral no Horizonte 2020 Multi-beneficiary General Model Grant Agreement Disposições aplicáveis no acordo de subvenção: • artigo 29: ”Dissemination of results - Open Access - Visibility of EU funding” • 29.2 Open access to scientific publications; • 29.3 Open access to research data http://http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf H2020 Open Research Data Pilot “Model Grant Agreement” 29.3 Open access to research data http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf EC Guidelines on Open Access and Research Data in Horizon 2020 Documentoscom orientaçõespara os benificiários dos projetos que integram o piloto de dados http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf www.openaire.eu/opendatapilot RESUMO DO PROJETO PILOTO DOS DADOS DE ABERTOS NO H2020 2 8 Piloto de dados abertos no H2020 Questões chave: ü Quais as áreas científicas abrangidas pelo piloto? ü Qual o objetivo e âmbito do piloto? ü Que dados são abrangidos? ü Quais são os requisitos? ü O que precisamos saber sobre gestão de dados? Piloto de dados abertos no H2020 – ÁREAS Áreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies • Research infrastructures – (new: coverage of the whole area) • Leadership in enabling and industrial technologies – Information and Communication Technologies • Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new) • Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new) • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society • Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP) Piloto de dados abertos no H2020 Áreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies • Research infrastructures – (new: coverage of the whole area) • Leadership in enabling and industrial technologies – Information and Communication Technologies • Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new) • Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new) • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society • Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP) PROJETOS DE OUTRAS ÁREAS SÃO ENCORAJADOS A ADERIR VOLUNTARIAMENTE Piloto de dados abertos no H2020 – OBJETIVO O Projeto-piloto que visa melhorar e maximizar o acesso e a reutilização dos dados de investigação gerados por projetos financiados pela CE. EC: information already paid for by the public should not be paid for again. Open data is data that is free to access and reuse Piloto de dados abertos no H2020 – PRINCÍPIOS 13 Discoverable Accessible Assessable and intelligible Usable beyond the original purpose for which it was collected Interoperable to specific quality standards Piloto de dados abertos no H2020 – QUE DADOS? Dados para validar os resultados apresentados em publicações científicas. Outros dados, conforme especificado no plano de gestão de dados. Piloto de dados abertos no H2020 – ÂMBITO Aos beneficiários é requerido o depósito: Ø Dados, incluindo metadados associados, necessários para validar os resultados apresentados em publicações científicas, logo que possível; Ø Outros dados, incluindo metadados associados, conforme especificado e dentro dos prazos estabelecidos no plano de gestão de dados. Não se aplica a todos os dados (os investigadores definem em função do seu projeto), havendo ainda exceções. Piloto de dados abertos no H2020 – REQUISITOS 1. Desenvolver (e atualizar) um Plano de Gestão de Dados. 2. Depositar num repositório de dados adequado. 3. Tornar possível a terceiros o acesso, a prospeção, a exploração, a reprodução e a disseminação dos dados – de forma gratuita. 4. Fornecer informações sobre as ferramentas e os instrumentos necessários para validar os resultados (ou fornecer as ferramentas). 16 AS OPEN AS POSSIBLE, AS CLOSED AS NEEDED Abordagem da Comissão Europeia: Piloto de dados abertos no H2020 – OPT OUT • Se o projeto não gerar/recolher dados. • Em caso de conflito com a obrigação de proteção dos resultados (se é esperado que os resultados sejam comercialmente ou industrialmente explorados). • Se a realização do objetivo principal do projeto (ação) ficar comprometido com a disponibilização aberta dos dados. • Em caso de conflito com as obrigações de confidencialidade. • Em caso de conflito com as obrigações nacionais de segurança. • Em caso de conflito com as regras em matéria de proteção de dados pessoais. 18 Os projetos podem optar por sair do piloto, na fase de proposta ou durante a execução (devidamente justificado no plano de projeto), com base em: Opting out / opting in ü É possível optar por sair, quando devidamente justificado; ü e optar por participar voluntariamente é igualmente possível. Formulários no participant portal Opt in / Opt out (alguns números) Basis: 3,699 Horizon 2020 signed grant agreements • Calls in core-areas: opt out 34,6% (149/431 proposals) • Other areas: voluntary opt in 12,5% (409/3268 proposals) Conclusion: • These numbers in the proposals for the first calls of H2020 are encouraging. • Comprehensive follow up needed. Numbersby Daniel Spichtinger, European Commission, at OpenCon 14-11-15 21 Razões do opting out Numbers by Daniel Spichtinger, European Commission, at OpenCon 14-11-15 17.85& 35.37& 5.32& 24.96& 7.79& 8.71& No&data&generated& IPR&protec:on& Confiden:ality& Privacy& Jeopardize&main&objec:ve& other& REQUISITOS NA PRÁTICA (simplificados) Criar um plano de gestão dos dados Assegurar o depósito num repositório Associar licenças CC Providenciar info de ferramentas O foco deve ser o planeamento >> para a disponibilização dos dados, facilitando o depósito e a licença para permitir a reutilização. PLANOS DE GESTÃO DE DADOS NO PILOTO DO H2020 3 24 Propósito do Plano de Gestão de dados: • Define o plano para a criação e gestão dos dados (ex. que normas vão ser usadas), e especifica que dados vão ser abertos. Planos para partilha e preservação deverão ser referidos também. • Data set referenceand name, Data set description, Standards and metadata, Data sharing, Archiving and preservation (including storage and backup) • Disponibilizar uma análise dos principais elementos da política de gestão de dados que será usada pelos beneficiários relativamente a todos os conjuntos de dados (datasets) que serão gerados pelo projeto. • A CE vê os planos como documentos “vivos” – deverão ser regularmente atualizados. Devenvolvimentodo Plano de Gestãode Dados Ø Para a CE não é um documento fechado – deverá evoluir e ir ganhando precisão. • Deverá ser apresentado nos primeiros seis meses do projeto. • Deverá ser atualizado e apresentado com novas versões sempre que as mudanças o justifiquem, mas no mínimo 2 x (mid-term & final review). ØA CE disponibiliza 2 templates (anexo 1 e 2). • A CE não solicita plano no momento entrega da proposta – portanto, o plano não é parte do processo de avaliação da candidatura). • No entanto, todas as propostas apresentadas no âmbito das ações "Research and Innovationactions“ e "Innovationactions“ incluem uma secção “research data” nos critérios de avaliação do impacto. Initial plan Mid-term Final review DMPonline https://dmponline.dcc.ac.uk • Ferramenta web para ajudar os investigadores a elaborar o seu plano de gestão de dados. • Disponibilizada de forma gratuita pelo DCC • Incluiu já um template para o Horizonte 2020 REPOSITÓRIOS DE DADOS E O ZENODO 4 28 Onde depositar e onde encontrar um repositório? 1. Num arquivo de dados ou repositório externo e de âmbito temático ou disciplinar 2. Num repositório de dados institucional, ou de unidade de investigação devidamente estabelecido e com facilidades de gestão de dados. Ø Zenodo.org Ø Pesquisar no diretório de repositórios: re3data.org www.re3data.org www.re3data.org Zenodo (OpenAIRE/CERN repository) www.zenodo.org .upload . . describ e … publish Upload Describe Publish http://www.datacite.org http://www.altmetric.com www.openaire.eu 39 Ø Para permitir o depósito de conjuntos de dados de investigação (datasets) produzidos na Universidade do Minho foi criada uma área/comunidade da UMinho no repositório Zenodo. Ø O Zenodo permite o depósito de um número ilimitado de datasets (mas com limite de 2Gb por ficheiro), atribuindo um identificador persistente (DOI) a cada dataset. Ø A utilização do Zenodo para depósito, preservação e partilha de dados visa disponibilizar à comunidade da UMinho, numa fase piloto, um serviço de qualidade para apoio à gestão dos dados. Dados ligados a artigos no RepositóriUM DADOS CIENTÍFICOS E OS SERVIÇOS DE APOIO NO OPENAIRE E FOSTER 5 42 POLÍTICAS OPEN ACCESS NA UE OpenAIRE implementa as e apoia o piloto de dados abertos do H2020 OpenAIRE Dez. 2009 a Nov. 2012 OpenAIREplus Dez. 2011 – Dez. 2014 OpenAIRE2020 Jan. 2015 a Jun. 2018 www.openaire.eu Open Research Data Pilot • Open Research Data Pilot: https://www.openaire.eu/opendatapilot • Create a Data Management Plan: https://www.openaire.eu/opendatapilot-dmp • Select a Data Repository: https://www.openaire.eu/opendatapilot-repository • Factsheet: https://www.openaire.eu/or-data-pilot-factsheet Informação útil disponibilizada pelo OpenAIRE 45 Dados no OpenAIRE 46 Projetos: publicações & dados 47 LINK RESEARCH RESULTS TOOL https://www.openaire.eu/participate/claim Link publication or datasets to projets. Identify the project, select publications or datasets and set the access rights. Deposit: www.zenodo.org 50 REPOSITORIES DEPOSIT WORKFLOW: Searching by the name, acronym or the project id number… Select the project and accept OpenAIRE Funders Projects List API http://fosteropenscience.eu/ Portal FOSTER • Todos os conteúdos e materiais são de utilização livre e podem ser recombinados com outros para necessidades de formação. • Muitos destes recursos estão a ser compilados e reusados em cursos online. Diagrama da classificação do projeto FOSTER Diagrama da classificação do projeto FOSTER Obrigado DADOS ABERTOS NO H2020 Pedro Principe, pedroprincipe@sdum.uminho.pt