DADOS ABERTOS NO HORIZONTE 2020 Pedro Principe, Universidade do Minho – 01/07/2016 Tópicos 1. Do piloto Open Access no 7ºPQ ao piloto dos Dados Abertos no H2020 2. Resumo do projeto piloto dos dados de investigação abertos no H2020 3. Planos de Gestão de Dados no piloto de dados abertos do H2020 4. Repositórios de dados e o Zenodo 5. Dados científicos e os serviços de apoio da infraestrutura OpenAIRE DO PILOTO OPEN ACCESS NO 7ºPQ AO PILOTO DOS DADOS ABERTOS NO H2020 1 3 Evolução do mandato OA da CE Piloto OA do 7ºPQ (2008) • Acordos com Claúsula Especial 39 • 20% das áreas do programa • Depósito em repositórios • Orientações OA do ERC: Depósito em repositórios e periodo de embargo. Horizonte 2020 (2014) • Todos os acordos • 100% das áreas do programa • Depósito em Repositórios •Projeto-piloto de Dados Abertos Open Access no Horizonte 2020 Open Access definido como princípio geral no Horizonte 2020 Multi-beneficiary General Model Grant Agreement Disposições aplicáveis no acordo de subvenção: • artigo 29: ”Dissemination of results - Open Access - Visibility of EU funding” • 29.2 Open access to scientific publications; • 29.3 Open access to research data http://http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf H2020 Open Research Data Pilot “Model Grant Agreement” 29.3 Open access to research data http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf EC Guidelines on Open Access and Research Data in Horizon 2020 Documentos com orientações para os benificiários dos projetos que integram o piloto de dados http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf www.openaire.eu/opendatapilot Novidade! Open Research Data in H2020 by default https://ec.europa.eu/research/openscience/index.cfm?pg=open-science-cloud https://www.openaire.eu/ec-announces-open-science-cloud-and-open-research-data-by-default RESUMO DO PROJETO PILOTO DOS DADOS DE ABERTOS NO H2020 2 10 Piloto de dados abertos no H2020 Questões chave:  Quais as ÁREAS científicas abrangidas pelo piloto?  Qual o OBJETIVO e âmbito do piloto?  Que DADOS são abrangidos?  Quais são os REQUISITOS?  O que precisamos saber sobre gestão de dados? Piloto de dados abertos no H2020 – ÁREAS Áreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies • Research infrastructures – (new: coverage of the whole area) • Leadership in enabling and industrial technologies – Information and Communication Technologies • Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new) • Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new) • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society • Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP) Piloto de dados abertos no H2020 Áreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies • Research infrastructures – (new: coverage of the whole area) • Leadership in enabling and industrial technologies – Information and Communication Technologies • Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new) • Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new) • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society • Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP) PROJETOS DE OUTRAS ÁREAS SÃO ENCORAJADOS A ADERIR VOLUNTARIAMENTE Piloto de dados abertos no H2020 –OBJETIVO O Projeto-piloto que visa melhorar e maximizar o acesso e a reutilização dos dados de investigação gerados por projetos financiados pela CE. EC: information already paid for by the public should not be paid for again. Open data is data that is free to access and reuse Piloto de dados abertos no H2020 – PRINCÍPIOS 15 Discoverable Accessible Assessable and intelligible Usable beyond the original purpose for which it was collected Interoperable to specific quality standards Piloto de dados abertos no H2020 –QUE DADOS? Dados para validar os resultados apresentados em publicações científicas. Outros dados, conforme especificado no plano de gestão de dados. Piloto de dados abertos no H2020 –ÂMBITO Aos beneficiários é requerido o depósito:  Dados, incluindo metadados associados, necessários para validar os resultados apresentados em publicações científicas, logo que possível;  Outros dados, incluindo metadados associados, conforme especificado e dentro dos prazos estabelecidos no plano de gestão de dados. Não se aplica a todos os dados (os investigadores definem em função do seu projeto), havendo ainda exceções. Piloto de dados abertos no H2020 –REQUISITOS 1. Desenvolver (e atualizar) um Plano de Gestão de Dados. 2. Depositar num repositório de dados adequado. 3. Tornar possível a terceiros o acesso, a prospeção, a exploração, a reprodução e a disseminação dos dados – de forma gratuita. 4. Fornecer informações sobre as ferramentas e os instrumentos necessários para validar os resultados (ou fornecer as ferramentas). 18 AS OPEN AS POSSIBLE, AS CLOSED AS NEEDED Abordagem da Comissão Europeia: Piloto de dados abertos no H2020 –OPT OUT • Se o projeto não gerar/recolher dados. • Em caso de conflito com a obrigação de proteção dos resultados (se é esperado que os resultados sejam comercialmente ou industrialmente explorados). • Se a realização do objetivo principal do projeto (ação) ficar comprometido com a disponibilização aberta dos dados. • Em caso de conflito com as obrigações de confidencialidade. • Em caso de conflito com as obrigações nacionais de segurança. • Em caso de conflito com as regras em matéria de proteção de dados pessoais. 20 Os projetos podem optar por sair do piloto, na fase de proposta ou durante a execução (devidamente justificado no plano de projeto), com base em: Opting out / opting in  É possível optar por sair, quando devidamente justificado;  e optar por participar voluntariamente é igualmente possível. Formulários no participant portal Opt in / Opt out (alguns números) Basis: 3,699 Horizon 2020 signed grant agreements • Calls in core-areas: opt out 34,6% (149/431 proposals) • Other areas: voluntary opt in 12,5% (409/3268 proposals) Numbersby Daniel Spichtinger, European Commission, at OpenCon 14-11-15 23 Opt in / Opt out (+ alguns números) Open Research Data - the uptake of the Pilot in the first calls of Horizon 2020 https://data.europa.eu/euodp/data/dataset/open-research-data-the-uptake-of-the-pilot-in-the-first-calls-of-horizon-2020 Number of proposals and opt-outs Number of Proposals Number opting out Number staying in Not answered 7869 1434 5214 1221 Calls not in core areas of the ORD pilot (voluntary opt-in) Signed grants Projects funded Opt-in Number Opt-In % 3268 388 11,87% EC Conclusion: These numbers in the proposals for the first calls of H2020 are encouraging (Comprehensive follow up needed). Razões do opting out Projetos H2020 no piloto de dados com coordenação de organizações PT Projetos H2020 no piloto de dados com participação de organizações PT REQUISITOS NA PRÁTICA (simplificados) Criar um plano de gestão dos dados Assegurar o depósito num repositório Associar licenças CC Providenciar info de ferramentas O foco deve ser o planeamento >> para a disponibilização dos dados, facilitando o depósito e a licença para permitir a reutilização. Tópicos 1. Do piloto Open Access no 7ºPQ ao piloto dos Dados Abertos no H2020 2. Resumo do projeto piloto dos dados de investigação abertos no H2020 3. Planos de Gestão de Dados no piloto de dados abertos do H2020 4. Repositórios de dados e o Zenodo 5. Dados científicos e os serviços de apoio da infraestrutura OpenAIRE www.dcc.ac.uk/resources/how-guides/license-research-data Licenças associadas a dados científicos: info de apoio Limitações CREATIVE COMMONS NC Non-Commercial o que é considerado comercial? SA Share Alike Reduz potencial de interoperabilidade! ND No Derivatives Restringe severamente o uso! Horizonte 2020 recomendação de uso ou PLANOS DE GESTÃO DE DADOS NO PILOTO DO H2020 3 31 Propósito do Plano de Gestão de dados: •Disponibilizar uma análise dos principais elementos da política de gestão de dados que será usada pelos beneficiários relativamente a todos os conjuntos de dados (datasets) que serão gerados pelo projeto. •A CE vê os planos como documentos “vivos” – deverão ser regularmente atualizados. Que aspetos da gestão de dados devem constar do plano Que dados vão ser criados (formato, tipos, dimensão...). Quais as Normas e metodologias que vão ser usadas (incl. metadados). Como é que as questões éticas e de propriedade inteletual serão definidas. Que planos para a partilha e acesso aos dados. Qual a estratégia para a preservação dos dados. CRIAR DOCUMENTAR USAR ARMAZENAR PARTILHAR PRESERVAR Tópicos do Plano de Gestão de Dados: Data set reference and name Identificação do conjunto de dados.. Data set description Descrição com origem, natureza, tamanho, público. Informação de eventuais dados similares, possibilidades de integração e reutilização. Standards and metadata Referencia às normas de metadados disciplinares a usar para descrição, ou como é que vão ser descritos ou criados os metadados. Data sharing Descrição de como os dados vão ser partilhados, incluindo procedimentos de acesso, períodos de embargo, indicando eventuais ferramentas necessárias para reutilização dos dados. Incluir informação das limitações de acesso. Archiving and preservation (incl. storage and backup) Descrição de procedimento de armazenamento e preservação, indicando quando tempo os dados devem ser preservados Devenvolvimento do Plano de Gestão de Dados  Para a CE não é um documento fechado – deverá evoluir e ir ganhando precisão. • Deverá ser apresentado nos primeiros seis meses do projeto. • Deverá ser atualizado e apresentado com novas versões sempre que as mudanças o justifiquem, mas no mínimo 2 x (mid-term & final review). A CE disponibiliza 2 templates (anexo 1 e 2). • A CE não solicita plano no momento entrega da proposta – portanto, o plano não é parte do processo de avaliação da candidatura). • No entanto, todas as propostas apresentadas no âmbito das ações "Research and Innovation actions“ e "Innovation actions“ incluem uma secção “research data” nos critérios de avaliação do impacto. Initial plan Mid-term Final review DMPonline https://dmponline.dcc.ac.uk • Ferramenta web para ajudar os investigadores a elaborar o seu plano de gestão de dados. • Disponibilizada de forma gratuita pelo DCC • Incluiu já um template para o Horizonte 2020 How to write a DMP Template available from https://dmponline.dcc.ac.uk/1 23 4 40 “The DMP is not a fixed document…” Self-assigned ID 41 Briefly specify • how data will be captured/created • how it will be documented • according to what standards • who will be able to access it • where it will be stored • how it will be backed up, and • where and how it will be shared and preserved long-term 42 ID of the dataset, assigned by PI EC guidance PI’s answer Initial DMP 5 43 Several export formats 6 Deliver the DMP • Send the initial DMP version to the Commission within six months. • EC: “Since DMPs are expected to mature during the project, more developed versions of the plan can be included as additional deliverables at later stages. (…) New versions of the DMP should be created whenever important changes to the project occur due to inclusion of new data sets, changes in consortium policies or external factors.” 44 REPOSITÓRIOS DE DADOS E O ZENODO 4 45 Onde depositar e onde encontrar um repositório? 1. Num arquivo de dados ou repositório externo e de âmbito temático ou disciplinar 2. Num repositório de dados institucional, ou de unidade de investigação devidamente estabelecido e com facilidades de gestão de dados.  Zenodo.org  Pesquisar no diretório de repositórios: re3data.org www.re3data.org www.re3data.org Zenodo (OpenAIRE/CERN repository) www.zenodo.org .upload .. describ e … publish Upload Describe Publish http://www.datacite.org http://www.altmetric.com www.openaire.eu 56 Em resumo: depositar os dados no final do projeto e providenciar acesso https://www.openaire.eu/opendatapilot-repository DADOS CIENTÍFICOS E OS SERVIÇOS DE APOIO NO OPENAIRE E FOSTER 5 58 POLÍTICAS OPEN ACCESS NA UE OpenAIRE implementa as e apoia o piloto de dados abertos do H2020 OpenAIRE Dez. 2009 a Nov. 2012 OpenAIREplus Dez. 2011 – Dez. 2014 OpenAIRE2020 Jan. 2015 a Jun. 2018 www.openaire.eu Open Research Data Pilot • Open Research Data Pilot: https://www.openaire.eu/opendatapilot • Create a Data Management Plan: https://www.openaire.eu/opendatapilot-dmp • Select a Data Repository: https://www.openaire.eu/opendatapilot-repository • Factsheet: https://www.openaire.eu/or-data-pilot-factsheet Informação útil disponibilizada pelo OpenAIRE 61 Dados no OpenAIRE 62 Projetos: publicações & dados 63 REPOSITORIES DEPOSIT WORKFLOW: Searching by the name, acronym or the project id number… Select the project and accept OpenAIRE Funders Projects List API http://fosteropenscience.eu/ Diagrama da classificação do projeto FOSTER Diagrama da classificação do projeto FOSTER Obrigado DADOS ABERTOS NO H2020 Pedro Principe, pedroprincipe@sdum.uminho.pt