Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Acesso aberto a dados de pesquisa no Brasil

78 views

Published on

Acesso aberto a dados de pesquisa no Brasil

Published in: Education
  • Login to see the comments

  • Be the first to like this

Acesso aberto a dados de pesquisa no Brasil

  1. 1. Rene Faustino Gabriel Junior(1), Rafael Port da Rocha(1), Sônia Elisa Caregnato(1), Caterina Groposo Pavão(1), Paula Caroline Schifino Jardim Passos(1), Eduardo Nunes Borges(1), Samile Andréa de Souza Vanz(1), Luís Alberto Barbosa Azambuja(1)) (1)UFRGS; (2)FURG; - dadosabertos@rnp.br; cedap@ufrgs.br Acesso Aberto a Dados de Pesquisa no Brasil
  2. 2. • Foi selecionado pela Rede Nacional de Ensino e Pesquisa (RNP), via carta-convite RNP/IBICT, de 01/2017, entre outros 7 propostas; • Hoje é um Grupo de Trabalho (GT) da RNP em parceria com IBICT; • Atuou na identificação de práticas de Acesso Aberto a Dados de Pesquisa (AADP) no Brasil e no desenvolvimento de experimentos tecnológicos visando o planejamento de infraestrutura e futuros serviços para dados de pesquisa. 2 Introdução: projeto RDP-Brasil
  3. 3. • A primeira parte do projeto foi desenvolvida por pesquisadores do Centro de Documentação e Acervo Digital da Pesquisa (CEDAP) da UFRGS e ao Centro de Ciências Computacionais (C3) da FURG. • O CEDAP/UFRGS foi concebido em 2010 para apoiar “a gestão, curadoria e disponibilização em rede de ativos de pesquisa da UFRGS”, tendo sido financiado pelo Edital CT-INFRA 2010, da FINEP. • Teve como objetivo geral realizar um levantamento de informações que subsidiassem as primeiras ações no âmbito do AADP no país. 3 Introdução: CEDAP/UFRGS e C3/FURG
  4. 4. Objetivos 1) Identificar os repositórios brasileiros de AADP; 2) levantar as práticas e percepções dos pesquisadores brasileiros sobre AADP; 3) desenvolver um portal website para reunir a comunidade brasileira; 4) analisar as soluções tecnológicas mais utilizadas no mundo; 5) desenvolver um protótipo para atender a um conjunto de usuários selecionados. 4
  5. 5. Objetivo 1 – Resultados (15 repositórios) a) Quatro repositórios de abrangência internacional; b) Onze nacionais, sendo cinco multi-institucionais; c) predominam as áreas de geociências e ciências biológicas e agrárias; d) cinco divulgam políticas; e) quadro informam os padrões de metadados usados e f) dois utilizam o DSpace e um o Dataverse. I Workshop institucional sobre Ciência Aberta 5
  6. 6. Objetivo 1 - Identificação das atuais práticas de AADP em instituições brasileiras Repositórios Abrangência Instituição área GLOBE - Global Collaboration Engine Intern. +INPE Solo, Bio, Geo, Oce IODP - International Ocean Discovery Program Intern. +CAPES Oceano, Solo, Geo,Eco PPBio Data Repository Intern. +CENBAM CV,Bio,Eco WorldClim - Global Climate Data Intern. +CRIA Clima,Oce,Geo BDC/UFPR - BD Científicos da UFPR Nasc. UFPR CCH,Bio,CN,Eng Sistema Maxwell Nasc. PUC-Rio Enf, Fis IBICT Nasc. IBICT CSH,CV,CN CIS - Consórcio de Informações Sociais Nasc. USP,ANPOCS CS IPAgriDados Nasc. Embrapa Ciências Agrárias INMET - Instituto Nacional de Meteorologia Nasc. MAPA Dados Meteorológicos IBGE - Instituto Brasileiro de Geografia e Estatística Nasc. IBGE Geo BDEP - BD de Exploração e Produção Nasc. ANP,SGB Petroleo,Geo Base Tuiuiu Nasc. Embrapa,IFMS Ar,Solo,Bio, Sensores Repositório de dados PELD Nasc. Âmbito SiBBr Eco Projeto speciesLink Nasc. CRIA,GBIF, .... CB,Coleções Científicas 15 Repositórios Analisados
  7. 7. Objetivo 2 – Resultados do Survey 7 Questionário foi organizado no software Survey Monkey contendo: • 8 questões demográficas • 13 questões sobre as práticas dos pesquisadores • 6 questões acerca das percepções em relação ao compartilhamento e uso de dados de pesquisa. Convite para participação foi enviado, em março de 2018, a um Universo de 71.712 e-mails válidos: • 48.335 líderes e 27.869 vice-líderes dos grupos de pesquisa cadastrados no Diretório de Grupos de Pesquisa CNPq; • 4.677 e-mails institucionais e de coordenadores dos PPGs cadastrados na CAPES; • 249 e-mails de coordenadores de INCT.
  8. 8. Objetivo 2 – Resultados (4.735 respostas / 4.703 válidas) 68% compartilharam dados de alguma maneira utilizaram dados abertos compartilhados por outros grupos 39,5% utilizaram algum repositório para acessar dados 31,7% 31,9% apontam a falta de infraestrutura como dificuldade para compartilhamento e 21,4% a falta de padronização dos dados 47,7% apontam que a instituição do pesquisador deve oferecer serviços de apoio à gestão dos dados de pesquisa 25,0% já elaboraram um plano de gestão de dados 8
  9. 9. Objetivo 3 – Resultados da comunidade https://dadosdepesquisa.rnp.br/ Migrou-se https://www.rd-alliance.org https://twitter.com/dadosdepesquisa https://www.facebook.com/dados.depesquisa
  10. 10. 10 https://www.rd-alliance.org/groups/rda-brazil Entre para essa comunidade Objetivo 3 – Resultados da comunidade
  11. 11. Objetivo 4 - Levantamento comparativo dos serviços e soluções tecnológicas para compartilhamento de dados • Análise • Qualitativa, Uso de Exemplos • Softwares Analisados • Software Livre, de “Prateleira”, completa • Em vários Repositórios de Dados • Em Repositório Confiável • Usado no Brasil Solução Tecnológica Uso em Repositório de Dados Repositórios Confiáveis TCS,DSA Dataverse 69 3 DSpace 62 11 CKAN 52 0 Fedora 31 14 Eprints 31 0 Fonte: Diretório Re3Data, em 15/11/2018 - https://www.re3data.org Dspace Datashare Dryad HKU Drum Dataverse Texas DR Dataverse NL Harvard DV ODUM CKAN (front end) DataBris (+Zenodo)
  12. 12. Objetivo 4 - Critérios Para analisar as soluções tecnológicas, elaboramos 56 critérios: • Representação do Ambiente do Repositório (6); • Representação dos Conjuntos de Dados (6); • Descrição e Documentação dos Conjuntos de Dados (11); • Produção dos Conjuntos de Dados (7); • Armazenamento de Longo Prazo e Preservação (5); • Acesso e Uso dos Conjuntos de Dados (15); • Uso, Desenvolvimento e Manutenção do Software (6). Os critérios foram estruturados com base no modelo OAIS e nos critérios relativos ao desenvolvimento e uso de software. 12
  13. 13. Objetivo 4 - Resultados Principais atributos Ferramentas estudadas DSpace Dataverse CKAN Código aberto Ambiente web Desenvolvimento Java Interface multilíngue Princípios OAIS Desenvolvimento específico para dados de pesquisa Inclusão de qualquer tipo de material digital Hierarquização de conteúdos Organização dos dados em datasets Registro e autenticação de usuários Políticas específicas por comunidade, usuários, submissão e acesso Data Research and Information Management (DRIM) Busca e a interoperabilidade semântica Protocolo OAI-PMH Princípios FAIR Metadados de citação Versionamento de dados de pesquisa Identificador persistente (DOI, Handle) Esquemas de metadados específicos (Perfil de Aplicação) Application programming interface (API) para facilitar: pesquisa, depósito, acesso e visualização dos dados armazenados Comunidade no Re3data (no. de repositórios) 61 69 51
  14. 14. Objetivo 5 - Resultados 14
  15. 15. Os princípios FAIR indicam que os dados devem: Localizáveis (Findable) Acessíveis (Accessible) Interoperáveis (Interoperable) Reusáveis (Reusable) Possuir identificadores únicos, persistentes e globais. Ser descritos por metadados indexáveis e ricos. Ser recuperáveis pelo seu identificador, por meio de protocolo de comunicação padronizado, aberto e gratuito. Ser representados em linguagens formais. Usar vocabulários controlados que sigam princípios FAIR. Ligar (meta)dados. Ser aceitos pela comunidade. Conter atributos relevantes, precisos e úteis, Incluir metadados de proveniência. Conter licenças claras e acessíveis. 15
  16. 16. 16 Relatórios disponíveis em acesso aberto no Repositório Lume /UFRGS http://hdl.handle.net/10183/185195 http://hdl.handle.net/10183/185138 http://hdl.handle.net/10183/185126 práticas e percepções dos pesquisadores repositórios brasileiros de dados de pesquisa soluções tecnológicas para compartilhamento de dados no Brasil
  17. 17. Relatórios do projeto: • Instalação do Dataverse (Ubuntu e Debian9) • Biblioteca de tradução do Dataverse v.5.15.1 (Português) • Indicadores persistentes no Dataverse • Grupos Nacionais do Portal RDA 17 Dados abertos do questionário: https://dadosabertos.rnp.br/dataset.xhtml? persistentId=hdl:20.500.12401/4 Acesso aberto a dados de pesquisa no Brasil : práticas e percepções dos pesquisadores
  18. 18. 18 Considerações Finais O estudo foi pioneiro na investigação do AADP no Brasil; Contribuiu para iniciativas governamentais, como o compromisso de “Estabelecer mecanismos de governança de dados científicos para o avanço da ciência aberta no Brasil”, assumido pelo Brasil na Parceria de Governo Aberto (OGP), através do seu Quarto Plano de Ação. O estudo sobre o AADP no Brasil demonstrou não somente que iniciativas institucionais de compartilhamento de dados abertos de pesquisa no Brasil ainda são poucas, mas também que esforços públicos são necessários para concretizar e consolidar tais iniciativas. A ciência aberta não depende só de soluções tecnológicas, mas também de uma mudança cultural.
  19. 19. “Os dados são preciosos e durarão mais que os próprios sistemas” Obrigado Tim Berners-Lee (2006). Disponível em : https://www.bcs.org/content/ConWebDoc/3337. Acesso em: 09/04/2019. 19

×