Gestão de dados científicos: o papel das bibliotecas

754
-1

Published on

Workshop no 2º Encontro de Bibliotecas de Ensino Superior da BAD - 6 de junho de 2013 na Universidade de Aveiro - Pedro Príncipe

Published in: Education

Gestão de dados científicos: o papel das bibliotecas

  1. 1. Pedro PríncipeServiços de Documentaçãoda Universidade do MinhoProjeto OpenAIREplus
  2. 2.  compreender o papelpapel que as bibliotecas têmhoje que desempenhar no domínio dos dadoscientíficos produzidos nas instituições deinvestigação e ensino superior. etapas da gestão de dados científicos, ciclo de vida dos dados científicos, criação de conjuntos de dados científicos, metadados e repositórios de dados científicos. traçar uma visão geral dos principais camposde compreensão e intervenção dos profissionaise bibliotecas.
  3. 3. http://epicgraphic.com/data-cake
  4. 4.  Definição da OCDE: “registos factuais usados como fontes primárias nainvestigação científica, e que são geralmenteaceites na comunidade científica como necessáriospara validar os resultados de investigação”.
  5. 5.  Podem assumir várias formas (texto, números, imagensfixas, imagens em movimento, etc.) e dimensões, desde registos de observações individuais ouensaios de pequenos laboratórios que não ultrapassarãoalgumas centenas de kilobytes, até aos dados produzidos peloLarge Hadron Collider (LHC) do CERN, que pode gerar váriasdezenas de petabytes por dia.“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  6. 6.  Analógicos ou digitais Livros de laboratório ou software Criados na forma digital (born digital) Ou convertidos para a forma digital (‘digitised’)
  7. 7.  Os dados científicos são produzidos ou utilizados nocontexto de investigação científica. recolhidos ou criados para efeito de processamentocientífico, como os dados atmosféricos usados para previsãometeorológica, ou os dados recolhidos de sensores paramonitorizar o estado de um edifício. obtidos como resultados do processamento automático deobjetos (por exemplo, uma coleção de imagens processada paraobter os respetivos histogramas de cor, que constituem assimnovos dados). dados que não são produzidos para investigação mas queacabam por ser objeto dela, como as contribuições que osutilizadores de uma rede social fazem na forma de textos,fotografias ou outros objetos e que acabam por ser utilizados paraestudos sociológicos.
  8. 8.  Instrument measurements Experimental observations Still images, video and audio Text documents, spreadsheets, databases Quantitative data (e.g. household survey data) Survey results & interview transcripts Simulation data, models & software Slides, artefacts, specimens, samples Sketches, diaries, lab notebooks…
  9. 9.  Para se constituírem como verdadeiramenteúteis, os dados científicos devem possuirestrutura e organização. Os conjuntos de dados (“datasets”) são uma dasunidades essenciais. Os conjuntos de dados são coleções de informaçõesou factos relacionados entre si e registados numformato comum. Por exemplo, os resultados de um estudo de opiniãopor entrevista numa investigação sociológicaconstituem um conjunto de dados, composto pelosregistos individuais das entrevistas.“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  10. 10. Relevância, atividades, princípios
  11. 11. É cada vez mais relevante o entendimento danecessidade de gerir o acesso e a utilizaçãodos dados produzidos ou recolhidos no âmbitodas atividades de investigação, garantindo a suapreservação.
  12. 12.  Cresce a sensibilidade dos investigadores para osefeitos da verdadeira explosão na produção dedados científicos: crescimento global das atividades de investigação consequência dos novos métodos e instrumentos depesquisa e registo que originam cada vez maiores volumesde dados. Onde o trabalho de investigação é baseado na análise dedados recolhidos de forma distribuída parece ter sido maisprecoce e mais profundo.
  13. 13.  Os organismos que produzem efinanciam ciência têm manifestado nestesúltimos anos redobrada atenção ànecessidade de assegurar meios emecanismos para a gestão dos dadoscientíficos.
  14. 14.  OCDE OECD. Declaration on Access to Research Data From Public Funding, Paris, 2004.http://www.oecd.org/document/15/0,3343,en_2649_34487_25998799_1_1_1_1,00.html OECD Principles and Guidelines for Access to Research Data from Public Funding. Paris, 2007.http://www.oecd.org/dataoecd/9/61/38500813.pdf Várias iniciativas dos Conselhos de Investigação do Reino Unido RCUK. (2011). Common Principles on Data Policy -http://www.rcuk.ac.uk/research/Pages/DataPolicy.aspx Jones, Sarah. (2011). Summary of UK research funders’ expectations for the content of datamanagement and sharing plans http://www.dcc.ac.uk/ Iniciativas no Contexto da União Europeia produzidas pela Comissão Europeiano âmbito da Agenda Digital Europeia e ERA CE (2012): Communication on a reinforced European Research Area partnership for excellenceand growth▪ Communication Towards better access to scientific information▪ Recommendation on access to and preservation of scientific information EUA com iniciativas da National Science Foundation - http://www.nsf.gov
  15. 15. “To make progress in science, we need to be open andshare… sharing data, and having the forum to openlyuse and build on what is shared, are essential toscience. They fuel the progress and practice of scientificdiscovery. ”Neelie Kroes, Rome, 11 April 2012
  16. 16.  Multiplicam-se as iniciativas de Open Access, Open Data. Panton Principles for Open Data in Science: http://pantonprinciples.org“Entendemos por dados abertos, em ciência, aqueles que estãolivremente disponíveis na Internet pública permitindo aqualquer utilizador baixar, copiar, analisar, reprocessar, usá-loscom um software ou utilizá-los para qualquer outra finalidadesem barreiras financeiras, legais, técnicas ou outras além doacesso à Internet. Para este fim, os dados relacionados comciência publicada devem ser explicitamente colocados emdomínio público.“
  17. 17. OpenAIREOpenAIRE implementa as políticasimplementa as políticasOpen AccessOpen Access da UEda UE
  18. 18. Planeamento e gestão de dadosCriação de dadosDocumentar os dadosAcesso e utilização dos dadosArmazenamento e backupsPartilha dos dadosPreservação dos dados
  19. 19. Digital Curation Centre
  20. 20.  Curadoria de dados é a atividade de gestão eutilização de dados desde o momento da suacriação para garantir o seu armazenamento, asua pesquisa e respetiva reutilização.“the active management and appraisalof data over the lifecycle of scholarly andscientific interest”Digital Curation Centre
  21. 21. Anthony Beitz, Monash University. OR 2012, EdinburghCollaborateConceive Design Experiment Publish ExposeAnalyseDesign ExposeCollaborateExperiment PublishAnalyseDesignGestão ePlaneamentode dadosRepositórios disciplinaresOu institucionais eRevistas científicasPlataforma deGestão de dados científicos
  22. 22.  Debate entre os participantes…
  23. 23.  Debate entre os participantes…
  24. 24.  Apoiar e aconselhar estudantes, investigadores,grupos de investigação sobre os meios e formasmais adequadas para preparar os dados para o seuarmazenamento, a pesquisa e a reutilização.
  25. 25.  Knowledge-Exchange (2011),"A Surfboard for Riding the Wave Towards a four country action programme on Ball, A and Duke, M (2011) How to Cite Datasets and Link to Publications.Digital Curation Centre http://www.dcc.ac.uk/webfm_send/525 Green, T (2009), “We Need Publishing Standards for Datasets and DataTables”, OECD Publishing White Paper,OECD Publishing.doi:10.1787/603233448430 http://dx.doi.org/10.1787/603233448430 MaRDI-Gross project DMP Planning for Big Science Projects (2012).http://arxiv.org/abs/1208.3754v1 Digital Curation Centre – http://www.dcc.ac.uk International Journal of Digital Curation - http://www.ijdc.net/ Data Science Journal - http://www.jstage.jst.go.jp/browse/dsj Open Knowledge Foundation: http://okfn.org/ OpenAIRE: http://www.openaire.eu
  26. 26. As 10 recomendações da LIBER
  27. 27.  Offer research data management support,including data management plans for grantapplications, intellectual property rightsadvice and information materials. Assistfaculty with data management plans and theintegration of data management into thecurriculum.
  28. 28. http://youtu.be/1stLmJUO81A
  29. 29.  Engage in the development of metadata anddata standards and provide metadataservices for research data.
  30. 30.  Create Data Librarian posts and developprofessional staff skills for data librarianship.
  31. 31. http://www.sheffield.ac.uk/is/research/projects/rdmrose
  32. 32.  Actively participate in institutional researchdata policy development, including resourceplans. Encourage and adopt open datapolicies where appropriate in the researchdata life cycle.
  33. 33. http://youtu.be/V8IIdfBAr_0
  34. 34.  Liaise and partner with researchers, researchgroups, data archives and data centers tofoster an interoperable infrastructure for dataaccess, discovery and data sharing.
  35. 35.  Support the lifecycle for research data byproviding services for storage, discovery andpermanent access.
  36. 36. https://dmponline.dcc.ac.ukwww.dcc.ac.uk/resources/how-guides/develop-data-plan
  37. 37.  Promote research data citation by applyingpersistent identifiers to research data.
  38. 38.  Provide an institutional Data Catalogue orData Repository, depending on availableinfrastructure.
  39. 39.  Get involved in subject specific datamanagement practice.
  40. 40.  Offer or mediate secure storage for dynamicand static research data in co-operation withinstitutional IT units and/or seek exploitationof appropriate cloud services.
  41. 41. University of Edinburgh policyhttp://www.ed.ac.uk/is/research-data-policyResearch data guidancehttp://www.ed.ac.uk/is/data-managementMANTRA online traininghttp://datalib.edina.ac.uk/mantra/Edinburgh University Data Libraryhttp://www.ed.ac.uk/is/data-library
  42. 42. Elementos, financiadores, políticas institucionais
  43. 43.  Principais questões no planeamento da gestãode dados científicos: Tipos de dados, formatos, normas e métodos de recolha Questões legais e éticas, de propriedade intelectual Acesso, Partilha e reutilização dos dados Gestão e armazenamento de curto prazo Depósito (arquivo) e preservação a longo prazo
  44. 44.  As condições em que os dados recolhidos ouproduzidos numa investigação podem, ou não, seracedidos e reutilizados por outros investigadores,para além do contexto em que foram gerados, sãoquestões importantes. A forma como são cuidados (curadoria de dados) eas condições legais associadas ao seu acesso epartilha constituem os dois elementos determinantesdo futuro dos diversos conjuntos de dados científicos. É preciso garantir que os dados são registados,mantidos e preservados de forma adequada.“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  45. 45.  Um dos primeiros requisitos é que os conjuntos dedados sejam acompanhados de informaçãoque descreva a sua origem (tempo ou espaço,métodos e instrumentos de recolha), âmbito, autoria,propriedade e condições de reutilização, ou seja, demetadados. Em paralelo com a interoperabilidade tecnológica,a existência de metadados adequados e normalizadosé um requisito essencial para o acesso e reutilizaçãodos dados científicos.
  46. 46.  Repositórios de dados científicos e anormalização dos metadados. Difícil uniformizar a descrição entre domíniosceintíficos. A descrição dos conjuntos de dados ainda sepode considerar muito pouco desenvolvida. Ao nível do conjunto têm sido adoptadosmodelos genéricos como o do Dublin Core, jámuito utilizado nos repositórios institucionais. Projecto DataShare (Edimburgo, Oxford eSouthampton)
  47. 47. (1) Datacontained andexplained withinthe article(2) Further dataexplanations inany kind ofsupplementaryfiles to articles(3) Datareferenced fromthe article andheld in datacenters andrepositories(4) Datapublications,describingavailable datasets(5) Data indrawers and ondisks at theinstituteThe Data PublicationPyramid
  48. 48. http://youtu.be/7IN_SD5B43U
  49. 49. PublicResearchCommunityProjectResearcherMetadata may not be requiredif you are working alone onyour own computer, butbecome crucial when data areshared online.Metadata help to place yourdataset in a broader context,allowing those outside yourinstitution, discipline, orresearch environment tounderstand how to interpretyour data.
  50. 50. REFERÊNCIASAustralia National Universitys Information Literacy Program DPM Template is a formatted templatefor any discipline.The Australian National Data Service created Data Management Planning, a document that lists thequestions that should be answered in a data management plan.The Digital Curation Centre created its Data Management Plan Content Checklist as "acomprehensive list of the details that researchers may be asked to include in such plans.”The Finnish Social Science Data Archives Data Management Planning Website lists questions thatshould be answered in a data management plan. It is aimed at social science researchers in particular.Geoscience Australias Guide to Preparation of Data Management Plans.MIT Libraries Data Management Webpage provides a list of questions that should be answered indata management plan.The National Science Boards Long-Lived Digital Data Collections Enabling Research and Education inthe 21st Century is one of the foundational documents in the US current push for data sharing. Itgives broad guidelines for what should be included.The National Science Foundation Directorate for Engineerings Data Management for NSFEngineering Directorate Proposals and Awards is the first document to directly address the comingNSF requirementThe Queensland University of Technology QUT Data Management Checklist is a highly structured,populable template.The UK Rural Economy and Land Use Programmes Data Management Plan is a form that must befilled out by RELU award holders at the outset of their projects.The University of Melbournes Research Data Management Plan Template is a te,plate aimed atuniversity researchers.
  51. 51.  http://monash.edu/library/researchdata/about/strategy/ Monash Universitys Research DataManagement Strategy and Strategic Plan2012-2015 [pdf 196kB] was publicly releasedon 13 April 2012.
  52. 52. Monash UniversitysResearch Data Management Strategy and Strategic Plan 2012-2015
  53. 53. Monash UniversitysResearch Data Management Strategy and Strategic Plan 2012-2015
  54. 54. National Science Foundationhttp://youtu.be/Lc82pxxRkMo
  55. 55. http://www.pangaea.de

×