O documento discute a curadoria de dados de pesquisa, abordando tópicos como a produção, gestão e plano de gestão de dados. Apresenta o ciclo de vida dos dados segundo o modelo DCC e destaca a importância de planejar a identificação, descrição, armazenamento, preservação, compartilhamento e avaliação dos dados de acordo com princípios como FAIR, visando torná-los acessíveis e reutilizáveis.
1. CURADORIA DE DADOS
DE PESQUISA
Dra. Ana Carolina Simionato
acsimionato@ufscar.br
set/2018
2. Agenda
Curadoria digital;
Produção de dados de pesquisa;
Gestão de dados;
Plano de gestão de dados de pesquisa.
3. cu.ra.do.ria
ato, processo ou efeito de curar, cuidado.
museologia: curador, comissário, conservador,
responsável pela montagem e exposição de coleções
do acervo do museu.
5. Curadoria Digital
A curadoria digital foi denominada para referenciar as atividades de
seleção, preservação, manutenção, coleta e
arquivamento de recursos.
A Curadoria Digital reduz os efeitos da obsolescência digital, mantendo
a informação acessível aos usuários por tempo indeterminado.
6. Sant’Ana (2016)
DCC Curation Lifecycle Model (2013)
(2013)
Qin; Ball; Greenberg (2012)
entre outros...
#diversidade de
modelos de ciclo de
vida dos dados de
pesquisa
7. ações essenciais do ciclo de vida dos dados:
IDENTIFICAÇÃO, DIGITALIZAÇÃO,
HIGIENIZAÇÃO, DESCRIÇÃO,
ARMAZENAMENTO E PRESERVAÇÃO,
COMPARTILHAMENTO, e AVALIAÇÃO.
#plano de gestão de dados
#planejamento
9. Ciclo da
curadoria digital
(Modelo DCC)
Três tipos de fases ou ações:
• Durante todo o ciclo de
vida;
• Realizam de forma
sequencial;
• Ações ocasionais que
podem ou não produzir.
10. Fases que se levam durante
todo o ciclo de vida:
a) Descrição e representação da
informação;
b) Planejamento da Preservação;
c) Participação e observação da
comunidade;
d) Preservação e curadoria.
11. Fases que se realizam
de forma sequencial
1) Conceitualização;
2) Criação ou recepção;
3) Valorização e seleção;
4) Ingestão;
5) Ação de preservação;
6) Armazenamento;
7) Acesso, uso e reutilização;
8) Transformação.
15. Dado de pesquisa
Dados são sempre registrados tomando como base de
algum interesse, perspectiva, tecnologia e prática que
determinam seus significados e utilidades em diferentes
contextos. (NIELSEN; HJORLAND, 2014, p.225).
16. Tipos de dados
Os dados de pesquisa em diferentes momentos, podem ser também
identificados como dados brutos (raw data) ou preliminares, dados
derivados, dados referenciais ou canônicos.
Tipos de dados:
observacionais, experimentais, simulações, dados compilados.
20. Paradigmas da Ciência
1. Ciência experimental ou empírica estuda a relação
entre fenômenos por meio de experimentos;
2. Ciência teórica ou descritiva formula modelos
para descrição e explicação dos fenômenos naturais;
SAYÃO; SALES, 2015
21. Paradigmas da Ciência
3. Ciência baseada em simulação uso de software e grande
geração de dados;
4. Ciência com o auxílio de ferramentas avançadas de software
e de mineração da dados ajudam a interpretar e transformar
dados brutos em configurações ilimitadas de informação e
conhecimento.
SAYÃO; SALES, 2015
22. # criação de inúmeros dados de pesquisa
# big data
27. É importante ressaltar que o dado precisa ser fornecido em
condições que permitam a sua reutilização e redistribuição, incluindo
o vínculo com outros conjuntos de dados.
Os princípios FAIR (Findable, Accessible, Interoperable, Reusable)
definem orientações para que os dados científicos sejam localizáveis,
acessíveis, interoperáveis e reusáveis.
FORCE11 (2016)
29. PUBLIQUEM E COMPARTILHEM SEUS DADOS!
Mandatória de:
• Agências financiadoras de pesquisa;
• Periódicos científicos;
• Instituições de pesquisa;
• Pesquisadores.
30. ? políticas institucionais
? responsabilidades
? armazenamento
? manutenção
? recursos humanos e
financeiros
? entre outras questões
?
32. Para o Plano de Gestão de
Dados, o Digital Curation Centre
(2013) orienta ao pesquisador a
refletir sobre 13 questões:
33. Plano de gestão de dados
1. Quais dados você coletará ou criará?
2. Como os dados serão coletados ou criados?
3. Que documentação e metadados acompanharão os dados?
4. Como você administrará qualquer questão ética?
5. Como você vai gerenciar os direitos autorais e os direitos de
propriedade intelectual?
6. Como os dados serão armazenados e armazenados durante a pesquisa?
DCC (2013)
34. Plano de gestão de dados
7. Como você vai gerenciar o acesso e a segurança?
8. Quais dados devem ser mantidos, compartilhados e / ou preservados?
9. Qual é o plano de preservação a longo prazo para o conjunto de dados?
10.Como você vai compartilhar os dados?
11.São necessárias restrições ao compartilhamento de dados?
12.Quem será responsável pelo gerenciamento de dados?
13.Quais recursos você precisará para implementar seu plano?
DCC (2013)
35. Conteúdo do PGD Fapesp
Um Plano de Gestão de Dados é um texto que deve responder a duas perguntas
básicas:
1. Quais dados serão gerados pelo projeto
2. Como serão preservados e disponibilizados, considerando questões éticas, legais, de
confidencialidade e outras
O texto de um Plano varia conforme a disciplina, os tipos de dados considerados e
como os responsáveis pelo projeto pretendem disponibilizá-los. Algumas chamadas
FAPESP poderão especificar o formato desejado do Plano. Para todos os demais casos,
o Plano submetido como anexo de uma proposta à FAPESP deve seguir as seguintes
diretivas:
36. Conteúdo do PGD Fapesp
Texto de até duas páginas, contendo as seguintes informações
a) Descrição dos dados e metadados produzidos pelo projeto - por exemplo, amostras, registros de
coleta, formulários, modelos, resultados experimentais, software, gráficos, mapas, vídeos, planilhas,
gravações de áudio, bancos de dados, material didático e outros.
b) Quando aplicável, restrições legais ou éticas para compartilhamento de tais dados, políticas para
garantir a privacidade, confidencialidade, segurança, propriedade intelectual e outros.
c) Política de preservação e compartilhamento (por exemplo, compartilhamento imediato ou apenas
após a aceitação da publicação associada). Período de carência (antes do compartilhamento) e
período durante o qual os dados serão preservados e disponibilizados.
d) Descrição de mecanismos, formatos e padrões para armazenar tais itens de forma a torná-los
acessíveis por terceiros. Esta descrição pode incluir o uso de repositórios e serviços de outras
instituições.
37. templates de auxílio a construção do plano de gestão
de dados, sugestão:
- DMP Tool
- DMP Online
[Cuidado: cada agência ou instituição de fomento possui um
escopo, é necessário verificar]
38. Onde depositar
seus dados?
Repositórios institucionais;
Repositórios multidisciplinares:
https://datadryad.org/
https://zenodo.org/
https://figshare.com/
42. Referências
A. Goben e R. Raszewski, “The data life cycle applied to our own data”, J. Med. Libr. Assoc. JMLA, vol. 103, no 1, p. 40–44, jan. 2015.
C. Borgman, “Research Data: Who will share what, with whom, when, and why?”, 2010.
C. Lee, S. Allard, N. McGovern, e A. Bishop, “Open Data meets Digital Curation: an investigation of practices and needs”, Int. J. Digit. Curation, vol. 11, no 2, p. 115–
125, jul. 2017.
D. R. Harvey, Digital curation: a how-to-do-it manual. New York: Neal-Schuman Publishers, 2010.
Digital Curation Centre, “Digital Curation Centre: because good research needs good data”, 2016. [Online]. Disponível em: http://www.dcc.ac.uk/. [Acessado: 02-
ago-2016].
Editorial Nature, “Everyone needs a data-management plan”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-03065-z.
[Acessado: 10-ago-2018].
FORCE11, “Guiding Principles for Findable, Accessible, Interoperable and Re-usable Data Publishing version b1.0”, FORCE11, 10-set-2014. [Online]. Disponível em:
https://www.force11.org/fairprinciples. [Acessado: 13-ago-2017].
H. Chen, Y. Lin, e C. Chen, “Approaches to building metadata for data curation”, Int. Conf. Dublin Core Metadata Appl., p. 4, 2013.
H. J. Nielsen e B. Hjørland, “Curating research data: the potential roles of libraries and information professionals”, J. Doc., vol. 70, no 2, p. 221–240, 2014.
L. F. Sayão e L. F. Sales, “Algumas considerações sobre os repositórios digitais de dados de pesquisa”, Informação Informação, vol. 21, no 2, p. 90, dez. 2016.
43. Referências
L. F. Sayão e L. F. Sales, “Curadoria digital e dados de pesquisa”, AtoZ Novas Práticas Em Informação E Conhecimento, vol. 5, no 2, p. 67, jan. 2017.
L. F. Sayão e L. F. Sales, “Dados de pesquisa: contribuição para o estabelecimento de um modelo de curadoria digital para o país”, 2013.
L. F. Sayão e L. F. Sales, Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN/IEN, 2015.
M. D. Wilkinson et al., “The FAIR Guiding Principles for scientific data management and stewardship”, Sci. Data, vol. 3, p. 160018, mar. 2016.
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information Services baseline,
2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-requirements/nsf/. [Acessado: 13-ago-
2017].
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information Services baseline,
2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-requirements/nsf/. [Acessado: 13-ago-
2017].
Q. Schiermeier, “Data management made simple”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-03071-1. [Acessado: 10-
ago-2018].
R. C. G. Sant’Ana, “Ciclo de vida dos dados: uma perspectiva a partir da ciência da informação”, Informação Amp Informação, vol. 21, no 2, p. 27, 2016.
R. G. Curty e J. Qin, “Towards a model for research data reuse behavior”, Proc. Am. Soc. Inf. Sci. Technol., vol. 51, no 1, p. 1–4, 2014.
R. G. Curty, K. Crowston, A. Specht, B. W. Grant, e E. D. Dalton, “Attitudes and norms affecting scientists’ data reuse”, PloS One, vol. 12, no 12, p. e0189288, 2017.
No século XX houve um movimento na direção do fechamento do conhecimento patrocinado por grandes corporações no sentido de privar parte das pessoas do acesso ao conhecimento como forma de gerar receita financeira (KON, 2013)
Irmãos Wright - patente