SlideShare a Scribd company logo
1 of 42
Data management a jak psát 
data management plan (DMP) 
Petra Dědičová 
Ústřední knihovna VUT 
dedicova@lib.vutbr.cz
Obsah 
• Vysvětlení základních pojmů 
• Data management – proč a kdo 
• DMP – struktura, příklady, nástroje 
• Požadavky poskytovatelů - Horizon 2020
Vědecká data - definice 
„Výzkumná data jsou zaznamenané informace (bez ohledu na 
formu a médium) nezbytné pro podporu nebo validaci 
pozorování, závěrů nebo výstupů výzkumu. Efektivní a účinná 
správa výzkumných dat je základem vědecké a akademické 
integrity. (Engineering and Physical Sciences Research Council: 
policy framework on research data) 
Za vědecká data se dají považovat: 
• Primární data získaná z přístrojů 
• Sekundární data: dokumenty, tabulky, databáze, laboratorní 
protokoly, vizualisace, modely, software, obrázky, měření 
výpočty aj.
Data management - definice 
Je aktivní správa a zhodnocení dat během jejich životního 
cyklu. (Engineering and Physical Sciences Research Council 
policy framework on research data) 
Pod pojmeme si představíme všechny prkatiky, manipulace, 
vylepšení a procesy, které zajistí vysokou kvalitu vědeckých 
dat, která jsou dobře zorganizována, zdokumentována, 
uložena, udržitelně uchovávána, dostupná a 
znovuvyužitelná.(Corti, 2014) 
Zahrnuje aktivity: plánování a popisu práce s daty, popis 
dat, uložení během výzkumu a po jeho uzavření, případné 
zveřejnění dat a prolinkování na publikace vztahující se k 
výzkumu.
DMP - definice 
• DMPlanning - je proces plánování, popisu a 
informování o životním cyklu dat a činností 
spojených s jejich správou v průběhu 
výzkumu. 
• DMPlan – je dokument, který popisuje tyto 
činnosti. Dokumenty často vyžadují 
poskytovatelé dotací či grantů.
Open data - definice 
Jsou data, která jsou volně dostupná pro 
kohokoliv na internetu a dále vytěžována, 
využívána, reprodukována a šířena. 
• Navazuje na tradici Open Access 
• Hlavní oblastí tzv. government data, ale nyní i 
scinetific data 
• Nové využití tzv. citizen science (např. 
Zooniverse)
Data management – Proč? 
• Transparentnost 
• Efektivita 
• Řízení rizika 
• Uchování 
• Splnění grantových požadavků
Data management – Proč? 
Také pro vás! 
• Organizace dat 
• Fluktuace zaměstnanců/vědců 
• Neduplikování činnosti
Open data – Proč? 
• Validace vašich výsledků – případ 
• Možnosti nových objevů - případ 
• Vyšší citovanost – studie
Životní cyklus dat 
Zdroj: http://www.data-archive.ac.uk/create-manage/life-cycle
Životní cyklus dat – případová studie 
Naplánování výzkumu. 
Souhlas účastníku s 
primárním užitím dat. 
Účastníci si píší deníky. 
Nahrávky rozhovorů. 
Přepis rozhovorů. Přepis 
deníků. 
Zpracování dat pro 
výzkum. Uchovávání dat 
diskutováno s účastníky. 
Souhlas účastníků s 
uchováváním dat. 
Přepisy a nahrávky 
uloženy do Data Archive 
UK. Vytvořen 
katalogizační záznam a 
návod pro uživatele. 
Data znovu využita v nové 
studii. 
Data zveřejněna. 
Zdroj: Corti, 2014, str.21
Data Management – kdo? 
• Vědci –tvůrci dat 
• IT – technické zajištění sběru a uchování 
• Právníci – etické a právní otázky 
• Knihovníci – popis dat, uchování, sdílení 
• Projektový manažeři – podmínky daných 
projektů 
• Nakladatelé a poskytovatelé grantů – dávají 
požadavky
Data Management Plan - obsah 
• U každého poskytovatele může být odlišné 
zadání. 
• Základ by však měl být stejný: 
http://www.dcc.ac.uk/resources/data-management- 
plans/checklist
Data Management Plan – základní 
oblasti 
• Typy, formáty, standardy dat a metody jejich 
sběru 
• Etické standardy a právní stránka 
• Přístup, sdílení a znovu užití dat 
• Krátkodobé uchování a data management 
• Dlouhodobé uchování 
• Zajištění zdrojů
DMP - Typy, formáty, standardy dat a 
metody jejich sběru 
• Jaká data budete váš výzkum produkovat? 
(formáty, typ, objem, obsah, kvalita) 
Doporučené formáty pro dlouhodobé uchovávání: 
– Formáty široce používaných software (MS Word, 
rtf, MS Excel, SPSS) 
– Otevřené formáty (PDF/A, CSV, TIFF, ODF, ASCII, 
tabel-delimited format, comma-separated values, 
XML)
DMP - Typy, formáty, standardy dat a 
metody jejich sběru 
• Jak bude třeba data popsat? 
(jména a struktura souborů, metadatové a přílohové 
materiály ke správné interpretaci) 
Pojmenování souborů 
– Používejte konzistentně a všichni v projektu 
– Mělo by obsahovat tyto elementy: zkratku projektu, popis 
obsahu, informaci o typu dokumentu, datum, iniciály 
tvůrce, číslo verze, status např. draft nebo final 
– Např. FG1_CONS_12-02-2010.rtf (přepis rozhovorů first 
focus group with consumers konaných dne 12.02.2012)
DMP - Typy, formáty, standardy dat a 
metody jejich sběru 
• Jaké standardy a metodologie bude třeba 
použít při sběru dat? 
(má instituce nějaké standardy, poskytovatel, 
metadatové standardy apod.)
DMP - Etické standardy a právo 
• Ochrana osobních dat 
• Bezpečnost (utajované informace) 
• Dodržování základních lidských práv 
• Komerční a průmyslové využití dat 
• Autorské a majetkové právo 
Další info.: 
http://www.h2020.cz/cs/storage/e38c919be0564a5290b5b0d84db1a977c17 
5d51c?uid=e38c919be0564a5290b5b0d84db1a977c175d51c
DMP - Přístup, sdílení a znovu užití dat 
• Kdo a pro jaké účely využije vaše data? 
• Jak data zpřístupníte? 
(kde, jak budou vyhledatelná, kdy) 
• Jak budete data licencovat? 
(za jakých podmínek je může někdo využít, licence 
Creative Commons)
DMP - Krátkodobé uchování a data 
management 
• Bezpečnost a uchování 
(kde se budou data ukládat, jaká forma ukládání, je 
možné data uložit i mimo instituci, jak je zajištěna 
jejich bezpečnost, kdo kontroluje jejich kvalitu) 
• Přidělení rolí 
(kdo má za co odpovědnost)
DMP - Dlouhodobé uchování 
• Která data jsou vhodná pro dlouhodobé 
uchování? 
(http://www.dcc.ac.uk/resources/how-guides/ 
appraise-select-data, u většiny projektů se 
jedná hlavně o data doplňující publikační činnost) 
• Jak a kde budete data uchovávat? 
(strojově čitelná podoba metadat, dlouhodobý 
přístupu, linkování)
DPM – zajištění zdrojů 
• Finančních 
• Personálních 
• Pomůcka pro vytváření rozpočtu: 
http://www.data-archive. 
ac.uk/media/247429/costingtool.pdf
DMP dobrá praxe 
• Napište si DMP 
• Vytvářejte zálohy. Pomůcka automatická synchronizace např. 
Dropbox (pouze pro necitlivá data ). 
• Popisujte data již při sběru. Kvalita metadat klesá s časem. 
Uživatelé i vy v budoucnu budete snadněji rozumět svým 
datům. 
• Ukládejte data v otevřených formátech, kdykoliv je to možné. 
Pro popis používejte standardizovanou metadatovou 
strukturu. 
• Ukládejte svá data v datových centrech a repozitářích. 
Odkazujte na ně ve svých publikacích.
DMP - příklady 
• USA: https://dmptool.org/public_dmps 
• Rural Economy and Land Use (Relu): 
http://relu.data-archive.ac.uk/data-sharing/ 
planning/examples 
• Yale: http://ydc2.yale.edu/documentation/data-management- 
plan-examples 
• Další: http://www.dcc.ac.uk/resources/data-management- 
plans/guidance-examples
DMP - online nástroje 
• DMP tool: https://dmptool.org/ 
• DMP online: http://www.dcc.ac.uk/dmponline
DMP - kurzy 
• Univerzity of Edinburgh: 
http://datalib.edina.ac.uk/mantra/ 
• University of Minnesota: 
https://sites.google.com/a/umn.edu/data-management- 
course_structures/home-1
Požadavky poskytovatelů 
Zdroj: http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
Požadavky poskytovatelů 
• US: https://dmptool.org/guidance 
• Nakladatelé: Plos, BioMed Central, Nature 
publishing, Elsevier a další 
• Evropská komise - Horizon 2020
Horizon 2020 – proč? 
• dlouhodobá podpora Open Access přístupu 
(FP7 program, podpůrná infrastruktura OpenAIRE plus, Horizon 
2020) 
• Open data další krok 
(Horizon 2020 – open data pilot) 
• Povinnost otevřeného přístupu k vědeckým publikacím a 
výzkumným datům je právně ošetřena v článku 29.2 a 29.3 
modelové grantové smlouvy. 
• Základní dokumenty k OA a datům: 
http://ec.europa.eu/research/participants/data/ref/h2020/grants_ 
manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf 
http://ec.europa.eu/research/participants/data/ref/h2020/grants_ 
manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
Horizon 2020 – kdo? 
Oblasti pilotu: 
• Future and Emerging Technologies 
• Research infrastructures – part e-Infrastructures 
• Leadership in enabling and industrial technologies – 
Information and Communication Technologies 
• Societal Challenge: Secure, Clean and Efficient Energy – part 
Smart cities and communities 
• Societal Challenge: Climate Action, Environment, Resource 
Efficiency and Raw materials – with the 
• exception of raw materials topics 
• Societal Challenge: Europe in a changing world – inclusive, 
innovative and reflective Societies 
• Science with and for Society 
Ostatní oblasti mohou dobrovolně
Horizon 2020 – kdo? 
Důvody pro vyvázání z podmínky: 
• Ochrana projektových výsledků 
• Povinnost mlčenlivosti 
• Projekty z oblasti bezpečnosti 
• Ochrana osobních údajů 
• Zpřístupnění konkrétních vědeckých dat (již vzniklých v projektu) 
– by ohrozilo dosažení hlavního cíle projektu podle popisu v 
Annexu I. 
– nezpřístupnění je popsáno a odůvodněno v Data Management 
Plan 
• Existuje-li jiný oprávněný důvod pro „opt-out“
Horizon 2020 – co? 
• Data která jsou nutná pro interpretaci 
výsledků u vědeckých publikací tzv. Underlying 
data 
• Ostatní data, která se vědecký tým rozhodne 
publikovat 
• Nutné publikovat vždy se souvisejícími 
metadaty
Horizon 2020 - postup 
• Povinnost uložit data v repozitáři 
• Povinnost přijmout opatření k tomu, aby třetí 
strany měly možnost bezplatného přístupu, 
využití, šíření a reprodukování těchto dat 
• Povinnost poskytnout informace o nástrojích 
a instrumentech - potřebné pro ověření 
výsledků 
(pokud je to možné, poskytnout tyto nástroje a 
instrumenty)
Horizon 2020 - DM 
• Všechny projekty v H2020 musejí obsahovat 
základní informace o data managementu ve svých 
přihláškách 
• Tyto informace poslouží pro evaluaci projektu 
pod kritériem „impact“ 
• Je třeba zodpovědět tyto základní dotazy: 
Jaká data budou v projektu generována a sbírána? 
Jaký standard bude na sběr použit? 
Jak budou data zveřejněna a sdílena? Pokud ne proč? 
Jak budou tyto data spravována a uchovávána?
Horizon 2020 - DMP 
• Pilotní projekty musí obsahovat Data 
Management Plan 
• Plán není částí přihlášky a neslouží k evaluaci 
• První verze do 6 měsíců od započetí projektu 
• Další verze v polovině projektu a v závěrečné 
zprávě
Horizon 2020 - obsah 
• Vzor DMP pro Horizon 2020 – Annex 1 - 
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h202 
0-hi-oa-data-mgt_en.pdf 
• Jednotlivé informace v DMP pro každý dataset: 
– Data set reference and name: základní popis a jméno datasetu 
– Data set description: popis dat, jejich původu, kde budou generována a sbírána. Kdo by je v 
budoucnu mohl využívat. Informace o tom zda existují nebo neexistují podobná data a možnosti je 
znovu využít. 
– Standards and metadata: odkazy na existující využitelné standardy popisu dat, pokud neexistují, 
návrh jak budou data metadatově popisována. 
– Data sharing: jak budou data sdílena – otevřeně nebo s nějakou restrikcí pro specifickou skupinu. 
Důvod proč popřípadě nemohou být sdílena. Popis přístupu k datům. Uvedené embargo, pokud 
existuje. Popsané technické mechanismy přístupu k datům, popřípadě speciální software. 
– Archiving and preservation (including storage and backup): kde budou data uložena, archivována a 
ochráněna (repozitář). Jak dlouho budou data uložena, jak se zařídí dlouhodobé uchování. Finální 
objem dat. Popis finančního a personálního zajištění.
Horizon 2020 - obsah 
• Více propracovaný DMP 
• Discoverable: jsou data snadno vyhledatelná – např. použitím 
jednoznačného identifikátoru DOI. 
• Accessible: jsou data snadno dostupná – kdo má práva, jaké jsou 
licence, jsou embarga? 
• Assessable and intelligible: jsou data a potřebný software snadno 
dostupný třetím stranám pro znovuvyužití, validaci, interpretaci? 
• Use beyond the original purpose for which it was collected: budou 
data dostupná a využitelná i v budoucnosti . Jednouché formáty, 
software, zajištěn upgrade. 
• Interoperable to specific quality standards: jsou data a software 
interoperabilní, byly použity standardizované formáty, formáty 
široce využívané, které se dají zaměnit nebo v průběhu času 
neztrácejí data.
Horizon 2020 - licencování 
EC doporučuje licence cc pro data: 
https://creativecommons.org/licenses/by/3.0/cz/ 
http://creativecommons.org/publicdomain/zero/1.0/
Horizon 2020 - příklad 
• Humbolt University: https://www.cms.hu-berlin. 
de/ueberblick/projekte/dataman/dmp-anleitung/ 
view
Kde? - Open data repozitáře 
Registry repozitářů: 
Registry of research data repozitories:http://www.re3data.org/ 
Databib: http://databib.org/ 
Velké datové repozitáře: 
Dryard:http://datadryad.org/ 
GitHub: https://github.com/ 
Zenodo https://zenodo.org/ 
Oborové 
http://oad.simmons.edu/oadwiki/Disciplinary_repositories 
https://www.libraries.psu.edu/psul/researchguides/pubcur/data_r 
esources.html#open-data
Situace na VUT 
Open Access a Horizon2020 
• Digitální knihovna VUT využitelná k naplnění podmínek publikování 
Open Access zelenou cestou u projektů Horizon2020. Veškeré info o 
vkládání článku do DK a OA: https://www.vutbr.cz/openaccess 
Open data na VUT a Horizon2020 
• Digitální knihovny VUT bude uzpůsobena k ukládání a zveřejňování 
vědeckých dat, dle požadavků projektů Horizon2020 – termín červenec 
až srpen 2015 
• Vytvoření vzoru DMP pro VUT, směrnice a dalších dokumentů 
• Základní informace k této oblasti lze nalézt na Portálu 
knihoven: https://www.vutbr.cz/knihovny/openaccess/projekty-eu. 
• Školení Data Management a vytvoření Data Management Plan. Školení 
je možné domluvit u p. Dědičové při účasti 5 a více účastníků.
Použitá literatura 
• CORTI, Louise. Managing and sharing research data: a guide to good practice. 1st pub. Los Angeles: SAGE, 2014, x, 
222 s. ISBN 978-1-4462-6726-4. 
• DIGITAL CURATION CENTRE. How to Develop a Data Management and Sharing Plan. dcc.ac.uk [online]. © 2004- 
2014 DCC [cit. 7-11-2014]. Dostupné z: http://www.dcc.ac.uk/resources/how-guides/develop-data-plan 
• DONNELLY, M. Facilitate Open Science Training for Europena Researcher [online]. 22 October 2014 [cit. 7-11-2014]. 
Dostupné z: https://www.fosteropenscience.eu/sites/default/files/pdf/259.pdf 
• JONES, S. The Horizon 2020 Open Data Pilot [online]. 21 October 2014 [cit. 7-11-2014]. Dostupné z: 
https://www.fosteropenscience.eu/project/images/presentations/H2020-open-data-pilot.pdf 
• KRATĚNOVÁ, J. Otevřený přístup k vědeckým informacím v Horizontu 2020 [online]. 06.05.2014, Sychrov [cit. 7-11- 
2014]. Dostupné z: http://slideplayer.cz/slide/1976078/ 
• ROZENBERG, D. Research Data Management Services at Royal Holloway [online]. 22 October 2014 [cit. 7-11-2014]. 
Dostupné z: https://www.fosteropenscience.eu/sites/default/files/pdf/257.pdf 
• ŠVÁSTOVÁ, P. Digital Curation [online]. 14.5.2014 MZK Brno [cit. 7-11-2014]. Dostupné z: 
http://www.slideshare.net/pavluskas/digital-curation-34938289 
• UK.DATA ARCHIVE. Create and Manage data. Data-archive.ac.uk [online]. © Copyright 2002-2014 University of 
Essex. All rights reserved [cit. 7-11-2014]. Dostupné z: http://www.data-archive.ac.uk/create-manage/copyright 
• VŠB – TECHNICKÁ UNIVERIZTA OSTRAVA. Opetvřený přístup povinný v programu Horizont 2020. e-zdroje.vsb.cz 
[online]. 17.3.2014 [ cit. 7-11-2014]. Dostupné z: http://e-zdroje.vsb.cz/otevreny-pristup-povinny-v-programu-horizont- 
2020/

More Related Content

Similar to Data management a jak psát data management plan

Mapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil KrčMapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil Krčkamilkrc
 
Mapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil KrčMapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil KrčKamil Krč
 
DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"Andrea Fojtu
 
Digital curation
Digital curationDigital curation
Digital curationpavluskas
 
LTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CRLTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CRdp-blog-cz
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Martin Bém
 
Jan Hutař - Dlouhodobá ochrana digitálních informací v Národním archivu na N...
Jan Hutař - Dlouhodobá ochrana digitálních informací  v Národním archivu na N...Jan Hutař - Dlouhodobá ochrana digitálních informací  v Národním archivu na N...
Jan Hutař - Dlouhodobá ochrana digitálních informací v Národním archivu na N...dp-blog-cz
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový skladProfinit
 
Výzkum a inovace
Výzkum a inovaceVýzkum a inovace
Výzkum a inovaceAdamHazdra
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematicadp-blog-cz
 
Marek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem ArchivematicaMarek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem ArchivematicaLTP-portal-cz
 
04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptxMagdalnaBohuslavov
 
Otevrene problemy architektury elektronickeho zdravotnictvi
Otevrene problemy architektury elektronickeho zdravotnictviOtevrene problemy architektury elektronickeho zdravotnictvi
Otevrene problemy architektury elektronickeho zdravotnictviMartin Necasky
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...ÚISK FF UK
 
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.Data Governance a datová kvalita v roce 2017. Příprava na GDPR.
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.Profinit
 

Similar to Data management a jak psát data management plan (20)

Mapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil KrčMapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil Krč
 
Mapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil KrčMapování zdrojů univerzity - Kamil Krč
Mapování zdrojů univerzity - Kamil Krč
 
DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"DSA a jiné možnosti "self-auditu"
DSA a jiné možnosti "self-auditu"
 
Otevřená data a kam s nimi
Otevřená data a kam s nimiOtevřená data a kam s nimi
Otevřená data a kam s nimi
 
Digital curation
Digital curationDigital curation
Digital curation
 
05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx
 
LTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CRLTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CR
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
 
Jan Hutař - Dlouhodobá ochrana digitálních informací v Národním archivu na N...
Jan Hutař - Dlouhodobá ochrana digitálních informací  v Národním archivu na N...Jan Hutař - Dlouhodobá ochrana digitálních informací  v Národním archivu na N...
Jan Hutař - Dlouhodobá ochrana digitálních informací v Národním archivu na N...
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový sklad
 
Výzkum a inovace
Výzkum a inovaceVýzkum a inovace
Výzkum a inovace
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematica
 
Marek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem ArchivematicaMarek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem Archivematica
 
02 OAIS.pptx
02 OAIS.pptx02 OAIS.pptx
02 OAIS.pptx
 
TNPW2-2014-01
TNPW2-2014-01TNPW2-2014-01
TNPW2-2014-01
 
04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx
 
Otevrene problemy architektury elektronickeho zdravotnictvi
Otevrene problemy architektury elektronickeho zdravotnictviOtevrene problemy architektury elektronickeho zdravotnictvi
Otevrene problemy architektury elektronickeho zdravotnictvi
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
 
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.Data Governance a datová kvalita v roce 2017. Příprava na GDPR.
Data Governance a datová kvalita v roce 2017. Příprava na GDPR.
 
TNPW2-2016-01
TNPW2-2016-01TNPW2-2016-01
TNPW2-2016-01
 

More from Ustredni knihovna VUT

More from Ustredni knihovna VUT (14)

Jak na otevřené publikování - VUT v Brně
Jak na otevřené publikování - VUT v BrněJak na otevřené publikování - VUT v Brně
Jak na otevřené publikování - VUT v Brně
 
Publikuj nebo zhyň - FAST
Publikuj nebo zhyň - FASTPublikuj nebo zhyň - FAST
Publikuj nebo zhyň - FAST
 
Kafe - USI
Kafe - USIKafe - USI
Kafe - USI
 
Emerald a publikovani 2014
Emerald a publikovani 2014Emerald a publikovani 2014
Emerald a publikovani 2014
 
Citační analýza, aneb kdo mě cituje?
Citační analýza, aneb kdo mě cituje?Citační analýza, aneb kdo mě cituje?
Citační analýza, aneb kdo mě cituje?
 
OBJEVTE MOŽNOSTI PUBLIKOVÁNÍ S VYDAVATELSTVÍM IEEE - by ESZTER LUKACS
OBJEVTE MOŽNOSTI PUBLIKOVÁNÍ S VYDAVATELSTVÍM IEEE - by ESZTER LUKACSOBJEVTE MOŽNOSTI PUBLIKOVÁNÍ S VYDAVATELSTVÍM IEEE - by ESZTER LUKACS
OBJEVTE MOŽNOSTI PUBLIKOVÁNÍ S VYDAVATELSTVÍM IEEE - by ESZTER LUKACS
 
Kafe FA
Kafe FAKafe FA
Kafe FA
 
OA dotace-final
OA dotace-finalOA dotace-final
OA dotace-final
 
Publikační proces a Open Access
Publikační proces a Open AccessPublikační proces a Open Access
Publikační proces a Open Access
 
Kdo mě cituje - FAST
Kdo mě cituje - FASTKdo mě cituje - FAST
Kdo mě cituje - FAST
 
Patenty
PatentyPatenty
Patenty
 
DATABÁZE EMERALD A PUBLIKOVÁNÍM VE SVĚTOVÝCH ODBORNÝCH ČASOPISECH
DATABÁZE EMERALD A PUBLIKOVÁNÍM VE SVĚTOVÝCH ODBORNÝCH ČASOPISECHDATABÁZE EMERALD A PUBLIKOVÁNÍM VE SVĚTOVÝCH ODBORNÝCH ČASOPISECH
DATABÁZE EMERALD A PUBLIKOVÁNÍM VE SVĚTOVÝCH ODBORNÝCH ČASOPISECH
 
Kafe FSI
Kafe FSIKafe FSI
Kafe FSI
 
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIElektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSI
 

Data management a jak psát data management plan

  • 1. Data management a jak psát data management plan (DMP) Petra Dědičová Ústřední knihovna VUT dedicova@lib.vutbr.cz
  • 2. Obsah • Vysvětlení základních pojmů • Data management – proč a kdo • DMP – struktura, příklady, nástroje • Požadavky poskytovatelů - Horizon 2020
  • 3. Vědecká data - definice „Výzkumná data jsou zaznamenané informace (bez ohledu na formu a médium) nezbytné pro podporu nebo validaci pozorování, závěrů nebo výstupů výzkumu. Efektivní a účinná správa výzkumných dat je základem vědecké a akademické integrity. (Engineering and Physical Sciences Research Council: policy framework on research data) Za vědecká data se dají považovat: • Primární data získaná z přístrojů • Sekundární data: dokumenty, tabulky, databáze, laboratorní protokoly, vizualisace, modely, software, obrázky, měření výpočty aj.
  • 4. Data management - definice Je aktivní správa a zhodnocení dat během jejich životního cyklu. (Engineering and Physical Sciences Research Council policy framework on research data) Pod pojmeme si představíme všechny prkatiky, manipulace, vylepšení a procesy, které zajistí vysokou kvalitu vědeckých dat, která jsou dobře zorganizována, zdokumentována, uložena, udržitelně uchovávána, dostupná a znovuvyužitelná.(Corti, 2014) Zahrnuje aktivity: plánování a popisu práce s daty, popis dat, uložení během výzkumu a po jeho uzavření, případné zveřejnění dat a prolinkování na publikace vztahující se k výzkumu.
  • 5. DMP - definice • DMPlanning - je proces plánování, popisu a informování o životním cyklu dat a činností spojených s jejich správou v průběhu výzkumu. • DMPlan – je dokument, který popisuje tyto činnosti. Dokumenty často vyžadují poskytovatelé dotací či grantů.
  • 6. Open data - definice Jsou data, která jsou volně dostupná pro kohokoliv na internetu a dále vytěžována, využívána, reprodukována a šířena. • Navazuje na tradici Open Access • Hlavní oblastí tzv. government data, ale nyní i scinetific data • Nové využití tzv. citizen science (např. Zooniverse)
  • 7. Data management – Proč? • Transparentnost • Efektivita • Řízení rizika • Uchování • Splnění grantových požadavků
  • 8. Data management – Proč? Také pro vás! • Organizace dat • Fluktuace zaměstnanců/vědců • Neduplikování činnosti
  • 9. Open data – Proč? • Validace vašich výsledků – případ • Možnosti nových objevů - případ • Vyšší citovanost – studie
  • 10. Životní cyklus dat Zdroj: http://www.data-archive.ac.uk/create-manage/life-cycle
  • 11. Životní cyklus dat – případová studie Naplánování výzkumu. Souhlas účastníku s primárním užitím dat. Účastníci si píší deníky. Nahrávky rozhovorů. Přepis rozhovorů. Přepis deníků. Zpracování dat pro výzkum. Uchovávání dat diskutováno s účastníky. Souhlas účastníků s uchováváním dat. Přepisy a nahrávky uloženy do Data Archive UK. Vytvořen katalogizační záznam a návod pro uživatele. Data znovu využita v nové studii. Data zveřejněna. Zdroj: Corti, 2014, str.21
  • 12. Data Management – kdo? • Vědci –tvůrci dat • IT – technické zajištění sběru a uchování • Právníci – etické a právní otázky • Knihovníci – popis dat, uchování, sdílení • Projektový manažeři – podmínky daných projektů • Nakladatelé a poskytovatelé grantů – dávají požadavky
  • 13. Data Management Plan - obsah • U každého poskytovatele může být odlišné zadání. • Základ by však měl být stejný: http://www.dcc.ac.uk/resources/data-management- plans/checklist
  • 14. Data Management Plan – základní oblasti • Typy, formáty, standardy dat a metody jejich sběru • Etické standardy a právní stránka • Přístup, sdílení a znovu užití dat • Krátkodobé uchování a data management • Dlouhodobé uchování • Zajištění zdrojů
  • 15. DMP - Typy, formáty, standardy dat a metody jejich sběru • Jaká data budete váš výzkum produkovat? (formáty, typ, objem, obsah, kvalita) Doporučené formáty pro dlouhodobé uchovávání: – Formáty široce používaných software (MS Word, rtf, MS Excel, SPSS) – Otevřené formáty (PDF/A, CSV, TIFF, ODF, ASCII, tabel-delimited format, comma-separated values, XML)
  • 16. DMP - Typy, formáty, standardy dat a metody jejich sběru • Jak bude třeba data popsat? (jména a struktura souborů, metadatové a přílohové materiály ke správné interpretaci) Pojmenování souborů – Používejte konzistentně a všichni v projektu – Mělo by obsahovat tyto elementy: zkratku projektu, popis obsahu, informaci o typu dokumentu, datum, iniciály tvůrce, číslo verze, status např. draft nebo final – Např. FG1_CONS_12-02-2010.rtf (přepis rozhovorů first focus group with consumers konaných dne 12.02.2012)
  • 17. DMP - Typy, formáty, standardy dat a metody jejich sběru • Jaké standardy a metodologie bude třeba použít při sběru dat? (má instituce nějaké standardy, poskytovatel, metadatové standardy apod.)
  • 18. DMP - Etické standardy a právo • Ochrana osobních dat • Bezpečnost (utajované informace) • Dodržování základních lidských práv • Komerční a průmyslové využití dat • Autorské a majetkové právo Další info.: http://www.h2020.cz/cs/storage/e38c919be0564a5290b5b0d84db1a977c17 5d51c?uid=e38c919be0564a5290b5b0d84db1a977c175d51c
  • 19. DMP - Přístup, sdílení a znovu užití dat • Kdo a pro jaké účely využije vaše data? • Jak data zpřístupníte? (kde, jak budou vyhledatelná, kdy) • Jak budete data licencovat? (za jakých podmínek je může někdo využít, licence Creative Commons)
  • 20. DMP - Krátkodobé uchování a data management • Bezpečnost a uchování (kde se budou data ukládat, jaká forma ukládání, je možné data uložit i mimo instituci, jak je zajištěna jejich bezpečnost, kdo kontroluje jejich kvalitu) • Přidělení rolí (kdo má za co odpovědnost)
  • 21. DMP - Dlouhodobé uchování • Která data jsou vhodná pro dlouhodobé uchování? (http://www.dcc.ac.uk/resources/how-guides/ appraise-select-data, u většiny projektů se jedná hlavně o data doplňující publikační činnost) • Jak a kde budete data uchovávat? (strojově čitelná podoba metadat, dlouhodobý přístupu, linkování)
  • 22. DPM – zajištění zdrojů • Finančních • Personálních • Pomůcka pro vytváření rozpočtu: http://www.data-archive. ac.uk/media/247429/costingtool.pdf
  • 23. DMP dobrá praxe • Napište si DMP • Vytvářejte zálohy. Pomůcka automatická synchronizace např. Dropbox (pouze pro necitlivá data ). • Popisujte data již při sběru. Kvalita metadat klesá s časem. Uživatelé i vy v budoucnu budete snadněji rozumět svým datům. • Ukládejte data v otevřených formátech, kdykoliv je to možné. Pro popis používejte standardizovanou metadatovou strukturu. • Ukládejte svá data v datových centrech a repozitářích. Odkazujte na ně ve svých publikacích.
  • 24. DMP - příklady • USA: https://dmptool.org/public_dmps • Rural Economy and Land Use (Relu): http://relu.data-archive.ac.uk/data-sharing/ planning/examples • Yale: http://ydc2.yale.edu/documentation/data-management- plan-examples • Další: http://www.dcc.ac.uk/resources/data-management- plans/guidance-examples
  • 25. DMP - online nástroje • DMP tool: https://dmptool.org/ • DMP online: http://www.dcc.ac.uk/dmponline
  • 26. DMP - kurzy • Univerzity of Edinburgh: http://datalib.edina.ac.uk/mantra/ • University of Minnesota: https://sites.google.com/a/umn.edu/data-management- course_structures/home-1
  • 27. Požadavky poskytovatelů Zdroj: http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
  • 28. Požadavky poskytovatelů • US: https://dmptool.org/guidance • Nakladatelé: Plos, BioMed Central, Nature publishing, Elsevier a další • Evropská komise - Horizon 2020
  • 29. Horizon 2020 – proč? • dlouhodobá podpora Open Access přístupu (FP7 program, podpůrná infrastruktura OpenAIRE plus, Horizon 2020) • Open data další krok (Horizon 2020 – open data pilot) • Povinnost otevřeného přístupu k vědeckým publikacím a výzkumným datům je právně ošetřena v článku 29.2 a 29.3 modelové grantové smlouvy. • Základní dokumenty k OA a datům: http://ec.europa.eu/research/participants/data/ref/h2020/grants_ manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf http://ec.europa.eu/research/participants/data/ref/h2020/grants_ manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
  • 30. Horizon 2020 – kdo? Oblasti pilotu: • Future and Emerging Technologies • Research infrastructures – part e-Infrastructures • Leadership in enabling and industrial technologies – Information and Communication Technologies • Societal Challenge: Secure, Clean and Efficient Energy – part Smart cities and communities • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – with the • exception of raw materials topics • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies • Science with and for Society Ostatní oblasti mohou dobrovolně
  • 31. Horizon 2020 – kdo? Důvody pro vyvázání z podmínky: • Ochrana projektových výsledků • Povinnost mlčenlivosti • Projekty z oblasti bezpečnosti • Ochrana osobních údajů • Zpřístupnění konkrétních vědeckých dat (již vzniklých v projektu) – by ohrozilo dosažení hlavního cíle projektu podle popisu v Annexu I. – nezpřístupnění je popsáno a odůvodněno v Data Management Plan • Existuje-li jiný oprávněný důvod pro „opt-out“
  • 32. Horizon 2020 – co? • Data která jsou nutná pro interpretaci výsledků u vědeckých publikací tzv. Underlying data • Ostatní data, která se vědecký tým rozhodne publikovat • Nutné publikovat vždy se souvisejícími metadaty
  • 33. Horizon 2020 - postup • Povinnost uložit data v repozitáři • Povinnost přijmout opatření k tomu, aby třetí strany měly možnost bezplatného přístupu, využití, šíření a reprodukování těchto dat • Povinnost poskytnout informace o nástrojích a instrumentech - potřebné pro ověření výsledků (pokud je to možné, poskytnout tyto nástroje a instrumenty)
  • 34. Horizon 2020 - DM • Všechny projekty v H2020 musejí obsahovat základní informace o data managementu ve svých přihláškách • Tyto informace poslouží pro evaluaci projektu pod kritériem „impact“ • Je třeba zodpovědět tyto základní dotazy: Jaká data budou v projektu generována a sbírána? Jaký standard bude na sběr použit? Jak budou data zveřejněna a sdílena? Pokud ne proč? Jak budou tyto data spravována a uchovávána?
  • 35. Horizon 2020 - DMP • Pilotní projekty musí obsahovat Data Management Plan • Plán není částí přihlášky a neslouží k evaluaci • První verze do 6 měsíců od započetí projektu • Další verze v polovině projektu a v závěrečné zprávě
  • 36. Horizon 2020 - obsah • Vzor DMP pro Horizon 2020 – Annex 1 - http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h202 0-hi-oa-data-mgt_en.pdf • Jednotlivé informace v DMP pro každý dataset: – Data set reference and name: základní popis a jméno datasetu – Data set description: popis dat, jejich původu, kde budou generována a sbírána. Kdo by je v budoucnu mohl využívat. Informace o tom zda existují nebo neexistují podobná data a možnosti je znovu využít. – Standards and metadata: odkazy na existující využitelné standardy popisu dat, pokud neexistují, návrh jak budou data metadatově popisována. – Data sharing: jak budou data sdílena – otevřeně nebo s nějakou restrikcí pro specifickou skupinu. Důvod proč popřípadě nemohou být sdílena. Popis přístupu k datům. Uvedené embargo, pokud existuje. Popsané technické mechanismy přístupu k datům, popřípadě speciální software. – Archiving and preservation (including storage and backup): kde budou data uložena, archivována a ochráněna (repozitář). Jak dlouho budou data uložena, jak se zařídí dlouhodobé uchování. Finální objem dat. Popis finančního a personálního zajištění.
  • 37. Horizon 2020 - obsah • Více propracovaný DMP • Discoverable: jsou data snadno vyhledatelná – např. použitím jednoznačného identifikátoru DOI. • Accessible: jsou data snadno dostupná – kdo má práva, jaké jsou licence, jsou embarga? • Assessable and intelligible: jsou data a potřebný software snadno dostupný třetím stranám pro znovuvyužití, validaci, interpretaci? • Use beyond the original purpose for which it was collected: budou data dostupná a využitelná i v budoucnosti . Jednouché formáty, software, zajištěn upgrade. • Interoperable to specific quality standards: jsou data a software interoperabilní, byly použity standardizované formáty, formáty široce využívané, které se dají zaměnit nebo v průběhu času neztrácejí data.
  • 38. Horizon 2020 - licencování EC doporučuje licence cc pro data: https://creativecommons.org/licenses/by/3.0/cz/ http://creativecommons.org/publicdomain/zero/1.0/
  • 39. Horizon 2020 - příklad • Humbolt University: https://www.cms.hu-berlin. de/ueberblick/projekte/dataman/dmp-anleitung/ view
  • 40. Kde? - Open data repozitáře Registry repozitářů: Registry of research data repozitories:http://www.re3data.org/ Databib: http://databib.org/ Velké datové repozitáře: Dryard:http://datadryad.org/ GitHub: https://github.com/ Zenodo https://zenodo.org/ Oborové http://oad.simmons.edu/oadwiki/Disciplinary_repositories https://www.libraries.psu.edu/psul/researchguides/pubcur/data_r esources.html#open-data
  • 41. Situace na VUT Open Access a Horizon2020 • Digitální knihovna VUT využitelná k naplnění podmínek publikování Open Access zelenou cestou u projektů Horizon2020. Veškeré info o vkládání článku do DK a OA: https://www.vutbr.cz/openaccess Open data na VUT a Horizon2020 • Digitální knihovny VUT bude uzpůsobena k ukládání a zveřejňování vědeckých dat, dle požadavků projektů Horizon2020 – termín červenec až srpen 2015 • Vytvoření vzoru DMP pro VUT, směrnice a dalších dokumentů • Základní informace k této oblasti lze nalézt na Portálu knihoven: https://www.vutbr.cz/knihovny/openaccess/projekty-eu. • Školení Data Management a vytvoření Data Management Plan. Školení je možné domluvit u p. Dědičové při účasti 5 a více účastníků.
  • 42. Použitá literatura • CORTI, Louise. Managing and sharing research data: a guide to good practice. 1st pub. Los Angeles: SAGE, 2014, x, 222 s. ISBN 978-1-4462-6726-4. • DIGITAL CURATION CENTRE. How to Develop a Data Management and Sharing Plan. dcc.ac.uk [online]. © 2004- 2014 DCC [cit. 7-11-2014]. Dostupné z: http://www.dcc.ac.uk/resources/how-guides/develop-data-plan • DONNELLY, M. Facilitate Open Science Training for Europena Researcher [online]. 22 October 2014 [cit. 7-11-2014]. Dostupné z: https://www.fosteropenscience.eu/sites/default/files/pdf/259.pdf • JONES, S. The Horizon 2020 Open Data Pilot [online]. 21 October 2014 [cit. 7-11-2014]. Dostupné z: https://www.fosteropenscience.eu/project/images/presentations/H2020-open-data-pilot.pdf • KRATĚNOVÁ, J. Otevřený přístup k vědeckým informacím v Horizontu 2020 [online]. 06.05.2014, Sychrov [cit. 7-11- 2014]. Dostupné z: http://slideplayer.cz/slide/1976078/ • ROZENBERG, D. Research Data Management Services at Royal Holloway [online]. 22 October 2014 [cit. 7-11-2014]. Dostupné z: https://www.fosteropenscience.eu/sites/default/files/pdf/257.pdf • ŠVÁSTOVÁ, P. Digital Curation [online]. 14.5.2014 MZK Brno [cit. 7-11-2014]. Dostupné z: http://www.slideshare.net/pavluskas/digital-curation-34938289 • UK.DATA ARCHIVE. Create and Manage data. Data-archive.ac.uk [online]. © Copyright 2002-2014 University of Essex. All rights reserved [cit. 7-11-2014]. Dostupné z: http://www.data-archive.ac.uk/create-manage/copyright • VŠB – TECHNICKÁ UNIVERIZTA OSTRAVA. Opetvřený přístup povinný v programu Horizont 2020. e-zdroje.vsb.cz [online]. 17.3.2014 [ cit. 7-11-2014]. Dostupné z: http://e-zdroje.vsb.cz/otevreny-pristup-povinny-v-programu-horizont- 2020/