V zájmu vědecké komunity a veřejnosti jsou kromě otevřeného přístupu k plným textům také mimo jiné otevřená data. Tzv. Open Data zefektivňují nejen výměnu informací a šetří finance, ale umožňují také větší transparentnost ve vědecké komunikaci. Otevřená data se v posledních několika letech stávají trendem, který se rozmáhá napříč jednotlivými vědeckými obory. Příspěvek se zaměří na představení iniciativy k otevřeným datům, představí termín Enhanced publication a především ukáže příklady vybraných datových repozitářů.
The scientific community and general public is not only interested in Open Access to the fulltexts but also in Open Data. Open Data enhance the information transfer, save money and increase the transparency of scientific communication. Lately Open Data have become a trend across many research fields. The paper aims to present the Open Data initiative, Enhanced publication term and also present examples of data repositories.
Tutoriál : Otevřená a propojitelná data veřejné správyMartin Necasky
Slajdy k tutoriálu, který proběhl v rámci semináře České společnosti pro systémovou integraci dne 6.6.2014. Popisuje co jsou otevřená propojitelná data (Linked Open Data) a jak s nimi můžeme pracovat (postupy, návody, nástroje).
V zájmu vědecké komunity a veřejnosti jsou kromě otevřeného přístupu k plným textům také mimo jiné otevřená data. Tzv. Open Data zefektivňují nejen výměnu informací a šetří finance, ale umožňují také větší transparentnost ve vědecké komunikaci. Otevřená data se v posledních několika letech stávají trendem, který se rozmáhá napříč jednotlivými vědeckými obory. Příspěvek se zaměří na představení iniciativy k otevřeným datům, představí termín Enhanced publication a především ukáže příklady vybraných datových repozitářů.
The scientific community and general public is not only interested in Open Access to the fulltexts but also in Open Data. Open Data enhance the information transfer, save money and increase the transparency of scientific communication. Lately Open Data have become a trend across many research fields. The paper aims to present the Open Data initiative, Enhanced publication term and also present examples of data repositories.
Tutoriál : Otevřená a propojitelná data veřejné správyMartin Necasky
Slajdy k tutoriálu, který proběhl v rámci semináře České společnosti pro systémovou integraci dne 6.6.2014. Popisuje co jsou otevřená propojitelná data (Linked Open Data) a jak s nimi můžeme pracovat (postupy, návody, nástroje).
Vysledek souteze o navrh hospodarneho a funkcniho elektronickeho zdravotnictviMartin Necasky
Prezentace ze semináře pořádaného Ministerstvem zdravotnictví ČR k soutěži o návrh podoby budoucího elektronického zdravotnictví. V prezentaci se zaměřuji především na otázky softwarové architektury pro elektronickou výměnu zdravotnické dokumentace.
Prezentace k projektu LTP Pilot, který má v ČR otestovat systém Archivematica. Projekt pořádá knihovna MUNI, MZK, a spolupracuje na něm i DU CESNET a možná i knihovna AV CR.
Cílem prezentace bylo podat přehledovou informaci o oblasti Digital preservation
Prezentace o použití výzkumu ve službách na KISK FF Masarykova univerzita Brno 21.10.2011. --- Presentation on research for innovation at Masaryk University in October 2011.
Marek Melichar - Zkušenosti se systémem ArchivematicaLTP-portal-cz
Marek Melichar se ve své prezentaci nejprve věnuje problematice digital preservation a poté shrnuje klady a zápory systému Archivematica, které byly zjištěny během testování v rámci projektu LTP-pilot.
Správné nastavení přístupu k datům, reportingu a datovým analýzám dává často firmám konkurenční výhodu. Jak moderní BI nástroje mohou pomoci firmám rychle a správně porozumět datům a na základě toho řídit svůj business?
Poznámka: Prezentace je psána česky.
A “disruptive BI” – How modern BI tools allow companies to understand and manage their business based on facts fast and at a fraction of the cost traditional BI projects cost.
Note: This presentation is written in Czech language.
Note: Presentation is written in Czech.
Přehled trendů, hlavních hráčů světového výzkumu trhu a poznámky k situaci v České republice. Prezentace SIMAR pro studenty předmětu Propedeutika sociologických výzkumů.
Prezentace ze semináře o Open Access na VUT v Brně - základní rozdělení, možnost zelené cesty - institucionálního repozitáře (Digtální knihovna VUT) a zlaté cesty - Fond na podporu publikování v režimu Open Access
Vysledek souteze o navrh hospodarneho a funkcniho elektronickeho zdravotnictviMartin Necasky
Prezentace ze semináře pořádaného Ministerstvem zdravotnictví ČR k soutěži o návrh podoby budoucího elektronického zdravotnictví. V prezentaci se zaměřuji především na otázky softwarové architektury pro elektronickou výměnu zdravotnické dokumentace.
Prezentace k projektu LTP Pilot, který má v ČR otestovat systém Archivematica. Projekt pořádá knihovna MUNI, MZK, a spolupracuje na něm i DU CESNET a možná i knihovna AV CR.
Cílem prezentace bylo podat přehledovou informaci o oblasti Digital preservation
Prezentace o použití výzkumu ve službách na KISK FF Masarykova univerzita Brno 21.10.2011. --- Presentation on research for innovation at Masaryk University in October 2011.
Marek Melichar - Zkušenosti se systémem ArchivematicaLTP-portal-cz
Marek Melichar se ve své prezentaci nejprve věnuje problematice digital preservation a poté shrnuje klady a zápory systému Archivematica, které byly zjištěny během testování v rámci projektu LTP-pilot.
Správné nastavení přístupu k datům, reportingu a datovým analýzám dává často firmám konkurenční výhodu. Jak moderní BI nástroje mohou pomoci firmám rychle a správně porozumět datům a na základě toho řídit svůj business?
Poznámka: Prezentace je psána česky.
A “disruptive BI” – How modern BI tools allow companies to understand and manage their business based on facts fast and at a fraction of the cost traditional BI projects cost.
Note: This presentation is written in Czech language.
Note: Presentation is written in Czech.
Přehled trendů, hlavních hráčů světového výzkumu trhu a poznámky k situaci v České republice. Prezentace SIMAR pro studenty předmětu Propedeutika sociologických výzkumů.
Prezentace ze semináře o Open Access na VUT v Brně - základní rozdělení, možnost zelené cesty - institucionálního repozitáře (Digtální knihovna VUT) a zlaté cesty - Fond na podporu publikování v režimu Open Access
OBJEVTE MOŽNOSTI PUBLIKOVÁNÍ S VYDAVATELSTVÍM IEEE - by ESZTER LUKACSUstredni knihovna VUT
About IEEE Xplore Digital Library, Why publish with IEEE, Publish in journal or conference, Find the right IEEE publication, Paper structure, Ethics, Open Access, Review process,
3. Co byste si dnes měli odnést
1. Více jistoty v práci s vědeckými daty a v jejich organizaci
2. Základní návody na DMP
3. Odkazy na existující zdroje informací o této oblasti
Odkaz na prezentaci:
http://bit.ly/dataDMPVUT2
5. Co můžou být data
Výzkumná data jsou zaznamenané informace (bez ohledu na formu a médium)
nezbytné pro podporu nebo validaci pozorování, závěrů nebo výstupů výzkumu.
Efektivní a účinná správa výzkumných dat je základem vědecké a
akademické integrity. (Engineering and Physical Sciences Research Council:
policy framework on research data)
Za vědecká data se dají považovat:
• Primární data získaná z přístrojů
• Sekundární data: dokumenty, tabulky, databáze,
laboratorní protokoly, vizualisace, modely, software,
obrázky, videa, dotazníky, měření, výpočty aj.
6. Data management - definice
Je aktivní správa a zhodnocení dat během jejich životního cyklu.
(Engineering and Physical Sciences Research Council policy framework
on research data).
Pod pojmem si představíme všechny praktiky, manipulace,
vylepšení a procesy, které zajistí vysokou kvalitu vědeckých dat,
která jsou dobře zorganizována, zdokumentována, uložena, udržitelně
uchovávána, dostupná a znovuvyužitelná.(Corti, 2014)
Zahrnuje aktivity: plánování a popisu práce s daty, popis dat, uložení během
výzkumu a po jeho uzavření, případné zveřejnění dat a prolinkování na
publikace vztahující se k výzkumu.
7. DMP - definice
DMPlanning - je proces plánování, popisu a informování o
životním cyklu dat a činností spojených s jejich správou
v průběhu výzkumu.
DMPlan – je dokument, který popisuje tyto činnosti.
Dokumenty často vyžadují poskytovatelé dotací či grantů.
8. Open data - definice
Otevřená výzkumná data jsou zejména data v digitální podobě
pocházející z výzkumných projektů (z experimentů, šetření a měření,
to včetně tzv. metadat [dat, která poskytují informaci o jiných datech]
a podrobností o zpracování dat) dostupná bez omezení online všem potenciálním
uživatelům. Otevřený přístup k výzkumným datům zahrnuje možnost data
volně používat, upravovat a sdílet kýmkoli k jakémukoli účelu.
(NÁRODNÍ STRATEGIE OTEVŘENÉHO PŘÍSTUPU ČR K VĚDECKÝM INFORMACÍM
NA LÉTA 2017–2020)
• Navazuje na tradici Open Access
• Hlavní oblasti: data veřejného sektoru a vědecká data
• Nové využití tzv. citizen science (např. Zooniverse)
10. Data management – Proč?
• Efektivita
• Řízení rizika
• Transparentnost
• Uchování
• Splnění grantových požadavků
11. Data management – Proč?
Také pro vás!
• Organizace dat
• Fluktuace zaměstnanců/vědců
• Neduplikování činnosti
Video - Jak předejít chybám
Zdroj: Peter Murray-Rust, http://blogs.ch.cam.ac.uk/pmr/2011/08/01/why-you-need-a-data-management-plan/, August 2011, CC-BY
12. Data management – Co?
Je třeba si ujasnit jaká vědecká data:
• data produkovaná během výzkumu
• data pro krátkodobé uložení
• data pro dlouhodobé uložení
Pomůcka: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-
what-data-keep
13. Data management – krátkodobé uchování
Bezpečnost a uchování
(kde se budou data ukládat, jaká forma ukládání, je možné data uložit i
mimo instituci, jak je zajištěna jejich bezpečnost)
Přidělení rolí
(kdo má za co odpovědnost, kdo ukládá, kontroluje zálohy, kdo
kontroluje jejich kvalitu, kdo zajišťuje zveřejnění)
14. Krátkodobé uchování– kde
• Institucionální uložiště – projektové servery, fakultní, ústavu, laboratoře
apod.
• Externí disky – osobní externí disk, projektový apod.
• Cloud uložiště na VUT (neomezené)
Google Apps https://sites.google.com/a/vutbr.cz/help/napovedy/drive Office365 disk
OneDrive https://www.vutbr.cz/cvis/office-365/disk-(onedrive)
• Cloud uložiště mimo VUT
CESNET https://www.cesnet.cz/sluzby/owncloud/ (100GB)
Dropbox https://www.dropbox.com (3TB)
Nejméně dvě uložiště na dvou různých místech!
Nutné hlídat aktualizace!
15. Data management – dlouhodobé uchovávání
• Která data jsou vhodná pro dlouhodobé uchování?
(http://www.dcc.ac.uk/resources/how-guides/appraise-select-data)
16. Data management – metadata, dokumentace,
kontrola kvality
• Jak budete data uchovávat, jak popsat?
(strojově čitelná podoba metadat, linkování, přílohové materiály ke správné
správné interpretaci)
• Jaké standardy a metodologie bude třeba použít při sběru dat?
(má instituce nějaké standardy, poskytovatel, metadatové standardy apod.)
17. Data management – formát
https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats
18. Data management – pojmenování
• Použijte všeobecně srozumitelná pojmenování, která popisují obsah
souboru – ne moc dlouhá
• Konzistentní velká a malá písmena (temp, Temp, TEMP)
• Standardizované zkratky (států, oborů apod.)
• Použijte datum nebo verzi
https://www.data.cam.ac.uk/files/gdl_tilsdocnaming_v1_20090612.pdf
19. Sdílení open research dat– Proč a Co?
• Validace vašich výsledků – případ
• Možnosti nových objevů - případ
• Vyšší citovanost – studie
Zvážit:
Kdo a pro jaké účely využije vaše data?
Jak data zpřístupníte?
Kde, jak budou vyhledatelná, kdy je zpřístupníte?
20. Sdílení open research dat – kdo?
• Vědci –tvůrci dat
• IT – technické zajištění sběru a uchování
• Právníci – etické a právní otázky
• Knihovníci – popis dat, uchování, sdílení
• Projektový manažeři – podmínky daných projektů
• Nakladatelé a poskytovatelé grantů – dávají požadavky
21. Sdílení open research dat – etické standardy a
právo
• Ochrana osobních dat, GDPR
• Bezpečnost (utajované informace)
• Dodržování základních lidských práv
• Komerční a průmyslové využití dat
• Autorské a majetkové právo
Další info.:
http://www.h2020.cz/cs/storage/e38c919be0564a5290b5b0d84db1a977c175d51c?uid=e38c919be
0564a5290b5b0d84db1a977c175d51c
nebo
https://www.fosteropenscience.eu/node/2330
22. Sdílení open research dat – autorské právo
Jak budete data licencovat?
Za jakých podmínek je může někdo využít.
• http://www.dcc.ac.uk/resources/how-guides/license-research-data
• licence Creative Commons
23. Sdílení open research dat – kde?
Registr repozitářů:
Registry of research data repozitories:http://www.re3data.org/
Velké datové repozitáře:
Dryard: http://datadryad.org/
GitHub: https://github.com/
Zenodo: https://zenodo.org/
Figshare: https://figshare.com/
Oborové:
http://oad.simmons.edu/oadwiki/Data_repositories
https://www.libraries.psu.edu/psul/researchguides/pubcur/data_resources.html#open
-data
24. Data management plan
Krátký dokument, který popisuje:
• jaká data budou v projektu vznikat a jak
• jak s nimi budete zacházet
• plány na způsob sdílení a uchování
U každého poskytovatele může být odlišné zadání.
Základ by však měl být stejný.
25. Data management plan – 5 obvyklých témat
1. Popis dat, která se budou sbírat/vznikat (obsah, formát, objem …)
2. Standardy/metodologie pro sběr dat a jejich management
3. Etické standardy a právo
4. Plány na sdílení a zpřístupnění
5. Strategie na dlouhodobé uchování
http://www.dcc.ac.uk/resources/data-management-plans/checklist
26. Data management plan – tipy
1. Piště jednoduše, krátce a konkrétně
2. Jasně vymezte role kdo, kdy a jak
3. Hledejte standardy/metodologie pro sběr dat a jejich management
4. Konzultujte a spolupracujte
5. Obhajujte svá rozhodnutí
27. DMP – Horizon 2020
Vzor DMP pro Horizon 2020 – Annex 1 -
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
Jednotlivé informace v DMP pro každý dataset:
• Data set reference and name: základní popis a jméno datasetu
• Data set description: popis dat, jejich původu, kde budou generována a sbírána. Kdo by je v budoucnu mohl využívat.
Informace o tom zda existují nebo neexistují podobná data a možnosti je znovu využít.
• Standards and metadata: odkazy na existující využitelné standardy popisu dat, pokud neexistují, návrh jak budou data
metadatově popisována.
• Data sharing: jak budou data sdílena – otevřeně nebo s nějakou restrikcí pro specifickou skupinu. Důvod proč popřípadě
nemohou být sdílena. Popis přístupu k datům. Uvedené embargo, pokud existuje. Popsané technické mechanismy
přístupu k datům, popřípadě speciální software.
• Archiving and preservation (including storage and backup): kde budou data uložena, archivována a ochráněna (repozitář).
Jak dlouho budou data uložena, jak se zařídí dlouhodobé uchování. Finální objem dat. Popis finančního a personálního
zajištění.
Humbolt University: https://www.cms.hu-berlin.de/ueberblick/projekte/dataman/dmp-anleitung/view
28. DMP – zajištění zdrojů
• finančních
• personálních
Pomůcka pro vytváření rozpočtu: http://www.data-
archive.ac.uk/media/247429/costingtool.pdf
29. DMP – příklady
Life Sciences: https://riojournal.com/article/11624/
Social Sciences:
https://library.leeds.ac.uk/download/downloads/id/87/data_management_p
lan_example_esrc.pdf
Další: http://www.dcc.ac.uk/resources/data-management-plans/guidance-
examples
30. DPM - požadavky poskytovatelů
Zdroj: https://www.slideshare.net/sjDCC/dmp-dmponline
31. DPM - požadavky poskytovatelů
Zdroj: http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
32. DPM - požadavky poskytovatelů
• Nakladatelé: Plos, BioMed Central, Nature publishing, Elsevier a další
34. DMP – kurzy
Foster: https://www.fosteropenscience.eu/node/2328
Univerzity of Edinburgh: http://datalib.edina.ac.uk/mantra/
University of Minnesota: https://sites.google.com/a/umn.edu/data-
management-course_structures/home-1
35. Situace na VUT
Horizon2020
• základní informace k této oblasti lze nalézt na Portálu
knihoven: https://www.vutbr.cz/knihovny/openaccess/projekty-eu
Školení
• je možné domluvit při účasti 5 a více účastníků na VUT
• pro h2020, 10 a více účastníků školení od TC AVČR – Jiří Kotouček kotoucek@tc.cz
Individuální konzultace
Nebojte se na nás obrátit! - dedicova@lib.vutbr.cz
VUT strategie pro Open Data
• je nutné provést průzkum mezi jednotlivými zainteresovanými
• vzhledem k plánovanému Akčnímu plánu pro OA v ČR je nutné zvolit strategii pro OA
na VUT