Een digitaal depot in de praktijk. (Luc Schokkaert, afdelingshoofd Algemene d...
Themamiddag ukb wg rdm introductie jr v06
1.
2. 13:15 – 13:25 Opening
13:25 – 13:45 Introductie, rollen/taken en RDM landschap NL
13:45 – 14:00 Resultaten inventarisatie UKB partners
14:00 – 14:30 Vragen/Discussie (RDM ondersteuning)
14:30 – 14:45 Pauze
14:45 – 15:00 Presentatie elementen bestaand RDM beleid
15:00 – 15:30 Discussie (RDM beleidsadvies)
15:30 – 15:45 Sluiting (vervolgstappen WG)
Doelen:
Informeren en van gedacht wisselen over organisatie van RDM.
Overeenstemming bereiken over uit te werken beleidsthema‟s RDM.
PROGRAMMA THEMAMIDDAG
3. 1. Introductie
Gasten: SURF, NCDD en DANS
Opdracht UKB werkgroep (WG) Research Data
Nieuws en overzicht elementen Research Data Management (RDM)
2. Welke RDM rol/taak voor research libraries?
Recente rapporten over belang en prioriteiten
Uitdaging: omgaan met brede scope en diversiteit
3. Situatie en ontwikkelingen landschap NL
Huidige situatie
Nabije toekomst
OUTLINE INTRODUCTIE/ROLLEN/LANDSCHAP
5. Met betrekking tot datamanagement worden door UKB de volgende resultaten
beoogd (UKB Beleidsplan, p. 14):
• alle universiteiten beschikken over de benodigde faciliteiten voor datamanagement
en dataopslag (allereerst beschrijven uitgangspositie)
• gedeelde kennis ten aanzien van de mogelijkheden tot hergebruik
• uitwerken van best practices
• verkennen van mogelijkheden voor (de)centrale opslag.
Samenstelling WG: TUD, TU/e, UM, UT, UU, VU, WUR.
Taak WG: voorbereiding van beleid, op het gebied van datamanagement, resulterend
in een concreet voorstel.
Doelstelling WG: komen tot (modulair) voorstel voor RDM beleid, door UKB partners
aan te passen tot een beleidsplan, passend bij de instelling.
Verwachting WG: UKB partners nemen actieve rol op zich voor het op de
instellingsagenda
plaatsen van RDM beleid. (Noodzaak RDM en wens rol voor UKB zijn
uitgangspunten)
1.1 WG UKB DATA
6. Doelen EU (Horizon 2020)
EU Goals for Open Access: 60% OA in 2016, 100% in 2020
The Framework Programme should lead by example BUT their budget is a small part
of research funding. Member states have to follow (Octavio Quintana Trias).
Conclusies prioriteiten (NordBib 2012)
1. Usability
2. Discoverability
3. (Open) Accessibility
Required changes volgens Royal Society
• a shift away from a research culture where data is viewed as a private preserve
• credit for useful data communication and novel ways of collaborating
• the development of common standards for communicating data
• mandating intelligent openness for data relevant to published scientific papers
• data scientists [LIBER says: data librarians, our experience: BOTH]
• new software tools
1.2 VERS VAN DE ‘PERS’
7. Data capture
Early meta data
Data model design
Support data-labs
Create Complete meta data
Data archiving
Data mining support
Creating „resource
maps‟
Describe
Exploit
& Store
Research
Data
Browse
Search Enable data citation
Query online Discover Identify „Publish‟ meta data
Google maps/earth & &
Access Register
1.3 NIET NIEUW (MEER)… DIENSTEN
10. LIBER Royal Society
Offer RDM support (DMP, IP, Training, …)
Engage in development of standards and Standards
metadata services
Data-librarians Data scientists
Participate in institutional RD policy mandating openness
development !!
Liaise and partner with researchers, Collaboration
repositories, … for access, discovery and
sharing
Support by providing /mediating storage Tools
(dynamic), archiving, registration
Promote data citation by persistent identifiers Credits
VSNU Code of conduct, NSF, DCC, EU en NWO, Shift (private > public)
…
OECD Principles and guidelines for access to research data (publicly
funded)
2.1 AANBEVELINGEN
11. LIBER Workshops
• Meeste workshop deelnemers zagen potentieel voor nieuwe diensten
op het gebied van RDM waarbij library expertise van nut kan zijn (o.a.
metadata, social infrastructure en attribution/citation).
• Belangrijke en actuele (onopgeloste) issues: “funding, ownership,
reskilling (library staff), scepticism towards library role (researchers
and boards)”.
• Essentiële elementen in aanpak: “engage with researchers on
different levels, small steps will do (full spectrum start not
necessary)”.
DCC / RDMF Workshops (UK), C
• Research data best at national (disciplinary) data-archives but
institutions should safeguard access to „their‟ data in case data-
archives fails.
• Publishers do NOT want to look after research data but do want
citations and access for reviewers and readers (trend: not as
supplementary material).
2.2 BEVINDINGEN
12. • Welke communities (extra) ondersteunen?
• In welke fase?
• Welke diensten?
• Met welke infrastructuur?
Science & Technology Facilities Center
• Welke data bewaren? (UK):
• … Big Science = Particle Physics, Earth
Observation, Astronomy
Small Science = ISIS Neutron Source,
Diamond X-ray source, UK Central
Laser Facility.
ISIS data (~25 yrs) > 3.000.000 files
Diamond data (~5 yrs) > 100.000.000 files
Doubling data every year: (4.6 PB ...)
2.3 WAT EERST?
13. Data-archief (statische data): research data bij voorkeur in discipline archieven
of juist in institutionele data repositories? Welke data archiveren? Hoe lang
moet data toegankelijk blijven?
Data-labs (dynamische data): ondersteunen van RDM tijdens het onderzoek
d.m.v. storage en tools?
Data-services: advisering, metadata, verrijkte publicaties, training, vindbaarheid
en citeerbaarheid vergroten, …
Lokaal: alleen front-office of ook backoffice? Eigen diensten en/of infrastructuur?
Discipline specifiek of algemeen (voor hele universiteit)? Training
(toekomstige) onderzoekers door bibliotheek, faculteiten, anders?
Centraal: alleen infrastructuur of ook dienstverlening (training, advies, cloud
computing, …) en/of kennisontwikkeling, etc.
Kennis ontwikkeling: per vakgebied, per file format, storage en preservation,
metadata, datamodellen, analyse en visualisatie tools, cloud computing,
licenties, IP, wet- en regelgeving, persistent identifiers, …
One size does not fit all (no-one)
Echter… onderwerp te groot om zonder samenwerking aan te pakken!
2.4 & HOE?
15. Disciplinaire/institutionele (research) data voorzieningen
Big Science, Life science, Bio-informatica, World Data System (ICSU, o.a.
PANGAEA (Earth Science)), NDFF (Flora en Fauna),
Instituten (KNAW, o.a. NIOZ, Deltares, TNO, KNMI, NiBG, MPI, JRC (Petten),
…), …
Multi disciplinaire/institutionele data voorzieningen
Overheid, DANS, 3TU.Datacentrum, …
Kennis
SURF SIG Research Data, NCDD, …
CARDS (VU e.a.), Selection of Research Data; Guidelines (DANS en 3TU), IISH
Guidelines for preserving research data (IISG), rapporten van Knowledge
Exchange, RIN, e-IRG, …
Data-lab voorzieningen
DataVerse Network (UU, Harvard), OpenEarth, Hubzero.org, …
Persistent identifier voorzieningen
Obj.: DataCite (DOI), Persid (URN:NBN), MPI (HDL), ARK, (PURL), …
Aut.: SCOPUS Auth. ID, ArXiv Auth. ID, Researcher ID, SURF (DAI), ORCID, …
Overige leveranciers van diensten
Figshare, myexperiment, …
3.1 UITGANGSSITUATIE
16. Actuele projecten, onderzoeken en ontwikkelingen
- Data Verse Network: UBU (contact: Menno Rasch/Paulien Wiersma)
- Data labs in sharepoint: UBL, DANS en 3TU.DC (contact: Peter
Verhaar)
- Training data-intelligence: 3TU.DC en DANS (contact: Madeleine de
Smaele)
- SIM4RDM (funding, intervention, policy): SURF (contact: Wilma
Mossink)
- Special Interest Group Research Data (SIG) net opgericht (contact:
Wilma Mossink/Ana van Meegen-Silva)
- Consortium Research Data NL i.o. door DANS/3TU.DC (contact: Henk
Harmsen/Jeroen Rombouts)
- Uitreiking NL Dataprijs 2012 op 18 oktober. (contact: Heiko
Tjalsma/Jeroen Rombouts)
- Toekomstig SURF project: Regie in de cloud (contact: Saskia van
Eeuwijk/Wilma Mossink)
- ERIC application for DARIAH (deze week), in NL met CLARIN
CLARIAH (contact: DANS/MPI)
3.2 (NABIJE) TOEKOMST
Editor's Notes
Ad inventarisatie: Kortevragenlijstverspreidonder UKB partnersAd elementenbestaandbeleid: Quick scan bestaandbeleid op belangrijkeelementen in (buitenlands) universitair RDM beleid
Punt 1 -> informeren, samenwerking, aanscherpenvervolgactiesGasten: SURF, NCDD en DANS voorbijdrageaandiscussie.Informeren over plannen en ontwikkelingen (inventarisatieonder UKB partners, presentatielandschap en bestaandbeleid (buitenlandse) universiteiten).Discussiestarten (en afstemmen).Toetsen (en evt. bijsturen) doelstelling en plan van aanpak WG.
Recentnieuwsuit 3 ‘hoeken’ (financier, ondersteuners, wetenschappers).NL voorstelaan EU begin deze week om OA voor research data niet door EU telatenopleggen maar door consortia telatenbepalen. (meer info: Agentschap NL, RUL: Ivo de Nooijer?)
Niet van de laatstemaand, artikel ANDS Verbs 2009,SURF Onderzoeks Data Forum sinds 2008Designing for Discovery and Re-Use: the ‘ANDS Data Sharing Verbs’ Approach to Service DecompositionAdrian Burton, Andrew Treloar2009, Vol. 4, No. 3, pp. 44-56doi:10.2218/ijdc.v4i3.124The Fourth Paradigm: Data-Intensive Scientific Discovery.Verzameling essays uit 2009Editor: Tony Hey (MS Research)ISBN 978-0-9825442-0-4
Curation, volgensdit schema, 1 van de elementen van RDM. Maar volgensbijv. DCC de hele lifecycle en preserveren ‘alleen’ het behouden van de langetermijntoegankelijkheid.Defin. van archiverenafhankelijk van de community en het land: An archive is a collection of historical records, or the physical place they are located [Glossary of Library and internet terms]. ICT’ers = techniek, …Vlgs. ‘UK’: curation > archiving > preservation
NB nogessentiele issues onopgelost, ook de scepsisbijonoderzoekers en boards herkenbaar (Royal Society noemtbibliothekenniet in hun rapport, WD&D ook library nietaangewezenpartijvoorallediensten en libraries komennietvoor in gevondenbeleidbijbuitenlandseuniversiteiten) maar zekerverbeteringlaatstetijd.Voormeerinformatie over het werk van LIBER: Marc van den Berg.Goedenieuws is: kleinestappenzijnookgoed.
Maar… Ookde kleinestappenbiedengroteuitdagingen.Dezevragenzijnnietzoeenvoudigtebeantwoorden want zeerafhankelijk van het soortonderzoek en data.De ‘long tail’ zou in zijngeheelgroterkunnenzijn/wordendan de Big Science.
Daarnaastverschillentussen disciplines, vakgroepen, personen en universiteiten, bibliotheken, …One-liner: “Niet1 centrale/standaardoplossing maar welkrachtenbundelenwaarmogelijk.”
ORCID: ResearcherID profile system from Thomson Reuters; authorprofilesfromRePEc, ScholarUniverse, andScopus; andbibliographic data from the CrossRefmetadata database. Interoperablewith ISNI, PersID: 8 members: NL, DK, D, FIN, I, SDataCite: NL, DK, D, F, S, CH, UK, Can, US, Aus, KoreaAPARSEN: “In fact, according to the benchmark result, PURL does not seem be a good solution for supporting a reliable persistent identification of resource that require high level of trust such scientific and cultural heritage objects. The level of service provided by this solutions, that was the first initiative on the field, is now too basic for addressing the identification requirements highlighted by the survey results (see Chapter 5). ”
Veel van de contactpersonenhaddenvandaagookgraagietsgepresenteerd, alsalternatiefditlijstje.Toelichtingsamenwerking DANS – 3TU.DCCLARIN (Linguistics), DARIAH (Arts & Humanities), …
Waaromdeze sheet? Waarinfrastructuurhalen, kennis, training, …Reacties op consortium van UKB partnersOpdit moment begin eerstefase van consortium oprichtingConsortium kan in tweedefaseooknieuwe partners toelaten.Kleuren front office back office en 3TU DANS verschillendemaken en toelichten