Präsentation anlässlich eines Thementreffs der Hauptbibliothek Universität Zürich zum Thema "Neue Open Access-Themen mit Bedeutung für wissenschaftliche Bibliotheken" am 23.7.2012
1. Main Library, Open Access
Forschungsdaten
& OpenAIREplus
Christian Gutknecht, Hauptbibliothek
HBZ-Thementreff 23.7.2012
www.oai.uzh.ch
(except University Logo)
2. Main Library, Open Access
Open Repositories 2012 - #OR2012 tagged tweets
http://adamfield.net/or2012/wordle.png
2
4. Main Library, Open Access
4
Compact Muon Solenoid (CMS), Photo by Muriel
Photo by von Martin Dougiamas (Flickr: CERN control center) [CC-BY-2.0], via Wikimedia Commons
5. Main Library, Open Access
Compact Muon Solenoid (CMS), Photo by Muriel
Loek Essers (2011). CERN pushes storage limits as it probes secrets of universe. In Computerworld. 11.7.2011
28.6.2012 Christian Gutknecht Page 5 5
6. Main Library, Open Access
Server room in CERN. Photo by Florian Hirzinger
Loek Essers (2011). CERN pushes storage limits as it probes secrets of universe. In Computerworld. 11.7.2011 6
7. Main Library, Open Access
Grösse, Komplexität
Long Tail
Forschungsprojekte
7
9. Main Library, Open Access
Data Publication Pyramid
EU Project ODE (Opportunities for Data Exchange)
Publications • Daten in Artikel enthalten oder darin erklärt
with data
Processed Data
• Daten und Erklärungen als Supplements
and Data zum Artikel
Representations
Data Collections and • Referenzierte Daten in
Datenrepositories oder
Structured Databases Rechenzentren
• Daten auf
Raw Data and Data Sets Insitutslaufwerk oder
persönlichem Laptop
Reilly, S. et al. (2011). Report on Integration of Data and Publications.
9
10. Main Library, Open Access
Berlin Declaration on Open Access
to Knowledge in the Sciences and Humanities
„ Open access contributions include original scientific
research results, raw data and metadata, source
materials, digital representations of pictorial and graphical
materials and scholarly multimedia material.
Von UZH unterzeichnet am 15.12.2004
http://oa.mpg.de/lang/de/berlin-prozess/berliner-erklarung/
10
14. Main Library, Open Access
oder so...
Repositories für Primärdaten (150+), einige Beispiele:
• GenBank (US)
• Protein Data Bank (US)
• Dryad (UK)
• DANS: Data Archiving and Networked Services (NL)
• ADS: Archaeology Data Service (UK)
• GESIS Data Archive (DE)
• FORS (CH)
http://datacite.org/repolist DFG-Projekt (2012-2014)
14
15. Main Library, Open Access
oder gar nicht?
Library
Publication Private Files
Manuscript Data Metadata
Klump, Jens (2007).Semantic linking of data and journal publications in the STD-DOI project.
European GeoInformatics Workshop Edinburgh, 7 March 2007
15
17. Main Library, Open Access
Integrität in der Wissenschaft: Anspruch
„
Daten und Materialien müssen in einer Weise aufbewahrt
werden, welche Beschädigung, Verlust oder Manipulation
ausschliesst. Dies gilt sowohl für handschriftliche wie auch
für elektronische Daten. Besondere Vorfälle, z.B.
Datenverlust und Abweichungen vom ursprünglichen
Forschungsplan müssen dokumentiert werden.
Die Projektleitung ist dafür verantwortlich, dass Daten und
Materialien nach Abschluss des Projektes während einer für
das Fachgebiet adäquaten Dauer aufbewahrt bleiben. Sie
hat für ihre Haltbarkeit und Sicherung zu sorgen.
Integrität in der Wissenschaft: Reglement der Akademien der Wissenschaften Schweiz, 2008
17
18. Main Library, Open Access
Integrität in der Wissenschaft: Realität
Meta-Analyse von 18 Umfragen
Prozentualer Anteil an Forschern, die eigenes Fehlverhalten zugaben.
Fälschung, Fabrikation 0.3 - 4.9% 2.6% (Mittelwert)
Questionable Research Practices bis zu 33.7% 9.5% (Mittelwert)
Prozentualer Anteil an Forschern, die Fehlverhalten anderer beobachtet haben.
Fälschung, Fabrikation 5.2 – 33.3% 16.7% (Mittelwert)
Questionable Research Practices 6.2 – 72% 28.5% (Mittelwert)
Bossi, Emilio (2010). Wissenschaftliche Integrität, wissenschaftliches Fehlverhalten.
Schweizerische Ärztezeitung, 91(16): 618-620
18
21. Main Library, Open Access
„
Data Policy von PLoS
PLoS is committed to ensuring the availability of data and
materials that underpin any articles published in PLoS
journals. PLoS's ideal is to make all data relevant to a given
article and all readily replaceable materials immediately
available without restrictions.
Accession numbers should be provided:
ArrayExpress Gene Expression Omnibus [GEO] Mouse Genome Database (MGD)
BioModels Database Protein Data Bank Online Mendelian Inheritance in Man
Database of Interacting Proteins UniProtKB/Swiss-Prot (OMIM)
DNA Data Bank of Japan [DDBJ] ClinicalTrials.gov PubChem
DRYAD Ensembl
EMBL Nucleotide Sequence Entrez Gene
Database FlyBase
GenBank InterPro
http://www.plosone.org/static/policies.action#sharing
21
22. Main Library, Open Access
„
Data Policy von Nature Publishing Group (1)
Therefore, a condition of publication in a Nature journal is
that authors are required to make materials, data and
associated protocols promptly available to readers
without undue qualifications in material transfer agreements.
„ The preferred way to share large data sets is via public
repositories. Some of these repositories offer authors the
option to host data associated with a manuscript
confidentially, and provide anonymous access to peer-
reviewers before public release.
http://www.nature.com/authors/policies/availability.html
22
23. Main Library, Open Access
„
Data Policy von Nature Publishing Group (2)
Peer-reviewers may be asked to comment on the terms of access to
materials, methods and/or data sets; Nature journals reserve the right to
refuse publication in cases where authors do not provide adequate
assurances that they can comply with the journal's requirements for
„
sharing materials.
After publication, readers who encounter refusal by the authors to
comply with these policies should contact the chief editor of the journal.
In cases where editors are unable to resolve a complaint, the journal may
refer the matter to the authors' funding institution and/or publish a formal
statement of correction, attached online to the publication, stating that
readers have been unable to obtain necessary materials to replicate the
findings.
http://www.nature.com/authors/policies/availability.html
23
24. Main Library, Open Access
Data Policy von Journal of Neuroscience
Ausschluss von Supplemental Material
„ It is conceivable that removing supplemental material from
articles might motivate more scientific communities to create
repositories for specific types of structured data, which are
vastly superior to supplemental material as a mechanism for
disseminating data.
John Maunsell, Editor-in-Chief
Journal of Neuroscience 2010, 30(32):10599-10600
24
25. Main Library, Open Access
Funder Policy: National Science Foundation (US)
„ Investigators are expected to share with other researchers, at no more
than incremental cost and within a reasonable time, the primary data,
samples, physical collections and other supporting materials created or
gathered in the course of work under NSF grants.
„ Proposals submitted or due on or after January 18, 2011, must include a
supplementary document of no more than two pages labeled “Data
Management Plan”. This supplementary document should describe how
the proposal will conform to NSF policy on the dissemination and sharing
of research results.
http://www.nsf.gov/bfa/dias/policy/dmp.jsp
25
26. Main Library, Open Access
Funder Policy:
Engineering and Physical Sciences Council (EPSRC)
„ To allow time for this EPSRC expects all those it funds to have developed
a clear roadmap to align their policies and processes with EPSRC’s
expectations by 1st May 2012, and to be fully compliant with these
expectations by 1st May 2015.
http://www.epsrc.ac.uk/about/standards/researchdata/Pages/default.aspx
26
27. Main Library, Open Access
Research Data Management Policy, University of Edinburgh
This policy for managing research data was approved by the University Court on 16 May, 2011.
The University adopts the following policy on Research Data Management. It is acknowledged that this is an
„
aspirational policy, and that implementation will take some years.
• Research data will be managed to the highest standards throughout the research data lifecycle
as part of the University’s commitment to research excellence.
• Responsibility for research data management through a sound research data management
plan during any research project or programme lies primarily with Principal Investigators (PIs).
• All new research proposals [from date of adoption] must include research data management
plans or protocols that explicitly address data capture, management, integrity, confidentiality,
retention, sharing and publication.
• The University will provide training, support, advice and where appropriate guidelines and
templates for the research data management and research data management plans.
• The University will provide mechanisms and services for storage, backup, registration, deposit
and retention of research data assets in support of current and future access, during and after
completion of research projects.
• …
http://www.ed.ac.uk/schools-departments/information-services/about/policies-and-regulations/research-data-policy
27
29. Main Library, Open Access
JISC - UK
http://www.jisc.ac.uk/whatwedo/programmes/di_researchmanagement/managingresearchdata.aspx#
29
30. Main Library, Open Access
Riding the Wave:
How Europe can gain from the rising tide of scientific data
Final report of the High Level
Expert Group on Scientific Data
A submission to the European
Commission
Riding the Wave Report (2010)
30
31. Main Library, Open Access
A Surfboard for Riding the Wave
Empfehlungen für DE, NL, DK & UK
Knowledge Exchange Primary Research Data Working Group (2011). A Surfboard for Riding the Wave: Toward a four country
action programm on research data.
31
33. Main Library, Open Access
Konzeptstudie ikeep 2008 im Rahmen von e-lib.ch
Im Auftrag der Konferenz der Universitätsbibliotheken (KUB)
Zwei Archivierungsmodelle für Primärdaten:
Self Deposit
eine zentrale nationale Infrastrukturlösung ohne Regulierung, fokussiert
auf die Eigenverantwortung der Forschenden
Managed Deposit
eine nationale Archivstelle im Sinne der Archivgesetze, sieht eine
Organisationseinheit vor, welche die Forschenden bei der Hinterlegung
der Daten unterstützt und die Langzeitarchivierung übernimmt
Keller-Marxer, Peter (2008). Konzeptstudie zur Entwicklung eines Modells für eine zentrale Langzeitarchivierung von
digitalen Primär- und Sekundärdaten der Forschung für die Schweiz. Situation, Bedarf, Nutzenziele, Modelle,
Anspruchsgruppen, Rahmenbedingungen und europäisches Umfeld. http://dx.doi.org/10.3929/ethz-a-006070903.
33
34. Main Library, Open Access
Umfrage bei Schweizer Hochschulen (2010)
Im Auftrag der Konferenz der Universitätsbibliotheken (KUB)
• Umfrage bei Leiter/innen von 393 ausgewählten Forschungsstellen
(i.d.R. Institute) an den 10 Universitäten, ETH und 24 Fachhochschulen.
• Der Rücklauf war 31% (13 Antworten von UZH)
• Ziel: Rückschlüsse auf „Stimmungsbild“ und „Awareness“
Fazit:
• Bedarf an Langzeitarchivierung von Forschungsdaten ist vorhanden
• Zuständigkeiten der Archivierung (Wer? Was? Wie lang?) sind nicht
wirklich klar geregelt und liegen (zu) häufig beim einzelnen Forscher
• Unklar auf welchen Level (International, National, Institution,
disziplinspezifisch) das Thema angegangen werden soll.
Keller-Marxer, Peter (2010). Umfrage «Archivdienstleistungen dLZA für Primärdaten an den Schweizer Hochschulen»
34
35. Main Library, Open Access
E-Library Strategie Hauptbibliothek (2009)
„ 2.2 Publikations- und Forschungsdaten
Im Rahmen der von EUROHORCs dargelegten Strategie
werden Konzepte für die Erfassung und Archivierung von
relevanten Forschungsdaten geprüft.
http://www.hbz.uzh.ch/images/docfiles/e-library-strategie_v2_0.pdf
http://www.eurohorcs.org/SiteCollectionDocuments/ESF_Road%20Map_long_0907.pdf
35
36. Main Library, Open Access
The LERU Roadmap towards Open Access
„
It is important that universities actively continue current
investigations into the feasibility of storing open primary
data in repositories, linking the open data to the secondary
research publication.
This is potentially a new area for repositories and will bring
to light different issues and concerns. Primary data, across
all subject areas, forms the building blocks from which
secondary research articles and monographs are created.
Advice Paper No. 8, June 2011, p.8
36
37. Main Library, Open Access
Supplemental Material in ZORA, zitierbar mit DOI
37
38. Main Library, Open Access
Data Repositories mit EPrints
Cadman, Christopher J. and Coles, Simon J. and Croft, Anna K. and Frey, Jeremy G. and Tizzard, Graham J. (2010)
University of Southampton, Crystal Structure Report Archive. http://dx.doi.org/10.3737/ecrystals.chem.soton.ac.uk/1343
38
39. Main Library, Open Access
Research Data @Essex mit EPrints
http://researchdataessex.posterous.com/
39
40. Main Library, Open Access
Forschungsdaten an der UZH?
Wie und wo
werden diese
archiviert?
Welche
Wer ist dafür
Aufbewahrun
verantwortlic
gsdauer
h?
gelten?
Wie wichtig
sind diese
Daten?
Welche Ist die
Daten gibt Integrität
es? gewährleistet
?
Daten in der
Dossier aktuell bei:
Zukunft noch
lesbar und
verständlich?
Prorektorat Medizin und
Naturwissenschaften
40
42. Main Library, Open Access
EU-Projekte: OpenAIRE + OpenAIREplus
OpenAIRE (2009-2012)
• 5 Mio EUR, 27 Länder
OpenAIREplus (2011-2014)
• 5.1 Mio EUR, 33 Länder
Projektleitung:
• Universität Athen
• SUB Göttingen
• Italian National Research Council: Institute of Information Science and
Technologies
42
43. Main Library, Open Access
OpenAIRE
Infrastruktur für OA Publikationen
Ausführung, Support, Überwachung des Open Access Pilots der EU (SC39)
Services
Open Access repositories FP7 Project
Information
43
45. Main Library, Open Access
OpenAIREplus
• Baut auf OpenAIRE auf
• Verlinkung von OA-Publikationen zu Datensets
• Verlinkung von Förderinformationen
(auch ausserhalb von FP7)
• Weitere Services für Nutzer des OpenAIRE Portal
http://cordis.europa.eu/fetch?CALLER=FP7_PROJ_EN&ACTION=D&DOC=66&CAT=PROJ&QUERY=0130d4ffe108:f01f:6
1d5b17e&RCN=100079
45
46. Main Library, Open Access
OpenAIREplus - Beteiligung durch HBZ
Arbeitspaket 2: Verbreitung und Öffentlichkeitsarbeit
• Interner Austausch zwischen Projektpartner
• Kommunikation von Projektresultaten
(Tools, Standards, Richtlinien, Informationsbroschüren etc.)
• Absprache mit anderen Initiativen/Projekten/Organisationen
Arbeitspaket 4: Community Unterstützung
• National Helpdesk
46
49. Main Library, Open Access
OpenAIREplus - Datenprovider
European Bioinformatics Institute
50. Main Library, Open Access
OpenAIREplus – Zwischenstand
• Website Schweiz:
http://www.openaire.eu/en/open-access/country-
information/switzerland
• Thema platziert bei UZH-Forschern mit FP7-Projekten
• Thema platziert bei Schweizer Repository Betreiber
(hoffentlich bald OpenAIRE compliant)
• Hauptarbeit wird kommen sobald weitere spezifische
Arbeitspakete von anderen OpenAIREplus-Partner
abgeschlossen sind.
50
52. Main Library, Open Access
Bibliometrie
http://dx.doi.org/10.1371/journal.pone.0000308
52
53. Main Library, Open Access
Data Citation Index
http://www.reuters.com/article/2012/06/22/idUS109861+22-Jun-2012+HUG20120622
53
54. Main Library, Open Access
Data Management Literacy (Informationskompetenz)
http://dx.doi.org/10.1371/journal.pbio.1001339
54
55. Main Library, Open Access
Journal of eScience Librarianship
http://escholarship.umassmed.edu/jeslib/
55
56. Main Library, Open Access
IFLA Kongress 2012 - Helsinki
http://www.ifla.org/en/news/the-role-of-libraries-in-data-curation-access-and-preservation-an-international-perspective
56
57. Main Library, Open Access
Data Librarian
The Data Librarian will serve as the primary
liaison and personal librarian for Barnard
students and faculty in assigned departments
and programs.
The candidate should have experience with
one or more of the following: GIS, Qualtrex,
SPSS, STATA--or a demonstrated aptitude
for learning data management tools.
http://library.barnard.edu/2011/data-librarian
57
58. Main Library, Open Access
Data Librarianship
http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:525-opus-1633
58
59. Main Library, Open Access
„ Research data can be new niche for librarians
• New roles within institutions
• New way to engage with wider range of clients
• New application of existing skills
• New partnerships with Research Office, IT Services, e-
Research folks
Andrew Treloar
Director of Technology, Australian National Data Service
Andrew Treloar (2012). Conceptualising Collaboration and Competition in the Changing Ecology of Research Data. In: Nordbib Conference 2012: Structural
frameworks for open, digital research, Copenhagen 11-13. June 2012. Slides:
http://conference.nordbib.net/fileadmin/user_upload/dokumenter/Treloar.pptx
59