0
Frauke Ziedorn
Meeting TIB/DataCite - DLR - EUMETSAT
22./23.05.2014
TIB DOI-Service und DataCite
PIDs, Best Practices
2
• Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie,
Informatik, Mathematik und Physik
• Bund-Lände...
3
Historie der DOI-Registrierung
• 2003:
DFG Projekt der TIB mit World DataCenters bzgl. Publikation
von Forschungsdaten
•...
4
PIDs
• DOI
• Zitierung von wissenschaftlichen Publikationen
• In der wissenschaftlichen Gemeinschaft anerkannt
• Auflöse...
5
PIDs
• URN
• Referenzieren lokaler Dokumente innerhalb eines geschlossenen
Systems (z.B. Hochschulschriften)
• Auflösung...
6
ARK
• origins in the library, archive, and museum (LAM) community (e.g., the
Internet Archive has 4 million ARKs, the Na...
7
ARK
• no fees to assign or resolve ARKs via a local resolver; to use
ARKs with the global n2t.net resolver you must be a...
8
ARK
• support for the '?' and '??' inflections is inconsistent at the
moment
• no standardization yet for persistence de...
9
Das DOI®
System
• 1998 Gründung der International DOI Foundation (IDF) als
übergeordnete Organisation
• DOI ist eine ges...
10
DOI-Registrierungsagenturen
• CrossRef – Zeitschriftenartikel, Bücher, Konferenzberichte
• DataCite – Forschungsdaten, ...
11
DataCite
• Globales Konsortium getragen von lokalen Einrichtungen
• Fokussiert auf die Verbesserung des Zugangs zu und ...
12
Technische Informationsbibliothek (TIB)
Canada Institute for Scientific and Technical Information (CISTI),
California D...
13
Datenzentren bei DataCite
Mitglie
d
Datenz
entren
Mitglie
d
Datenz
entren
ANDS 14 INIST 10
BL 17 MTAKI
K
4
CDL 100 NRCT...
14
TIB Datenzentren
Die TIB arbeit derzeit mit 60+ Datenzentren zusammen, die
bereits >800.000 DOI-Namen registriert haben...
15
DataCite Working Groups
Metadata
• 12 Mitglieder aus 7 Nationen
• Erstellen des Metadaten Schemas
• Kommunikation mit d...
16
Das DataCite Metadaten Schema
• Vorgabe der IDF, ein Mindestmaß an identifizierenden
Metadaten vorzuhalten.
• Aktuelle ...
17
Das DataCite Metadaten Schema
• Identifier (mit type Attribut)
• Creator (mit type und nameIdentifier Attributen)
• Tit...
18
Das DataCite Metadaten Schema
• Subject (mit scheme Attribut)
• Contributor (mit type und nameIdentifier Attributen)
• ...
19
• ‚nichtsprechende‘ Zeichenfolge
• Zeichen für DOI-Namen:
• A – Z
• a – z
• 0 – 9
• : (Doppelpunkt)
• . (Punkt)
• - (Bi...
20
Best Practices
Drei Ansätze zur DOI-Vergabe und Zitierung:
• Cite a specific time slice (the set of updates to the data...
21
“DataCite clients are the custodians of their data and therefore
define the granularity of the data to which they are a...
22
Best Practices
• Es gilt wie bei der Granularität: Jedes Datenzentrum ist selbst
für die Bestimmung von Versionen veran...
23
Kooperationen
• ORCID
• ODIN Projekt: http://odin-project.eu/
http://datacite.labs.orcid-eu.org/
• re3data.org und Data...
24
DataCite Services I
• http://mds.datacite.org
Metadata Store Userinterface zum manuellen Registrieren von
DOIs und Hoch...
25
DataCite Services II
• http://data.datacite.org
DataCite Content Service stellt Metadaten in verschiedenen
Formaten ber...
Vielen Dank für Ihre Aufmerksamkeit!
Upcoming SlideShare
Loading in...5
×

TIB DOI-Service und DataCite - PIDs, Best Practices

260

Published on

Published in: Data & Analytics
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
260
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "TIB DOI-Service und DataCite - PIDs, Best Practices"

  1. 1. Frauke Ziedorn Meeting TIB/DataCite - DLR - EUMETSAT 22./23.05.2014 TIB DOI-Service und DataCite PIDs, Best Practices
  2. 2. 2 • Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik • Bund-Länder-finanziert, Mitglied der Leibniz-Gemeinschaft (WGL) • Alle 7 Jahre Evaluierung durch externe international besetzte Gutachtergruppe (zuletzt 02.2011) • Ergebnis (u.a.): Besonders hervorzuheben ist dabei der Betrieb der nationalen DOI-Registrierungsagentur zur Referenzierung von Forschungsdaten. Mit ihr bietet die TIB einen innovativen und bedeutenden Dienst an, der auch international wahrgenommen wird. Die Technische Informationsbibliothek
  3. 3. 3 Historie der DOI-Registrierung • 2003: DFG Projekt der TIB mit World DataCenters bzgl. Publikation von Forschungsdaten • 2005: TIB wird erste DOI-Registrierungsagentur für Forschungsdaten. Von Anfang an wird auch graue Literatur registriert. • 03.2009: Paris Memorandum bzgl. der Zusammenarbeit von 6 europäischen Informationseinrichtungen • 12.2009: Gründung von DataCite mit 7 Mitgliedern • 03.2014: 22 Mitglieder, 9 assoziierte Mitglieder aus 18 Ländern der Kontinente Amerika, Europa, Afrika, Asien und Australien.
  4. 4. 4 PIDs • DOI • Zitierung von wissenschaftlichen Publikationen • In der wissenschaftlichen Gemeinschaft anerkannt • Auflösen möglich über jeden Handle Server oder http://dx.doi.org/{doi} • Verantwortung und Garantien für Persistenz und Datenqualität • Handle • Globales Referenzieren von Daten vor der Publikation • Auflösen möglich über jeden Handle Server • Keine Persistenz, keine gesicherten Verantwortlichkeiten
  5. 5. 5 PIDs • URN • Referenzieren lokaler Dokumente innerhalb eines geschlossenen Systems (z.B. Hochschulschriften) • Auflösung nur auf Server des Herausgebers • Persistenz und Datenqualität werden gewährleistet • ARK • Dokumente aller Arbeitsprozesse • Möglichkeit “persistence declaration” abzugeben • ARKs können auch gelöscht werden • Auflösen nur kostenfrei auf dem eigenen Server möglich, Kosten entstehen bei Nutzung des globalen n2t.net Resolvers • Qualitätsmanagement, keine Persistenzgarantie
  6. 6. 6 ARK • origins in the library, archive, and museum (LAM) community (e.g., the Internet Archive has 4 million ARKs, the National Library of France has 20 million ARKs, natural history museums are using ARKs for specimens) • applicable to any resource, whether digital, physical, or abstract, e.g., to vocabulary terms or people • flexible metadata guidelines, depending on discipline and application • ability to declare different kinds of persistence, e.g., long-term retention with absolute bit-level fixity, or long-term retention subject to update, or something in between • ARKs are URLs, with the ability to retrieve metadata by appending '?' to the URL • persistence declaration and organizational commitment retrievable by appending '??' • a time-limited persistence declaration permits some ARKs to be deleted, as appropriate • support for mixed case, allowing shorter identifiers in unique combinations Eigenschaften Informationen von Joan Starr (CDL / EZID)
  7. 7. 7 ARK • no fees to assign or resolve ARKs via a local resolver; to use ARKs with the global n2t.net resolver you must be an EZID customer • resolution based on simple web redirection, with open source tools available • you can host ARKs on your own branded web server/resolver (e.g., the British Library uses ARKs this way) • at low cost via EZID, you can host ARKs at a global resolver http://n2t.net/ ; this resolver is in the process of being replicated for high availability • with respect to publication content, ARKs can be used for pre- prints, post-prints, and supporting artifacts Anwendungsfälle Informationen von Joan Starr (CDL / EZID)
  8. 8. 8 ARK • support for the '?' and '??' inflections is inconsistent at the moment • no standardization yet for persistence declarations • currently there is no replication for the global n2t.net resolver • In terms of the research data life cycle, we recommend the use of ARKs as a best practice for good data management by assigning unique identifiers (ARKs) to the data as part of the data documentation. Researchers benefit by keeping track of (and remembering) aspects of their data throughout the research project. Schwächen Informationen von Joan Starr (CDL / EZID)
  9. 9. 9 Das DOI® System • 1998 Gründung der International DOI Foundation (IDF) als übergeordnete Organisation • DOI ist eine geschützte Marke; seit Mai 2012 ISO Standard 26324 • DOI ist eine Vermarktung des technisch geprägten Handle Systems • Teil der Qualitätskontrolle ist die verpflichtende Abgabe von Metadaten bei jeder DOI-Registrierung. DOI® , DOI.ORG® and shortDOI® are trademarks of the International DOI Foundation
  10. 10. 10 DOI-Registrierungsagenturen • CrossRef – Zeitschriftenartikel, Bücher, Konferenzberichte • DataCite – Forschungsdaten, Graue Literatur, nicht-textuelle Materialien • EIDR – Filme, TV Serien und andere kommerzielle Filmmaterialien • Airiti, Inc. – Traditionale Chinesische Materialien • CNKI (China National Knowledge Infrastructure) - Chinesische e-Journals, Zeitungen, Dissertationen, Konferenzbände u.m. • ISTIC (The Institute of Scientific and Technical Information of China) – Zeitschriften des chinesischen Marktes • JaLC (Japan Link Center) – wissenschaftliche und akademische Publikationen in Japan • mEDRA – Internet Dokumente • OPOCE (Office des publications EU) – Dokumente der Europäischen Union
  11. 11. 11 DataCite • Globales Konsortium getragen von lokalen Einrichtungen • Fokussiert auf die Verbesserung des Zugangs zu und der Zitierung von Daten und anderen nicht-textuellen Inhalten • Gegründet am 1. Dezember 2009 in London • Working Groups / Staff: • Metadata: Entwicklung des Metadaten Schemas in Zusammenarbeit mit der Community • Business Practices: Entwicklung von Standards, Workflows und Best Practices • Tech Team: Weiterentwicklung der technischen Infrastruktur
  12. 12. 12 Technische Informationsbibliothek (TIB) Canada Institute for Scientific and Technical Information (CISTI), California Digital Library, USA Purdue University, USA Office of Scientific and Technical Information (OSTI), USA Library of TU Delft, The Netherlands Technical Information Center of Denmark The British Library ZB MED, Germany ZBW, Germany Gesis, Germany Library of ETH Zürich L’Institut de l’Information Scientifique et Technique (INIST), France Swedish National Data Service (SND) Australian National Data Service (ANDS) Conferenza dei Rettori delle Università Italiane (CRUI) National Research Council of Thailand (NRCT) The Hungarian Academy of Sciences University of Tartu, Estonia Japan Link Center (JaLC) South African Environmental Observation Network (SAEON) European Organization for Nuclear Research (CERN) DataCite Mitglieder Affiliated members: Digital Curation Center (UK) Microsoft Research Interuniversity Consortium for Political and Social Research (ICPSR) Korea Institute of Science and Technology Information (KISTI) Bejiing Genomic Institute (BGI) IEEE Harvard University Library World Data System (WDS) GWDG
  13. 13. 13 Datenzentren bei DataCite Mitglie d Datenz entren Mitglie d Datenz entren ANDS 14 INIST 10 BL 17 MTAKI K 4 CDL 100 NRCT 1 CISTI 8 OSTI 7 CRUI 18 PURDU E 9
  14. 14. 14 TIB Datenzentren Die TIB arbeit derzeit mit 60+ Datenzentren zusammen, die bereits >800.000 DOI-Namen registriert haben, z.B.: • Publishing Network for Geoscientific & Environmental Data (PANGAEA) • ZALF – Leibniz-Zentrum für Agrarlandschaftsforschung • HZB - Helmholtz-Zentrum Berlin • UB München • UB Konstanz • Bibliothek des KIT • Julius-Kühn-Institut Außerdem vergibt die TIB auch DOI-Namen für von der TIB gespeicherte Dokumente, wie BMBF-Forschungsberichte und Fahrtberichte, und natürlich die Medien im AV-Portal.
  15. 15. 15 DataCite Working Groups Metadata • 12 Mitglieder aus 7 Nationen • Erstellen des Metadaten Schemas • Kommunikation mit der Community • Google Diskussionsgruppe: https://groups.google.com/forum/?hl=en&fromgroups#!forum/datacite-metadata Business Practices • 9 Mitglieder aus 6 Nationen • Entwicklung von Empfehlungen zu Geschäftsmodellen; Formulierung der DataCite Policy, Best Practices • Zusammenarbeit mit anderen DataCite Working Groups • Business Models Principles: doi:10.5438/0007
  16. 16. 16 Das DataCite Metadaten Schema • Vorgabe der IDF, ein Mindestmaß an identifizierenden Metadaten vorzuhalten. • Aktuelle Version ist 3.0. • Ein Metadatenschema für die Verlinkung von Daten und anderen Objekten. • Disziplinübergreifend. • Auf Dublin Core basierend. • DOI-Namen des Schemas: • Dokumentation: doi:10.5438/0005 • Schema Definition: doi:10.5438/0006
  17. 17. 17 Das DataCite Metadaten Schema • Identifier (mit type Attribut) • Creator (mit type und nameIdentifier Attributen) • Title (mit optionalem type Attribut) • Publisher • PublicationYear • Zitierung: Creator (PublicationYear): Title. Publisher. Identifier Pflichtfelder
  18. 18. 18 Das DataCite Metadaten Schema • Subject (mit scheme Attribut) • Contributor (mit type und nameIdentifier Attributen) • Date (mit type Attribut) • Language • ResourceType (mit description Attribut) • AlternateIdentifier (mit type Attribut) • RelatedIdentifier (mit type und relationType Attributen) • Size • Format • Version • Rights • Description (mit type Attribut) • GeoLocation (mit point, box und place) Optionale und Recommended Felder
  19. 19. 19 • ‚nichtsprechende‘ Zeichenfolge • Zeichen für DOI-Namen: • A – Z • a – z • 0 – 9 • : (Doppelpunkt) • . (Punkt) • - (Bindestrich) • _ (Unterstrich) • / (Schrägstrich) Keine Umlaute und Sonderzeichen! http://www.tib-hannover.de/fileadmin/informationsmaterial/flyer/TIB_DOI_Service_DOKU_DT.pdf Best Practices Der DOI-Name
  20. 20. 20 Best Practices Drei Ansätze zur DOI-Vergabe und Zitierung: • Cite a specific time slice (the set of updates to the dataset made during a particular period of time); • Cite a specific snap shot (a copy of the entire dataset made at a specific time); • Cite the continuously updated dataset, but add an Access Date and Time to the citation. Note that a “time slice” and “snap shot” are versions of the dataset and require unique identifiers. The third option is controversial, because it necessarily means that following the citation does not result in observation of the resource as cited. DataCite Metadata Documentation Dynamische Daten
  21. 21. 21 “DataCite clients are the custodians of their data and therefore define the granularity of the data to which they are assigning DOIs. Because the aim of DataCite is to make data citable, however, all data registered should be easily and clearly citable.” DataCite Business Models Principles Best Practices Granularität
  22. 22. 22 Best Practices • Es gilt wie bei der Granularität: Jedes Datenzentrum ist selbst für die Bestimmung von Versionen verantwortlich. • Prinzip des „gesunden Menschenverstandes“ – kleinste Korrekturen erfordern keinen neuen DOI, es sei denn sie können große Auswirkungen haben. • Kennzeichnung von Versionen: Punkt (.) • Kennzeichnung von Teilen eines Ganzen: Schrägstriche (/) Beispiele • Ursprungs-DOI: 10.1234/abc123 • DOI einer neuen Version: 10.1234/abc123.1 • DOI eines Teils: 10.1234/abc123/2 Versionierung
  23. 23. 23 Kooperationen • ORCID • ODIN Projekt: http://odin-project.eu/ http://datacite.labs.orcid-eu.org/ • re3data.org und Databib • Übernahme der Repository Listen: http://www.datacite.org/node/115 • STM und DataCite Joint Statement (2012) • bi-directional linking, increase visibility of these links: http://www.datacite.org/node/65 • Research Data Alliance (RDA) • MoU – organizational affiliate
  24. 24. 24 DataCite Services I • http://mds.datacite.org Metadata Store Userinterface zum manuellen Registrieren von DOIs und Hochladen von Metadaten • http://schema.datacite.org Zugang zu allen Versionen des DataCite Metadatenschemas, mit Dokumentation, Schema Definition und Beispielen • http://search.datacite.org Suchmaschine für alle von DataCite gespeicherten Metadaten • http://stats.datacite.org Statistiken zu Registrierungen und Aufrufen von DOI-Namen • http://test.datacite.org Test-Umgebung der gesamten DataCite Infrastruktur
  25. 25. 25 DataCite Services II • http://data.datacite.org DataCite Content Service stellt Metadaten in verschiedenen Formaten bereit. In Zusammenarbeit mit CrossRef: • http://crosscite.org/citeproc Der Citation Formater stellt Zitierungen in über 100 Formaten bereit. • http://crosscite.org/cn/ Über die Content Negotiation kann maschinell direkt auf verschiedene (vorher hinterlegte) Medienformate eines Objektes zugegriffen werden.
  26. 26. Vielen Dank für Ihre Aufmerksamkeit!
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×