Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Wie offen sind Forschungsdaten in
Repositorien?
Ergebnisse einer Metadatenanalyse
Maxi Kindling
Open-Access-Tage 2015
Univ...
2
Fokus
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
Wie offen sind
Forsch...
RDR
• Zugang (Policies)
• Standards (Metadatenstandards, Datenformate,
Software)
MD
• Angaben zur Nachnutzbarkeit (Fokus: ...
RDR
MD
DS
4
Offenheit und Nachnutzbarkeit von Forschungsdaten in Repositorien
Maxi Kindling (Humboldt-Universität zu Berli...
5
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
Vierkant, ...
6
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
n = 1312 R...
7
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
Open Teilw...
8
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
1
1
2
3
3
...
9
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
10
12
13
9...
10
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
6
11
20
2...
11
Repository level
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
9
10
12
1...
FDR
MD
DS
12
Offenheit und Nachnutzbarkeit von Forschungsdaten in Repositorien
Maxi Kindling (Humboldt-Universität zu Berl...
13
All metadata records
via OAI-PMH oai_dc
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. S...
14
Resource type „data set“
via OAI-PMH oai_dc (preliminary)
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-...
15
All metadata records
via OAI-PMH oai_dc (preliminary)
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage...
16
all metadata records
via OAI-PMH oai_dc (preliminary)
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage...
17
all metadata records
via OAI-PMH oai_dc
Beispiele aus <dc:rights>
Maxi Kindling (Humboldt-Universität zu Berlin) – Open...
„Der Vertragstext bei CC-Lizenzen sieht vor, dass
LizenznehmerInnen bei weiterer Verwendung der Inhalte
immer eine Kopie d...
19
resource type „data set“
via OAI-PMH oai_dc (preliminary)
Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-...
Mehr offene Forschungsdaten als wir wissen können (?)
Ein Blick in die Metadaten lohnt.
Metadatenangaben zur Offenheit und...
Grenzen und Möglichkeiten:
• Mehr Metadateninformationen über oai_dc
(Datenformate, Datentypen, Metadatenstandards).
• Ser...
Vielen Dank für die Aufmerksamkeit!
Fragen und Details: maxi.kindling@hu-berlin.de
Mein Dank für den Support geht an:
Alex...
Upcoming SlideShare
Loading in …5
×

Wie offen sind Forschungsdaten in Repositorien? Ergebnisse einer Metadatenanalyse

1,457 views

Published on

Vortrag auf den Open-Access-Tagen 2015 an der Universität Zürich am 8. September 2015

Published in: Education
  • Be the first to comment

  • Be the first to like this

Wie offen sind Forschungsdaten in Repositorien? Ergebnisse einer Metadatenanalyse

  1. 1. Wie offen sind Forschungsdaten in Repositorien? Ergebnisse einer Metadatenanalyse Maxi Kindling Open-Access-Tage 2015 Universität Zürich 8. September 2015 1Dieses Werk ist soweit nicht anders gekennzeichnet lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz http://creativecommons.org/licenses/by/4.0
  2. 2. 2 Fokus Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Wie offen sind Forschungs- daten in Repositorien? Was können wir über die Offenheit von Forschungsdaten in Repositorien wissen?
  3. 3. RDR • Zugang (Policies) • Standards (Metadatenstandards, Datenformate, Software) MD • Angaben zur Nachnutzbarkeit (Fokus: Rechtsangaben) • Schemata und Standards • Persistente Adressierung • maschinelle Lesbarkeit DS • Zugang (Authentifizierung, Datenformate) • Prozessierbarkeit (Datenformate, Dokumentation, Verfügbarkeit von Software) 3 Offenheit und Nachnutzbarkeit von Forschungsdaten in Repositorien Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015  Open Data Definition (OKFN)  Budapest Initiative (2002)  Berlin Declaration (2003)  Panton Principles (2010)  Royal Society Open Science (2012)  … RDR = Research Data Repository; MD = Metadata; DS = Data Set
  4. 4. RDR MD DS 4 Offenheit und Nachnutzbarkeit von Forschungsdaten in Repositorien Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
  5. 5. 5 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Vierkant, P., et al. (2014). Schema for the Description of Research Data Repositories. Version 2.2. doi:10.2312/re3.006 Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
  6. 6. 6 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 n = 1312 Repositorien in re3data.org (Stand: 14. August 2015) 152 359 651 666 0 100 200 300 400 500 600 700 Engineering Sciences Humanities and Social Sciences Life Sciences Natural Sciences Anzahl der Repositorien DFG subjects (oberste Kategorien, Mehrfachnennung möglich)
  7. 7. 7 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Open Teilweise Open Database Access 1250 0 Data Access 659 468 Data Upload 49 1 Database Access type, Data Access type & Data Upload type für jeweils n = 1312 (Mehrfachnennungen möglich)
  8. 8. 8 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 1 1 2 3 3 4 5 9 14 22 27 52 0 10 20 30 40 50 60 ABCD - Access to Biological Collection Data AVM - Astronomy Visualization Metadata DataCite Metadata Schema DIF - Directory Interchange Format RDF Data Cube Vocabulary EML - Ecological Metadata Language Darwin Core FGDC/CSDGM - Federal Geographic Data… ISO 19115 DDI - Data Documentation Initiative Dublin Core other Anzahl der Repositorien Metadata standards für n=1312 (Mehrfachnennung möglich, gesamt = 143)
  9. 9. 9 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 10 12 13 92 100 221 912 0 200 400 600 800 1000 ARK PURL URN other hdl DOI none Anzahl der Repositorien Persistent Identifier für n=1312 (Mehrfachnennung möglich, gesamt = 1360)
  10. 10. 10 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 6 11 20 21 178 270 512 752 0 100 200 300 400 500 600 700 800 RL, Apache 2.0, BSD (< 3) OGL CC0 ODC Public Domain CC Copyrights Other Anzahl der Repositorien License type für n=1312 (Mehrfachnennung möglich, gesamt = 1170)
  11. 11. 11 Repository level Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 9 10 12 18 49 82 150 166 271 0 50 100 150 200 250 300 NetCDF SPARQL OpenDAP SWORD SOAP OAI-PMH REST other FTP Anzahl der Repositorien API type für n=1312 (Mehrfachnennungen möglich, gesamt = 767)
  12. 12. FDR MD DS 12 Offenheit und Nachnutzbarkeit von Forschungsdaten in Repositorien Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 RDR = Research Data Repository; MD = Metadata; DS = Data Set
  13. 13. 13 All metadata records via OAI-PMH oai_dc Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 OAI-PMH Harvest Metadata format oai_dc 3.663.885 items 908.907 items in resource type <dataset> (11. Februar 2015) XML Parser Zählung der Vorkommen in <dc:rights> für jeden resource type Offenes Coding von <dc:rights> Write into SQL Database and count Auswertung der Codierungen für <dc:rights> records Anzahl der Vorkommen pro Code(gruppe)
  14. 14. 14 Resource type „data set“ via OAI-PMH oai_dc (preliminary) Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Gruppierung auf Basis des Codesystems Anzahl der Vorkommen Leeres Feld 18 Open Data Commons 613 Creative Commons 604.689 OGL 23 Rights reserved 183 Terms of Use 13.912 Text 3.127 Gesamt 622.565 Zahl der items in resource type „data set“ 908.907
  15. 15. 15 All metadata records via OAI-PMH oai_dc (preliminary) Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Gruppierung im Codesystem (Anzahl der vergebenen Codes) Varianz der Vorkommen in <dc:rights> records Creative Commons Licenses + CC0 (34) 218 Digital Peer Publishing Licenses (3) 11 info:eu-repo Licenses (4) 5 Open Government Licenses (2) 3 Open Data Commons Licenses (3) 14 Open Source Licenses (25) 74 Rights reserved/Copyrights statements (6) > 5.000 Terms of Use (5) 86 Text statements (12) 95 Codesystem gesamt (94) > 5.617 Sprache! CC: durchschnittlich 6,4 Vorkommen pro Lizenzvarianten
  16. 16. 16 all metadata records via OAI-PMH oai_dc (preliminary) Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Creative Commons cc:by:nc:nd 3.0 international: 23 verschiedene Varianten der Lizenzangabe → Abhängigkeit von (Zahl) der Content-Provider und der Zahl der items mit dieser Lizenzangabe → Abhängigkeit bei offeneren Kategorien (Text/Terms of Use) auch vom Codesystem
  17. 17. 17 all metadata records via OAI-PMH oai_dc Beispiele aus <dc:rights> Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 20 Minuten Editura Medical? Universitar?[…] Open access for scientific and educational purposes under requirement of correct citation (see above). The data may be used for scholarly research only.
  18. 18. „Der Vertragstext bei CC-Lizenzen sieht vor, dass LizenznehmerInnen bei weiterer Verwendung der Inhalte immer eine Kopie der Lizenz oder die Uniform Resource Identifier (URI) der jeweiligen Lizenz angeben.“ (S. 56) 18 Beispiel Creative Commons Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 78 September 2015 Voigt, Micheala (2014) Nutzungsrechte bei institutionellen Repositorien in Deutschland – Analyse der Rechteübertragung und Metadatenangaben. urn:nbn:de:kobv:11-1002283262014
  19. 19. 19 resource type „data set“ via OAI-PMH oai_dc (preliminary) Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015 Codierung (open) Varianz <dc:rights> records mit URI (von gesamt) Anzahl Vorkommen <dc:rights>-records mit URI (open) cc:by 3.0 international 2 (4) 201.743 cc:by:nc 3.0 international 1 (3) 1.546 cc:by:nc:sa 3.0 Ireland 1 (1) 360 CC0 1.0 Public domain dedication 3 (9) 206 cc:by:nc:nd 3.0 international 1 (2) 6 cc:by:sa 3.0 international 1 (2) 5 cc:by:nc:sa 3.0 international 1 (2) 1 cc:by:nd 3.0 international 1 (2) 1 cc:by 3.0 Australia 1 (1) 1 Open Data Commons BY 1.0 1 (4) 1 Gesamt 13 (98) 203.870 (201.951)
  20. 20. Mehr offene Forschungsdaten als wir wissen können (?) Ein Blick in die Metadaten lohnt. Metadatenangaben zur Offenheit und Nachnutzbarkeit müssen normiert, standardisiert, maschinell lesbar aufbereitet werden. • Unterstützung von Initiativen wie: www.rightsstatements.org 20 Fazit & Diskussion Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
  21. 21. Grenzen und Möglichkeiten: • Mehr Metadateninformationen über oai_dc (Datenformate, Datentypen, Metadatenstandards). • Service Provider oder Dataprovider? • Metadatenmapping zu oai_dc • Verknüpfung mit Datentypen/Repositorien. • Weitere Samples (re3data.org RDR und BASE in Vorbereitung). • Mehr Schnittstellen. • Was ist ein Forschungsdatenrepositorium? Was beschreiben Metadaten? Was ist ein Datensatz? 21 Ausblick Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 8. September 2015
  22. 22. Vielen Dank für die Aufmerksamkeit! Fragen und Details: maxi.kindling@hu-berlin.de Mein Dank für den Support geht an: Alexander Petrus und Stephanie van de Sandt (HU Berlin), das Projektteam von re3data.org, Frauke Ziedorn (DataCite) und vorab an Friedrich Summann (BASE) 22 Danke! Maxi Kindling (Humboldt-Universität zu Berlin) – Open-Access-Tage Zürich – 7. September 2015

×