SlideShare a Scribd company logo
1 of 8
Download to read offline
Höher, schneller, weiter?
Datenmanagement
mit Augenmaß!
Astrid Recker | Sebastian Netscher | Jessica Trixa
GESIS – Datenarchiv für Sozialwissenschaften
archive.training@gesis.org | @CESSDAtraining
2. Workshop der DINI/nestor-AG Forschungsdaten:
„Datenmanagementpläne und ihre Bedeutung im Forschungsdatenmanagement“
Berlin, 23. März 2015
(planung)
http://creativecommons.org/licenses/by/4.0/
● Herausforderungen:
– Menschliche Teilnehmer_innen = ethische und
rechtliche Einschränkungen;
– Messungen in der Regel nicht oder nur mit großem
Aufwand wiederholbar;
– Umfassende Kontextinformationen notwendig, um
Interpretierbarkeit zu erhalten.
Sozialwissenschaftliche
Forschungsdaten
Bild: CC0
Fallbeispiel (fiktiv)
2008-2012 …........................................... ......20152008-2012 …........................................... ......2015
Archiv
Feldinstitut
„Begünstigende Faktoren
für Studienabbrüche
in STEM-Fächern“
● Nationales Verbundprojekt;
● quantitative und qualitative Daten in
mehreren Wellen;
● Werkpakete an verschiedenen Standorten;
● Datenerhebung: Feldinstitut (verwendet
eigene Standard-Einwilligungserklärungen);
● Daten werden lokal in den Institutionen
gespeichert;
● lokale Regelungen zur Datenaufbereitung
und Versionierung;
● zwischen Projektende und Übergabe der
Daten an ein Archiv vergehen mehrere
Jahre.
Grafiken: RRZE (cc-by-sa) https://github.com/RRZE-PP/rrze-icon-set
Probleme im Fallbeispiel
● Informationen über die Feldphase / den Interviewprozess fehlen;
● Vom Feldinstitut verwendete Einwilligungserklärung schließt eine Weitergabe
der Daten an Dritte außerhalb der Forschergruppe aus;
● Kodierung und Datenaufbereitung erfolgten nicht einheitlich an allen
Standorten;
● keine konsistente Versionierung;
● Uneinheitliche Verwendung von Software und Formaten bei Daten, die
zusammengespielt werden müssten (z.B. STATA vs SPSS; ODF vs. DOCX);
● Qualitative Daten wurden nicht anonymisiert/pseudonymisiert;
● Zwischen Projektende und Einreichung beim Archiv sind mehrere Jahre
vergangen – Kontextinformationen nur noch mit hohem Aufwand
reproduzierbar, wenn überhaupt.
Ziele des Datenmanagements
Bild: CC0
2. Replizierbarkeit
Verständlichkeit;
Reproduzierbarkeit der
Forschungsergebnisse
ermöglichen, Nachweis
der Validität
1. Qualitätssicherung
lesbare, authentische
Daten; Vermeidung von
Datenverlusten
3. Nachnutzbarkeit
Nutzung der Daten in
neuen Kontexten,
Beantwortung neuer
Forschungsfragen
1. Qualitätssicherung 3. Nachnutzbarkeit2. Replizierbarkeit
Z i e l e u n d M a ß n a h m e n d e s D a t e n m a n a g e m e n t s
Backup-/Sicherheitskonzept
(Projektlaufzeit)
Backup-/Sicherheitskonzept
(10 Jahre nach Projektende)
Planung der Übergabe an Archiv
oder Repository
Richtlinien zur Datenerhebung,
-aufbereitung, Versionierung, etc.
Beachtung von Standards
(z.B. bei der Skalen- oder
Variablenbildung)
Minimale Dokumentation,
insbesondere zu Sampling,
Interviews, Variablen- und
Codelabel
Strukturierte/unstrukturierte
Metadaten zur Dokumentation des
gesamten Forschungsprozesses
(Feldphase, Bereinigung, Analyse,
etc.)
Detailliertere Dokumentation
(z.B. bis auf Variablenebene;
zusätzliche Kontextinformationen)
Klärung ethischer/rechtlicher
Fragen zur Datenerhebung,
-speicherung und Weitergabe in
der Forschergruppe (informierte
Einwilligung)
Klärung ethischer/rechtlicher
Fragen zur Speicherung und
Weitergabe an Dritte
Klärung ethischer/rechtlicher
Fragen,
● die sich bei einer Verknüpfung
von Datensätzen ergeben
können
(z.B. De-Anonymisierung)
● die bei der Übergabe an ein
Archiv zu beachten sind
Einsatz adäquater Dateiformate
für den Projektzweck
Einsatz von Formaten, die
(voraussichtlich) in 10 Jahren
noch lesbar sind
Einsatz adäquater Dateiformate
für die Nachnutzung
Datenmanagement mit Augenmaß
● „Angemessen“ heißt „so viel wie nötig“ um ein
angestrebtes Ziel zu erreichen
● Stehen der Nutzen des angestrebten Ziels und der
Aufwand in einem angemessenen Verhältnis?
Aufwand
Nutzen
Datenmanagement mit Augenmaß
Um diesen Anspruch einzulösen brauchen wir
Werkzeuge zur
Kostenkalkulation
(disziplinspezifische)
Kostenmodelle
Ökonomische
Modelle

More Related Content

Viewers also liked

El Recicaje Y La Contaminacion
El Recicaje Y La ContaminacionEl Recicaje Y La Contaminacion
El Recicaje Y La Contaminacion
lina04
 
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
Luciana Tamas
 
Matematicos famosos-1218472932730776-9
Matematicos famosos-1218472932730776-9Matematicos famosos-1218472932730776-9
Matematicos famosos-1218472932730776-9
Dept. Educacion
 

Viewers also liked (18)

Tema 04 Dy A
Tema 04  Dy ATema 04  Dy A
Tema 04 Dy A
 
Buena Idea 3
Buena Idea 3Buena Idea 3
Buena Idea 3
 
Paredes Que Hablan E Interpelan El Mundo
Paredes Que Hablan E Interpelan El MundoParedes Que Hablan E Interpelan El Mundo
Paredes Que Hablan E Interpelan El Mundo
 
Bioingenieria
BioingenieriaBioingenieria
Bioingenieria
 
El Recicaje Y La Contaminacion
El Recicaje Y La ContaminacionEl Recicaje Y La Contaminacion
El Recicaje Y La Contaminacion
 
100 años atras
100 años atras100 años atras
100 años atras
 
PresentacióN P Lan De Gestion Tics Robledo 2
PresentacióN P Lan De Gestion Tics Robledo 2PresentacióN P Lan De Gestion Tics Robledo 2
PresentacióN P Lan De Gestion Tics Robledo 2
 
Unternehmerische Tätigkeit in Österreich: Relevante Aspekte des österreichisc...
Unternehmerische Tätigkeit in Österreich: Relevante Aspekte des österreichisc...Unternehmerische Tätigkeit in Österreich: Relevante Aspekte des österreichisc...
Unternehmerische Tätigkeit in Österreich: Relevante Aspekte des österreichisc...
 
Tema 04 DyA
Tema 04  DyATema 04  DyA
Tema 04 DyA
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1
 
Academia ..
Academia ..Academia ..
Academia ..
 
Redes Ethernet UCV 2009
Redes Ethernet UCV 2009Redes Ethernet UCV 2009
Redes Ethernet UCV 2009
 
Academia ..
Academia ..Academia ..
Academia ..
 
Aaaaa
AaaaaAaaaa
Aaaaa
 
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
LUCIANA TAMAS - REVISTA ARGO NR. 20 / 2000
 
LA FOTOGRAFÍA
LA FOTOGRAFÍALA FOTOGRAFÍA
LA FOTOGRAFÍA
 
5 Hausmittel gegen Fingernägel kauen
5 Hausmittel gegen Fingernägel kauen5 Hausmittel gegen Fingernägel kauen
5 Hausmittel gegen Fingernägel kauen
 
Matematicos famosos-1218472932730776-9
Matematicos famosos-1218472932730776-9Matematicos famosos-1218472932730776-9
Matematicos famosos-1218472932730776-9
 

Similar to Höher, schneller, weiter? Datenmanagement mit Augenmaß!

Similar to Höher, schneller, weiter? Datenmanagement mit Augenmaß! (20)

Qualitative Datenanalyse
Qualitative DatenanalyseQualitative Datenanalyse
Qualitative Datenanalyse
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
 
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
 
Learning Analytics
Learning AnalyticsLearning Analytics
Learning Analytics
 
Dehnhard, I., Weiland, P. (2011, März). Toolbasierte Datendokumentation in de...
Dehnhard, I., Weiland, P. (2011, März). Toolbasierte Datendokumentation in de...Dehnhard, I., Weiland, P. (2011, März). Toolbasierte Datendokumentation in de...
Dehnhard, I., Weiland, P. (2011, März). Toolbasierte Datendokumentation in de...
 
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
 
SDIC'16 - Best Practices für Smart Data Projekte
SDIC'16 - Best Practices für Smart Data ProjekteSDIC'16 - Best Practices für Smart Data Projekte
SDIC'16 - Best Practices für Smart Data Projekte
 
Institutional Repository for Research Data - Support for Science and Scientis...
Institutional Repository for Research Data - Support for Science and Scientis...Institutional Repository for Research Data - Support for Science and Scientis...
Institutional Repository for Research Data - Support for Science and Scientis...
 
Muc 2018-Panel-Lean-User-Research
Muc 2018-Panel-Lean-User-ResearchMuc 2018-Panel-Lean-User-Research
Muc 2018-Panel-Lean-User-Research
 
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
 
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
 
Untersuchung des Einflusses von Popularitätsdaten auf die Relevanzbewertung i...
Untersuchung des Einflusses von Popularitätsdaten auf die Relevanzbewertung i...Untersuchung des Einflusses von Popularitätsdaten auf die Relevanzbewertung i...
Untersuchung des Einflusses von Popularitätsdaten auf die Relevanzbewertung i...
 
Softwaretests in der Domäne modellgetriebener BI-Systeme
Softwaretests in der Domäne modellgetriebener BI-SystemeSoftwaretests in der Domäne modellgetriebener BI-Systeme
Softwaretests in der Domäne modellgetriebener BI-Systeme
 
Neue Räume - neue Regeln? Ethische Herausforderungen des Forschens im Netz
Neue Räume - neue Regeln? Ethische Herausforderungen des Forschens im NetzNeue Räume - neue Regeln? Ethische Herausforderungen des Forschens im Netz
Neue Räume - neue Regeln? Ethische Herausforderungen des Forschens im Netz
 
Continuity-Seminar-Dokumentation (unfertig) 2006-02-16
Continuity-Seminar-Dokumentation (unfertig) 2006-02-16Continuity-Seminar-Dokumentation (unfertig) 2006-02-16
Continuity-Seminar-Dokumentation (unfertig) 2006-02-16
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
Big Data und Business Intelligence
Big Data und Business IntelligenceBig Data und Business Intelligence
Big Data und Business Intelligence
 
TDWI Buchprojekt: Data Governance - Problemfelder in der Umsetzung von BI-Pro...
TDWI Buchprojekt: Data Governance - Problemfelder in der Umsetzung von BI-Pro...TDWI Buchprojekt: Data Governance - Problemfelder in der Umsetzung von BI-Pro...
TDWI Buchprojekt: Data Governance - Problemfelder in der Umsetzung von BI-Pro...
 
Datenanalyse in der Praxis
Datenanalyse in der PraxisDatenanalyse in der Praxis
Datenanalyse in der Praxis
 

More from CESSDA Training

Alive and kicking! Keeping data re-usable in the European Values Study
Alive and kicking! Keeping data re-usable in the European Values StudyAlive and kicking! Keeping data re-usable in the European Values Study
Alive and kicking! Keeping data re-usable in the European Values Study
CESSDA Training
 
Access Policies and Licensing for Archives and Repositories
Access Policies and Licensing for Archives and RepositoriesAccess Policies and Licensing for Archives and Repositories
Access Policies and Licensing for Archives and Repositories
CESSDA Training
 

More from CESSDA Training (10)

Supporting the creation, management, and long-term preservation of social sc...
Supporting the creation, management, and  long-term preservation of social sc...Supporting the creation, management, and  long-term preservation of social sc...
Supporting the creation, management, and long-term preservation of social sc...
 
Academic Writing and Research Data Management
Academic Writing and Research Data ManagementAcademic Writing and Research Data Management
Academic Writing and Research Data Management
 
Alive and kicking! Keeping data re-usable in the European Values Study
Alive and kicking! Keeping data re-usable in the European Values StudyAlive and kicking! Keeping data re-usable in the European Values Study
Alive and kicking! Keeping data re-usable in the European Values Study
 
De-mystifying OAIS compliance Benefits and challenges of mapping the OAIS re...
De-mystifying OAIS compliance  Benefits and challenges of mapping the OAIS re...De-mystifying OAIS compliance  Benefits and challenges of mapping the OAIS re...
De-mystifying OAIS compliance Benefits and challenges of mapping the OAIS re...
 
Access Policies and Licensing for Archives and Repositories
Access Policies and Licensing for Archives and RepositoriesAccess Policies and Licensing for Archives and Repositories
Access Policies and Licensing for Archives and Repositories
 
A Look at CESSDA and Data Re-use Licenses
A Look at CESSDA and Data Re-use LicensesA Look at CESSDA and Data Re-use Licenses
A Look at CESSDA and Data Re-use Licenses
 
Archive and Data Management Training Center
Archive and Data Management Training CenterArchive and Data Management Training Center
Archive and Data Management Training Center
 
Archiving and Data Management Training and Information Center
Archiving and Data Management Training and Information CenterArchiving and Data Management Training and Information Center
Archiving and Data Management Training and Information Center
 
Archives as a market regulator, or how can archives connect supply and demand?
Archives as a market regulator, or how can archives connect supply and demand?Archives as a market regulator, or how can archives connect supply and demand?
Archives as a market regulator, or how can archives connect supply and demand?
 
Election studies: a research data management challenge
Election studies: a research data management challengeElection studies: a research data management challenge
Election studies: a research data management challenge
 

Höher, schneller, weiter? Datenmanagement mit Augenmaß!

  • 1. Höher, schneller, weiter? Datenmanagement mit Augenmaß! Astrid Recker | Sebastian Netscher | Jessica Trixa GESIS – Datenarchiv für Sozialwissenschaften archive.training@gesis.org | @CESSDAtraining 2. Workshop der DINI/nestor-AG Forschungsdaten: „Datenmanagementpläne und ihre Bedeutung im Forschungsdatenmanagement“ Berlin, 23. März 2015 (planung) http://creativecommons.org/licenses/by/4.0/
  • 2. ● Herausforderungen: – Menschliche Teilnehmer_innen = ethische und rechtliche Einschränkungen; – Messungen in der Regel nicht oder nur mit großem Aufwand wiederholbar; – Umfassende Kontextinformationen notwendig, um Interpretierbarkeit zu erhalten. Sozialwissenschaftliche Forschungsdaten Bild: CC0
  • 3. Fallbeispiel (fiktiv) 2008-2012 …........................................... ......20152008-2012 …........................................... ......2015 Archiv Feldinstitut „Begünstigende Faktoren für Studienabbrüche in STEM-Fächern“ ● Nationales Verbundprojekt; ● quantitative und qualitative Daten in mehreren Wellen; ● Werkpakete an verschiedenen Standorten; ● Datenerhebung: Feldinstitut (verwendet eigene Standard-Einwilligungserklärungen); ● Daten werden lokal in den Institutionen gespeichert; ● lokale Regelungen zur Datenaufbereitung und Versionierung; ● zwischen Projektende und Übergabe der Daten an ein Archiv vergehen mehrere Jahre. Grafiken: RRZE (cc-by-sa) https://github.com/RRZE-PP/rrze-icon-set
  • 4. Probleme im Fallbeispiel ● Informationen über die Feldphase / den Interviewprozess fehlen; ● Vom Feldinstitut verwendete Einwilligungserklärung schließt eine Weitergabe der Daten an Dritte außerhalb der Forschergruppe aus; ● Kodierung und Datenaufbereitung erfolgten nicht einheitlich an allen Standorten; ● keine konsistente Versionierung; ● Uneinheitliche Verwendung von Software und Formaten bei Daten, die zusammengespielt werden müssten (z.B. STATA vs SPSS; ODF vs. DOCX); ● Qualitative Daten wurden nicht anonymisiert/pseudonymisiert; ● Zwischen Projektende und Einreichung beim Archiv sind mehrere Jahre vergangen – Kontextinformationen nur noch mit hohem Aufwand reproduzierbar, wenn überhaupt.
  • 5. Ziele des Datenmanagements Bild: CC0 2. Replizierbarkeit Verständlichkeit; Reproduzierbarkeit der Forschungsergebnisse ermöglichen, Nachweis der Validität 1. Qualitätssicherung lesbare, authentische Daten; Vermeidung von Datenverlusten 3. Nachnutzbarkeit Nutzung der Daten in neuen Kontexten, Beantwortung neuer Forschungsfragen
  • 6. 1. Qualitätssicherung 3. Nachnutzbarkeit2. Replizierbarkeit Z i e l e u n d M a ß n a h m e n d e s D a t e n m a n a g e m e n t s Backup-/Sicherheitskonzept (Projektlaufzeit) Backup-/Sicherheitskonzept (10 Jahre nach Projektende) Planung der Übergabe an Archiv oder Repository Richtlinien zur Datenerhebung, -aufbereitung, Versionierung, etc. Beachtung von Standards (z.B. bei der Skalen- oder Variablenbildung) Minimale Dokumentation, insbesondere zu Sampling, Interviews, Variablen- und Codelabel Strukturierte/unstrukturierte Metadaten zur Dokumentation des gesamten Forschungsprozesses (Feldphase, Bereinigung, Analyse, etc.) Detailliertere Dokumentation (z.B. bis auf Variablenebene; zusätzliche Kontextinformationen) Klärung ethischer/rechtlicher Fragen zur Datenerhebung, -speicherung und Weitergabe in der Forschergruppe (informierte Einwilligung) Klärung ethischer/rechtlicher Fragen zur Speicherung und Weitergabe an Dritte Klärung ethischer/rechtlicher Fragen, ● die sich bei einer Verknüpfung von Datensätzen ergeben können (z.B. De-Anonymisierung) ● die bei der Übergabe an ein Archiv zu beachten sind Einsatz adäquater Dateiformate für den Projektzweck Einsatz von Formaten, die (voraussichtlich) in 10 Jahren noch lesbar sind Einsatz adäquater Dateiformate für die Nachnutzung
  • 7. Datenmanagement mit Augenmaß ● „Angemessen“ heißt „so viel wie nötig“ um ein angestrebtes Ziel zu erreichen ● Stehen der Nutzen des angestrebten Ziels und der Aufwand in einem angemessenen Verhältnis? Aufwand Nutzen
  • 8. Datenmanagement mit Augenmaß Um diesen Anspruch einzulösen brauchen wir Werkzeuge zur Kostenkalkulation (disziplinspezifische) Kostenmodelle Ökonomische Modelle