Forskningsdata
Digital kultur i humaniora
10 april 2015
Jessica Parland-von Essen
Helsingfors univeristet
Vad är forskningsdata?
"Research data is defined as recorded factual material
commonly retained by and accepted in the scientific
community as necessary to validate research findings;
although the majority of such data is created in digital
format, all research data is included irrespective of the
format in which it is created.”
The Engineering and Physical Sciences Research Council
http://www2.le.ac.uk/services/research-data/rdm/what-is-rdm/research-data
DCC: Managing Research Data.mov
https://www.youtube.com/watch?v=2JBQS0qKOBU
Kvantitativ forskning
● Statistiska metoder
● Registerforskning
● THL https://www.thl.fi/sv/web/thlfi-sv
● Statistik Finlandhttp://www.stat.fi
● Statistik EUhttp://ec.europa.eu/
● Öppen data https://www.avoindata.fi/
● Samhällsvetenskaplig data https://services.fsd.uta.fi/
● Textresurser, exempel
● Finska och svenska https://korp.csc.fi
● Engelska https://books.google.com/ngrams
● Visualiseringar
Viktiga frågor
● Säkerhet, etik och integritet
● Datamodellering
● Hur förhåller sig data/indikatorerna till det de representerar och till
varandra (beroende/oberoende?)
● Hur kodas relationer?
● Metadata för variabler?
● Datas kvalitet
● Korrekthet
● Norm- och standardenlighet
● Koherens
● Entydighet
● Begriplighet
Viktiga frågor
● Vilken datamängd? Representativitet
● Hypotes och operationalisering
● Samlas eller skapas ny data?
● Sker digitalisering, kvalitetsfrågor?
● Metadata och dokumentation
● Instrument
● Insamlingsmetoder
● Vilka variabler? Vad mäter vi och hur?
Kvantitativa metoder
● Faktoranalys
● Variansanalys
● Regressionsanalys
Läsning
https://www.khanacademy.org/math/probability
http://www.fsd.uta.fi/menetelmaopetus/intro.html
Gapminder.or
g
Nätverk och modellering
● Kladisitik, stemmatologi
● Nätverksanalyser
● Visualiseringar (relationer, förlopp, geografi)
● Digitala metoder stärker möjlighet till abduktion,
vid sidan av deduktiva och induktiva metoder
● Mönster och anomalier som behöver förklaras
kan framträda
● Kräver stor substanskännedom!
Alaric Hall: ”Making Stemmas with Small Samples, and New Media Approaches to
Publishing them: Testing the Stemma of Konráðs saga keisarasonar”, University of
Leeds. http://digitalmedievalist.org/journal/9/hall/support/index.html
Kritik
http://twentytwowords.com/funny-graphs-show-correlation-between-completely-
unrelated-stats-9-pictures/4/
Kritik
● Chimären om objektivitet
● Styrkan av visuella bevis
● Den svarta lådan
● Interdisciplinariteten
● Jakten på universalism
Berharnd Rieder & Theo Röhler
http://essetter.blogspot.fi/2012/10/5-utmaningar-inom-digital-humaniora.html#.VSD6YpTkSHo
http://www.ted.com/talks/what_we_learned_from_5_million_books?language=en
Kvalitativa metoder
● Innehåller oftast personuppgifter
● Personskydd och upphovsrätt gäller alla ”nyare” material
● Kräver avtal och planering
● Anonymisering
● Kontakta alltid dataarkiv i tid!
Läsning
http://www.fsd.uta.fi/menetelmaopetus/kvali/index.html
Hantering av forskningsdata
● Planering, planering, planering!
● Universitetets direktiv och tjänster
● http://www.helsinki.fi/kirjasto/fi/avuksi/tutkimusdatan-hallinta/
● Samhällsvetenskapliga dataarkivet
● http://www.fsd.uta.fi/aineistonhallinta/fi/
● Intiativet för öppen forskning och vetenskap
● http://avointiede.fi/www-kasikirja
Att jobba med kvalitet
● Dokumentation
● Beständighet
● Begriplighet
● Återanvändbarhet
● Ändamålsenlighet
Ge andra (och dig själv) möjlighet att använda
materialet igen för trovärdighet och kvalitet!
Att skapa ny data
● Var konsekvent då du kodar information
● Använd etablerade standarder där de finns
● Ordlistor och kodningmanualer viktiga (använd existerande då de finns)
● Varenda lista -> åtminstone en excel!
● Strukturera så mycket som möjligt (aldrig olika typers information
i samma fält!)
● Undvik allmänna fritextavsnitt så långt det går, men ha gärna
deskriptiva o a fria kommenter också. Inför koder genast möjligt
● Använd beständiga identifikatorer (PID) om möjligt för saker
● Noggrann beskrivning för procedur och principer som
uppdateras! Försiktighet vid uppdateringar
● Dokumentera proveniens
Öppen data är ...
... möjlig att hitta
... maskinläsbar
... dynamisk
... licenserad
Data Management
● Skapa
● Samla
● Strukturera
● Beskriva
● Förvara
● Dela
● Kuratera
● Arkivera
● Bevara
God datahantering ger bättre kvalitet på
forskningen

Forskningsdataforhumanister

  • 1.
    Forskningsdata Digital kultur ihumaniora 10 april 2015 Jessica Parland-von Essen Helsingfors univeristet
  • 2.
    Vad är forskningsdata? "Researchdata is defined as recorded factual material commonly retained by and accepted in the scientific community as necessary to validate research findings; although the majority of such data is created in digital format, all research data is included irrespective of the format in which it is created.” The Engineering and Physical Sciences Research Council http://www2.le.ac.uk/services/research-data/rdm/what-is-rdm/research-data DCC: Managing Research Data.mov https://www.youtube.com/watch?v=2JBQS0qKOBU
  • 3.
    Kvantitativ forskning ● Statistiskametoder ● Registerforskning ● THL https://www.thl.fi/sv/web/thlfi-sv ● Statistik Finlandhttp://www.stat.fi ● Statistik EUhttp://ec.europa.eu/ ● Öppen data https://www.avoindata.fi/ ● Samhällsvetenskaplig data https://services.fsd.uta.fi/ ● Textresurser, exempel ● Finska och svenska https://korp.csc.fi ● Engelska https://books.google.com/ngrams ● Visualiseringar
  • 4.
    Viktiga frågor ● Säkerhet,etik och integritet ● Datamodellering ● Hur förhåller sig data/indikatorerna till det de representerar och till varandra (beroende/oberoende?) ● Hur kodas relationer? ● Metadata för variabler? ● Datas kvalitet ● Korrekthet ● Norm- och standardenlighet ● Koherens ● Entydighet ● Begriplighet
  • 5.
    Viktiga frågor ● Vilkendatamängd? Representativitet ● Hypotes och operationalisering ● Samlas eller skapas ny data? ● Sker digitalisering, kvalitetsfrågor? ● Metadata och dokumentation ● Instrument ● Insamlingsmetoder ● Vilka variabler? Vad mäter vi och hur?
  • 6.
    Kvantitativa metoder ● Faktoranalys ●Variansanalys ● Regressionsanalys Läsning https://www.khanacademy.org/math/probability http://www.fsd.uta.fi/menetelmaopetus/intro.html Gapminder.or g
  • 7.
    Nätverk och modellering ●Kladisitik, stemmatologi ● Nätverksanalyser ● Visualiseringar (relationer, förlopp, geografi) ● Digitala metoder stärker möjlighet till abduktion, vid sidan av deduktiva och induktiva metoder ● Mönster och anomalier som behöver förklaras kan framträda ● Kräver stor substanskännedom!
  • 8.
    Alaric Hall: ”MakingStemmas with Small Samples, and New Media Approaches to Publishing them: Testing the Stemma of Konráðs saga keisarasonar”, University of Leeds. http://digitalmedievalist.org/journal/9/hall/support/index.html
  • 9.
  • 10.
    Kritik ● Chimären omobjektivitet ● Styrkan av visuella bevis ● Den svarta lådan ● Interdisciplinariteten ● Jakten på universalism Berharnd Rieder & Theo Röhler http://essetter.blogspot.fi/2012/10/5-utmaningar-inom-digital-humaniora.html#.VSD6YpTkSHo http://www.ted.com/talks/what_we_learned_from_5_million_books?language=en
  • 11.
    Kvalitativa metoder ● Innehålleroftast personuppgifter ● Personskydd och upphovsrätt gäller alla ”nyare” material ● Kräver avtal och planering ● Anonymisering ● Kontakta alltid dataarkiv i tid! Läsning http://www.fsd.uta.fi/menetelmaopetus/kvali/index.html
  • 12.
    Hantering av forskningsdata ●Planering, planering, planering! ● Universitetets direktiv och tjänster ● http://www.helsinki.fi/kirjasto/fi/avuksi/tutkimusdatan-hallinta/ ● Samhällsvetenskapliga dataarkivet ● http://www.fsd.uta.fi/aineistonhallinta/fi/ ● Intiativet för öppen forskning och vetenskap ● http://avointiede.fi/www-kasikirja
  • 13.
    Att jobba medkvalitet ● Dokumentation ● Beständighet ● Begriplighet ● Återanvändbarhet ● Ändamålsenlighet Ge andra (och dig själv) möjlighet att använda materialet igen för trovärdighet och kvalitet!
  • 14.
    Att skapa nydata ● Var konsekvent då du kodar information ● Använd etablerade standarder där de finns ● Ordlistor och kodningmanualer viktiga (använd existerande då de finns) ● Varenda lista -> åtminstone en excel! ● Strukturera så mycket som möjligt (aldrig olika typers information i samma fält!) ● Undvik allmänna fritextavsnitt så långt det går, men ha gärna deskriptiva o a fria kommenter också. Inför koder genast möjligt ● Använd beständiga identifikatorer (PID) om möjligt för saker ● Noggrann beskrivning för procedur och principer som uppdateras! Försiktighet vid uppdateringar ● Dokumentera proveniens
  • 16.
    Öppen data är... ... möjlig att hitta ... maskinläsbar ... dynamisk ... licenserad
  • 17.
    Data Management ● Skapa ●Samla ● Strukturera ● Beskriva ● Förvara ● Dela ● Kuratera ● Arkivera ● Bevara
  • 18.
    God datahantering gerbättre kvalitet på forskningen