Bodil Qvistgaard, Nationalmuseet: Genvej til dine arkivdata. Eksemplet er Nationalmuseets Dagbogsprojekt. Ved hjælp af tilgængelige teknologier kombineres fuldtekstanalyse med enkle sæt af demografiske og stedbaserede data, som giver en hurtig genvej til et meget stort materiale.
Maria Knude Oldhøj Nielsen, DFI Danmark på film version 2.0.
Bodil Qvistgaard, Nationalmuseet: Genvej til dine arkivdata.
1. Projektets baggrund
1992: Ca. 50.000 dagbøger indsamles med post.
25 år
2017: Ca. 8.500 dagbøger indsamles primært digitalt
2018: Masterprojekt
Spatiel og fuldtekstbaseret analyse
Af Nationalmuseets dagbogsindsamlinger
1992 og 2017
101-02-2019
2. Hypoteser
A. Ændringer over tid kan ses i sætningers og dagbøgers
længde.
B. Forskelle i køn, alder og geografi kan ses i længden og
ordvalg.
C. Det er muligt at udlede kontekst ud fra naboord
201-02-2019
3. Fokus
Open source teknologier:
PostgreSQL, PostGIS, OpenJUMP, Python
Fokus på backend
Funktioner baseret på fuldtekst
Ingen frontend
Ingen signifikansberegninger
301-02-2019
4. Fuldtekst
Tekst:
”Jeg sidder og skriver dagbog. Er kun nået til første
side i dagens dagbog. Jeg har skrevet mange
dagbøger”
Vektor:
"'dag':13 'dagbog':5,14 'dagbøg':19 'først':10 'kun':7
'nået':8 'sid':2,11 'skrev':17 'skriv':4"
401-02-2019
5. Indsamling af data
Ikke trivelt at indsamle data
Undervurder ikke dataoprensning: 70 % af tiden
En del arbejdet kan spares ved at tænke grundigt
over indsamlingsmetoden
2017: Ca. 10 % dubletter
501-02-2019
19. Ny bogudgivelse?
Tema ”Hvor er hjem?”
Skribenter, som har
Skrevet dagbog i 1992 og 2017
261 af ca. 500 identificeret.
Eksempel – flytning
1901-02-2019
20. Ny bogudgivelse?
Tema ”Hvor er hjem?”
Søgning efter de 5 skribenter
der har flyttet sig længst.
Her i fugleflugt
Eksempel – flytning
2001-02-2019
21. Ny bogudgivelse?
Tema ”Hvor er hjem?”
Søgning efter de skribenter
Som har samme bopæl
100 i alt
Eksempel – flytning
2101-02-2019