E-Politieke geschiedenis 1
E-Politieke geschiedenis
Slimmer zoeken en Distant Reading
Maarten Marx
Informatica Institute, Universiteit van Amsterdam
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen,
2013-09-13
E-Politieke geschiedenis 2
Inhoud
• Ik laat 2 manieren zien om computers in te zetten om onderzoek
te doen in Politieke Geschiedenis.
• Onderzoek is steeds comparatief en diachronisch. (Vaak landen
vergelijken door de tijd).
E-Politieke geschiedenis 3
E-geschiedenis bedrijven
Twee manieren om met gigantische collecties gedigitaliseerde
bronenn om te gaan:
1. Lekker makkelijk zoeken Alles handig thuis bij de hand.
Verder net als vroeger, zelf lezen en interpreteren. “Close reading”
2. Distant reading laat de computer patronen en verbanden zichtbaar
maken (niet ontdekken, dat moet je zelf doen) door datasets
onderling en door de tijd te vergelijken.
E-Politieke geschiedenis 4
Zoeken
• Jullie zijn vast welbekend met zoeken in
statengeneraaldigitaal.nl en kbkranten.nl.
• Ik laat zien hoe dat net weer wat beter kan.
E-Politieke geschiedenis 5
Zoeken in expliciet gestructureerde tekst
• Maak structuur die impliciet aanwezig is in documenten ook voor
de machine leesbaar en gebruik die structuur in je zoekmachine.
• Voorbeeld: zoek naar toespraken over fascisme in het parlement
• http://search.politicalmashup.nl
• Zoek op fascis*, en vraag speeches terug.
E-Politieke geschiedenis 6
Voordelen
• Meer mogelijkheden om resultaten te ordenen en om granulariteit
in te stellen.
• Direct naar de juiste plek in het document. Maar met context.
• Documenten bevatten extra informatie en zijn verbonden met
andere bronnen (hier biografie¨en)
E-Politieke geschiedenis 7
Uitgebreid zoeken in kranten
• Niet alles in mogelijk met een zoekmachine.
• Bijvoorbeeld prefix-queries als “welke samenstellingen worden er
gemaakt met fascist/fascisme?”
• Query van de vorm *fascis*
• Kan met reguliere expressies, maar duurt wat langer
• http://kbkranten.politicalmashup.nl en zoek op
w+fascisw+.
• Dit is slechts 0.1 promille van het hele KB kranten corpus.
• Zoek wat er allemaal fascistisch wordt gevonden:
bfascistischeb bw+b
E-Politieke geschiedenis 8
E-geschiedenis bedrijven
Twee manieren om met gigantische collecties gedigitaliseerde
bronenn om te gaan:
1. Lekker makkelijk zoeken Alles handig thuis bij de hand.
Verder net als vroeger, zelf lezen en interpreteren. “Close reading”
2. “Distant reading”: Laat de computer patronen en verbanden
zichtbaar maken (niet ontdekken, dat moet je zelf doen) door
datasets onderling en door de tijd te vergelijken.
E-Politieke geschiedenis 9
Distant reading
• Voorbeeld: onderzoek naar populistische partijen in parlement (de
Vreese/van de Brug/Vliegenthart).
• Vergelijk taalgebruik in verschillende parlementen door de tijd.
• Stel zelfde query in verschillende talen
’immigra* OR minderhe* OR vreemdeling OR ethni* OR
asiel* OR (ras AND relaties) OR migra*’,
’immigra* OR minorit* OR ethni* OR asylum* OR (race
AND relations) OR migrat*’
E-Politieke geschiedenis 10
Wie gebruikt in NL parlement fascisme?
• Haal de speeches op, en zet ze om in een (Excel) spreadsheet.
• Google Fusion table:
https://www.google.com/fusiontables/DataSource?
docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U
• Tel hoeveel hits per persoon, en per partij
E-Politieke geschiedenis 11
Per persoon
bash-3.2$ cat fascisme.csv |awk -F$’t’ ’{print $2}’ |sort|uniq -c|sort -nr
6
5 Rutte
5 Pechtold
4 Wilders
3 Timmermans
3 Middel
3 Kox
3 Halsema
2 Van Gennip
2 Roemer
2 De Roon
2 Bosma
1 Werner
PS: ook heel makkelijk te doen in Excel/Fusion Tables: add
summary, choose the Speaker column.
E-Politieke geschiedenis 12
per partij
bash-3.2$ cat fascisme.csv |awk -F$’t’ ’{print $5}’ |sort
9 PVV
9 D66
8 PvdA
7 VVD
7 SP
6 GroenLinks
6
4 CDA
1 speaker-party
1 Groep Wilders
1 CD
1 ""
E-Politieke geschiedenis 13
Netwerk
• Wie gebruikt fascisme tijdens hetzelfde debat en waar gaat dat
dan over?
• https://www.google.com/fusiontables/DataSource?
docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U
E-Politieke geschiedenis 14
Tot slot
• Computers bieden veel meer voor geschiedenis-onderzoek dan
“gewoon zoeken”.
• Zeker voor politieke geschiedenis is er heel veel prachtig materiaal
digitaal beschikbaar: http://search.politicalmashup.nl
• En er komt nog meer: NWO ExPoSe project (Jaap Kamps,
Maarten Marx en heel veel erfgoed instellingen)

Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

  • 1.
    E-Politieke geschiedenis 1 E-Politiekegeschiedenis Slimmer zoeken en Distant Reading Maarten Marx Informatica Institute, Universiteit van Amsterdam Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
  • 2.
    E-Politieke geschiedenis 2 Inhoud •Ik laat 2 manieren zien om computers in te zetten om onderzoek te doen in Politieke Geschiedenis. • Onderzoek is steeds comparatief en diachronisch. (Vaak landen vergelijken door de tijd).
  • 3.
    E-Politieke geschiedenis 3 E-geschiedenisbedrijven Twee manieren om met gigantische collecties gedigitaliseerde bronenn om te gaan: 1. Lekker makkelijk zoeken Alles handig thuis bij de hand. Verder net als vroeger, zelf lezen en interpreteren. “Close reading” 2. Distant reading laat de computer patronen en verbanden zichtbaar maken (niet ontdekken, dat moet je zelf doen) door datasets onderling en door de tijd te vergelijken.
  • 4.
    E-Politieke geschiedenis 4 Zoeken •Jullie zijn vast welbekend met zoeken in statengeneraaldigitaal.nl en kbkranten.nl. • Ik laat zien hoe dat net weer wat beter kan.
  • 5.
    E-Politieke geschiedenis 5 Zoekenin expliciet gestructureerde tekst • Maak structuur die impliciet aanwezig is in documenten ook voor de machine leesbaar en gebruik die structuur in je zoekmachine. • Voorbeeld: zoek naar toespraken over fascisme in het parlement • http://search.politicalmashup.nl • Zoek op fascis*, en vraag speeches terug.
  • 6.
    E-Politieke geschiedenis 6 Voordelen •Meer mogelijkheden om resultaten te ordenen en om granulariteit in te stellen. • Direct naar de juiste plek in het document. Maar met context. • Documenten bevatten extra informatie en zijn verbonden met andere bronnen (hier biografie¨en)
  • 7.
    E-Politieke geschiedenis 7 Uitgebreidzoeken in kranten • Niet alles in mogelijk met een zoekmachine. • Bijvoorbeeld prefix-queries als “welke samenstellingen worden er gemaakt met fascist/fascisme?” • Query van de vorm *fascis* • Kan met reguliere expressies, maar duurt wat langer • http://kbkranten.politicalmashup.nl en zoek op w+fascisw+. • Dit is slechts 0.1 promille van het hele KB kranten corpus. • Zoek wat er allemaal fascistisch wordt gevonden: bfascistischeb bw+b
  • 8.
    E-Politieke geschiedenis 8 E-geschiedenisbedrijven Twee manieren om met gigantische collecties gedigitaliseerde bronenn om te gaan: 1. Lekker makkelijk zoeken Alles handig thuis bij de hand. Verder net als vroeger, zelf lezen en interpreteren. “Close reading” 2. “Distant reading”: Laat de computer patronen en verbanden zichtbaar maken (niet ontdekken, dat moet je zelf doen) door datasets onderling en door de tijd te vergelijken.
  • 9.
    E-Politieke geschiedenis 9 Distantreading • Voorbeeld: onderzoek naar populistische partijen in parlement (de Vreese/van de Brug/Vliegenthart). • Vergelijk taalgebruik in verschillende parlementen door de tijd. • Stel zelfde query in verschillende talen ’immigra* OR minderhe* OR vreemdeling OR ethni* OR asiel* OR (ras AND relaties) OR migra*’, ’immigra* OR minorit* OR ethni* OR asylum* OR (race AND relations) OR migrat*’
  • 10.
    E-Politieke geschiedenis 10 Wiegebruikt in NL parlement fascisme? • Haal de speeches op, en zet ze om in een (Excel) spreadsheet. • Google Fusion table: https://www.google.com/fusiontables/DataSource? docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U • Tel hoeveel hits per persoon, en per partij
  • 11.
    E-Politieke geschiedenis 11 Perpersoon bash-3.2$ cat fascisme.csv |awk -F$’t’ ’{print $2}’ |sort|uniq -c|sort -nr 6 5 Rutte 5 Pechtold 4 Wilders 3 Timmermans 3 Middel 3 Kox 3 Halsema 2 Van Gennip 2 Roemer 2 De Roon 2 Bosma 1 Werner PS: ook heel makkelijk te doen in Excel/Fusion Tables: add summary, choose the Speaker column.
  • 12.
    E-Politieke geschiedenis 12 perpartij bash-3.2$ cat fascisme.csv |awk -F$’t’ ’{print $5}’ |sort 9 PVV 9 D66 8 PvdA 7 VVD 7 SP 6 GroenLinks 6 4 CDA 1 speaker-party 1 Groep Wilders 1 CD 1 ""
  • 13.
    E-Politieke geschiedenis 13 Netwerk •Wie gebruikt fascisme tijdens hetzelfde debat en waar gaat dat dan over? • https://www.google.com/fusiontables/DataSource? docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U
  • 14.
    E-Politieke geschiedenis 14 Totslot • Computers bieden veel meer voor geschiedenis-onderzoek dan “gewoon zoeken”. • Zeker voor politieke geschiedenis is er heel veel prachtig materiaal digitaal beschikbaar: http://search.politicalmashup.nl • En er komt nog meer: NWO ExPoSe project (Jaap Kamps, Maarten Marx en heel veel erfgoed instellingen)