Het Huis van Alijn. Een hub in de culturele erfgoedgemeenschap. Iedereen expe...Het Huis van Alijn
Sylvie Dhaene
Presentatie voor studiedag NU in het museum: het verzamelen van hedendaags erfgoed. Organisatie Nederlandse Museumvereniging, 18 april 2013
Leven lang leren met Wikipedia & de KB, Teamdag KB, 29 mei 2018, Den HaagOlaf Janssen
Inspiratiesessie 'Levenlang Leren & Wikipedia' voor de afdeling Marketing & Educatie van de KB tijdens een teamdag op 29 mei 2018 in Den Haag. (https://www.kb.nl/organisatie/organisatie-en-beleid/afdelingen-en-organogram/sector-marketing-diensten).
Het sociaal-cultureel volwassenenwerk is nauw betrokken bij wat er gebeurt in de samenleving. Informatie over grote maatschappelijke tendensen is dus van belang voor het engagement binnen en rond organisaties. Om tot een beleidsplan te komen, moeten organisaties een pak gegevens verzamelen en verwerken. Deze gegevensverzameling veronderstelt een inventarisatie van globale trends binnen de maatschappelijke context die een invloed uitoefenen op de organisatie.
Presentatie op 13 september 2011 bij lezing Probiblio over de toekomst van openbare bibliotheken. In bibliotheken moet medewerkers meer ruimte krijgen voor vernieuwing en passie. De nieuwe bibliothecaris is een "content curator", 30 tools in de presentatie. Leer samenwerken met het publiek en gebruik de kennis van het publiek om diensten op te zetten. De landelijke diensten leveren "achterhaalde" producten af. Bij een ontwikkelingstijd van 3 tot 4 jaar is het product al verouderd bij oplevering. Bibliotheken moeten meer de kennis ontmoeting organiseren.
De presentatie bevat beeldend materiaal en het 2e gedeelte de bronnen.
Op 10 april 2018 organiseerde het Netwerk Oorlogsbronnen een beleidsdag voor betrokken financiers, facilitators en andere ondersteuners van het programma. Deze presentatie laat de ontwikkelingen en plannen van NOB zien.
Towards Culturally Aware AI Systems - TSDH SymposiumMarieke van Erp
Towards Culturally Aware AI Systems
Presented 23 June 2021
Slide credits: Cultural AI team members Andrei Nesterov, Laura Hollink, Ryan Brate, Valentin Vogelmann + input and inspiration from all Cultural AI Colleagues
Biases in data can be both explicit and implicit. Explicitly, ‘The Dutch Seventeenth Century’ and ‘The Dutch Golden Age’ are pseudo-synonymous and refer to a particular era of Dutch history. Implicitly, the ‘Golden Age’ moniker is contested due to the fact that the geopolitical and economic expansion came with great costs, such as the slave trade. A simple two-word phrase can carry strong contestations, and entire research fields, such as post-colonial studies, are devoted to them. However, these sometimes subtle (and sometimes not so subtle) differences in voice are as yet not often represented well in AI systems.
In this talk, I will discuss how the Cultural AI Lab is working towards creating AI systems that are implicitly or explicitly aware of the subtle and subjective complexity of human culture. I will highlight the different research strands and activities that look at AI from different angles as well as how we engage with our user communities to create synergies between the technology and the daily practice of cultural heritage professionals.
The Human in Digital Humanities
Online Symposium, Tilburg School of Humanities & Digital Sciences
Tilburg University
https://www.digitalhumanitiestilburg.com/
Marieke van Erp & Victor de Boer (2021, June). A Polyvocal and Contextualised Semantic Web. In European Semantic Web Conference (pp. 506-512). Springer, Cham.
Presented on 8 June, 2021
More Related Content
Similar to AI x Digital Humanities = > Inclusiviteit
Het Huis van Alijn. Een hub in de culturele erfgoedgemeenschap. Iedereen expe...Het Huis van Alijn
Sylvie Dhaene
Presentatie voor studiedag NU in het museum: het verzamelen van hedendaags erfgoed. Organisatie Nederlandse Museumvereniging, 18 april 2013
Leven lang leren met Wikipedia & de KB, Teamdag KB, 29 mei 2018, Den HaagOlaf Janssen
Inspiratiesessie 'Levenlang Leren & Wikipedia' voor de afdeling Marketing & Educatie van de KB tijdens een teamdag op 29 mei 2018 in Den Haag. (https://www.kb.nl/organisatie/organisatie-en-beleid/afdelingen-en-organogram/sector-marketing-diensten).
Het sociaal-cultureel volwassenenwerk is nauw betrokken bij wat er gebeurt in de samenleving. Informatie over grote maatschappelijke tendensen is dus van belang voor het engagement binnen en rond organisaties. Om tot een beleidsplan te komen, moeten organisaties een pak gegevens verzamelen en verwerken. Deze gegevensverzameling veronderstelt een inventarisatie van globale trends binnen de maatschappelijke context die een invloed uitoefenen op de organisatie.
Presentatie op 13 september 2011 bij lezing Probiblio over de toekomst van openbare bibliotheken. In bibliotheken moet medewerkers meer ruimte krijgen voor vernieuwing en passie. De nieuwe bibliothecaris is een "content curator", 30 tools in de presentatie. Leer samenwerken met het publiek en gebruik de kennis van het publiek om diensten op te zetten. De landelijke diensten leveren "achterhaalde" producten af. Bij een ontwikkelingstijd van 3 tot 4 jaar is het product al verouderd bij oplevering. Bibliotheken moeten meer de kennis ontmoeting organiseren.
De presentatie bevat beeldend materiaal en het 2e gedeelte de bronnen.
Op 10 april 2018 organiseerde het Netwerk Oorlogsbronnen een beleidsdag voor betrokken financiers, facilitators en andere ondersteuners van het programma. Deze presentatie laat de ontwikkelingen en plannen van NOB zien.
Towards Culturally Aware AI Systems - TSDH SymposiumMarieke van Erp
Towards Culturally Aware AI Systems
Presented 23 June 2021
Slide credits: Cultural AI team members Andrei Nesterov, Laura Hollink, Ryan Brate, Valentin Vogelmann + input and inspiration from all Cultural AI Colleagues
Biases in data can be both explicit and implicit. Explicitly, ‘The Dutch Seventeenth Century’ and ‘The Dutch Golden Age’ are pseudo-synonymous and refer to a particular era of Dutch history. Implicitly, the ‘Golden Age’ moniker is contested due to the fact that the geopolitical and economic expansion came with great costs, such as the slave trade. A simple two-word phrase can carry strong contestations, and entire research fields, such as post-colonial studies, are devoted to them. However, these sometimes subtle (and sometimes not so subtle) differences in voice are as yet not often represented well in AI systems.
In this talk, I will discuss how the Cultural AI Lab is working towards creating AI systems that are implicitly or explicitly aware of the subtle and subjective complexity of human culture. I will highlight the different research strands and activities that look at AI from different angles as well as how we engage with our user communities to create synergies between the technology and the daily practice of cultural heritage professionals.
The Human in Digital Humanities
Online Symposium, Tilburg School of Humanities & Digital Sciences
Tilburg University
https://www.digitalhumanitiestilburg.com/
Marieke van Erp & Victor de Boer (2021, June). A Polyvocal and Contextualised Semantic Web. In European Semantic Web Conference (pp. 506-512). Springer, Cham.
Presented on 8 June, 2021
Computationally Tracing Concepts Through Time and SpaceMarieke van Erp
Slides for HNR2020 Keynote presentation
Abstract:
Digitised sources are a treasure trove for scholars, but accessing the information contained in them is far from trivial. Due to scale, traditional methods are insufficient to analyse the big data coming from these sources. Hence, computational methods look to be the solution. Indeed, computational methods can be utilised to identify and model concepts in large digital datasets, however the nature of these datasets as well as that of humanities research questions requires caution. In particular, the ramifications of time and location on understanding concepts cannot be underestimated.
In this talk, Marieke will present ongoing work on computationally tracing concepts through time and across geography using language and semantic web technology. The work illustrates that seemingly simple concepts (e.g. sugar) prove to be much more complex than expected. We discuss the importance of semantics in helping not only to deal with this complexity but reify it so that it can be interrogated both computationally and via expert analysis.
Slides 5, 8, 11, 12, 15, 16, 17, 18, 19, 20 are based the presentation Tabea Tietz gave for the paper "Challenges of Knowledge Graph Evolution from an NLP Perspective" in the WHiSe Workshop @ ESWC 2020 (2 June 2020).
http://hnr2020.historicalnetworkresearch.org/
The Hitchhiker's Guide to the Future of Digital HumanitiesMarieke van Erp
Slides of my DHOxSS closing lecture
Oxford, 26 July 2019
Abstract
In the constellation of research fields, new configurations are continuously reshaping our ideas of what a field should be. This is particularly the case in the young field of digital humanities which, as David M. Berry noted, started with a focus on improving access to digital repositories and then moved to expanding the limits of archives to include born-digital materials as research objects. Both moves greatly impacted our research practice. However, I argue that we have only started scratching the surface of what digital methods can mean for humanities research.
In particular, as our methods and collaborations with other fields have matured, we can now start imagining new types of research questions that go beyond the sum of their ‘digital’ and ‘humanities’ parts -- to fundamentally change the nature of the humanities questions that we can ask. For such a reshaping to occur, we need to deepen the connection to our academic neighbours and keep looking beyond our own research community in order to ask these new questions. In my talk, I will present how multi-disciplinary collaborations between historians, linguists, and computer scientists can bring about new insights that may form the first steps to this future.
Why language technology can’t handle Game of Thrones (yet)Marieke van Erp
Natural language processing (NLP) tools are commonly used in many day-to-day applications such as Siri and Google, but the effectiveness of these technologies is not thoroughly understood. I will present joint work with colleagues from the Vrij Universiteit Amsterdam in which we perform a thorough evaluation of four different name recognition tools on 40 popular novels (including A Game of Thrones). I will highlight why literary texts are so difficult for NLP tools as well as solutions for improving their performance.
Finding common ground between text, maps, and tables for quantitative and qua...Marieke van Erp
Invited talk given at 8th AIUCD Conference 2019 – ‘Pedagogy, teaching, and research in the age of Digital Humanities’
http://aiucd2019.uniud.it/
24 January 2019, Udine, Italy
Slicing and Dicing a Newspaper Corpus for Historical Ecology ResearchMarieke van Erp
Presented at EKAW 2018
Historical newspapers are a novel source of information for historical ecologists to study the interactions between humans and animals through time and space. Newspaper archives are particularly interesting to analyse because of their breadth and depth. However, the size and the occasional noisiness of such archives also brings difficulties, as manual analysis is impossible. In this paper, we present experiments and results on automatic query expansion and categorisation for the perception of animal species between 1800 and 1940. For query expansion and to the manual annotation process, we used lexicons. For the categorisation we trained a Support Vector Machine model. Our results indicate that we can distinguish newspaper articles that are about animal species from those that are not with an F 1 of 0.92 and the subcategorisation of the different types of newspapers on animals up to 0.84 F 1 .
Lessons Learnt from the Named Entity rEcognition and Linking (NEEL) Challenge...Marieke van Erp
Giuseppe Rizzo, Biana Pereira, Andra Varga, Marieke van Erp, Amparo Elizabeth Cano Basave
Presented on Wednesday 10 October at the 17th International Semantic Web Conference (ISWC 2018)
Paper: http://www.semantic-web-journal.net/content/lessons-learnt-named-entity-recognition-and-linking-neel-challenge-series
Conference: http://iswc2018.semanticweb.org/
Entity Typing Using Distributional Semantics and DBpedia Marieke van Erp
Presentation given at NLP&DBpedia workshop on 18 October 2016. The presentation accompanies the work described in: https://nlpdbpedia2016.files.wordpress.com/2016/09/nlpdbpedia2016_paper_9.pdf
The domain as unifier, how focusing on social history can bring technical fie...Marieke van Erp
Invited talk given at the final CEDAR symposium about the interaction between (social) history, language technology, and semantic web.
https://socialhistory.org/en/events/final-cedar-mini-symposium
Evaluating entity linking an analysis of current benchmark datasets and a ro...Marieke van Erp
Marieke van Erp, Pablo Mendes, Heiko Paulheim, Filip Ilievski, Julien Plu, Giuseppe Rizzo and Joerg Waitelonis
Presented at LREC 2016:
http://www.lrec-conf.org/proceedings/lrec2016/pdf/926_Paper.pdf
Finding Stories in 1,784,532 Events: Scaling up computational models of narr...Marieke van Erp
Slides of the NewsReader Computational Models of Narrative Presentation "Finding Stories in 1,784,532 Events: Scaling Up Computational Models of Narrative - Marieke van Erp, Antske Fokkens, and Piek Vossen"
Workshop page: http://narrative.csail.mit.edu/cmn14/
Project page: http://www.newsreader-project.eu
Evaluating Named Entity Recognition and Disambiguation in News and TweetsMarieke van Erp
Named entity recognition and disambiguation are important for information extraction and populating knowledge bases. Detecting and classifying named entities has traditionally been taken on by the natural language processing community, whilst linking of entities to external resources, such as DBpedia and GeoNames, has been the domain of the Semantic Web community. As these tasks are treated in different communities, it is difficult to assess the performance of these tasks combined.
We present results on an evaluation of the NERD-ML approach on newswire and tweets for both Named Entity Recognition and Named Entity Disambiguation.
Presented at CLIN 24: http://clin24.inl.nl/
http://nerd.eurecom.fr
https://github.com/giusepperizzo/nerdml
2. D I G I TA L H U M A N I T I E S L A B
Overzicht
• Taalvariatiehobbels
• Waarom AI context nodig heeft
• Hoe we AI vooroordelen kunnen
laten detecteren
• Wrap up
4. You know nothing AI…
Project samen met:
Niels Dekker & Tobias Kuhn
Zie: https://peerj.com/articles/cs-189/
Image source: https://anibundel.files.wordpress.com/2015/04/jonsnow-leaves-ygritte.jpg
5. Achtergrond
• Karakters en relaties vormen de kern van veel verhalen
• Computationele methodes maken het mogelijk om op
grote schaal verhalen te analyseren
• Hiervoor is het wel nodig om eerst namen te herkennen
• Het meeste werk aan naamherkenningssoftware is
gemaakt voor kranten, tweets en in veel mindere mate
voor laat 19e en begin 20e eeuwse boeken
D I G I TA L H U M A N I T I E S L A B
10. Performance fixes
• ‘Wordnamen’ vervangen met generieke namen
• Verwijder apostrofs van namen
• Maar:
• Handwerk
• Schaalt niet
• Vervolgproject literatuur samen met Rositsa
Ivanova en Sabrina Kirrane
(Wirtschaftsuniversität Wien)
• Voor VOC data: Barry Hendriks, Paul Groth,
Marieke van Erp (2020) Recognising and Linking
Entities in Old DutchText: A Case Study on VOC
Notary Records. Geaccepteerd voor: Collect &
Connect. 23 & 24 November, Leiden.
D I G I TA L H U M A N I T I E S L A B
12. D I G I TA L H U M A N I T I E S L A B
Wie is de grootste zoetekauw?
• Historische suikerconsumptiepatronen
zijn moeilijk te traceren
• Historische appeltaartrecepten als
‘proxy’
• Maar er zijn hobbels
Marieke van Erp & Ulbe Bosma: Divergent patterns of sugar consumption in the wake of the Industrial Revolution: an analysis on the basis of
apple pie recipes. Forthcoming
13. D I G I TA L H U M A N I T I E S L A B
Analyse van historische recepten
• Niet alle bronnen zijn even
toegankelijk
• Artefacten van digitalisatie (OCR
fouten)
• Normalisatie van hoeveelheden en
eenheden (een Amerikaans
theekopje ≠ een Nederlands
theekopje
• Combinatie kwantitatieve en
kwalitatieve methoden
Marieke van Erp & Ulbe Bosma: Divergent patterns of sugar consumption in the wake of the Industrial Revolution: an analysis on the basis of
apple pie recipes. (Forthcoming)
Image source: https://en.wikipedia.org/wiki/Apple_pie#/media/File:For_to_Make_Tartys_in_Applis_(1381).gif
14. D I G I TA L H U M A N I T I E S L A B
Culturele Context
● Hoe veel is ‘een beetje’ of
‘naar smaak’?
● Hoe groot is een portie?
● Hoe vaak eten mensen
appeltaart?
● Apfelstrudel == appeltaart?
Tabea Tietz et al. Challenges of Knowledge Graph Evolution from an NLP Perspective. WHiSe Workshop @ ESWC 2020
15. D I G I TA L H U M A N I T I E S L A B
Eenheden
● Moderne eenheden
○ imperial vs. metrisch (ponden,
kg)
● Historische eenheden
○ el, lood
● Beschrijvingen van hoeveelheden
○ “veel boter”, “een bord
appelen”
Tabea Tietz et al. Challenges of Knowledge Graph Evolution from an NLP Perspective. WHiSe Workshop @ ESWC 2020
16.
17.
18. D I G I TA L H U M A N I T I E S L A B
‘Bias’ in erfgoedcollecties
○ Veel erfgoedcollecties zijn over
een langere periode
samengesteld
○ Niet alle perspectieven zijn
even goed vertegenwoordigd
○ De erfgoedsector werkt aan
het opsporen van sensitief
taalgebruik in
collectiebeschrijvingen
19. D I G I TA L H U M A N I T I E S L A B
SABIO
The Social Bias Observatory
● Gefinancierd door Netwerk
Digitaal Erfgoed
● KNAW Humanities Cluster,
Nationaal Museum voor
Wereldculturen, Koninklijke
Bibliotheek, Nederlands Instituut
voor Beeld en Geluid
● Looptijd: 1 jaar
● We zoeken nog een onderzoeker!
(deadline sollicitaties 9 november)
Image source: https://commons.wikimedia.org/wiki/File:%C5%BDebr%C3%A1k_observatory_at_night.jpg
20. D I G I TA L H U M A N I T I E S L A B
Aanpak
● Samen met de curatoren gaan we:
● Kijken ‘hoe’ bias eruit ziet
● Een computermodel trainen om
nieuwe voorbeelden van bias te
herkennen
● Nieuwe voorbeelden aanbieden aan
een domeinexpert (human-in-the-
loop)
● Fundamentele onderzoeksvragen,
geen software ‘op de plank’ die dit
oplost (op dit moment)
21. D I G I TA L H U M A N I T I E S L A B
Wrap up
● Computers kunnen nog maar
mondjesmaat omgaan met
dingen die buiten ‘de
standaard’ liggen
● Context is nodig om de AI bij
te sturen
● Hiervoor is samenwerking met
domeinexperts cruciaal
Trofeeschedel
https://hdl.handle.net/20.500.11840/1037688
22. https://dhlab.nl
Acknowledgments:
Cindy Zalm, Cultural AI Lab,
Eleonora Marzi, Fabio Mariani,
Harald Sack, ISWS Summer
School, Johan Oomen Lientje
Maas, Martijn Kleppe, Mehwish
Alam, Mortaza Alinam, Paul
Groth, Tabea Tietz, Ulbe Bosma
& Wouter van den Berg