SlideShare a Scribd company logo
1 of 57
● organisatoren?
○ Digitaal Archief Vlaanderen, meemoo, UGent en VRT
● waarom?
○ delen van recente ontwikkelingen en innovatieve projecten op vlak van digitale
preservering delen en samen problemen oplossen
● deelnemers?
○ wetenschappers, studenten, onderzoekers, archivarissen, bibliothecarissen,
dienstverleners en andere deskundigen
iPRES 2024
https://ipres2024.pubpub.org/
Van experiment naar structurele oplossing:
gezichtsherkenning in functie van metadatacreatie
David Chambaere, Matthias Priem & Rony Vissers (meemoo)
Waarom gezichtsherkenning?
Metadata
● Uitdaging
○ beschrijvende metadata ontbreekt of is heel beknopt
● Creëren en verrijken van metadata is tijdsintensief > dus duur
○ herkennen van afgebeelde personen vereist veel kennis;
○ vaak omvangrijke collecties die niet tot kerncollectie van organisatie behoren en
dus geen prioriteit zijn;
○ aard van materiaal zorgt voor extra drempels:
■ om afgebeelde personen manueel te beschrijven, moeten video’s afgespeeld
worden - wat zeer tijdsintensief is;
■ zolang ze niet gedigitaliseerd zijn, zijn video’s niet of moeilijk afspeelbaar,
waardoor het onmogelijk is om hun inhoud te beschrijven
Metadata
● Geautomatiseerde metadatacreatie of - verrijking m.b.v. artificiële
intelligentie?
○ Speech-to-Text
○ Named Entity Recognition en Named Entity Linking
○ Computer Vision
■ Optical Character Recognition
■ Face Detection en Face Recognition
○ ...
FAME (FAce MEtadata)
Gezichtsherkenning
• FAME (FAce MEtadata):
operationalisering van
metadata-gedreven
gezichtsherkenning in de
registratiepraktijk
FAME
● Culturele organisaties slagen er onvoldoende in om omvangrijke
collecties foto’s en video’s van goede metadata te voorzien. Dit tekort
belemmert de online toegang en bevraging, alsook het hergebruik van
digitale foto’s en video’s.
● Dit project ontwikkelt best practices om personen op die foto’s en
video’s te identificeren via (semi-)geautomatiseerde
gezichtsherkenning.
● Daarnaast onderzoekt dit project ook hoe bestaande metadata de
accuraatheid van de gezichtsherkenning kunnen verbeteren.
FAME: partners
● Projectcoördinator: meemoo
● Technische partner: IDLab UGent
● Contentpartners:
○ ADVN | archief voor nationale bewegingen
○ archief van het Vlaams Parlement
○ KOERS, museum van de wielersport
○ Kunstenpunt
● Looptijd: maart 2021- september 2022
FAME: werkpakketten
● Werkpakket 1: voorbereidend onderzoek
● Werkpakket 2: pilootproject politici en activisten herkennen
● Werkpakket 3: pilootproject sportmensen herkennen
● Werkpakket 4: pilootproject podiumkunstenaars herkennen
● Werkpakket 5: rapportering en disseminatie
● Werkpakket 6: projectadministratie
FAME: terminologie
• Gezichtsdetectie: het lokaliseren van gezichten op een foto of in een
video
• Gezichtsherkenning: het toekennen van een naam aan een gezicht
• Referentieset: portretfoto’s waarvan we door metadata weten wie er
op staat
• Onderzoeksset: portretfoto’s, groepsfoto’s en allerhande andere foto’s
waarvan we willen weten wie erop staat
Onderzoeksset: foto’s en video’s
● In totaal: 154.287 foto's en 9 video's:
○ podiumkunstenaars:
■ 19.576 foto's en 2 video’s van Kunstenpunt;
○ wielrenners:
■ 123.911 foto’s van KOERS;
○ politici:
■ 5.587 foto's en 3 video’s van ADVN;
■ 5.213 foto’s en en 4 video’s van archief van Vlaams Parlement;
■ in totaal: 10.800 foto’s en 7 video’s.
● Oorspronkelijk meer videomateriaal in onderzoeksset voorzien:
○ tijdsgebrek
○ opstart luik gezichtsherkenning in GIVE-metadataproject
Onderzoeksset: video’s
● Video’s omgezet in reeks van stilstaande beelden > doorlopen nadien dezelfde
workflow als foto’s
● Video’s bestaan vaak uit 25 stilstaande beelden (frames) per seconde > 1 uur video =
90.000 frames of foto’s
● Volstaat om beperkt aantal frames te analyseren uit shot dat persoon afbeeldt!
● Willen weten van welk moment tot welk ander moment persoon in beeld komt
● Shots gezocht in video’s: shot detection m.b.v. PySceneDetect
● Uit ieder shot 3 willekeurige frames gekozen waarop gezichtherkenningsworkflow
toegepast werd
● Voorbeeld: video van 103.500 frames (72 min) > 714 frames of stilstaande beelden
Referentieset
● Gezichtsherkenning werkt op basis van vergelijking van gezichten >
referentieset
● In totaal 54.540 portretfoto’s van in totaal 6.075 verschillende personen
aangelegd
○ podiumkunstenaars:
■ 2.393 podiumkunstenaars in referentieset (37.172 referentiefoto’s);
■ richtgetal: 3.982 te herkennen personen;
○ wielrenners:
■ 2.791 wielrenners in referentieset (15.323 referentiefoto’s);
■ geen richtgetal voor te herkennen personen;
○ politici:
■ 891 politici in referentieset (2.045 referentiefoto’s)
■ geen richtgetal voor te herkennen personen.
Samenstelling referentieset: metadata
● Samenstelling van referentiesets is waar mogelijk gebaseerd op beschikbaarheid van
bestaande metadata.
○ Podiumkunstenaars:
■ ontleden pad- en bestandsnamen Kunstenpunt > naam podiumkunstenproducties > ophalen
van namen van betrokken podiumkunstenaars uit Wikidata
■ vereiste dataschoning en reconciliatie
■ Wikidata: enkel data vanaf 1990
○ Politici:
■ aanspreken Vlaams Parlement Open Data endpoint: data alle huidige en gewezen
vertegenwoordigers, plus detailinformatie over vergaderingen en commissies
■ ADVN: authority-databank over de personen in het archief nog in ontwikkeling
○ Wielrenners:
■ waar mogelijk gebruik gemaakt van gegevens van gespecialiseerde websites over
wielersport
Samenstelling referentieset: metadata
● Identifiers overgenomen uit Wikidata voor personen die we willen herkennen >
personen ondubbelzinnig geïdentificeerd
● Maar ook:
○ podiumkunstenaars: identifiers voor personen uit Kunstenpuntdatabank én IMDb;
○ politici: identificatiecodes van Vlaams Parlement én Belgische Senaat voor personen;
○ wielrenners: identifiers van De Wielersite en ProCyclingStats voor personen.
● Afkomst referentiefoto’s:
○ collectiebeherende projectpartners;
○ enkele andere archieven (o.a. Amsab-ISG, KADOC, Liberas);
○ Wikimedia Commons;
○ world wide web.
Werkwijze
● In alle foto’s en video’s uit referentie- en onderzoeksset automatisch gezichten gedetecteerd en
gelokaliseerd met behulp van software > die gezichten gekopieerd en apart opgeslagen.
● Kenmerken van ieder gezicht omgezet naar wiskundig element, een vector.
● Alle vectoren met elkaar vergeleken > gezichten met gelijkaardige vector werden in cluster
samengevoegd: die gezichten beelden eenzelfde persoon af.
● Per cluster gekeken welke gezichten afkomstig waren uit referentiesets > hun metadata bevat
al naam.
● Naam van persoon wiens vectorprofiel cluster dichtst benaderde, toegekend aan alle
gezichten in die cluster.
Visual Name Authority
Manuele validatie
● Doel: bekomen van zo betrouwbaar mogelijke gezichtsherkenningsresultaten.
● Medewerkers van collectiebeherende organisaties konden automatisch bekomen
resultaten valideren met behulp van online tool.
● Toekennen validatielabels aan herkende gezichten: ‘geaccepteerd’, ‘geweigerd’ of
‘ongeschikt’.
● ‘Ongeschikt’: geen gezicht afgebeeld, of foto te onduidelijk om gezicht te herkennen.
● Aantal te labelen gezichten beperkt > filtering (op basis van similariteitsscore)
● Iedere collectiebeherende organisaties valideerde resultaten eigen collectie.
● Niet alle aangeboden resultaten gevalideerd, wel zeer groot aantal.
● Mate van validatie niet bij alle collectiebeherende organisaties dezelfde.
Similariteitsscore
● In FAME gewerkt met
similariteitsscore.
● Duidt mate van gelijkenis van
gezicht en met andere gezichten in
cluster automatisch aan >
probabliteit.
● In combinatie met gebruik van
validatietool berekend in hoeverre
resultaten met similariteitscore van
0,5 als betrouwbaar werden
beschouwd door medewerkers van
collectiebeherende organisaties.
Betrouwbaarheid
● Vaststelling: automatisch herkende gezichten met similariteitsscore van
minstens 0,5 zijn gemiddeld 93,6 % betrouwbaar:
○ Kunstenpunten: idem > 93,6%;
○ KOERS en ADVN: hoger > respectievelijk 94,8% en 99,8%;
○ Archief van Vlaams Parlement: lager > 82,7%.
Relevantie similariteitsscore
● Indien collectiebeherende instellingen zeer kleine
foutenmarge aanvaarden, kunnen ze al deze resultaten
opnemen in hun beheersystemen, zonder dat ze zelf
(alles) moeten valideren > verhoudingsgewijs vooral
grote winst voor Kunstenpunt doordat zij relatief weinig
resultaten hebben gevalideerd met similariteitsscore van
minstens 0,5.
● Toekomstige projecten organisaties die manuele en
tijdsintensieve validatie willen vermijden kunnen
similaiteitsscore van 0,5 of hoger hanteren als drempel
voor automatisch aanvaarden van resultaten >
zekerheid van resultaten met zeer grote mate van
betrouwbaarheid hebben, zonder manuele validatie.
Bruikbare eindresultaten 1
● Indien enkel rekening gehouden met resultaten van manuele validatie
door medewerkers van collectiebeherende instellingen: 78.440
herkende gezichten van 1.693 unieke publieke personen (= 27,9% van
personen uit aangelegde referentieset):
○ 2.818 herkende gezichten van 125 unieke podiumkunstenaars;
○ 63.397 herkende gezichten van 953 unieke wielrenners;
○ 12.225 herkende gezichten van 616 unieke politici.
Bruikbare eindresultaten 2
● Indien Kunstenpunt tevreden met betrouwbaarheid van 93,6% >
toevoeging van groot aantal herkende gezichten en unieke
podiumkunstenaars mogelijk
● Nieuwe eindresultaat: 81.144 gezichten van 2.578 unieke publieke
personen (= 42,4% van personen uit door ons aangelegde referentieset).
● Maar: kans dat klein aantal gezichten van podiumkunstenaars en
unieke podiumkunstenaars foutief automatisch zijn herkend.
Juridische aspecten
● Auteursrecht
○ auteursrechtelijk beschermde foto’s en video’s;
○ beroep op de onderwijs- en onderzoeksexceptie.
● Recht op afbeelding
○ toelating nodig voor maken en gebruiken van
afbeelding van persoon, en ook voor iedere
reproductie en publicatie daarvan;
○ keuze voor publieke personen: toestemming
vermoed, op voorwaarde dat afbeeldingen zijn
gemaakt tijdens uitoefening van publieke activiteit.
Juridische aspecten
● Algemene Verordening Gegevensbescherming (AVG of GDPR)
○ maken, opslaan en gebruiken foto’s met personen is verwerking van
(persoons)gegevens > strikt gereglementeerd: verwerking van
‘biometrische’ gegevens met het oog op identificatie enkel mogelijk
mits uitzondering;
○ verwerking is noodzakelijk voor vervulling van decretale opdracht;
○ versoepeld regime met oog op archivering in algemeen belang.
● Terms of Service sociale mediaplatformen
Ethische aspecten
● Samenstelling referentiesets
○ keuze voor publieke figuren beperkt impact op privé-
personen;
○ afweging uiteindelijke doel tegenover eventuele
negatieve gevolgen voor afgebeelde personen;
○ delen van referentiesets? efficiëntiewinst, maar ook
gevaar op verlies aan controle > nood aan beroepsethiek.
● Vooringenomenheid (bias) in algoritmes
○ zorgvuldig gecreëerde referentiesets;
○ controle van gebruikte algoritme op bias aan hand van
manuele steekproef: worden alle mensen even goed
herkend worden, ongeacht hun fysieke eigenschappen of
kledij?
Ethische aspecten
● Automatisering als bedreiging voor jobs
○ focus: automatisering van werk dat vandaag wegens tijdgebrek / personeelstekort niet
gebeurt;
○ samenwerking tussen mens en algoritme blijft cruciaal.
● Werkomstandigheden van data labellers
○ we weten wie door ons gebruikte toolbox Insightface heeft ontwikkeld, maar niet met
welk doel en in welke omstandigheden dat is gebeurd;
○ aandachtspunt: manier waarop cultureelerfgoedorganisaties manuele validatie van
matchingresultaten aanpakken.
● Impact op het milieu
○ vergt veel rekenkracht en energie;
○ energie mogelijk niet afkomstig uit hernieuwbare bronnen;
○ aandachtspunten: terugdringen van nefaste effecten (bv. door energie-efficiëntere
workflows en algoritmes) en transparantie.
Lessons learned
● Bottlenecks:
○ samenstelling van namenlijsten en referentiesets >
tijdsintensief
○ manuele validatie > tijdsintensief
● Beschikbare informatiebeheersystemen zijn vandaag vaak niet
voorzien op wegschrijven van dergelijke (complexe)
beschrijvende metadata
● Juridische en ethische aspecten blijven belangrijke
aandachtspunten
GIVE metadataproject
GiVE Metadata - Scope
Spraakherkenning (Speech-To-Text of STT)
- Input: audio (uit zowel audio als video files)
- Output: transcripties
Entiteitsherkenning (Named Entity Recognition of NER)
- Input: transcripties
- Output: metadata updates met semantiek en links naar
authentieke bronnen (bvb. wikidata)
Gezichtsdetectie & Herkenning
- Input: video
- Output: metadata updates met herkende personen
Over alles
heen:
1/ uniforme
metadata
2/ gelinkt
aan externe
authorities
(bvb.
wikidata)
Schaal
● 126 contentpartners betrokken
● Per activiteit
○ Spraakherkenning en Entiteit Herkenning :
130.000 gearchiveerde stuks of 160.000 uur
media
○ Gezichtsdetectie en -herkenning :
100.000 gearchiveerde stuks of 120.000 uur
media
Dit is 5500 keer
meer data dan
in FAME
Schaalvergroting: uitdagingen
● Oplossing die werkt op grote schaal, voor veel partners
○ Communicatie en samenwerking
○ Juridische en ethische vraagstukken
○ Technische uitdagingen
■ software : zo ontworpen dat het snel geschaald kan worden
■ hardware : cloud gebaseerd, snel uitbreiden en inkrimpen
● Kwalitatieve aspect
○ Manuele validatie is niet langer mogelijk
○ Grondige parametrisering, vertrouwen en goed gekozen
thresholds worden cruciaal
Veel partners
● We werken met materiaal van heel
veel partners
● Vaak ook nieuwe uitdagingen /
inzichten
● Informatie via communicatieplan
● Betrokkenheid via werkgroep
○ krijgen meer in-depth informatie
○ bepalen mee wat we doen en niet doen
■ parametrisering gezichtsherkenning
■ beheer referentieset gezichten
■ workshops rond ethiek
■ feedback op functionaliteit
■ feedback op wireframes
Brede oproep naar alle 120 partners,
uiteindelijk +/- 10 partners
vertegenwoordigd.
Juridische aspecten
• AI toepassen: het kan volgens GDPR (archivering in het
algemeen belang)
• Maar DPIA is nodig want:
• Grootschalige verwerking
• → Aantal betrokkenen
• → Volume van de gegevens
• → Duur van de activiteit
• Creatie van nieuwe metadata kan linken leggen tussen
personen en lidmaatschap vakbond/etniciteit/politieke
voorkeur…
→ Verwerking van ‘bijzondere categorieën
persoonsgegevens’
Data Protection Impact Assessment
● Deel 1 : omschrijf wat je wil doen
○ Algemene beschrijving beoogde verwerking
○ Beschrijving type persoonsgegevens
○ Doel van de verwerking
○ Bronnen van de persoonsgegevens
○ Betrokkenen
● Deel 2 : Risico analyse
○ Wat zijn de taken in het project?
○ Welke risico's zijn hieraan verbonden?
○ Hoe gaan we deze minimaliseren?
⇒ Checklist voor privacy aspecten binnen project
Ethische aspecten
● ism. Kenniscentrum data &
maatschappij
● Meerdere workshops, focus op
gezichtsherkenning
○ breng alle stakeholders samen
■ archivarissen, personen die
herkend zullen worden, technici
○ Probeer tot een principes document
te komen of gedeeld inzicht / proces
○ Bvb. referentielijst
Ethische / juridische conclusies worden samengevat & gedeeld
Technische aspecten - kopen of bouwen?
Spraakherkenning (Speech-To-Text of STT)
- Mature tooling op de markt
- Kostenefficiënte oplossing, makkelijk te integreren
Entiteitsherkenning (Named Entity Recognition of NER)
- Mature tooling op de markt
- Kostenefficiënte oplossing, makkelijk te integreren
Gezichtsdetectie & Herkenning (Face detection and recognition)
- Deels beschikbaar op de markt
- Hoge kost per uur
- Reeds kennis opgedaan via FAME
⇒ KOPEN
⇒ KOPEN
⇒ BOUWEN
● Gezichtsdetectie
○ identificeer een stuk van een beeld als 'gezicht' en stop in een cluster voor een persoon
● Gezichtsherkenning
○ ga na of er een match is tussen de persoon en iemand in de referentieset
● Vaak voorkomende 'onbekenden'
○ Kunnen we veel voorkomende, niet gematchte gezichten aanbieden aan de archivaris (om
toe te voegen aan de referentieset)
● Daarnaast: beheer van de referentieset
○ hergebruik van de bestaande set uit FAMe
○ kunnen we komen tot gedeeld beheer?
Gezichtsherkenning - Wat willen we?
Gezichtsherkenning - Video Pipeline
Face Detection Face Tracking Face Clustering
Face Embedding Face Matching
Video pipeline
Faces Persoon 0
Goede gelijkenis
Zelfde persoon
Subset obv
kwaliteit
Gezichtsherkenning - parameters
Gezichtskwaliteit
● Box-grootte
● Pose (landmarks)
● Belichting
● Blurriness
● Confidence
Schermtijd
● Duur van gezicht binnen 1 shot (tracker)
● Aantal keer dat gezicht terugkomt (aantal trackers per persoon)
● Totale schermtijd van 1 persoon in video
Nu: parametrisering met werkgroep
Oranje gezichten komen te kort voor (bv. kort shot binnen reportage);
gezichten in de achtergrond leveren vaak geen metadata op omdat ze te
klein zijn
05:48
http://give-face-
qas.private.cloud.meemoo.be/task_results/baba7b5ef1d2459180c2ea8fffa49d02cf2aed7b29ba41758f43c7e1eae
457a1b6a6377d6b4d4e2c8b032c69a4597bbc_af862059c93c6475d5320919c7c48b7d
2:00 http://give-face-
qas.private.cloud.meemoo.be/task_results/99496d03b4904e1fa23c6b0a203d36db8651dc32f64049bb995ffd93d
bc395c28cb9a1f48db84a5c9b10192aba6e9d2c_af862059c93c6475d5320919c7c48b7d
Gezichtsherkenning - werken op schaal
● Verwerking opgedeeld in kleine (micro)services
○ doen 1 bepaalde taak en geven resultaat door
○ kan geparallelliseerd worden
● Effectieve processing in de cloud
○ Snelle opschaling en ook downscaling
○ 120k uur verwerkt op 10 weken
○ Tijdens verwerking ingezien dat het te lang zou duren:
■ dubbel zoveel hardware ingezet
■ verwerkingstijd kunnen halveren
Alle machine
learning algoritmes
die we gebruikten
zijn open source,
voorgetrainde
modellen.
Geen specifieke
training nodig.
Gezichtsherkenning - tussentijdse resultaten
- Gezichtsdetectie
- Loopt 1x om alle gezichten te detecteren op alle archieven
- heel rekenintensief, tientallen nodes actief om verwerking te doen
- verwerking alle video’s afgelopen (10 weken)
- 3,3 mio personen gedetecteerd (~ 27 per video)
- Gezichtsherkenning (matching)
- Referentie set (+ referentieset beheer)
- Loopt herhaaldelijk (vergelijking van alle video vs refset duurt +/- 2 uur)
- extra persoon aan de referentieset toegevoegd ⇒ mogelijk nieuwe matches.
- 208.000 personen gelinkt aan 2500 personen uit de huidige referentieset
Referentieset
● Essentie
○ Een lijst van personen + foto's + links naar wikidata + authorities CP's
○ Gedeeld beheer, steunen op elkaars kennis (bvb. Koers / Huis van Alijn)
○ Transparantie rond aanpassingen (wie, wat, wanneer)
● Cruciale schakel
○ Referentieset maakt de brug tussen detectie en matching
○ Ethisch: iemand in de referentieset steken betekent die persoon herkennen
■ Belangrijk dat het een mens is die dit uitvoert
Beheer van de referentieset
Beheer van de referentieset - aanpassen
Beheer van de referentieset - historiek
Vaak voorkomend maar onbekend
Vaak voorkomend maar onbekend
Vaak voorkomend maar onbekend
Dit project kadert binnen het relanceplan Vlaamse Veerkracht en wordt
gerealiseerd met de steun van het Europees Fonds voor Regionale Ontwikkeling.
Andere projecten en toekomst
Toekomst en andere projecten
● SHARED AI
○ Oktober 2023 - Dec 2024
○ GiVE project, maar voor regionale media + VRT
● Visual Name Authority
○ 2023 - 2026 (3 fases, 3 jaar)
○ Project waarin we overkoepelende namenlijst en gedeelde referentieset breder
inzetbaar willen maken
○ Processen, juridisch, ethische kwesties
○ Maar ook de bouw van een tool
Zijn er nog
vragen?
matthias.priem@meemoo.be
rony.vissers@meemoo.be

More Related Content

Similar to Van experiment naar structurele oplossing: gezichtsherkenning in functie van metadatacreatie

Gastcollege M&S Fontys 180411
Gastcollege M&S Fontys 180411Gastcollege M&S Fontys 180411
Gastcollege M&S Fontys 180411Dominique Hanssen
 
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013itslearning Nederland
 
JobCircuit Io4 manual train the trainers on job circuit model final version_be
JobCircuit Io4 manual train the trainers on job circuit model final version_beJobCircuit Io4 manual train the trainers on job circuit model final version_be
JobCircuit Io4 manual train the trainers on job circuit model final version_beKarel Van Isacker
 
Gastcollege Hanzehogeschool Groningen 10 januari 2014
Gastcollege Hanzehogeschool Groningen 10 januari 2014Gastcollege Hanzehogeschool Groningen 10 januari 2014
Gastcollege Hanzehogeschool Groningen 10 januari 2014Harold van Heeringen
 
20180323 presentatie beeldenhub_interwaas
20180323 presentatie beeldenhub_interwaas20180323 presentatie beeldenhub_interwaas
20180323 presentatie beeldenhub_interwaasPACKED vzw
 
HKZ certificering
HKZ certificeringHKZ certificering
HKZ certificeringguest8e5dbe
 
Presentatie December 2011 Astorium It
Presentatie December 2011 Astorium ItPresentatie December 2011 Astorium It
Presentatie December 2011 Astorium ItLennartLieffering
 
CV - Michel Noordzij - Januari 2015
CV - Michel Noordzij - Januari 2015CV - Michel Noordzij - Januari 2015
CV - Michel Noordzij - Januari 2015Michel Noordzij
 
Gastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoGastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoMalengo
 
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...Gemeente Zwijndrecht
 
Design management, a curse or a blessing for the independent designer?
Design management, a curse or a blessing for the independent designer?Design management, a curse or a blessing for the independent designer?
Design management, a curse or a blessing for the independent designer?Matthijs Van Haagen
 
De docent als ontwikkelaar versie live sessie
De docent als ontwikkelaar   versie live sessieDe docent als ontwikkelaar   versie live sessie
De docent als ontwikkelaar versie live sessieEric Kluijfhout
 
Presentatie: De RIE een continue regisseerproces door Henny van den Born
Presentatie: De RIE een continue regisseerproces door Henny van den BornPresentatie: De RIE een continue regisseerproces door Henny van den Born
Presentatie: De RIE een continue regisseerproces door Henny van den BornVakmedianet
 
Organisatie ontwikkeling bij trislot final
Organisatie ontwikkeling bij trislot finalOrganisatie ontwikkeling bij trislot final
Organisatie ontwikkeling bij trislot finalKarl Vroman
 
Gastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoGastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoMalengo
 
Module Architectuurprincipes voor NAF Masterclass Enterprise Architectuur
Module Architectuurprincipes voor NAF Masterclass Enterprise ArchitectuurModule Architectuurprincipes voor NAF Masterclass Enterprise Architectuur
Module Architectuurprincipes voor NAF Masterclass Enterprise ArchitectuurDanny Greefhorst
 
Software leveren met de snelheid van het licht
Software leveren met de snelheid van het lichtSoftware leveren met de snelheid van het licht
Software leveren met de snelheid van het lichtJacob Duijzer
 
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen Finchline
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen FinchlineDDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen Finchline
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen FinchlineDDMA
 
Certificering bij DANS - Valentijn Gilissen
Certificering bij DANS - Valentijn GilissenCertificering bij DANS - Valentijn Gilissen
Certificering bij DANS - Valentijn GilissenNetwerk Digitaal Erfgoed
 

Similar to Van experiment naar structurele oplossing: gezichtsherkenning in functie van metadatacreatie (20)

Gastcollege M&S Fontys 180411
Gastcollege M&S Fontys 180411Gastcollege M&S Fontys 180411
Gastcollege M&S Fontys 180411
 
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013
De leerling in beeld brengen en houden met ICT - Onderwijsdag 2013
 
JobCircuit Io4 manual train the trainers on job circuit model final version_be
JobCircuit Io4 manual train the trainers on job circuit model final version_beJobCircuit Io4 manual train the trainers on job circuit model final version_be
JobCircuit Io4 manual train the trainers on job circuit model final version_be
 
Gastcollege Hanzehogeschool Groningen 10 januari 2014
Gastcollege Hanzehogeschool Groningen 10 januari 2014Gastcollege Hanzehogeschool Groningen 10 januari 2014
Gastcollege Hanzehogeschool Groningen 10 januari 2014
 
20180323 presentatie beeldenhub_interwaas
20180323 presentatie beeldenhub_interwaas20180323 presentatie beeldenhub_interwaas
20180323 presentatie beeldenhub_interwaas
 
HKZ certificering
HKZ certificeringHKZ certificering
HKZ certificering
 
Presentatie December 2011 Astorium It
Presentatie December 2011 Astorium ItPresentatie December 2011 Astorium It
Presentatie December 2011 Astorium It
 
CV - Michel Noordzij - Januari 2015
CV - Michel Noordzij - Januari 2015CV - Michel Noordzij - Januari 2015
CV - Michel Noordzij - Januari 2015
 
Gastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoGastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie Malengo
 
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...
Nieuwe dienstverleningsconcept - Presentatie bij diensthoofdenvergadering 201...
 
Design management, a curse or a blessing for the independent designer?
Design management, a curse or a blessing for the independent designer?Design management, a curse or a blessing for the independent designer?
Design management, a curse or a blessing for the independent designer?
 
De docent als ontwikkelaar versie live sessie
De docent als ontwikkelaar   versie live sessieDe docent als ontwikkelaar   versie live sessie
De docent als ontwikkelaar versie live sessie
 
mtenv Academie programma 2016
mtenv Academie programma 2016mtenv Academie programma 2016
mtenv Academie programma 2016
 
Presentatie: De RIE een continue regisseerproces door Henny van den Born
Presentatie: De RIE een continue regisseerproces door Henny van den BornPresentatie: De RIE een continue regisseerproces door Henny van den Born
Presentatie: De RIE een continue regisseerproces door Henny van den Born
 
Organisatie ontwikkeling bij trislot final
Organisatie ontwikkeling bij trislot finalOrganisatie ontwikkeling bij trislot final
Organisatie ontwikkeling bij trislot final
 
Gastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie MalengoGastcollege Human Technology: introductie Malengo
Gastcollege Human Technology: introductie Malengo
 
Module Architectuurprincipes voor NAF Masterclass Enterprise Architectuur
Module Architectuurprincipes voor NAF Masterclass Enterprise ArchitectuurModule Architectuurprincipes voor NAF Masterclass Enterprise Architectuur
Module Architectuurprincipes voor NAF Masterclass Enterprise Architectuur
 
Software leveren met de snelheid van het licht
Software leveren met de snelheid van het lichtSoftware leveren met de snelheid van het licht
Software leveren met de snelheid van het licht
 
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen Finchline
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen FinchlineDDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen Finchline
DDMA Dialogue Challenge 2012 - Presentatie Social - Michiel van Galen Finchline
 
Certificering bij DANS - Valentijn Gilissen
Certificering bij DANS - Valentijn GilissenCertificering bij DANS - Valentijn Gilissen
Certificering bij DANS - Valentijn Gilissen
 

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD) (20)

Presentatie AHD studiedag Leeszaalmedewerkers -
Presentatie AHD studiedag Leeszaalmedewerkers -Presentatie AHD studiedag Leeszaalmedewerkers -
Presentatie AHD studiedag Leeszaalmedewerkers -
 
ChatGPT, chatboxes en het einde van de databases
ChatGPT, chatboxes en het einde van de databasesChatGPT, chatboxes en het einde van de databases
ChatGPT, chatboxes en het einde van de databases
 
Connecting libraries to EU resources
Connecting libraries to EU resourcesConnecting libraries to EU resources
Connecting libraries to EU resources
 
Ben je klaar voor innovatie?
Ben je klaar voor innovatie?Ben je klaar voor innovatie?
Ben je klaar voor innovatie?
 
Hoe maak ik mijn project impactvol?
Hoe maak ik mijn project impactvol?Hoe maak ik mijn project impactvol?
Hoe maak ik mijn project impactvol?
 
Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?
Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?
Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?
 
Netwerken bij Informatie aan Zee
Netwerken bij Informatie aan ZeeNetwerken bij Informatie aan Zee
Netwerken bij Informatie aan Zee
 
Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?
Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?
Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?
 
Waarderen van archieven
Waarderen van archievenWaarderen van archieven
Waarderen van archieven
 
Okapi2-Vlaanderen een hulp richting data driven management
Okapi2-Vlaanderen een hulp richting data driven managementOkapi2-Vlaanderen een hulp richting data driven management
Okapi2-Vlaanderen een hulp richting data driven management
 
Het gebruik van AI bij het catalogiseren van boeken in KBR
Het gebruik van AI bij het catalogiseren van boeken in KBRHet gebruik van AI bij het catalogiseren van boeken in KBR
Het gebruik van AI bij het catalogiseren van boeken in KBR
 
Data-interoperabiliteit in de praktijk
Data-interoperabiliteit in de praktijkData-interoperabiliteit in de praktijk
Data-interoperabiliteit in de praktijk
 
Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...
Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...
Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...
 
Participative Registration of Intangible Cultural Heritage on immaterieelerfg...
Participative Registration of Intangible Cultural Heritage on immaterieelerfg...Participative Registration of Intangible Cultural Heritage on immaterieelerfg...
Participative Registration of Intangible Cultural Heritage on immaterieelerfg...
 
Een MaakBib voor iedereen in elke bib
Een MaakBib voor iedereen in elke bibEen MaakBib voor iedereen in elke bib
Een MaakBib voor iedereen in elke bib
 
De bib als derde plek? Ja, selvølgelig
De bib als derde plek? Ja, selvølgeligDe bib als derde plek? Ja, selvølgelig
De bib als derde plek? Ja, selvølgelig
 
ZB Bibliotheek van Zeeland maakt het verschil
ZB Bibliotheek van Zeeland maakt het verschilZB Bibliotheek van Zeeland maakt het verschil
ZB Bibliotheek van Zeeland maakt het verschil
 
Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...
Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...
Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...
 
De bib is mens- en buurtversterkend
De bib is mens- en buurtversterkendDe bib is mens- en buurtversterkend
De bib is mens- en buurtversterkend
 
Van registratie naar valorisatie: collectieregistratie in de diepte als katal...
Van registratie naar valorisatie: collectieregistratie in de diepte als katal...Van registratie naar valorisatie: collectieregistratie in de diepte als katal...
Van registratie naar valorisatie: collectieregistratie in de diepte als katal...
 

Van experiment naar structurele oplossing: gezichtsherkenning in functie van metadatacreatie

  • 1.
  • 2. ● organisatoren? ○ Digitaal Archief Vlaanderen, meemoo, UGent en VRT ● waarom? ○ delen van recente ontwikkelingen en innovatieve projecten op vlak van digitale preservering delen en samen problemen oplossen ● deelnemers? ○ wetenschappers, studenten, onderzoekers, archivarissen, bibliothecarissen, dienstverleners en andere deskundigen iPRES 2024
  • 4. Van experiment naar structurele oplossing: gezichtsherkenning in functie van metadatacreatie David Chambaere, Matthias Priem & Rony Vissers (meemoo)
  • 6. Metadata ● Uitdaging ○ beschrijvende metadata ontbreekt of is heel beknopt ● Creëren en verrijken van metadata is tijdsintensief > dus duur ○ herkennen van afgebeelde personen vereist veel kennis; ○ vaak omvangrijke collecties die niet tot kerncollectie van organisatie behoren en dus geen prioriteit zijn; ○ aard van materiaal zorgt voor extra drempels: ■ om afgebeelde personen manueel te beschrijven, moeten video’s afgespeeld worden - wat zeer tijdsintensief is; ■ zolang ze niet gedigitaliseerd zijn, zijn video’s niet of moeilijk afspeelbaar, waardoor het onmogelijk is om hun inhoud te beschrijven
  • 7. Metadata ● Geautomatiseerde metadatacreatie of - verrijking m.b.v. artificiële intelligentie? ○ Speech-to-Text ○ Named Entity Recognition en Named Entity Linking ○ Computer Vision ■ Optical Character Recognition ■ Face Detection en Face Recognition ○ ...
  • 9. Gezichtsherkenning • FAME (FAce MEtadata): operationalisering van metadata-gedreven gezichtsherkenning in de registratiepraktijk
  • 10. FAME ● Culturele organisaties slagen er onvoldoende in om omvangrijke collecties foto’s en video’s van goede metadata te voorzien. Dit tekort belemmert de online toegang en bevraging, alsook het hergebruik van digitale foto’s en video’s. ● Dit project ontwikkelt best practices om personen op die foto’s en video’s te identificeren via (semi-)geautomatiseerde gezichtsherkenning. ● Daarnaast onderzoekt dit project ook hoe bestaande metadata de accuraatheid van de gezichtsherkenning kunnen verbeteren.
  • 11. FAME: partners ● Projectcoördinator: meemoo ● Technische partner: IDLab UGent ● Contentpartners: ○ ADVN | archief voor nationale bewegingen ○ archief van het Vlaams Parlement ○ KOERS, museum van de wielersport ○ Kunstenpunt ● Looptijd: maart 2021- september 2022
  • 12. FAME: werkpakketten ● Werkpakket 1: voorbereidend onderzoek ● Werkpakket 2: pilootproject politici en activisten herkennen ● Werkpakket 3: pilootproject sportmensen herkennen ● Werkpakket 4: pilootproject podiumkunstenaars herkennen ● Werkpakket 5: rapportering en disseminatie ● Werkpakket 6: projectadministratie
  • 13. FAME: terminologie • Gezichtsdetectie: het lokaliseren van gezichten op een foto of in een video • Gezichtsherkenning: het toekennen van een naam aan een gezicht • Referentieset: portretfoto’s waarvan we door metadata weten wie er op staat • Onderzoeksset: portretfoto’s, groepsfoto’s en allerhande andere foto’s waarvan we willen weten wie erop staat
  • 14. Onderzoeksset: foto’s en video’s ● In totaal: 154.287 foto's en 9 video's: ○ podiumkunstenaars: ■ 19.576 foto's en 2 video’s van Kunstenpunt; ○ wielrenners: ■ 123.911 foto’s van KOERS; ○ politici: ■ 5.587 foto's en 3 video’s van ADVN; ■ 5.213 foto’s en en 4 video’s van archief van Vlaams Parlement; ■ in totaal: 10.800 foto’s en 7 video’s. ● Oorspronkelijk meer videomateriaal in onderzoeksset voorzien: ○ tijdsgebrek ○ opstart luik gezichtsherkenning in GIVE-metadataproject
  • 15. Onderzoeksset: video’s ● Video’s omgezet in reeks van stilstaande beelden > doorlopen nadien dezelfde workflow als foto’s ● Video’s bestaan vaak uit 25 stilstaande beelden (frames) per seconde > 1 uur video = 90.000 frames of foto’s ● Volstaat om beperkt aantal frames te analyseren uit shot dat persoon afbeeldt! ● Willen weten van welk moment tot welk ander moment persoon in beeld komt ● Shots gezocht in video’s: shot detection m.b.v. PySceneDetect ● Uit ieder shot 3 willekeurige frames gekozen waarop gezichtherkenningsworkflow toegepast werd ● Voorbeeld: video van 103.500 frames (72 min) > 714 frames of stilstaande beelden
  • 16. Referentieset ● Gezichtsherkenning werkt op basis van vergelijking van gezichten > referentieset ● In totaal 54.540 portretfoto’s van in totaal 6.075 verschillende personen aangelegd ○ podiumkunstenaars: ■ 2.393 podiumkunstenaars in referentieset (37.172 referentiefoto’s); ■ richtgetal: 3.982 te herkennen personen; ○ wielrenners: ■ 2.791 wielrenners in referentieset (15.323 referentiefoto’s); ■ geen richtgetal voor te herkennen personen; ○ politici: ■ 891 politici in referentieset (2.045 referentiefoto’s) ■ geen richtgetal voor te herkennen personen.
  • 17. Samenstelling referentieset: metadata ● Samenstelling van referentiesets is waar mogelijk gebaseerd op beschikbaarheid van bestaande metadata. ○ Podiumkunstenaars: ■ ontleden pad- en bestandsnamen Kunstenpunt > naam podiumkunstenproducties > ophalen van namen van betrokken podiumkunstenaars uit Wikidata ■ vereiste dataschoning en reconciliatie ■ Wikidata: enkel data vanaf 1990 ○ Politici: ■ aanspreken Vlaams Parlement Open Data endpoint: data alle huidige en gewezen vertegenwoordigers, plus detailinformatie over vergaderingen en commissies ■ ADVN: authority-databank over de personen in het archief nog in ontwikkeling ○ Wielrenners: ■ waar mogelijk gebruik gemaakt van gegevens van gespecialiseerde websites over wielersport
  • 18. Samenstelling referentieset: metadata ● Identifiers overgenomen uit Wikidata voor personen die we willen herkennen > personen ondubbelzinnig geïdentificeerd ● Maar ook: ○ podiumkunstenaars: identifiers voor personen uit Kunstenpuntdatabank én IMDb; ○ politici: identificatiecodes van Vlaams Parlement én Belgische Senaat voor personen; ○ wielrenners: identifiers van De Wielersite en ProCyclingStats voor personen. ● Afkomst referentiefoto’s: ○ collectiebeherende projectpartners; ○ enkele andere archieven (o.a. Amsab-ISG, KADOC, Liberas); ○ Wikimedia Commons; ○ world wide web.
  • 19. Werkwijze ● In alle foto’s en video’s uit referentie- en onderzoeksset automatisch gezichten gedetecteerd en gelokaliseerd met behulp van software > die gezichten gekopieerd en apart opgeslagen. ● Kenmerken van ieder gezicht omgezet naar wiskundig element, een vector. ● Alle vectoren met elkaar vergeleken > gezichten met gelijkaardige vector werden in cluster samengevoegd: die gezichten beelden eenzelfde persoon af. ● Per cluster gekeken welke gezichten afkomstig waren uit referentiesets > hun metadata bevat al naam. ● Naam van persoon wiens vectorprofiel cluster dichtst benaderde, toegekend aan alle gezichten in die cluster.
  • 21. Manuele validatie ● Doel: bekomen van zo betrouwbaar mogelijke gezichtsherkenningsresultaten. ● Medewerkers van collectiebeherende organisaties konden automatisch bekomen resultaten valideren met behulp van online tool. ● Toekennen validatielabels aan herkende gezichten: ‘geaccepteerd’, ‘geweigerd’ of ‘ongeschikt’. ● ‘Ongeschikt’: geen gezicht afgebeeld, of foto te onduidelijk om gezicht te herkennen. ● Aantal te labelen gezichten beperkt > filtering (op basis van similariteitsscore) ● Iedere collectiebeherende organisaties valideerde resultaten eigen collectie. ● Niet alle aangeboden resultaten gevalideerd, wel zeer groot aantal. ● Mate van validatie niet bij alle collectiebeherende organisaties dezelfde.
  • 22. Similariteitsscore ● In FAME gewerkt met similariteitsscore. ● Duidt mate van gelijkenis van gezicht en met andere gezichten in cluster automatisch aan > probabliteit. ● In combinatie met gebruik van validatietool berekend in hoeverre resultaten met similariteitscore van 0,5 als betrouwbaar werden beschouwd door medewerkers van collectiebeherende organisaties.
  • 23. Betrouwbaarheid ● Vaststelling: automatisch herkende gezichten met similariteitsscore van minstens 0,5 zijn gemiddeld 93,6 % betrouwbaar: ○ Kunstenpunten: idem > 93,6%; ○ KOERS en ADVN: hoger > respectievelijk 94,8% en 99,8%; ○ Archief van Vlaams Parlement: lager > 82,7%.
  • 24. Relevantie similariteitsscore ● Indien collectiebeherende instellingen zeer kleine foutenmarge aanvaarden, kunnen ze al deze resultaten opnemen in hun beheersystemen, zonder dat ze zelf (alles) moeten valideren > verhoudingsgewijs vooral grote winst voor Kunstenpunt doordat zij relatief weinig resultaten hebben gevalideerd met similariteitsscore van minstens 0,5. ● Toekomstige projecten organisaties die manuele en tijdsintensieve validatie willen vermijden kunnen similaiteitsscore van 0,5 of hoger hanteren als drempel voor automatisch aanvaarden van resultaten > zekerheid van resultaten met zeer grote mate van betrouwbaarheid hebben, zonder manuele validatie.
  • 25. Bruikbare eindresultaten 1 ● Indien enkel rekening gehouden met resultaten van manuele validatie door medewerkers van collectiebeherende instellingen: 78.440 herkende gezichten van 1.693 unieke publieke personen (= 27,9% van personen uit aangelegde referentieset): ○ 2.818 herkende gezichten van 125 unieke podiumkunstenaars; ○ 63.397 herkende gezichten van 953 unieke wielrenners; ○ 12.225 herkende gezichten van 616 unieke politici.
  • 26. Bruikbare eindresultaten 2 ● Indien Kunstenpunt tevreden met betrouwbaarheid van 93,6% > toevoeging van groot aantal herkende gezichten en unieke podiumkunstenaars mogelijk ● Nieuwe eindresultaat: 81.144 gezichten van 2.578 unieke publieke personen (= 42,4% van personen uit door ons aangelegde referentieset). ● Maar: kans dat klein aantal gezichten van podiumkunstenaars en unieke podiumkunstenaars foutief automatisch zijn herkend.
  • 27. Juridische aspecten ● Auteursrecht ○ auteursrechtelijk beschermde foto’s en video’s; ○ beroep op de onderwijs- en onderzoeksexceptie. ● Recht op afbeelding ○ toelating nodig voor maken en gebruiken van afbeelding van persoon, en ook voor iedere reproductie en publicatie daarvan; ○ keuze voor publieke personen: toestemming vermoed, op voorwaarde dat afbeeldingen zijn gemaakt tijdens uitoefening van publieke activiteit.
  • 28. Juridische aspecten ● Algemene Verordening Gegevensbescherming (AVG of GDPR) ○ maken, opslaan en gebruiken foto’s met personen is verwerking van (persoons)gegevens > strikt gereglementeerd: verwerking van ‘biometrische’ gegevens met het oog op identificatie enkel mogelijk mits uitzondering; ○ verwerking is noodzakelijk voor vervulling van decretale opdracht; ○ versoepeld regime met oog op archivering in algemeen belang. ● Terms of Service sociale mediaplatformen
  • 29. Ethische aspecten ● Samenstelling referentiesets ○ keuze voor publieke figuren beperkt impact op privé- personen; ○ afweging uiteindelijke doel tegenover eventuele negatieve gevolgen voor afgebeelde personen; ○ delen van referentiesets? efficiëntiewinst, maar ook gevaar op verlies aan controle > nood aan beroepsethiek. ● Vooringenomenheid (bias) in algoritmes ○ zorgvuldig gecreëerde referentiesets; ○ controle van gebruikte algoritme op bias aan hand van manuele steekproef: worden alle mensen even goed herkend worden, ongeacht hun fysieke eigenschappen of kledij?
  • 30. Ethische aspecten ● Automatisering als bedreiging voor jobs ○ focus: automatisering van werk dat vandaag wegens tijdgebrek / personeelstekort niet gebeurt; ○ samenwerking tussen mens en algoritme blijft cruciaal. ● Werkomstandigheden van data labellers ○ we weten wie door ons gebruikte toolbox Insightface heeft ontwikkeld, maar niet met welk doel en in welke omstandigheden dat is gebeurd; ○ aandachtspunt: manier waarop cultureelerfgoedorganisaties manuele validatie van matchingresultaten aanpakken. ● Impact op het milieu ○ vergt veel rekenkracht en energie; ○ energie mogelijk niet afkomstig uit hernieuwbare bronnen; ○ aandachtspunten: terugdringen van nefaste effecten (bv. door energie-efficiëntere workflows en algoritmes) en transparantie.
  • 31. Lessons learned ● Bottlenecks: ○ samenstelling van namenlijsten en referentiesets > tijdsintensief ○ manuele validatie > tijdsintensief ● Beschikbare informatiebeheersystemen zijn vandaag vaak niet voorzien op wegschrijven van dergelijke (complexe) beschrijvende metadata ● Juridische en ethische aspecten blijven belangrijke aandachtspunten
  • 33. GiVE Metadata - Scope Spraakherkenning (Speech-To-Text of STT) - Input: audio (uit zowel audio als video files) - Output: transcripties Entiteitsherkenning (Named Entity Recognition of NER) - Input: transcripties - Output: metadata updates met semantiek en links naar authentieke bronnen (bvb. wikidata) Gezichtsdetectie & Herkenning - Input: video - Output: metadata updates met herkende personen Over alles heen: 1/ uniforme metadata 2/ gelinkt aan externe authorities (bvb. wikidata)
  • 34. Schaal ● 126 contentpartners betrokken ● Per activiteit ○ Spraakherkenning en Entiteit Herkenning : 130.000 gearchiveerde stuks of 160.000 uur media ○ Gezichtsdetectie en -herkenning : 100.000 gearchiveerde stuks of 120.000 uur media Dit is 5500 keer meer data dan in FAME
  • 35. Schaalvergroting: uitdagingen ● Oplossing die werkt op grote schaal, voor veel partners ○ Communicatie en samenwerking ○ Juridische en ethische vraagstukken ○ Technische uitdagingen ■ software : zo ontworpen dat het snel geschaald kan worden ■ hardware : cloud gebaseerd, snel uitbreiden en inkrimpen ● Kwalitatieve aspect ○ Manuele validatie is niet langer mogelijk ○ Grondige parametrisering, vertrouwen en goed gekozen thresholds worden cruciaal
  • 36. Veel partners ● We werken met materiaal van heel veel partners ● Vaak ook nieuwe uitdagingen / inzichten ● Informatie via communicatieplan ● Betrokkenheid via werkgroep ○ krijgen meer in-depth informatie ○ bepalen mee wat we doen en niet doen ■ parametrisering gezichtsherkenning ■ beheer referentieset gezichten ■ workshops rond ethiek ■ feedback op functionaliteit ■ feedback op wireframes Brede oproep naar alle 120 partners, uiteindelijk +/- 10 partners vertegenwoordigd.
  • 37. Juridische aspecten • AI toepassen: het kan volgens GDPR (archivering in het algemeen belang) • Maar DPIA is nodig want: • Grootschalige verwerking • → Aantal betrokkenen • → Volume van de gegevens • → Duur van de activiteit • Creatie van nieuwe metadata kan linken leggen tussen personen en lidmaatschap vakbond/etniciteit/politieke voorkeur… → Verwerking van ‘bijzondere categorieën persoonsgegevens’
  • 38. Data Protection Impact Assessment ● Deel 1 : omschrijf wat je wil doen ○ Algemene beschrijving beoogde verwerking ○ Beschrijving type persoonsgegevens ○ Doel van de verwerking ○ Bronnen van de persoonsgegevens ○ Betrokkenen ● Deel 2 : Risico analyse ○ Wat zijn de taken in het project? ○ Welke risico's zijn hieraan verbonden? ○ Hoe gaan we deze minimaliseren? ⇒ Checklist voor privacy aspecten binnen project
  • 39. Ethische aspecten ● ism. Kenniscentrum data & maatschappij ● Meerdere workshops, focus op gezichtsherkenning ○ breng alle stakeholders samen ■ archivarissen, personen die herkend zullen worden, technici ○ Probeer tot een principes document te komen of gedeeld inzicht / proces ○ Bvb. referentielijst Ethische / juridische conclusies worden samengevat & gedeeld
  • 40. Technische aspecten - kopen of bouwen? Spraakherkenning (Speech-To-Text of STT) - Mature tooling op de markt - Kostenefficiënte oplossing, makkelijk te integreren Entiteitsherkenning (Named Entity Recognition of NER) - Mature tooling op de markt - Kostenefficiënte oplossing, makkelijk te integreren Gezichtsdetectie & Herkenning (Face detection and recognition) - Deels beschikbaar op de markt - Hoge kost per uur - Reeds kennis opgedaan via FAME ⇒ KOPEN ⇒ KOPEN ⇒ BOUWEN
  • 41. ● Gezichtsdetectie ○ identificeer een stuk van een beeld als 'gezicht' en stop in een cluster voor een persoon ● Gezichtsherkenning ○ ga na of er een match is tussen de persoon en iemand in de referentieset ● Vaak voorkomende 'onbekenden' ○ Kunnen we veel voorkomende, niet gematchte gezichten aanbieden aan de archivaris (om toe te voegen aan de referentieset) ● Daarnaast: beheer van de referentieset ○ hergebruik van de bestaande set uit FAMe ○ kunnen we komen tot gedeeld beheer? Gezichtsherkenning - Wat willen we?
  • 42. Gezichtsherkenning - Video Pipeline Face Detection Face Tracking Face Clustering Face Embedding Face Matching Video pipeline Faces Persoon 0 Goede gelijkenis Zelfde persoon Subset obv kwaliteit
  • 43. Gezichtsherkenning - parameters Gezichtskwaliteit ● Box-grootte ● Pose (landmarks) ● Belichting ● Blurriness ● Confidence Schermtijd ● Duur van gezicht binnen 1 shot (tracker) ● Aantal keer dat gezicht terugkomt (aantal trackers per persoon) ● Totale schermtijd van 1 persoon in video
  • 44. Nu: parametrisering met werkgroep Oranje gezichten komen te kort voor (bv. kort shot binnen reportage); gezichten in de achtergrond leveren vaak geen metadata op omdat ze te klein zijn 05:48 http://give-face- qas.private.cloud.meemoo.be/task_results/baba7b5ef1d2459180c2ea8fffa49d02cf2aed7b29ba41758f43c7e1eae 457a1b6a6377d6b4d4e2c8b032c69a4597bbc_af862059c93c6475d5320919c7c48b7d 2:00 http://give-face- qas.private.cloud.meemoo.be/task_results/99496d03b4904e1fa23c6b0a203d36db8651dc32f64049bb995ffd93d bc395c28cb9a1f48db84a5c9b10192aba6e9d2c_af862059c93c6475d5320919c7c48b7d
  • 45. Gezichtsherkenning - werken op schaal ● Verwerking opgedeeld in kleine (micro)services ○ doen 1 bepaalde taak en geven resultaat door ○ kan geparallelliseerd worden ● Effectieve processing in de cloud ○ Snelle opschaling en ook downscaling ○ 120k uur verwerkt op 10 weken ○ Tijdens verwerking ingezien dat het te lang zou duren: ■ dubbel zoveel hardware ingezet ■ verwerkingstijd kunnen halveren Alle machine learning algoritmes die we gebruikten zijn open source, voorgetrainde modellen. Geen specifieke training nodig.
  • 46. Gezichtsherkenning - tussentijdse resultaten - Gezichtsdetectie - Loopt 1x om alle gezichten te detecteren op alle archieven - heel rekenintensief, tientallen nodes actief om verwerking te doen - verwerking alle video’s afgelopen (10 weken) - 3,3 mio personen gedetecteerd (~ 27 per video) - Gezichtsherkenning (matching) - Referentie set (+ referentieset beheer) - Loopt herhaaldelijk (vergelijking van alle video vs refset duurt +/- 2 uur) - extra persoon aan de referentieset toegevoegd ⇒ mogelijk nieuwe matches. - 208.000 personen gelinkt aan 2500 personen uit de huidige referentieset
  • 47. Referentieset ● Essentie ○ Een lijst van personen + foto's + links naar wikidata + authorities CP's ○ Gedeeld beheer, steunen op elkaars kennis (bvb. Koers / Huis van Alijn) ○ Transparantie rond aanpassingen (wie, wat, wanneer) ● Cruciale schakel ○ Referentieset maakt de brug tussen detectie en matching ○ Ethisch: iemand in de referentieset steken betekent die persoon herkennen ■ Belangrijk dat het een mens is die dit uitvoert
  • 48. Beheer van de referentieset
  • 49. Beheer van de referentieset - aanpassen
  • 50. Beheer van de referentieset - historiek
  • 54. Dit project kadert binnen het relanceplan Vlaamse Veerkracht en wordt gerealiseerd met de steun van het Europees Fonds voor Regionale Ontwikkeling.
  • 56. Toekomst en andere projecten ● SHARED AI ○ Oktober 2023 - Dec 2024 ○ GiVE project, maar voor regionale media + VRT ● Visual Name Authority ○ 2023 - 2026 (3 fases, 3 jaar) ○ Project waarin we overkoepelende namenlijst en gedeelde referentieset breder inzetbaar willen maken ○ Processen, juridisch, ethische kwesties ○ Maar ook de bouw van een tool