Nastasia Vanderperren geeft aan de collegegroep digitale collectieregistratie van 6 december 2019 een introductie tot automatische beelherkenningsservices en hun mogelijke toepassing in het beschrijven en classificeren van erfgoedcollecties.
20190121 public domain_day_be_2019_introduction_sam_donvil
20191206 presentatie beeldherkenning
1. Bert Lemmens Alina Saenko
bertb@packed.be
alina@packed.be
@PACKEDvzw
Beeldherkenning voor het
beschrijven en
classificeren van
erfgoedcollecties
Nastasia Vanderperren
7. ONDERZOEK
1. VR4CH (MoMu, Datable, PACKED)
2. BP: Fotocollectie snapshots Huis Van Alijn (Nastasia
Vanderperren)
a. automatisch metadateren
b. classificatie op basis van training
3. Operationalisering van beeldherkenning in de
registratiepraktijk (FOMU, Datable, PACKED)
9. VR4CH
Onderzoeksvragen:
● bruikbaar voor cultureel erfgoed?
● kwaliteit?
● mogelijke toepassingen?
● vergelijking van verschillende diensten
● case: MOMU studiecollectie - 164 foto’s van objecten,
scenorgrafie, modeshows en events
10. VR4CH
Onderzoeksvragen:
● bruikbaar voor cultureel erfgoed?
● kwaliteit?
● mogelijke toepassingen?
● vergelijking van verschillende diensten
CC BY Henk Vanstappen
11. VR4CH
Onderzoeksvragen:
● bruikbaar voor cultureel erfgoed?
● kwaliteit?
● mogelijke toepassingen?
● vergelijking van verschillende diensten
CC BY Henk Vanstappen
13. VR4CH
Conclusies
● snel en goedkoop
● andere soorten trefwoorden
● maar veel ruis en niet geschikt voor alle soorten
beeldmateriaal
CC BY Henk Vanstappen
15. USE CASES
1. automatisch metadateren van de beelden: hoe ver komen
we hier mee?
2. classificeren van beelden in thema’s → training
3. classificeren van beelden in decennia → training
18. CLARIFAI
● 20 tags per foto people (0,99553334), child (0,9944993),
portrait (0,9912409), sepia (0,9822352),
girl (0,97256065), baby (0,9721891),
wear (0,96921843), wedding (0,96212375),
son (0,9487199), dress (0,9479506),
family (0,9464451),woman (0,94372404),
two (0,93469185), princess (0,927248),
love (0,9161264), retro (0,9128336),
vintage (0,90305287), sit (0,8941809),
nostalgia (0,8909985), one (0,8850393)
FO-00-00015 van Huis van Alijn met
Clarifai general model
29. RESULTATEN
● 20 tags per foto
○ entiteiten: people, adult, vehicle, toy, flower, camel,
dress, furniture, beach…
○ activiteiten: dancing, sit, reclining, shopping, travel
○ emoties: fun, love, enjoyment, affection
○ contextuele concepten: friendship, togetherness,
family, wedding, tourism, leisure
○ over de foto: portrait, profile, monochrome, black and
white, color, sepia, no person
○ ook hoeveelheden: one, two, three, four, many, several
30. RESULTATEN - HUWELIJK
top 30 termen
● people (399x)
● woman
● adult
● man
● wedding (341x)
● portrait
● wear
● groom
● two
● bride
● veil
● group
● dress
● ceremony
● facial expression
● group together
● love
● monochrome
● flower arrangement
● family
● several
● dinner jacket
● marriage
● bridal
● many
● engagement
● girl
● couple
● child
● bouquet (48x)
31. RESULTATEN - SINTERKLAAS
top 30 termen
● people (97x)
● wear
● adult
● portrait
● child
● man
● two
● monochrome
● outfit
● veil
● three
● facial expression
● group together
● group
● costume
● several
● boy
● woman
● family
● coat
● sibling
● four
● outerwear
● recreation
● actor
● sepia
● uniform
● girl
● gown (clothing)
● sit (5x)
32. RESULTATEN
● opvallend:
○ Sinterklaas en verwante concepten niet gekend door
model
○ minder goed in objectherkenning? focus op omgeving?
○ kinderen worden als volwassenen gezien of krijgen
fout gender; pop wordt als baby getagd
○ foto’s van ouder(s) met kind ook als wedding (16x),
groom (3x) of bride (2x) geclassificeerd
○ scoort iets beter op foto’s vanaf jaren 60
34. IN DE PRAKTIJK?
● 20 tags per foto people (0,99553334), child (0,9944993),
portrait (0,9912409), sepia (0,9822352),
girl (0,97256065), baby (0,9721891),
wear (0,96921843), wedding (0,96212375),
son (0,9487199), dress (0,9479506),
family (0,9464451),woman (0,94372404),
two (0,93469185), princess (0,927248),
love (0,9161264), retro (0,9128336),
vintage (0,90305287), sit (0,8941809),
nostalgia (0,8909985), one (0,8850393)
FO-00-00015
35. IN DE PRAKTIJK?
● drempelwaarde instellen
● selectie maken van thema’s (Sintfoto’s doen de
percentages dalen → niet gebruiken?)
drempelwaarde
(%)
aandeel juiste
tags (%)
aantal foute tags
(%)
95 55 17
90 85 25
85 95 30
geen 100 32
37. UITGANGSPUNT
● max. 50% gebruiken voor training
● gebruik maken van iteraties
● ieder concept (thema) even goed trainen = evenveel
trainingsbeelden
○ Themamodel: → max. 50 trainingsbeelden per thema
○ Periodemodel → te ongelijk verdeeld, niet mogelijk om
evenwaardig te trainen
● keuze voor versie met hoogste performantiescore
(F-score)
38. METHODE
● creatie custom model
○ via API
○ via webinterface
● webinterface → eenvoudig als je geen programmeur bent
● maar via wel API sneller
40. METHODE
● creatie custom model
○ via API
○ via webinterface
● webinterface → eenvoudig als je geen programmeur bent
● maar via wel API sneller
41. METHODE
● creatie custom model
○ via API
○ via webinterface
● webinterface → eenvoudig als je geen programmeur bent
● maar via wel API sneller
42. VALIDATIE
validatie:
● uitgangspunt: ieder concept (thema) even goed trainen =
even veel trainingsbeelden
● probleem: grote verschillen in aantallen per thema
● ⇒ aftoppen tot honderd beelden per thema → max. 50
trainingsbeelden per thema
● iteraties van 10 beelden per thema
● trainingset:
https://drive.google.com/open?id=1I-Zi1Vp8SKD4A7BUKu
ymBb96TU81sI89xFeNjn4BDi4
43. VALIDATIE
● 20 tags per foto geboorte (0,99555284),
sint (0,0036374554),
speelgoed (0,0007022651),
huwelijk (0,000107247644),
vakantie (0,0000001857)
FO-00-00015
45. VALIDATIE Is it a chihuahua or a
muffin?!
→ true positive! 😊
→ true negative! 😊
→ false negative! 😫
→ false positive! 😫
46. VALIDATIE
● vangst
(rappel/recall): het
aantal relevante
items dat gevonden
werd
● precisie: het aantal
relevante items op
alle gevonden items
● F-score: harmonisch
gemiddelde van
vangst en precisie
47. RESULTATEN
● Themamodel
○ 89% correcte classificaties
○ beelden hadden een gemiddelde
waarschijnlijkheidsscore van 95% (Clarifai was dus voor
gemiddeld 95% zeker van classificatie)
50. RESULTATEN
● Periodemodel
○ 57% correcte classificaties
○ beelden hadden een gemiddelde
waarschijnlijkheidsscore van 55% (Clarifai was dus voor
gemiddeld 55% zeker van classificatie)
52. RESULTATEN
opvallend
● periodes met minste trainingsdata scoren slechter
● erg lage waarschijnlijkheidsscores (gemiddelde van 60%
voor de juiste classificaties) → concepten niet voldoende
gekend?
● ook beelden die als trainingsbeelden gebruikt zijn, worden
fout geclassificeerd
53. IN DE PRAKTIJK?
Verschillende strategieën
1. drempelwaarde instellen op tag met hoogste
waarschijnlijkheidsscore
2. drempelwaarde instellen op tag met tweede hoogste
waarschijnlijkheidsscore
54. IN DE PRAKTIJK?
● 20 tags per foto geboorte (0,99555284),
sint (0,0036374554),
speelgoed (0,0007022651),
huwelijk (0,000107247644),
vakantie (0,0000001857)
FO-00-00015
55. IN DE PRAKTIJK?
● 20 tags per foto sint (0,87703073),
geboorte (0,101171814),
speelgoed (0,018132137),
huwelijk (0,0036528711),
vakantie (0,000012468)
FO-00-00035
57. IN DE PRAKTIJK?
Strategie 1: te lage score → classificatie niet aanvaard
drempelwaarde
(%)
aandeel juiste
classificaties (%)
aantal foute
classificaties (%)
95 87 3,7
90 91 4,6
80 95 6,6
55 100 11
58. IN DE PRAKTIJK?
● 20 tags per foto geboorte (0,99555284),
sint (0,0036374554),
speelgoed (0,0007022651),
huwelijk (0,000107247644),
vakantie (0,0000001857)
FO-00-00015
59. IN DE PRAKTIJK?
● 20 tags per foto sint (0,87703073),
geboorte (0,101171814),
speelgoed (0,018132137),
huwelijk (0,0036528711),
vakantie (0,000012468)
FO-00-00035
60. IN DE PRAKTIJK?
● drempelwaarde instellen
● selectie maken van thema’s (Sintfoto’s doen de
percentages dalen → niet gebruiken?)
drempelwaarde
(%)
aandeel juiste
tags (%)
aantal foute tags
(%)
95 55 17
90 85 25
85 95 30
geen 100 32
61. IN DE PRAKTIJK?
Strategie 2: tweede tag heeft hoge score → classificatie niet
aanvaard
drempelwaarde
(%)
aandeel juiste
classificatie (%)
aantal foute
classificatie (%)
5 87,5 3,3
10 91,6 4,5
15 93,6 5,6
48 100 12
62. CONCLUSIES
Automatisch metadateren
● eenvoudig in gebruik
● snel, volledig + meer termen
● geeft andere soort tags → nieuwe mogelijkheden om
collectie te ontsluiten?
● wél selectie maken van thema’s + instellen drempelwaarde
→ vervangt de menselijke registrator niet
63. CONCLUSIES
Classificeren op thema
● goede resultaten via training
● werkt goed voor foto’s met strak format
● verder onderzoek: testen met niet-geclassificeerde foto’s
Classificeren op periode
● ondanks marginale trainingsbeelden toch resultaten >
50%
● doet vermoeden dat betere resultaten mogelijk zijn
● verder onderzoek nodig met meer trainingsdata
72. CONCLUSIES
Verder onderzoek
● andere use cases: iconografische beschrijving, topic
detection, gezichtsherkenning, landmark detection
● ander soort erfgoedmateriaal: schilderijen,
museumobjecten, archiefstukken, ….