9. Which technics?
1. Where are the images?
(segmentation)
2. What is their content? (visual recognition)
3. How to look into this content?
(information retrieval)
10. 1. Use the segmentation contained in the OCR (when
available: monographs, newspapers)
2. Segment the image (e.g. with supervised learning)
1. Segment
12. Today, deep learning makes the feature extraction phase unnecessary
(the artificial neural network takes care of it)
Which tools for indexing?
Yesterday, visual feature models and learning algorithms....
13. Generic pretrained models Transfert learning
Software as a Service Deep learning
frameworks
Ad hoc models:
(« dog » ou « griffo » ?)
Applications
?
Which tools for indexing?
Deep learning approaches, with…
and tools
14. • In the digital signatures space: [12,5,87,54…]
• In the (textual) labels of classes: "aircraft", "pilot", "biplane"...
• In the visual characteristics: blue, large size, contrast....
• With several indexing (multimodal search): "fish" + "red“ + “drawing”
3. Search
Similarity search Semantic search
15. Select Segment Index QA Use
Search
Disseminate
APIs,
datasets
Access
The workflow
17. • Picard, D., Gosselin, P.-H., Gaspard, M.-C., “Challenged in Content-Based Image Indexing of
Cultural Heritage Collections”. IEEE Signal Processing Magazine, Institute of Electrical and
Electronics Engineers, 2015, 32 (4), pp. 95-102
• Évaluation de descripteurs visuels pour l’annotation automatique d’images patrimoniales,
David PICARD, Philippe-Henri GOSSELIN, ETIS UMR 8051
Collaboration BnF/DRE and ETIS lab (2015)
3,000 annotated images
(400 concepts, 6 categories :
visual, physical, historical…)
1. Global Descriptors (e.g. color and textures
histograms)
2. Aggregation of local descriptors
3. Deep learning (CNN 8-19 layers)
• Best results : deep learning
• Too much concepts, too much diversity, too few images
18. • Indexing by visual and structural similarities
• Search by sample image
• Search API (e.g. by color)
GallicaSimilitudes (BnF, 2017)
http://gallicastudio.bnf.fr/gallicaimages/
770k images
(coll. Spécialisées)
• Global descriptors computed on the dataset
• FCTH (Fuzzy Color and Texture Histogram) footprint
calculation and Tanimoto similarity measurement
• Good results on color and overall structure criteria
• No consideration of shapes
• Complementary to "semantic" approaches
19. • Iconographic retrieval in encyclopedic collections
• Multimodal search (metadata, text, image)
• Creation of iconographic datasets for visual studies
• IIIF driven
GallicaPix (BnF, 2017)
http://demo14-18.bnf.fr:8984/rest?run=findIllustrations-form.xq
220k images from 500k pages
(print, images, maps…).
Topic: WW1
• Data mining of the collections (metadata, OCR)
• Visual recognition (IBM, Google, open source models)
• Classification of 12 genres (picture, engraving, drawing,
map, text…) with a CNN trained on 12k BnF illustrations
20. GallicaPix and Numapresse research project
http://demo14-18.bnf.fr:8984/rest?run=findIllustrations-form.xq
• Face and genre recognition on Excelsior and Paris-Match front pages (1910-1920)
• Human correction and annotation (named people/anonymous)
• Statistical analysis of representation
Genres in newspapers illustrations: GallicaPix for the Digital Humanities
21. GallicaPix and DH 2019
http://demo14-18.bnf.fr:8984/rest?run=findIllustrations-form.xq
• DH Hackathon, May 2019, Helsinki : “Newspapers and Capitalism”, focus on ads
• Object detection (Yolo v3) on 60k illustrated ads
• Means of transport analysis (WW1)
Illustrated ads: GallicaPix for the Digital Humanities
23. (à compléter)
• Two INRIA teams: ZENITH (Montpellier), LinkedMedia (Rennes)
• Datasets: manuscripts (Mandragore) and WW1
•
INRIA, BnF research project (2018-2020)
• SNOOP (INRIA, INA), Pl@ntnet:
collaborative recognition of plants
• Search in large visual indexes
https://interstices.info/plantnet-un-reseau-et-des-outils-pour-une-recherche-participative
Objectives :
• Human in the loop :
• Relevance evaluation
• Object detection on small datasets
• Visual signatures for heritage content
search in large indexes
This is not a lion
24. 24
Initial
Query
User
selection New query
leveraging the
user inputs
Selection…
INRIA/Zenith
• Tests on 1M images (WW1)
• Iterative retrain of the model
• New classes are created by the user
Good/Wrong
Human in the loop: iterative queries
26. 26
INRIA/LinkedMedia
• Tests on Mandragore database (manuscripts): zoologie
• Small datasets, visual heterogeneity (1000 BC to XXth c.)
Heritage content, small datasets
Première étape du cycle de la donnée : les mettre à disposition
Quelles données concernées : données et métadonnées produites par l’établissement
Open data / ouverture des données publiques :
métadonnées 2014
Conditions de réutilisations Gallica
Sous quelles formes / comment les mettre à disposition ? Mise à disposition technique
Interrogation synchrone :
API : Interface de programmation applicative pour permettre à deux machines de dialoguer entre elles par un ou des protocoles normalisés
Services web : API utilise des protocoles web
Exemple : applications sur smartphone qui utilisent des données publiques et des données privées pour créer du service
Interrogation asynchrone
Données / data
Jeux de données dont la constitution constitue une valeur ajoutée
Première étape du cycle de la donnée : les mettre à disposition
Quelles données concernées : données et métadonnées produites par l’établissement
Open data / ouverture des données publiques :
métadonnées 2014
Conditions de réutilisations Gallica
Sous quelles formes / comment les mettre à disposition ? Mise à disposition technique
Interrogation synchrone :
API : Interface de programmation applicative pour permettre à deux machines de dialoguer entre elles par un ou des protocoles normalisés
Services web : API utilise des protocoles web
Exemple : applications sur smartphone qui utilisent des données publiques et des données privées pour créer du service
Interrogation asynchrone
Données / data
Jeux de données dont la constitution constitue une valeur ajoutée
Tradition ancienne d’échanges de données en bibliothèque.
La situation en 2016 : plusieurs API ouvertes par la BnF
l’historique Z39.50, bon exemple d’API qui n’est pas un service web
le protocole SRU sur le catalogue général version web du Z3950
des API très utilisées comme les entrepôts OAI
un service créé spécifiquement pour la diffusion des données : data.bnf.fr et son sparql endpoint
des API à usage interne, d’abord créées parfois accessibles de l’extérieur : le SRU Gallica
IIIF
Mais dispersion de l’accès, de la documentation (lorsqu’elle existait) reflet de l’histoire, dispersion des usages
Rappeler la diversité des publics : publics professionnels, développeurs,
Prise de conscience : le hackathon 2016 >
documenter officiellement, assumer l’ouverture de services web IIIF, SRU Gallica
réalisation d’un wiki sur la plate-forme Github
A l’occasion du hackathon 2017
Regrouper la documentation existante
Aussi les jeux de données, notamment produits dans le cadre des projets de recherche : lien avec le projet CORPUS
Corpus d’images
Dumps de MD
Listes d’URL du dépôt légal de l’internet
Statistiques
And finally, raw unsegmented images result in generic classes like "frame", "document", "written document », « newspapers », which are definitively not usable…
And finally, raw unsegmented images result in generic classes like "frame", "document", "written document », « newspapers », which are definitively not usable…
And finally, raw unsegmented images result in generic classes like "frame", "document", "written document », « newspapers », which are definitively not usable…
And finally, raw unsegmented images result in generic classes like "frame", "document", "written document », « newspapers », which are definitively not usable…
And finally, raw unsegmented images result in generic classes like "frame", "document", "written document », « newspapers », which are definitively not usable…
Production / exploitation internalisée vs. externalisée