SlideShare a Scribd company logo
1 of 43
Download to read offline
1/43
16e
Journées des Archives
Pérenniser l’éphémère. Archivage et médias sociaux
Louvain-la-Neuve, 9 et 10 mai 2016
http://dejavu.hypotheses.org/
Les métadonnées des images fixes
et les médias sociaux
Patrick Peccatte
Informaticien
Chercheur associé au Laboratoire d'histoire visuelle contemporaine
(Lhivic/EHESS)
peccatte@softexperience.com
Twitter: @ppeccatte
Facebook: patrick.peccatte
Google+: Patrick Peccatte
Flickr: patrickpeccatte et photosnormandie
Tumblr: dubruitausignal.tumblr.com
2/43
Au menu...

Rappel sur les métadonnées des images fixes

Panorama du (non) traitement des métadonnées
des images fixes sur les médias sociaux

Un exemple d'utilisation des métadonnées sur la
plate-forme Flickr:
le projet PhotosNormandie
3/43
wenzday01/Flickr
Creative Commons
Il était une fois...
L'album de photos
Les métadonnées
des images fixes ?
Une histoire
ancienne
et bien connue...
4/43
lizjones112/Flickr
Creative Commons
on ajoutait des légendes
aux photos...
5/43
Yume Photo/Flickr
Creative Commons
mais attention
au déclassement...
6/43
Guanatos Gwyn/Flickr
Creative Commons
la solution ?
la légende au verso
7/43
Images numériques fixes
Où sont les métadonnées ?

À l'extérieur des données elles-mêmes, dans un
catalogue.
Les métadonnées sont externes.
~ écrire sur l'album de photos

Dans les données elles-mêmes.
Les métadonnées sont internes, "embarquées"
dans les ressources numériques.
~ écrire au verso de la photo
8/43
Quelques techniques de métadonnées
des images numériques fixes

Exif
(EXchangeable Image File)

IPTC/IIM
(International Press and Telecommunications
Council / Information Interchange Model)

XMP
(EXtensible Metadata Platform)
9/43
EXIF

EXIF est une abréviation de EXchangeable Image File.

Développé en octobre 1995 par le JEIDA
(Japan Electronic Industry Development Association).

Ce n'est pas un standard, mais il est supporté par tous les fabricants
d'appareils photographiques numériques (APN)

Définit les paramètres de prise de vue et les réglages de l'appareil au
moment de la capture numérique.
Ce sont des métadonnées de type interne.
✔ fabricant et modèle de l'appareil
✔ hauteur et largeur de l'image
✔ date et heure de la prise de vue
✔ orientation
✔ résolution, temps d'exposition, ouverture
✔ présence d'un flash
✔ coordonnées GPS
✔ etc.
10/43
IPTC

L'IPTC (International Press and Telecommunications
Council) est un consortium qui réunit les principales
agences de presses du monde

L'IPTC développe des standards techniques d'échange
de données pour la presse

Ces standards sont employés par la quasi-totalité des
agences de presse du monde
11/43
IPTC/IIM (1/2)

L'IPTC et la NAA (Newspaper Association of America)
ont créé en 1991 le modèle global de données appelé
Information Interchange Model [IIM]

Sous-ensemble de l'IIM utilisé par Adobe en 1994 pour
définir dans Photoshop les informations associées à
une image

Standard considéré comme obsolète par l'IPTC et
remplacé par XMP
12/43

Métadonnées internes = ensemble de champs
textuels stockés dans le fichier image:
Titre, Légende, Mots-clés, Copyright, etc.

Standard toujours très utilisé dans la presse et
l'édition, bien qu'il soit considéré comme
obsolète
IPTC/IIM (2/2)
13/43
XMP – Extensible Metadata Platform

Créé par Adobe en septembre 2001

Utilise une version simplifiée de RDF
(Resource Description Framework)
●
Standard développé par le W3C, base du Web sémantique
●
Permet d'encoder, échanger et réutiliser des métadonnées
structurées
●
Images munies de métadonnées XMP:
probablement la plus grande collection d'objets décrits en RDF
sur le Web...
●
N'est pas réservé aux images...

Utilise le schéma Dublin Core comme fondation

Standard ISO depuis mars 2012: ISO 16684-1:2012
14/43
Fichier image numérique
Où sont les métadonnées ?
Exif IPTC/IIM
GPS
Autres informations...
XMP XMP
Vignette
intégrée
Catalogue
(informations
externes
explicites)
exploitation
copie externe
contexte de
publication
(sans métadonnées)
15/43
Avantages et inconvénients
des métadonnées internes

Avantage des métadonnées internes :
l'échange est facilité; la ressource numérique
transporte avec elle ses propres métadonnées
lorsqu'elle est téléchargée, copiée, renommée,
compactée, etc.

Inconvénient des métadonnées internes :
il est nécessaire d'extraire les métadonnées et
les copier dans une base de données pour
exploiter une grande collection de ressources
numériques.
~ retourner la photo pour lire la légende
16/43
Contexte de publication
l'exemple de Google Images (1/2)
●
Google Images indexe le contexte de publication,
c'est-à-dire le nom du fichier image et le texte qui
encadre l'image dans la page où elle apparaît
✔
Pour un moteur de recherche généraliste, les images
avec des métadonnées internes constituent une partie
insignifiante des images du web
●
Google Images n'indexe pas les métadonnées
internes des images (IPTC/IIM ou XMP)
✔
Test en indexant une image avec un mot-clé "hapax"
en IPTC/IIM et XMP
17/43
Contexte de publication
l'exemple de Google Images (2/2)
●
Une Interrogation récurrente en SEO (Search Engine
Optimization / Optimisation pour les moteurs de
recherche):
La présence de métadonnées internes aux images
améliore-t-elle le positionnement dans les résultats de
recherche de Google Images ?
La réponse est non
●
Mais Google a probablement des projets internes qui
exploitent les métadonnées internes aux images
18/43
Le Manifeste
"Embedded Metadata Manifesto"

Le Manifeste "Embedded Metadata" (métadonnées
embarquées/intégrées) de l'IPTC définit cinq principes
directeurs pour la création et le stockage des
métadonnées, afin qu'elles soient transportées avec le
fichier chaque fois que c'est possible

Le Manifeste affirme que les métadonnées associées à
une image doivent être persistantes dans toutes les
étapes du flux des informations (workflow)

Le Manifeste s'adresse à tous les organismes qui
gèrent des métadonnées et aux fournisseurs de
matériels et de logiciels dont les systèmes exploitent
des flux de données
19/43
L'enquête
How Social Media sites manage metadata ?
http://www.embeddedmetadata.org/social-media-test-results.php
20/43
Méthode
Image de test avec un jeu complet de métadonnées
(Exif, IPTC/IIM, XMP) téléchargée sur différents sites
Détail du protocole ici:
http://www.embeddedmetadata.org/social-media-test-procedure.php
21/43
Historique et objectifs

Deux séries de tests en 2013 et 2015
✔
Prendre en compte les nouveaux réseaux sociaux
✔
Observer les évolutions éventuelles

Analyser quelles sont les métadonnées
embarquées qui s'affichent sur chaque plate-forme
de réseau social

Vérifier les métadonnées préservées et celles qui
sont supprimées
22/43
Quatre tests précis

Quelles sont les métadonnées embarquées qui
s'affichent dans l'interface utilisateur ?

Les informations de crédit sont-elles correctement
affichées ?
Vérification des "4C" :
Caption, Creator, Copyright Notice, Creditline

Quelles sont les métadonnées préservées lorsque
l'on récupère l'image depuis un navigateur, à l'aide
d'une commande du genre Save As ?

Quelles sont les métadonnées préservées lorsque
le réseau social propose un téléchargement de
l'image (bouton Download) ?
23/43
Résultats

Ce n'est pas très brillant!

Les réseaux sociaux les plus connus altèrent les
métadonnées embarquées d'une manière ou d'une
autre

La situation se détériore globalement; les résultats
étaient un peu meilleurs en 2013

Quelques détails...
24/43
Dropbox

Aucune métadonnée n'est affichée

Les métadonnées sont préservées uniquement lors
d'un download, elles ne sont pas préservées avec
un Save As

Dégradation:
en 2013, elles étaient préservées avec un Save As
25/43
Facebook

Aucune métadonnée n'est affichée

Seules les métadonnées Copyright Notice et
Creator de l'IPTC/IIM sont préservées avec un
Save As. Toutes les autres sont supprimées.

Légère amélioration depuis 2013:
toutes les métadonnées étaient alors supprimées
avec un Save As
26/43
Facebook - une curiosité intrigante (1/2)
Facebook ajoute systématiquement deux
métadonnées IPTC/IIM
27/43
Facebook - une curiosité intrigante (2/2)

Il est extrêmement difficile de comprendre à quoi
correspondent ces codes générés lors du
téléchargement d'une image sur Facebook

Aucune communication de Facebook sur ce sujet
et le reverse engineering a des limites

L’IPTC ignore tout de cette particularité des images
ayant transité par Facebook

Grâce à ce dispositif, Facebook est peut-être
capable d’effectuer un suivi élémentaire des
images qui ont transité sur la plate-forme
28/43
Flickr

Quelques métadonnées sont affichées
correctement, mais pas toutes les "4C"

Toutes les métadonnées sont préservées lors d'un
download ou un Save As de l'image dans sa
définition originale, mais elles sont supprimées
dans les autres définitions

Dégradation
Vers 2010, toutes les résolutions intermédiaires
proposées par la plate-forme possédaient les
métadonnées de l'image originale
29/43
Google Photos

Quelques métadonnées sont affichées
correctement, mais pas toutes les "4C"

Les métadonnées sont préservées lors d'un
download de l'image originale

Seules les métadonnées Exif sont préservées avec
un Save As sur les images en résolution réduite

Dégradation
En 2013, toutes les métadonnées étaient
préservées avec un Save As sur les images en
résolution réduite
30/43
Instagram

Aucune métadonnée n'est affichée

Aucune sauvegarde n'est possible

En 2013, le Save As était possible mais supprimait
les métadonnées

L'un des pires réseaux sociaux au regard des
métadonnées...
31/43
Pinterest

Aucune métadonnée n'est affichée

Les métadonnées sont préservées avec un Save
As de l'image dans sa définition originale, mais pas
lors d'un download

Non testé en 2013
32/43
Tumblr

Aucune métadonnée n'est affichée

Seules les métadonnées Exif sont préservées avec
un Save As, toutes les autres sont supprimées

Dégradation
En 2013, toutes les métadonnées embarquées
étaient préservées avec un Save As
33/43
Twitter

Aucune métadonnée n'est affichée

Seules les images en résolution réduite sont
disponibles avec un Save As, sans aucune
métadonnées

Inchangé depuis 2013

Lanterne rouge avec Instagram
34/43
Il est pourtant possible de concevoir des réseaux sociaux
respectueux des métadonnées embarquées
L'exemple de Behance

Appartient à Adobe
www.behance.net

Porte-folios d'artistes

Toutes les métadonnées 4C sont correctement
affichées

Plusieurs autres métadonnées (mais pas toutes)
sont également affichées

Toutes les métadonnées sont préservées lors d'un
download et avec un Save As
35/43
Il est aussi possible de travailler avec les métadonnées
embarquées sur un réseau social "médiocre"
Le projet PhotosNormandie sur Flickr

Améliorer la description documentaire d'un fonds de
plus de 3400 photographies historiques sur la
bataille de Normandie

Actif sur la plate-forme grand public Flickr depuis
janvier 2007
www.flickr.com/photos/photosnormandie/

Ouvert à tous.
Une soixantaine de contributeurs (une dizaine
d'intervenants participent régulièrement au projet)

Crowdsourcing (contenus générés par les utilisateurs),
indexation sociale, indexation collaborative, indexation
contributive, redocumentarisation, etc.
36/43
Origine des photos

2760 photos proviennent du site
Archives Normandie 1939-1945 [n'existe plus]
✔
Service public du Conseil Régional de Basse-
Normandie mis en place en 2004
✔
Photos libres de droit issues des
Archives Nationales des États-Unis et du Canada

296 photos de The Allison Collection: photos
transmises par radio en 1944

322 photos proviennent de la bibliothèque de la
ville de Cherbourg-Octeville

163 photos proviennent de la Médiathèque de
Lisieux
37/43
Les légendes des photos

Les légendes des photos sont écrites selon les
standards de métadonnées IPTC/IIM et XMP

Ensemble de champs textuels (Titre, Légende, Mots-clés,
Copyright, etc.) stockés dans le fichier image

S'appuie sur une fonctionnalité peu connue de la
plate-forme Flickr

Renseignement automatique de champs Flickr à partir
des champs IPTC lors du téléchargement d'une photo
38/43
Métadonnées dans Photoshop
Téléchargement de l'image sur Flickr
39/43
Photo
Commentaires
des utilisateurs
Rédaction
d'une
description
Photo + métadonnées
IPTC
Photo sur Flickr
+ description, mots-clés
Rédaction
d'une nouvelle
description
Photo +
nouvelles métadonnées
Le processus documentaire et rédactionnel
40/43
Avantages des métadonnées
embarquées dans les photos

La description textuelle de l'image est
toujours disponible avec l'image et
facilement réutilisable

L'utilisateur reste libre de la technologie de base
de données utilisée pour l'exploitation de son
corpus d'images
Comme les images, les métadonnées
vous appartiennent, elles n'appartiennent
pas à votre prestataire de service
41/43

La mise à jour d'une description est lourde.
Nécessité de recharger la photo contenant la nouvelle
description

Une URL Flickr pointant sur une photo ne peut être
considérée comme stable; le numéro d'identification
Flickr change lorsque l'on télécharge à nouveau
l'image

Mais... Nous pouvons travailler avec les références (ID)
des photos
www.flickr.com/photos/photosnormandie/3019172081/
Numéro d'identification
Ruse....
www.flickr.com/search/?
w=58897785@N00&q=p012516&m=text
ID PhotosNormandie ID Photo
Inconvénients de la méthode (avec Flickr)
42/43
Bilan documentaire

Depuis fin janvier 2007, la galerie et les photos ont été vues
plus de 36 millions de fois (soit plus de 7700 visites par jour)

Grande progression depuis quatre ans
(4500 visites quotidiennes en 2012)

Le 6 juin 2014, près de 200 000 visites

9222 descriptions corrigées et mises à jour
(certaines descriptions ont été corrigées plusieurs fois)

417 photos correspondent à des séquences filmées retrouvées
(plus de 1 sur 10; il doit en exister davantage)
43/43
Merci de votre
attention

More Related Content

Similar to Les métadonnées des images fixes et les médias sociaux

Présentation de la bdd Image des LP
Présentation de la bdd Image des LPPrésentation de la bdd Image des LP
Présentation de la bdd Image des LP
louamax
 
Les extensions Firefox et Google Chrome pour naviguer efficacement
Les extensions Firefox et Google Chrome pour naviguer efficacementLes extensions Firefox et Google Chrome pour naviguer efficacement
Les extensions Firefox et Google Chrome pour naviguer efficacement
URFIST de Paris
 
25emes journées du_rndh_atelier_ff19-10-2012
25emes journées du_rndh_atelier_ff19-10-201225emes journées du_rndh_atelier_ff19-10-2012
25emes journées du_rndh_atelier_ff19-10-2012
URFIST de Paris
 
Medihal2 130424123214-phpapp02-2
Medihal2 130424123214-phpapp02-2Medihal2 130424123214-phpapp02-2
Medihal2 130424123214-phpapp02-2
Jacqueline Nivard
 

Similar to Les métadonnées des images fixes et les médias sociaux (20)

photos.ppt
photos.pptphotos.ppt
photos.ppt
 
Doc Soc2008 Peccatte
Doc Soc2008 PeccatteDoc Soc2008 Peccatte
Doc Soc2008 Peccatte
 
Présentation de la bdd Image des LP
Présentation de la bdd Image des LPPrésentation de la bdd Image des LP
Présentation de la bdd Image des LP
 
Les extensions Firefox et Google Chrome pour naviguer efficacement
Les extensions Firefox et Google Chrome pour naviguer efficacementLes extensions Firefox et Google Chrome pour naviguer efficacement
Les extensions Firefox et Google Chrome pour naviguer efficacement
 
Intégration continue
Intégration continueIntégration continue
Intégration continue
 
25emes journées du_rndh_atelier_ff19-10-2012
25emes journées du_rndh_atelier_ff19-10-201225emes journées du_rndh_atelier_ff19-10-2012
25emes journées du_rndh_atelier_ff19-10-2012
 
RMLL 2011 - L'accessibilité Web des CMS
RMLL 2011 - L'accessibilité Web des CMSRMLL 2011 - L'accessibilité Web des CMS
RMLL 2011 - L'accessibilité Web des CMS
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Gestion des médias dans Drupal
Gestion des médias dans DrupalGestion des médias dans Drupal
Gestion des médias dans Drupal
 
Chapitre 1 - Introcution & cycles de développement - Etudiant.pptx
Chapitre 1 - Introcution & cycles de développement - Etudiant.pptxChapitre 1 - Introcution & cycles de développement - Etudiant.pptx
Chapitre 1 - Introcution & cycles de développement - Etudiant.pptx
 
L'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherL'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cher
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Ère Numérique - Nouvel Écosystème Média
Ère Numérique - Nouvel Écosystème MédiaÈre Numérique - Nouvel Écosystème Média
Ère Numérique - Nouvel Écosystème Média
 
Medihal2 130424123214-phpapp02-2
Medihal2 130424123214-phpapp02-2Medihal2 130424123214-phpapp02-2
Medihal2 130424123214-phpapp02-2
 
Jcom02.ppt
Jcom02.pptJcom02.ppt
Jcom02.ppt
 
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
 
La Meta-programmation
La Meta-programmation La Meta-programmation
La Meta-programmation
 
Nouveau site web pour bibliothèques ups
Nouveau site web pour bibliothèques upsNouveau site web pour bibliothèques ups
Nouveau site web pour bibliothèques ups
 
Etude des Frameworks PHP
Etude des Frameworks PHPEtude des Frameworks PHP
Etude des Frameworks PHP
 
Drupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet DrupalDrupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet Drupal
 

More from Peccatte

Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Peccatte
 
Fadben presentation 23 mars 2012
Fadben presentation   23 mars 2012Fadben presentation   23 mars 2012
Fadben presentation 23 mars 2012
Peccatte
 
The commons séminaire muséologie - 14 février 2012
The commons   séminaire muséologie - 14 février 2012The commons   séminaire muséologie - 14 février 2012
The commons séminaire muséologie - 14 février 2012
Peccatte
 
Colloque si la photo est bonne 20 octobre 2011
Colloque si la photo est bonne   20 octobre 2011Colloque si la photo est bonne   20 octobre 2011
Colloque si la photo est bonne 20 octobre 2011
Peccatte
 

More from Peccatte (20)

Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
 
Les origines du cinéma de nazisploitation
Les origines du cinéma de nazisploitationLes origines du cinéma de nazisploitation
Les origines du cinéma de nazisploitation
 
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
 
La bande dessinée et la tapisserie de Bayeux - Angoulême, 3 mai 2017
La bande dessinée et la tapisserie de Bayeux  - Angoulême, 3 mai 2017La bande dessinée et la tapisserie de Bayeux  - Angoulême, 3 mai 2017
La bande dessinée et la tapisserie de Bayeux - Angoulême, 3 mai 2017
 
Girls' Romances #97, December 1963, Arleigh Publishing [DC]
Girls' Romances #97, December 1963, Arleigh Publishing [DC]Girls' Romances #97, December 1963, Arleigh Publishing [DC]
Girls' Romances #97, December 1963, Arleigh Publishing [DC]
 
Strange Suspense Stories #72, October 1964, Charlton Comics
Strange Suspense Stories #72, October 1964,  Charlton ComicsStrange Suspense Stories #72, October 1964,  Charlton Comics
Strange Suspense Stories #72, October 1964, Charlton Comics
 
Secret Hearts #83, November 1962, Arleigh Publishing [DC]
Secret Hearts #83, November 1962, Arleigh Publishing [DC]Secret Hearts #83, November 1962, Arleigh Publishing [DC]
Secret Hearts #83, November 1962, Arleigh Publishing [DC]
 
All-American Men of War #089, February 1962, DC
All-American Men of War #089, February 1962, DCAll-American Men of War #089, February 1962, DC
All-American Men of War #089, February 1962, DC
 
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
 
PhotosNormandie, Forum des Archivistes - 20 mars 2013
PhotosNormandie, Forum des Archivistes - 20 mars 2013PhotosNormandie, Forum des Archivistes - 20 mars 2013
PhotosNormandie, Forum des Archivistes - 20 mars 2013
 
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
 
Séminaire images de guerres ULB (présentation)
Séminaire images de guerres ULB (présentation)Séminaire images de guerres ULB (présentation)
Séminaire images de guerres ULB (présentation)
 
Fadben presentation 23 mars 2012
Fadben presentation   23 mars 2012Fadben presentation   23 mars 2012
Fadben presentation 23 mars 2012
 
The commons séminaire muséologie - 14 février 2012
The commons   séminaire muséologie - 14 février 2012The commons   séminaire muséologie - 14 février 2012
The commons séminaire muséologie - 14 février 2012
 
La Tapisserie de Bayeux
La Tapisserie de BayeuxLa Tapisserie de Bayeux
La Tapisserie de Bayeux
 
Colloque si la photo est bonne 20 octobre 2011
Colloque si la photo est bonne   20 octobre 2011Colloque si la photo est bonne   20 octobre 2011
Colloque si la photo est bonne 20 octobre 2011
 
IHA - 28 juin 2011 - PhotosNormandie
IHA - 28 juin 2011 - PhotosNormandieIHA - 28 juin 2011 - PhotosNormandie
IHA - 28 juin 2011 - PhotosNormandie
 
Machine Tags Flickr Peccatte
Machine Tags Flickr PeccatteMachine Tags Flickr Peccatte
Machine Tags Flickr Peccatte
 
Luxembourg Photos Normandie Peccatte
Luxembourg Photos Normandie PeccatteLuxembourg Photos Normandie Peccatte
Luxembourg Photos Normandie Peccatte
 
Web 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophiqueWeb 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophique
 

Recently uploaded

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Recently uploaded (16)

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 

Les métadonnées des images fixes et les médias sociaux

  • 1. 1/43 16e Journées des Archives Pérenniser l’éphémère. Archivage et médias sociaux Louvain-la-Neuve, 9 et 10 mai 2016 http://dejavu.hypotheses.org/ Les métadonnées des images fixes et les médias sociaux Patrick Peccatte Informaticien Chercheur associé au Laboratoire d'histoire visuelle contemporaine (Lhivic/EHESS) peccatte@softexperience.com Twitter: @ppeccatte Facebook: patrick.peccatte Google+: Patrick Peccatte Flickr: patrickpeccatte et photosnormandie Tumblr: dubruitausignal.tumblr.com
  • 2. 2/43 Au menu...  Rappel sur les métadonnées des images fixes  Panorama du (non) traitement des métadonnées des images fixes sur les médias sociaux  Un exemple d'utilisation des métadonnées sur la plate-forme Flickr: le projet PhotosNormandie
  • 3. 3/43 wenzday01/Flickr Creative Commons Il était une fois... L'album de photos Les métadonnées des images fixes ? Une histoire ancienne et bien connue...
  • 5. 5/43 Yume Photo/Flickr Creative Commons mais attention au déclassement...
  • 6. 6/43 Guanatos Gwyn/Flickr Creative Commons la solution ? la légende au verso
  • 7. 7/43 Images numériques fixes Où sont les métadonnées ?  À l'extérieur des données elles-mêmes, dans un catalogue. Les métadonnées sont externes. ~ écrire sur l'album de photos  Dans les données elles-mêmes. Les métadonnées sont internes, "embarquées" dans les ressources numériques. ~ écrire au verso de la photo
  • 8. 8/43 Quelques techniques de métadonnées des images numériques fixes  Exif (EXchangeable Image File)  IPTC/IIM (International Press and Telecommunications Council / Information Interchange Model)  XMP (EXtensible Metadata Platform)
  • 9. 9/43 EXIF  EXIF est une abréviation de EXchangeable Image File.  Développé en octobre 1995 par le JEIDA (Japan Electronic Industry Development Association).  Ce n'est pas un standard, mais il est supporté par tous les fabricants d'appareils photographiques numériques (APN)  Définit les paramètres de prise de vue et les réglages de l'appareil au moment de la capture numérique. Ce sont des métadonnées de type interne. ✔ fabricant et modèle de l'appareil ✔ hauteur et largeur de l'image ✔ date et heure de la prise de vue ✔ orientation ✔ résolution, temps d'exposition, ouverture ✔ présence d'un flash ✔ coordonnées GPS ✔ etc.
  • 10. 10/43 IPTC  L'IPTC (International Press and Telecommunications Council) est un consortium qui réunit les principales agences de presses du monde  L'IPTC développe des standards techniques d'échange de données pour la presse  Ces standards sont employés par la quasi-totalité des agences de presse du monde
  • 11. 11/43 IPTC/IIM (1/2)  L'IPTC et la NAA (Newspaper Association of America) ont créé en 1991 le modèle global de données appelé Information Interchange Model [IIM]  Sous-ensemble de l'IIM utilisé par Adobe en 1994 pour définir dans Photoshop les informations associées à une image  Standard considéré comme obsolète par l'IPTC et remplacé par XMP
  • 12. 12/43  Métadonnées internes = ensemble de champs textuels stockés dans le fichier image: Titre, Légende, Mots-clés, Copyright, etc.  Standard toujours très utilisé dans la presse et l'édition, bien qu'il soit considéré comme obsolète IPTC/IIM (2/2)
  • 13. 13/43 XMP – Extensible Metadata Platform  Créé par Adobe en septembre 2001  Utilise une version simplifiée de RDF (Resource Description Framework) ● Standard développé par le W3C, base du Web sémantique ● Permet d'encoder, échanger et réutiliser des métadonnées structurées ● Images munies de métadonnées XMP: probablement la plus grande collection d'objets décrits en RDF sur le Web... ● N'est pas réservé aux images...  Utilise le schéma Dublin Core comme fondation  Standard ISO depuis mars 2012: ISO 16684-1:2012
  • 14. 14/43 Fichier image numérique Où sont les métadonnées ? Exif IPTC/IIM GPS Autres informations... XMP XMP Vignette intégrée Catalogue (informations externes explicites) exploitation copie externe contexte de publication (sans métadonnées)
  • 15. 15/43 Avantages et inconvénients des métadonnées internes  Avantage des métadonnées internes : l'échange est facilité; la ressource numérique transporte avec elle ses propres métadonnées lorsqu'elle est téléchargée, copiée, renommée, compactée, etc.  Inconvénient des métadonnées internes : il est nécessaire d'extraire les métadonnées et les copier dans une base de données pour exploiter une grande collection de ressources numériques. ~ retourner la photo pour lire la légende
  • 16. 16/43 Contexte de publication l'exemple de Google Images (1/2) ● Google Images indexe le contexte de publication, c'est-à-dire le nom du fichier image et le texte qui encadre l'image dans la page où elle apparaît ✔ Pour un moteur de recherche généraliste, les images avec des métadonnées internes constituent une partie insignifiante des images du web ● Google Images n'indexe pas les métadonnées internes des images (IPTC/IIM ou XMP) ✔ Test en indexant une image avec un mot-clé "hapax" en IPTC/IIM et XMP
  • 17. 17/43 Contexte de publication l'exemple de Google Images (2/2) ● Une Interrogation récurrente en SEO (Search Engine Optimization / Optimisation pour les moteurs de recherche): La présence de métadonnées internes aux images améliore-t-elle le positionnement dans les résultats de recherche de Google Images ? La réponse est non ● Mais Google a probablement des projets internes qui exploitent les métadonnées internes aux images
  • 18. 18/43 Le Manifeste "Embedded Metadata Manifesto"  Le Manifeste "Embedded Metadata" (métadonnées embarquées/intégrées) de l'IPTC définit cinq principes directeurs pour la création et le stockage des métadonnées, afin qu'elles soient transportées avec le fichier chaque fois que c'est possible  Le Manifeste affirme que les métadonnées associées à une image doivent être persistantes dans toutes les étapes du flux des informations (workflow)  Le Manifeste s'adresse à tous les organismes qui gèrent des métadonnées et aux fournisseurs de matériels et de logiciels dont les systèmes exploitent des flux de données
  • 19. 19/43 L'enquête How Social Media sites manage metadata ? http://www.embeddedmetadata.org/social-media-test-results.php
  • 20. 20/43 Méthode Image de test avec un jeu complet de métadonnées (Exif, IPTC/IIM, XMP) téléchargée sur différents sites Détail du protocole ici: http://www.embeddedmetadata.org/social-media-test-procedure.php
  • 21. 21/43 Historique et objectifs  Deux séries de tests en 2013 et 2015 ✔ Prendre en compte les nouveaux réseaux sociaux ✔ Observer les évolutions éventuelles  Analyser quelles sont les métadonnées embarquées qui s'affichent sur chaque plate-forme de réseau social  Vérifier les métadonnées préservées et celles qui sont supprimées
  • 22. 22/43 Quatre tests précis  Quelles sont les métadonnées embarquées qui s'affichent dans l'interface utilisateur ?  Les informations de crédit sont-elles correctement affichées ? Vérification des "4C" : Caption, Creator, Copyright Notice, Creditline  Quelles sont les métadonnées préservées lorsque l'on récupère l'image depuis un navigateur, à l'aide d'une commande du genre Save As ?  Quelles sont les métadonnées préservées lorsque le réseau social propose un téléchargement de l'image (bouton Download) ?
  • 23. 23/43 Résultats  Ce n'est pas très brillant!  Les réseaux sociaux les plus connus altèrent les métadonnées embarquées d'une manière ou d'une autre  La situation se détériore globalement; les résultats étaient un peu meilleurs en 2013  Quelques détails...
  • 24. 24/43 Dropbox  Aucune métadonnée n'est affichée  Les métadonnées sont préservées uniquement lors d'un download, elles ne sont pas préservées avec un Save As  Dégradation: en 2013, elles étaient préservées avec un Save As
  • 25. 25/43 Facebook  Aucune métadonnée n'est affichée  Seules les métadonnées Copyright Notice et Creator de l'IPTC/IIM sont préservées avec un Save As. Toutes les autres sont supprimées.  Légère amélioration depuis 2013: toutes les métadonnées étaient alors supprimées avec un Save As
  • 26. 26/43 Facebook - une curiosité intrigante (1/2) Facebook ajoute systématiquement deux métadonnées IPTC/IIM
  • 27. 27/43 Facebook - une curiosité intrigante (2/2)  Il est extrêmement difficile de comprendre à quoi correspondent ces codes générés lors du téléchargement d'une image sur Facebook  Aucune communication de Facebook sur ce sujet et le reverse engineering a des limites  L’IPTC ignore tout de cette particularité des images ayant transité par Facebook  Grâce à ce dispositif, Facebook est peut-être capable d’effectuer un suivi élémentaire des images qui ont transité sur la plate-forme
  • 28. 28/43 Flickr  Quelques métadonnées sont affichées correctement, mais pas toutes les "4C"  Toutes les métadonnées sont préservées lors d'un download ou un Save As de l'image dans sa définition originale, mais elles sont supprimées dans les autres définitions  Dégradation Vers 2010, toutes les résolutions intermédiaires proposées par la plate-forme possédaient les métadonnées de l'image originale
  • 29. 29/43 Google Photos  Quelques métadonnées sont affichées correctement, mais pas toutes les "4C"  Les métadonnées sont préservées lors d'un download de l'image originale  Seules les métadonnées Exif sont préservées avec un Save As sur les images en résolution réduite  Dégradation En 2013, toutes les métadonnées étaient préservées avec un Save As sur les images en résolution réduite
  • 30. 30/43 Instagram  Aucune métadonnée n'est affichée  Aucune sauvegarde n'est possible  En 2013, le Save As était possible mais supprimait les métadonnées  L'un des pires réseaux sociaux au regard des métadonnées...
  • 31. 31/43 Pinterest  Aucune métadonnée n'est affichée  Les métadonnées sont préservées avec un Save As de l'image dans sa définition originale, mais pas lors d'un download  Non testé en 2013
  • 32. 32/43 Tumblr  Aucune métadonnée n'est affichée  Seules les métadonnées Exif sont préservées avec un Save As, toutes les autres sont supprimées  Dégradation En 2013, toutes les métadonnées embarquées étaient préservées avec un Save As
  • 33. 33/43 Twitter  Aucune métadonnée n'est affichée  Seules les images en résolution réduite sont disponibles avec un Save As, sans aucune métadonnées  Inchangé depuis 2013  Lanterne rouge avec Instagram
  • 34. 34/43 Il est pourtant possible de concevoir des réseaux sociaux respectueux des métadonnées embarquées L'exemple de Behance  Appartient à Adobe www.behance.net  Porte-folios d'artistes  Toutes les métadonnées 4C sont correctement affichées  Plusieurs autres métadonnées (mais pas toutes) sont également affichées  Toutes les métadonnées sont préservées lors d'un download et avec un Save As
  • 35. 35/43 Il est aussi possible de travailler avec les métadonnées embarquées sur un réseau social "médiocre" Le projet PhotosNormandie sur Flickr  Améliorer la description documentaire d'un fonds de plus de 3400 photographies historiques sur la bataille de Normandie  Actif sur la plate-forme grand public Flickr depuis janvier 2007 www.flickr.com/photos/photosnormandie/  Ouvert à tous. Une soixantaine de contributeurs (une dizaine d'intervenants participent régulièrement au projet)  Crowdsourcing (contenus générés par les utilisateurs), indexation sociale, indexation collaborative, indexation contributive, redocumentarisation, etc.
  • 36. 36/43 Origine des photos  2760 photos proviennent du site Archives Normandie 1939-1945 [n'existe plus] ✔ Service public du Conseil Régional de Basse- Normandie mis en place en 2004 ✔ Photos libres de droit issues des Archives Nationales des États-Unis et du Canada  296 photos de The Allison Collection: photos transmises par radio en 1944  322 photos proviennent de la bibliothèque de la ville de Cherbourg-Octeville  163 photos proviennent de la Médiathèque de Lisieux
  • 37. 37/43 Les légendes des photos  Les légendes des photos sont écrites selon les standards de métadonnées IPTC/IIM et XMP  Ensemble de champs textuels (Titre, Légende, Mots-clés, Copyright, etc.) stockés dans le fichier image  S'appuie sur une fonctionnalité peu connue de la plate-forme Flickr  Renseignement automatique de champs Flickr à partir des champs IPTC lors du téléchargement d'une photo
  • 39. 39/43 Photo Commentaires des utilisateurs Rédaction d'une description Photo + métadonnées IPTC Photo sur Flickr + description, mots-clés Rédaction d'une nouvelle description Photo + nouvelles métadonnées Le processus documentaire et rédactionnel
  • 40. 40/43 Avantages des métadonnées embarquées dans les photos  La description textuelle de l'image est toujours disponible avec l'image et facilement réutilisable  L'utilisateur reste libre de la technologie de base de données utilisée pour l'exploitation de son corpus d'images Comme les images, les métadonnées vous appartiennent, elles n'appartiennent pas à votre prestataire de service
  • 41. 41/43  La mise à jour d'une description est lourde. Nécessité de recharger la photo contenant la nouvelle description  Une URL Flickr pointant sur une photo ne peut être considérée comme stable; le numéro d'identification Flickr change lorsque l'on télécharge à nouveau l'image  Mais... Nous pouvons travailler avec les références (ID) des photos www.flickr.com/photos/photosnormandie/3019172081/ Numéro d'identification Ruse.... www.flickr.com/search/? w=58897785@N00&q=p012516&m=text ID PhotosNormandie ID Photo Inconvénients de la méthode (avec Flickr)
  • 42. 42/43 Bilan documentaire  Depuis fin janvier 2007, la galerie et les photos ont été vues plus de 36 millions de fois (soit plus de 7700 visites par jour)  Grande progression depuis quatre ans (4500 visites quotidiennes en 2012)  Le 6 juin 2014, près de 200 000 visites  9222 descriptions corrigées et mises à jour (certaines descriptions ont été corrigées plusieurs fois)  417 photos correspondent à des séquences filmées retrouvées (plus de 1 sur 10; il doit en exister davantage)