Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Machine Tags Flickr Peccatte

3,917 views

Published on

Séminaire Foksonomies et tagging - DICEN

Published in: Education
  • Be the first to comment

Machine Tags Flickr Peccatte

  1. 1. Dispositifs d'Information et de Communication à l'Ère Numérique (DICEN) Séminaire Folksonomies et Tagging vendredi 26 mars 2010 - CNAM-Paris Machine tags de Flickr et folksonomies organisées Patrick Peccatte www.softexperience.com blog.tuquoque.com Laboratoire d'histoire visuelle contemporaine (Lhivic) culturevisuelle.org/dejavu/
  2. 2. Sommaire  Rappels sur Flickr et les tags  Fonctions Rechercher et Explorer sur les tags  Définition des machine tags et (non)-relation avec RDF  Premiers exemples de machine tags  Fonctions Rechercher et Explorer sur les machine tags  Applications simples  Applications "plus évoluées"  API de Flickr et machine tags  Avantages et inconvénients des machine tags DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  3. 3. Présentation succincte de Flickr  Flickr est un site web de partage de photos et de vidéos  Appartient à Yahoo!  Annonce 4,4 milliards de photos (en fait probablement de l'ordre de 3 milliards)  Chaque photo peut être décrite par un titre, une description, des tags (75 maximum par photo), des commentaires, des notes associées à des zones de la photo  Organisation des photos par albums et classeurs  Groupes d'utilisateurs réunis sur des thématiques très variées DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  4. 4. Le titulaire d'un compte Flickr a la possibilité de contrôler qui peut ajouter des tags sur ses photos http://www.flickr.com/account/prefs/photoprivacy/?from=privacy DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  5. 5. Possibilité de rechercher uniquement sur les tags http://www.flickr.com/search/?m=tags DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  6. 6. Possibilité d'explorer les tags http://www.flickr.com/photos/tags/
  7. 7. Possibilité d'explorer les tags http://www.flickr.com/photos/tags/tiger/ DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  8. 8. Possibilité d'explorer les tags - clusters http://www.flickr.com/photos/tags/tiger/clusters/ Les clusters sont des regroupements automatiques des tags qui interviennent le plus souvent dans une exploration
  9. 9. Tags et machine tags  L'usage massif des tags sur Flickr est souvent reconnu comme "emblématique" des folksonomies du Web 2.0  Ces folksonomies peuvent être organisées grâce aux machine tags  Les machine tags (en français tags de programmation) sont des tags tout à fait standards : ✔ ils peuvent être écrits à la main ou à l'aide de l'API de Flickr ✔ seule différence par rapport aux tags habituels : ils suivent une syntaxe particulière DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  10. 10. Machine tags Un machine tag est un triple tag, c'est-à-dire un tag de la forme : namespace:predicate=value où : ✔ namespace est un espace de nom quelconque (grosso modo, un sujet ou une classe) ✔ predicate est un prédicat (ou champ, ou propriété) qui appartient à la classe ou au sujet défini(e) par l'espace de nom ✔ value est une valeur ; comme pour les tags Flickr habituels, les guillemets sont requis si la valeur comporte un espace (terminologie de Flickr) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  11. 11. Un premier exemple (interfaces en anglais et en français) Note : si la photo ne comporte pas de tags standards, alors les machine tasg sont affichés comme des tags (sans Show/Hide machine tags)
  12. 12. Machine tags - autres représentations Tableau statue hauteur 9.50m statue nature bronze statue ville Paris statue localisation Place de la République statue sculpteur Léopold et Charles Morice statue sujet allégorie de la République Arbre statue hauteur = 9.50m nature = bronze ville = Paris localisation = Place de la République sculpteur = Léopold et Charles Morice sujet = allégorie de la République Les machine tags permettent de travailler avec une folksonomie organisée, d'introduire une structuration peu formelle dans une folksonomie
  13. 13. Machine tags entre folksonomy et taxonomy présentation de Flickr folksonomy taxonomy DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  14. 14. Machine tags (MT) et RDF Photo MTnamespace:MTpredicate "MTvalue" (resource) triple RDF ?? Non, mais presque...  « Machine tags associated to a photo are much like RDF triples having that photo as its subject. The main difference is that the so-called "namespace" of the machine tag is not necessarily associated to a URI prefix. So there is no guarantee that different people will not use the same prefix with different meaning. But this was already true of plain tags, and is considered as a feature rather than a problem in the land of folksonomies :) » Wiki du W3C http://www.w3.org/2008/WebVideo/Annotations/wiki/FlickrMachineTags  La flèche n'est même pas un morphisme (map) au sens de la théorie des catégories : une même flèche MTnamespace:MTpredicate peut pointer sur deux MTvalue distinctes (d'où l'expression folksonomie organisée plutôt que catégorisée  !)
  15. 15. Machine tags et RDF  NQRDF = Not Quite RDF  The Poor Man's RDF A Performance and Scalability Metric for Virtual RDF Graphs, by Michael Hausenblas, Wolfgang Slany, Danny Ayers, 2007 http://sw-app.org/pub/sfsw07-vrdfgraph.pdf
  16. 16. "RDFizers" introduire de véritables namespaces  Service pour obtenir une représentation RDF des informations sur une image Flickr Flickr photo info to RDF image description http://www.kanzaki.com/works/2005/imgdsc/flickr2rdf ✔ mais date de 2005, donc ne prend pas en compte les machines tags  Flickcurl: C library for the Flickr API, by Dave Beckett http://librdf.org/flickcurl/ Comporte un utilitaire flickrdf qui génère des triples RDFà partir d'une photo Flickr : ✔ « Machine tags when they are found are scanned for xmlns:prefix=uri and then all other machine tags with that prefix turn into triples. Several prefixes are also pre-defined by the library to automatically get turned into triples without an xmlns, such as blue:, cell:, filter: and geo:. Non-machine tags are not yet interpreted. » DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  17. 17. Exemples de machine tags The Library Of Congress / The Commons  Le projet The Commons (les Organismes publics en français) a été lancé en janvier 2008 avec la publication sur Flickr de photographies de la Library of Congress  Actuellement 34 institutions participent au projet  Objectifs : ✔ accroître l'accès aux collections détenues par des institutions du monde entier ✔ fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  18. 18. The Library Of Congress / The Commons  Machine tags utilisés par la LoC ✔ xmlns:dc=http://purl.org/dc/elements/1.1/ ✔ dc:identifier=http://hdl.loc.gov/loc.pnp/fsa.8b29516 ✔ commons:event=commonground2009  xmlns:dc : syntaxe "à la XML" (cependant, xmlns n'est pas standardisé en machine tags) -> l'espace de nom dc est bien le Dublin Core, mais le souci de rigueur ne va pas jusqu'à définir le préfixe commons ...  dc:identifier : la Library of Congress maintient le lien entre les images stockées sur Flickr et son catalogue en ligne (Prints and Photographs Online Catalog)  commons:event : l'image a été choisie en 2009 pour un événement global Common Ground regroupant plusieurs institutions -> sélection d'images par le public et projections sur les bâtiments des institutions DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  19. 19. dc:identifier= http://hdl.loc.gov/loc.pnp/fsa.8b29516 Identifiant persistant résolu par Handle System en : http://lcweb2.loc.gov/cgi-bin/query/h?pp/PPALL:@field(NUMBER+@band(fsa+8b29516))
  20. 20. Utilisation  Les machine tags xmlns:dc et dc:identifier sont aussi utilisés par quelques institutions du projet The Commons : ✔ Powerhouse Museum Collection ✔ New York Public Library ✔ Boston Public Library (très partiellement)  Ainsi que par d'autres institutions qui ne font pas partie de The Commons (MIT OpenCourseWare, etc.) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  21. 21. Recherche sur les machine tags
  22. 22. Explore avec un joker sur predicate et value http://www.flickr.com/photos/tags/dc:*=* DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  23. 23. Explore avec un joker sur namespace http://www.flickr.com/photos/tags/*:user= DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  24. 24. Explore sur un namespace + predicate + value http://www.flickr.com/photos/tags/photo:process=daguerreotype
  25. 25. Explore avec un joker sur namespace et value http://www.flickr.com/photos/tags/*:*=losangeles suppression des espaces DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  26. 26. Applications simples  "Simple" : machine tags = identifiant unique (id) ou saisie manuelle des informations  Montre la variété de l'utilisation des machine tags  Nécessité de groupes ou associations qui développent un vocabulaire spécifique à leurs besoins DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  27. 27. Upcoming est un calendrier d'événements et un réseau social. Appartient à Yahoo! http://www.flickr.com/photos/tags/upcoming:*=* (+373 000 photos) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  28. 28. Upcoming Chaque événement est identifié par un numéro, ce qui permet d'effectuer des Credit : Patrick H~ on Flickr, licence Creative Commons recherches précises sur les photos de cet événement
  29. 29. Last.fm est une webradio et un site internet proposant un système de collection de statistiques et de recommandation de musique http://www.flickr.com/photos/tags/lastfm:*=* (+1457000 photos) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  30. 30. Last.fm Identification des événements similaire à celui de Upcoming : autre namespace et même predicate Credit : Christoph! on Flickr, licence Creative Commons DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  31. 31. Rotocasted groupe d'amateurs de jouets http://rotocasted.com/ http://www.flickr.com/photos/tags/roto:*=* (+2400 photos) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  32. 32. Roto Credit : blakewest on Flickr, licence Creative Commons DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  33. 33. Autres applications simples  Utata - collectif de photographes et d'écrivains qui partagent un même intérêt artistique. Groupe Flickr : plus de 18000 membres et 300000 photos. http://www.flickr.com/photos/tags/utata:*=  Typedia – encyclopédie de dessins de caractères http://www.flickr.com/photos/tags/type:*=  Citizen Weather Observer Program (CWOP) Station Metadata Group vise à constituer une base de photos sur les stations météorologiques du réseau CWOP http://www.flickr.com/photos/tags/wx:*=  Burning Man - « rencontre artistique et bariolée qui se tient chaque année dans le désert du Nevada » (Wikipedia) http://www.flickr.com/photos/tags/burningman:*=  Dopplr - « service gratuit de réseau social, lancé en 2001, qui permet aux utilisateurs de calcu- ler l'empreinte carbone que leurs voyages ont produit » (Wikipedia) http://www.flickr.com/photos/tags/dopplr:*=  Foursquare - outil de réseau social, de jeu et de microblogging qui permet à l’utilisateur d'indi- quer où il se trouve et de rencontrer ses contacts http://www.flickr.com/photos/tags/foursquare:*=  Open Plaques – plaques bleues commémoratives d'événements ou de personnalités (en Grande-Bretagne) http://www.flickr.com/photos/tags/openplaques:*=  Lego – photos de constructions en Lego http://www.flickr.com/photos/tags/lego:*=
  34. 34. Applications "plus évoluées"  Utilisation d'automatismes ou de l'API Flickr  Utilisation de Flickr en relation avec une autre application DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  35. 35. Taxonomie des plantes et animaux http://www.flickr.com/photos/tags/taxonomy:*=* (+78000 photos) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  36. 36. Taxonomy Credit : OliBac on Flickr, licence Creative Commons
  37. 37. Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/
  38. 38. Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/ DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  39. 39. Astrometry est un groupe Flickr créé en 2007. Un programme automatique scrute le groupe et identifie les photos astronomiques d'après les positions des étoiles et planètes environnantes sur les clichés http://www.flickr.com/photos/tags/astrometrydotnet:*=* (+7800 photos) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  40. 40. Credit : jimkster on Flickr, licence Creative Commons Machine tags Compte-rendu générés par le robot du robot Astrometry.net Astrometry.net
  41. 41. Le projet AccessCeramics  accessCeramics est une collection de photos de céramiques contemporaines conçue pour être utilisée par des artistes, des enseignants, des chercheurs et le grand public  Le projet utilise les possibilités de Flickr et des réseaux sociaux tout en proposant également une interface web personnalisée DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  42. 42. Le projet AccessCeramics  Les initiateurs du projet souhaitaient initialement utiliser Flickr comme un silo unique regroupant images et métadonnées accédées par une interface web utilisant l'API de Flickr  Mais les possibilités de Flickr sont apparues insuffisantes, en ce qui concerne la sécurisation des machine tags et l'impossibilité d'effectuer des recherches avec troncatures DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  43. 43. Le projet AccessCeramics  Images sur Flickr  Métadonnées saisies par l'artiste stockées dans une base de données MySQL  Machine tags générées ensuite par un 'super-utilisateur' accessCeramics sur Flickr
  44. 44. Le projet AccessCeramics  Les métadonnées utilisées sont un mélange de : ✔ Dublin Core ✔ VRA Core (un standard développé par la Visual Resource Association)  Choix effectué pour simplifier le processus d'indexation des images  La plupart des valeurs de champs proviennent du Getty Art and Architecture Thesaurus DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  45. 45. accessCeramics sur Flickr http://www.flickr.com/photos/tags/accessceramics:*=* (+1300 photos) (+3000 photos dans la base) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  46. 46. AccessCeramics – saisie des métadonnées sur l'application MySQL
  47. 47. Sur accessCeramics.org (base MySQL) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  48. 48. Sur le groupe Flickr accessCeramics Credit : accessCeramics guest on Flickr licence Creative Commons
  49. 49. Autres applications "plus évoluées"  Fotopedia encyclopédie de photos en ligne mixant des contenus de Flickr, de Wikipedia et des utilisateurs. http://www.flickr.com/photos/tags/fotonauts:*=  WildlifeNearYou – site pour partager la passion de la vie sauvage http://www.flickr.com/photos/tags/wlny:*=*  Open Library – couvertures de livres (très peu développé...) http://www.flickr.com/photos/tags/openlibrary:*=  OpenStreetMap - projet pour créer des cartes libres du monde sous licence CC-BY- SA, en utilisant le système GPS ou d'autres données libres http://www.flickr.com/photos/tags/osm:*= DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  50. 50. API Flickr  Pour exécuter une action à l'aide de l'API Flickr, vous devez sélectionner une convention d'appel, envoyer une requête à son point terminal en spécifiant une méthode et des arguments, puis vous recevez une réponse formatée  Format d'envoi : REST, XML-RPC, SOAP  Format de retour : REST, XML-RPC, SOAP, JSON  L'API Flickr dispose de 166 méthodes ...  ... dont 5 pour travailler avec les machine tags DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  51. 51. API Flickr  flickr.machinetags.getNamespaces Return a list of unique namespaces, optionally limited by a given predicate, in alphabetical order  flickr.machinetags.getPairs Return a list of unique namespace and predicate pairs, optionally limited by predicate or namespace, in alphabetical order  flickr.machinetags.getPredicates Return a list of unique predicates, optionally limited by a given namespace  flickr.machinetags.getValues Return a list of unique values for a namespace and predicate  flickr.machinetags.getRecentValues Fetch recently used (or created) machine tags values Ces API sont mises en œuvre par exemple avec la fonction Explore en utilisant des jokers * sur les machine tags (voir ci-dessus) DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  52. 52. API Flickr – Exemple http://www.flickr.com/services/api/explore/?method=flickr.machinetags.getPredicates <rsp stat="ok"> <predicates namespace="statue" page="1" total="6" perpage="500" pages="1"> <predicate usage="1" namespaces="1">hauteur</predicate> <predicate usage="2" namespaces="1">localisation</predicate> <predicate usage="1" namespaces="1">nature</predicate> <predicate usage="2" namespaces="1">sculpteur</predicate> <predicate usage="3" namespaces="1">sujet</predicate> <predicate usage="1" namespaces="1">ville</predicate> </predicates> </rsp>
  53. 53. Une application : Flickr machine tag browser de Paul Mison http://husk.org/code/machine-tag-browser.html Navigation dans les machine tags selon les trois niveaux namespace, predicate, value
  54. 54. Avantages et inconvénients des machine tags  Lors du chargement d'une photo comprenant un mot-clé IPTC (ou XMP) observant la syntaxe d'un machine tag, celui-ci est effectivement reconnu comme un machine tag  La création des machine tags est libre et non contrôlée : ✔ avantage : souple et facile ✔ mais aussi inconvénient : c'est un capharnaüm  API : pas de possibilité de troncatures  Problèmes de langue  Accents et espaces  Problème des machine tags qui demeurent dans l'index après suppression des photos DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
  55. 55. Merci pour votre attention DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

×