1. Folksonomie
23/03/2006
Cos’è una folksonomia
• Etimologia: “Folk” + “Taxonomy”
– Folk = gente
– Tassonomia/classificazione = organizzazione di
elementi in gruppi in base a un criterio stabilito
• Sistema di categorizzazione sociale bottom-up
• Forma di condivisione e organizzazione di
contenuti
– Associazione di tag (etichette di categorie) a
elementi (es. risorse web)
2. Caratteristiche
• Creata dagli utenti del sistema (bottom-up)
• Non esiste un vocabolario prefissato di tag
• Nessuna struttura
• Nessuna relazione tra i diversi tag
• Nessuna autorità
• Distribuzione
• Collaborazione
The old way creates a tree
The new rakes leaves together
3. Tipologie
• Broad folksonomy
– etnoclassificazione ampia
– molte persone etichettano le stesse risorse
• Narrow folksonomy
– etnoclassificazione stretta
– utile in caso di risorse difficilmente indicizzabili
Novità: aspetti collaborativi
• Possibilità di associare tag ai contenuti di altri utenti
• Immediatezza del feedback
– Possibilità di vedere tutti i contenuti con uno stesso tag
– Possibilità di vedere tutti i tag associati allo stesso contenuto
• Comunicazione tra utenti mediata dai tag
– Ciclo continuo di feedback
– Negoziazione del significato dei tag
• Possibilità di cambiare o aggiungere un nuovo tag
• Non si è mai forzati nelle decisioni
4. Come si stanno diffondendo?
• Blog
– evoluzione delle categorie
• Motori di ricerca specializzati
– parole chiave di “seconda generazione”
• Social software
– indice analitico della condivisione
Cosa si può fare oggi con i tag?
• La mappa dei tag di un singolo utente
• La condivisione dello stesso tag tra più utenti
• La relazione tra diversi tag
• La mappa di tutti i tag contenuti nel sistema
• L’emergenza di determinati tag in un tempo X
5. Alcune applicazioni
• Del.icio.us – http://del.icio.us/
• Flickr – http://www.flickr.com/
• CiteULike - http://www.citeulike.org/
• Bibsonomy - http://www.bibsonomy.org/
• Technorati - http://www.technorati.com/tag/
• 43 Things - http://www.43things.com/
del.icio.us: pagina principale
11. Organizzazione delle informazioni
• Folksonomia
• Tassonomia
• Ontologia
Tassonomia
• Gerarchica
– Relazioni padre/figlio
• Esclusiva
– Un oggetto non può appartenere a due categorie
che non fanno parte dello stesso percorso
gerarchico
• Top-down
– Decisa da qualche “autorità”
12. Tassonomia
• Ogni oggetto può
appartenere ad una sola
categoria che a sua volta
può essere contenuta in
altre categorie
• Esempi:
– Linnean System
– Dewey Decimal
System
– Computer File
Systems
Tassonomia vs Folksonomia
• Hierarchical • Flat
– Parent/child & sibling – No levels, order, explicit
relationship relationship
• Exclusive • Not Exclusive
– The same item can not be – An item can be associated
in two distinct categories to many tags
• Top-down • Bottom-up
– Established by an – Created by users
authority
13. Ontologia
• È differente da una tassonomia
– Non è semplicemente una suddivisione in categorie
dei concetti
– Relazioni più complesse di padre/figlio
– Un concetto può ereditare il significato da più di un
genitore
– Si possono fare inferenze
– È in grado di mappare diverse tassonomie tra di loro
Ontologia
• An enabling technology for information sharing
and manipulation
– XML allows users to add arbitrary structure to their
documents but says nothing about what the
structures mean.
– RDF enables expression of meaning (sets of triples,
each triple being rather like the subject, verb and
object)
– Ontologies (OWL) “will enable machines to
comprehend semantic documents and dataquot;
14. Folsonomia vs Ontologia
• Domain • Domain
– Large corpus – Small corpus
– Informal categories – Formal categories
– Unstable entities – Stable entities
– Unestricted entities – Restricted entities
– Unclear edges – Clear edges
• Partecipants • Partecipants
– Naive catalogers – Expert catalogers
– No Authority – Authoritative source of judgment
– Uncoordinated users – Coordinated users
– Amateur users – Expert users
– critical mass needed – Not too many (in the
development process)
Difetti
• Ambiguità
– Stesso tag utilizzato in modi diversi (Polisemia)
– Tag differenti per lo stesso concetto (Sinonimi)
– Plurale/singolare
– Acronimi
• Formattazione delle parole
– Spazi, parole composte
• Linguaggio
– Lingue differenti per i tag
15. Obiezioni
• shortsighted
– fail to capture the quot;big picture”
• now-oriented
– Not optimally to organize resources for the long-term
• too little formal structure
– easily result in quot;metadata soup”
Pregi
• Semplicità
• Costi limitati
• Capacità di adattamento
– ai cambiamenti
– alle necessità degli utenti
– Approccio scalabile
• Riflette il vocabolario degli utenti
• Agevola la serendipity
– browsing vs finding
• Favorisce la creazione di comunità virtuali
– Comunicazione attraverso i metadati
16. Tagging is good for
• Personal Recall
– re-finding something that was tagged
• Supporting Social Effects
– emergence of flickr group tagged
• Serendipity
– discovering a good thesis book in the library that catches your
eye while looking for another
• Novelty
– spikes in popularity of tags such as AJAX in del.icio.us
Tagging is not good for
• Precision and recall regarding information
retrieval
– can return queries that will be noisy (low in
precision) or incomplete (low in recall)
• Ontologies in the sense of rigid hierarchical
system for classification
– No formal system for creating a controlled
vocabulary
17. What is the best choice?
• Folksonomies are useful when all that is
needed is the ability to link items to topics
• Ontologies are useful when what is needed is
to rigorously define or understand what is
meant, or not meant, by particular classes,
fields and relationships
Research Directions
• Combination of two distinct approaches
– Hybrid System
• Quantitative tag analysis & qualitative user
analysis in current social software
• Applicability to new domains
18. Folktology: Folk Ontology
• A folksonomy combined with an ontology
– users could propose or modify ontological classes
and properties
– the most popular ontological constructs would quot;rise
to the topquot; and self-amplify, while the less-
instantiated ones would quot;fall to the bottom“
• Ease and adaptability of a folksonomy plus
semantic richness and formal structure of an
ontology
Tags analysis
• Analyzing tags distribution
– To understand if it converges or it does not
• Analyzing people motivations when tagging
– To understand how a folksonomy is formed
• Others kind of analysis?
19. Domains tagging might be good for
• People
– (social relationships)
• Products
– (e-commerce)
• Places
– (geographic location)
• Music
– (iTunes shared libraries)
• Filesystems
– (apple spotlight model if shared)
• Tasks
– (organisational intranet)
Some hypothetical domains
• Tagging of Web Services
• Tagging of process tasks
• Tagging in Source Code Management Systems
(when you commit)
• Tagging of messages in mailing lists
• Tagging in file sharing applications
20. References
• Mathes, A., Folksonomies - Cooperative Classification and
Communication Through Shared Metadata. Computer Mediated
Communication LIS590CMC, December 2004.
• Sturtz, D. N., Communal Categorization: the Folksonomy.
INFO622: Content Representation, December 2004.
• Shirky, C. Ontology is Overrated: Categories, Links and Tags.
2005.
• Golder, S. A., Huberman, B. A., The Structure of Collaborative
Tagging Systems. 2005.
• Quintarelli, E., Folksonomies: power to the people. Presented at
the ISKO Italy-UniMIB meeting, Milan, June 24 2005.