SlideShare a Scribd company logo
1 of 40
Στέλιος Καραμπασάκης  •  Δημήτρης Κωτσάκος Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Integrating Folksonomies with the Semantic Web
Περιεχόμενα ,[object Object],[object Object],[object Object]
Tagging  σε  παραδοσιακά συστήματα ψηφιακές βιβλιοθήκες <html>   <head>   <meta name=&quot; keywords &quot; content=“ education ,  university,   postgraduate, computer science, informatics, telecommunication &quot;/>   </head> </html> παγκόσμιος ιστός διαχείριση αρχείων
Tagging  στο  Web 2.0 εικόνες blog posts βίντεο ιστοσελίδες επιστημονικά άρθρα
Folksonomies Folksonomy   =  Folk  +  Taxonomy ,[object Object],[object Object],[object Object],χρήστες tags πόροι
Taxonomy vs. Folksonomy ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Ιεραρχία στα  folksonomies ,[object Object],[object Object],tag bundles  στο  del.icio.us relations  στο  Bibsonomy
Ένα τυπικό μοντέλο ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
URL Scheme semantics ,[object Object],[object Object],http://bibsonomy.org/user/ u http://del.icio.us/ u http://bibsonomy.org/tag/ t 1 +…+t n http://del.icio.us/tag/ t 1 +…+t n Επιστρέφονται οι καταχωρήσεις που διαθέτουν όλα τα  tags  t 1   , … , t n C t1, … ,tn   :=  {   (u,  Τ ur  , r)    P   |  {  t 1   , … , t n  }     Τ ur   } http://bibsonomy.org/user/ u / t 1 +…+t n http://del.icio.us/ u / t 1 +…+t n Επιστρέφονται οι καταχωρήσεις του χρήστη  u που διαθέτουν όλα τα  tags  t 1   , … , t n C u,t1, … ,tn  :=  C u      C t1, … ,tn
Τι προσπαθούμε να πετύχουμε; ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Τα εμπόδια ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Narrow vs. Broad Folksonomies ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Δυνατές προσεγγίσεις 1/2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],linux    ubuntu
Δυνατές προσεγγίσεις 2 /2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Η προσέγγιση των  Specia &   Motta ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Περίγραμμα της μεθόδου ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Βήμα 1:  Preprocessing Απαλοιφή των  tags  που εμφανίζονται λιγότερες από 10 φορές Φιλτράρισμα μη συχνών  tags {  cat  cats } { tipography typograph  typography  } {  web-based  web_based webbased } Levenshtein similarity  (83%) ________________________________________________________________ Κριτήριο επιλογής εκπροσώπου της ομάδας: αναφορά στο  WordNet Ομαδοποίηση παρόμοιων μορφολογικά  tags 1984  _private  /etc 3d  802.11n Απαλοιφή των  tags  των οποίων ο πρώτος χαρακτήρας είναι αριθμός ή σημείο στίξης Απαλοιφή των  tags  με ασυνήθιστη μορφή ,  που είναι απίθανο να εμφανίζονται μέσα σε οντολογίες Παραδείγματα Μέθοδος Στόχος
Preprocessing  στην πράξη συμμετέχουν στο  clustering 2.696 17.956 διακριτά  tags 127.098 167.130 tags 44.032 49.087 πόροι 44.032 49.087 καταχωρήσεις 1.265 11.960 διακριτά  tags 70.194 89.978 tags 13.579 14.211 πόροι 18.882 19.605 καταχωρήσεις μετά πριν
Βήμα 2:  Clustering ,[object Object],[object Object],[object Object],[object Object],[object Object]
Pre-Clustering  1/6 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],audio mp3 playlist music audio 7 5 3 6 mp3 5 9 7 2 playlist 3 7 8 3 music 6 2 3 6
Pre-Clustering  2/6 ,[object Object],[object Object],[object Object],[object Object],[object Object]
Pre-Clustering  3/6 ,[object Object],[object Object],audio mp3 playlist music 1 0.97 mp3 0.99 playlist 0.99 mp3 0.95 audio 2 0.95 music 0.97 audio 0.90 music 0.90 playlist 3 0.82 playlist 0.60 music 0.82 audio 0.60 mp3 4 0.75 radio 0.72 streaming 0.40 files 0.50 rock
Pre-Clustering  4/ 6 ,[object Object],[object Object],[object Object],[object Object],apple,  η εταιρία υπολογιστών apple,  το φρούτο apple,  η… μάρκα εσωρούχων! apple 0.90 mac 0.87 ipod 0.75 fruit 0.69 osx 0.54 pie 0.01 boxer
Pre-Clustering  5/ 6 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],apple 0.90 mac 0.87 ipod 0.75 fruit 0.69 osx 0.54 pie 0.01 boxer
Pre-Clustering  6/6 ,[object Object],[object Object],Μόνο τα ζεύγη των  tags  που απομένουν  συμμετέχουν στο  clustering audio mp3 playlist music 1 0.97 mp3 0.99 playlist 0.99 mp3 0.95 audio 2 0.95 music 0.97 audio 0.90 music 0.90 playlist 3 0.82 playlist 0.60 music 0.82 audio 0.60 mp3 4 0.75 radio 0.72 streaming 0.40 files 0.50 rock audio mp3 playlist music 1 0.97 mp3 0.99 playlist 0.99 mp3 0.95 audio 2 0.95 music 0.97 audio 0.90 music 0.90 playlist 3 0.82 playlist 0.60 music 0.82 audio 0.60 mp3 4 0.75 radio 0.72 streaming 0.40 files 0.50 rock
Clustering 1/ 3 ,[object Object],[object Object],audio mp3 audio music audio playlist mp3 playlist mp3 audio playlist mp3 playlist music playlist audio music audio music playlist 4 audio 0.82 playlist 0.82 3 playlist 0.90 music 0.90 audio 0.97 music 0.95 2 audio 0.95 mp3 0.99 playlist 0.99 mp3 0.97 1 music playlist mp3 audio
Clustering 2/ 3 ,[object Object],[object Object],[object Object],[object Object],audio mp3 playlist ? audio mp3 playlist music ? 4 audio 0.82 playlist 0.82 3 playlist 0.90 music 0.90 audio 0.97 music 0.95 2 audio 0.95 mp3 0.99 playlist 0.99 mp3 0.97 1 music playlist mp3 audio
Clustering 3/3 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T dif  T dif
Ανακεφαλαίωση  Clustering ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Clustering  στην πράξη 1/2 ,[object Object],[object Object],[object Object],2140 847 διακριτά  tags  σε ζεύγη  T sim  >  0.8 3.632.860 799.480 δυνατά  ζεύγη 4,983 2.298 ζεύγη με T sim  >  0.8 2.696 Flickr 1.265 del.icio.us διακριτά  tags dataset 882 410 clusters 206 Flickr 47 del.icio.us clusters  με   πάνω από 2  tags dataset
Clustering  στην πράξη 2/2 ,[object Object]
Βήμα 3:  Concept and Relation  Identification 1/5 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Concept and  Relation Identification 2 /5 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Concept and  Relation Identification 3 /5 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Concept and  Relation Identification 4 /5 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Concept and  Relation Identification 5 /5 ,[object Object],[object Object],[object Object]
Concept and Relation Identification  στην πράξη 1/2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],309 569 ζεύγη σε οντολογίες 67 126 ζεύγη σε οντολογίες  εκτός  WordNet 5031 3152 δυνατά ζεύγη 94 97 διακριτά  tags σε ζεύγη  εκτός  WordNet 882 410 clusters Flickr del.icio.us dataset
Concept and Relation Identification  στην πράξη 2/2 ,[object Object],[object Object]
Γενική επισκόπηση
Αναφορές ,[object Object],[object Object],[object Object],[object Object],[object Object]

More Related Content

Similar to Integrating Folksonomies with the Semantic Web

Παρουσίαση-εργασίας-useraRating
Παρουσίαση-εργασίας-useraRatingΠαρουσίαση-εργασίας-useraRating
Παρουσίαση-εργασίας-useraRatingAikaterini Daoultzoglou
 
Nikolaos Oikonomou
Nikolaos OikonomouNikolaos Oikonomou
Nikolaos OikonomouISSEL
 
Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...Manos Tsardoulias
 
Γκιλίρης Ιωάννης 7419
Γκιλίρης Ιωάννης 7419Γκιλίρης Ιωάννης 7419
Γκιλίρης Ιωάννης 7419ISSEL
 
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked Data
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked DataΔεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked Data
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked DataGiannis Tsakonas
 
Σωτήρης Μπέης
Σωτήρης ΜπέηςΣωτήρης Μπέης
Σωτήρης ΜπέηςISSEL
 
Ioannis Loias
Ioannis LoiasIoannis Loias
Ioannis LoiasISSEL
 
Social Bookmarking Gaitanou
Social Bookmarking GaitanouSocial Bookmarking Gaitanou
Social Bookmarking Gaitanougreeklis
 
Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992ISSEL
 
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο Ιστό
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο ΙστόΑρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο Ιστό
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο ΙστόGiannis Tsakonas
 
Μαρίνα Γέραλη
Μαρίνα Γέραλη Μαρίνα Γέραλη
Μαρίνα Γέραλη ISSEL
 
Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185ISSEL
 
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...ISSEL
 
Keyword-based software library recommendation in order to bootstrap software ...
Keyword-based software library recommendation in order to bootstrap software ...Keyword-based software library recommendation in order to bootstrap software ...
Keyword-based software library recommendation in order to bootstrap software ...ISSEL
 
Stelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentationStelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentationISSEL
 
Βάσεις δεδομένων Κεφ.1
Βάσεις δεδομένων Κεφ.1Βάσεις δεδομένων Κεφ.1
Βάσεις δεδομένων Κεφ.1marygeorg
 

Similar to Integrating Folksonomies with the Semantic Web (19)

Παρουσίαση-εργασίας-useraRating
Παρουσίαση-εργασίας-useraRatingΠαρουσίαση-εργασίας-useraRating
Παρουσίαση-εργασίας-useraRating
 
Nikolaos Oikonomou
Nikolaos OikonomouNikolaos Oikonomou
Nikolaos Oikonomou
 
Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...
 
Γκιλίρης Ιωάννης 7419
Γκιλίρης Ιωάννης 7419Γκιλίρης Ιωάννης 7419
Γκιλίρης Ιωάννης 7419
 
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked Data
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked DataΔεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked Data
Δεδομένα Βιβλιοθηκών στο μελλοντικό ψηφιακό περιβάλλον - FRBR και Linked Data
 
ThesisPresentation
ThesisPresentationThesisPresentation
ThesisPresentation
 
Σωτήρης Μπέης
Σωτήρης ΜπέηςΣωτήρης Μπέης
Σωτήρης Μπέης
 
Ioannis Loias
Ioannis LoiasIoannis Loias
Ioannis Loias
 
Social Bookmarking Gaitanou
Social Bookmarking GaitanouSocial Bookmarking Gaitanou
Social Bookmarking Gaitanou
 
L-systems
L-systemsL-systems
L-systems
 
Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992
 
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο Ιστό
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο ΙστόΑρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο Ιστό
Αρχειακά Μεταδεδομένα: Πρότυπα και Διαχείριση στον Παγκόσμιο Ιστό
 
Μαρίνα Γέραλη
Μαρίνα Γέραλη Μαρίνα Γέραλη
Μαρίνα Γέραλη
 
Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185
 
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...
Πρόταση Βιβλιοθηκών Σχετικών με Λέξεις-Κλειδιά για Εκκίνηση της Διαδικασίας Α...
 
Keyword-based software library recommendation in order to bootstrap software ...
Keyword-based software library recommendation in order to bootstrap software ...Keyword-based software library recommendation in order to bootstrap software ...
Keyword-based software library recommendation in order to bootstrap software ...
 
Stelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentationStelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentation
 
Βάσεις δεδομένων Κεφ.1
Βάσεις δεδομένων Κεφ.1Βάσεις δεδομένων Κεφ.1
Βάσεις δεδομένων Κεφ.1
 
Exercise3
Exercise3Exercise3
Exercise3
 

Integrating Folksonomies with the Semantic Web

  • 1. Στέλιος Καραμπασάκης • Δημήτρης Κωτσάκος Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Integrating Folksonomies with the Semantic Web
  • 2.
  • 3. Tagging σε παραδοσιακά συστήματα ψηφιακές βιβλιοθήκες <html> <head> <meta name=&quot; keywords &quot; content=“ education , university, postgraduate, computer science, informatics, telecommunication &quot;/> </head> </html> παγκόσμιος ιστός διαχείριση αρχείων
  • 4. Tagging στο Web 2.0 εικόνες blog posts βίντεο ιστοσελίδες επιστημονικά άρθρα
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. Βήμα 1: Preprocessing Απαλοιφή των tags που εμφανίζονται λιγότερες από 10 φορές Φιλτράρισμα μη συχνών tags { cat cats } { tipography typograph typography } { web-based web_based webbased } Levenshtein similarity (83%) ________________________________________________________________ Κριτήριο επιλογής εκπροσώπου της ομάδας: αναφορά στο WordNet Ομαδοποίηση παρόμοιων μορφολογικά tags 1984 _private /etc 3d 802.11n Απαλοιφή των tags των οποίων ο πρώτος χαρακτήρας είναι αριθμός ή σημείο στίξης Απαλοιφή των tags με ασυνήθιστη μορφή , που είναι απίθανο να εμφανίζονται μέσα σε οντολογίες Παραδείγματα Μέθοδος Στόχος
  • 18. Preprocessing στην πράξη συμμετέχουν στο clustering 2.696 17.956 διακριτά tags 127.098 167.130 tags 44.032 49.087 πόροι 44.032 49.087 καταχωρήσεις 1.265 11.960 διακριτά tags 70.194 89.978 tags 13.579 14.211 πόροι 18.882 19.605 καταχωρήσεις μετά πριν
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 40.