Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ΠΑΡΟΤ΢ΙΑ΢Θ ΔΙΔΑΚΣΟΡΙΚΘ΢ ΔΙΑΣΡΙΒΘ΢Μζκοδοι Εξόρυξθσ Γνϊςθσ ςε Συλλογζσ ΠεριεχομζνουΜεγάλθσ Κλίμακασ από Κοινωνικά ΔίκτυαΣυμε...
΢φνοψθ Παρουςίαςθσ• Αντικείμενο & Συμβολζσ τθσ Διατριβισ• Στατιςτικζσ Ιδιότθτεσ Κοινωνικϊν Εφαρμογϊν• Ανίχνευςθ Κοινοτιτων...
1Αντικείμενο & Συμβολζσ τθσ Διατριβισ                           #3
Ευκαιρίεσ & ΠροκλιςεισΟ Παγκόςμιοσ Ιςτόσ (ΠΙ) αλλάηει: Web  Social WebΕυκαιρίεσ• Αντανάκλαςθ πραγματικότθτασ: Γεγονότα κα...
Εποπτικι Παρουςίαςθ Δεδομζνα -    Ιδιότθτεσ -     Δομι      ΟμαδοποίθςθΠεριεχόμενο   ΢υμπεριφορά    οργάνωςθσ             ...
΢υμβολζσ τθσ Διατριβισ• Κατανόθςθ ςυμπεριφοράσ/ιδιοτιτων κοινωνικϊν  εφαρμογϊν• Ανίχνευςθ κοινοτιτων ςε κοινωνικό περιεχόμ...
2Στατιςτικζσ Ιδιότθτεσ Κοινωνικϊν Εφαρμογϊν                          #7
Κοινωνικζσ Εφαρμογζσ                                            folksonomy - diggsonomyΒαςικζσ Λειτουργίεσ• Επιςιμανςθ (bo...
Άξονεσ Ανάλυςθσ Δθμοτικότθτασ• Κατανομζσ Μεγεκϊν:   – Power law, λογαρικμικι κατανομι   – Μθχανιςμόσ προνομιακισ προςάρτθς...
Πειραματικι Ανάλυςθ• Συλλογι δεδομζνων από Digg         ζντονο ενδιαφζρον• Στατιςτικά ςυλλογισ Β0                     μεγά...
Κατανομζσ Μεγεκϊν  99% ιςτοριϊν < 100 ψιφουσ                                    απόκλιςθ από power law90% περιςταςιακϊνχρθ...
Χρονικι Εξζλιξθ    Μοντζλο κυλιόμενθσ                                  Πειραματικι μζτρθςθ   ςελιδοποιθμζνθσ λίςτασ       ...
Χαρακτθριςτικά Κειμζνου                   #13
Κοινωνικι Επιδεκτικότθτα vs. ΢υςχζτιςθ                     διαμορφωτζσ γνϊμθσ    επθρεάηονται από το δίκτυό τουσδεν επθρεά...
Κζρδοσ Κοινωνικισ Επιρροισ              μθχανιςμόσ επιλογισ                       #15
Εφαρμογζσ            #16
΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ  S. Papadopoulos, A. Vakali, Y. Kompatsiaris. “The Dynamics of Content  Popularity in Socia...
3Ανίχνευςθ Κοινοτιτων ςε Γράφουσ                         #18
Ανίχνευςθ Κοινοτιτων ςε ΚοινωνικόΠεριεχόμενο• Περιεχόμενο από Κοινωνικά Δίκτυα: Ποικιλία ςχζςεων (explicit) και  ςυςχετίςε...
Κατθγορίεσ ΜεκόδωνΒΑ΢ΙΚΕ΢ ΚΑΣΘΓΟΡΙΕ΢:• Ανίχνευςθ ςυνεκτικϊνυπογράφων• Ομαδοποίθςθ κόμβων• Βελτιςτοποίθςθ μζτρουποιότθτασ• ...
Αξιολόγθςθ Μεκόδων - ΑκρίβειαΑκρίβεια: ικανότθτα μεκόδων να ανακαλφπτουν τισ  «ςωςτζσ» κοινότθτεσΜζκοδοι αξιολόγθςθσ ακρίβ...
Τπολογιςτικι Πολυπλοκότθτα                  #22
Απαιτιςεισ ςε Μνιμθ• Αποκικευςθ γράφου (το ίδιο για όλεσ τισ κακολικζσ  μεκόδουσ εκτόσ από τοπικζσ μεκόδουσ και μεκόδουσ  ...
Πειραματικι Αξιολόγθςθ                                                 ΢υνκετικά ΔεδομζναΕπιλεγμζνεσ μζκοδοι              ...
΢υνκετικοί Γράφοι• Girvan-Newman• Lancichinetti-Fortunato-Radicchi Αρικμόσ κόμβων Μζςοσ βακμόσ Παράμετροσ πρόςμιξθσ       ...
Πειραματικι Αξιολόγθςθ - Ακρίβεια•   Μζγεκοσ γράφου: ςχετικά μικρι επιρροι•   Μζςοσ βακμόσ: ςθμαντικι επιρροι•   Παράμετρο...
Πειραματικι Αξιολόγθςθ - Χρόνοσ Εκτζλεςθσ•   Μζγεκοσ γράφου: ςχεδόν γραμμικι ςχζςθ (πλθν WALKTRAP, LPROP)•   Μζςοσ βακμόσ:...
Πειραματικι Αξιολόγθςθ – Απαιτιςεισ Μνιμθσ•   WALKTRAP: χειρότερθ επίδοςθ (8GB για γράφο 50Κ κόμβων)•   MCL: δεφτεροσ χειρ...
΢φνοψθ Αποτελεςμάτων• Πειραματικά αποτελζςματα:• Παρατθριςεισ:  – Μεγάλοσ αρικμόσ μεκόδων, πλοφςιο υπόβακρο αλλά λίγεσ    ...
΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ  S. Papadopoulos, Y. Kompatsiaris, A. Vakali, P. Spyridonos. “Community  Detection in Socia...
4Ομαδοποίθςθ Κοινωνικοφ Περιεχομζνου                        #31
Ομαδοποίθςθ Κοινωνικοφ ΠεριεχομζνουΠρόβλθμα• Υψθλι πολυπλοκότθτα, δφςκολθ εφαρμογι ςε μεγάλεσ ςυλλογζσ  περιεχομζνου• Ευαι...
Προτεινόμενο Πλαίςιο                   Κεφάλαιο 3                         Κεφάλαιο 5                                      ...
Σοπικι Ανίχνευςθ Κοινοτιτων:                      Bridge Bounding• Ανίχνευςθ κοινοτιτων = διαδικαςία εξερεφνθςθσ (ΒFS) γφρ...
΢υνάρτθςθ Local Bridging                    #35
Local Bridging Δεφτερθσ Σάξθσ                   τάξθ local bridging   Πολυπλοκότθτα                                       ...
Ανίχνευςθ Κοινοτιτων με Αντοχι ςτοΘόρυβο: SCAN++• Βαςικό χαρακτθριςτικό SCAN:   – Αποφυγι ανάκεςθσ όλων των κόμβων ςε κοιν...
SCAN: Βαςικζσ Ζννοιεσ  • Δομικι ομοιότθτα:  • ε-γειτονιά:  • (μ,ε)-πυρινασ:                                   huboutlier  ...
Αναηιτθςθ Παραμζτρων (μ,ε)                    Μικροί πυρινεσ υψθλισ         Μεγάλοι πυρινεσ                    ποιότθτασ  ...
Επζκταςθ Κοινοτιτων                  #40
Παράδειγμα Εκτζλεςθσ SCAN++Εφρεςθ πυρινων για (μ1,ε1)Εφρεςθ πυρινων για (μi,εi)Επζκταςθ με μεγιςτοποίθςθ   τμθματικότθτασ ...
Αξιολόγθςθ - Ομαδοποίθςθ Ετικετϊν• Μελζτθ κεματολογίασ• Σφςταςθ ετικετϊν                        #42
Αξιολόγθςθ - Μελζτθ Θεματολογίασ              Τπολογιςτζσ                         Ιςτορία    Μουςικι      Επιςτιμθ        ...
Αξιολόγθςθ ΢θμαςιολογικισ ΢υνάφειασ• Για αξιολόγθςθ ςε μεγάλθ κλίμακα προτείνεται θ χριςθ  του Normalized Google Distance ...
΢φςταςθ Ετικετϊν• Χριςθ ιςτορικϊν δεδομζνων για αξιολόγθςθ• SCAN: υψθλότερθ ακρίβεια• SCAN++: υψθλότερθ ανάκλθςθ          ...
Αξιολόγθςθ - Ομαδοποίθςθ Εικόνων΢υλλογιΓράφοσ ομοιότθτασ• Ομοιότθτα με βάςθ τα οπτικά χαρακτθριςτικά   – SIFT  Bag-of-Wor...
Αξιολόγθςθ ομάδων εικόνων                        (1)• HYB > VIS, TAG                   Γεωγραφικι• SCAN > k-means         ...
Αξιολόγθςθ ομάδων εικόνων   (2)                  #48
΢υμπεράςματα• Προτεινόμενο πλαίςιο ομαδοποίθςθσ:   – Αντοχι ςτο κόρυβο   – Εφαρμογι ςε μεγάλθ κλίμακα   – Ταυτόχρονθ αξιοπ...
΢χετικζσ ΔθμοςιεφςεισΚΕΦΑΛΑΙΟ   S. Papadopoulos, A. Vakali, Y. Kompatsiaris. “Community Detection in Collaborative   Taggi...
5Εξαγωγι & Επιςκόπθςθ Πλθροφορίασ απόΚοινωνικό Περιεχόμενο                        #51
Εξόρυξθ Γνϊςθσ από Κοινωνικό ΠεριεχόμενοΠρόβλθμα• Εξόρυξθ & προβολι γνϊςθσ από μεγάλο όγκο κοινωνικοφ περιεχομζνουΠροτεινό...
Ανίχνευςθ ΢θμείων Ενδιαφζροντοσ &Δραςτθριοτιτων             Κεφάλαιο 4                    #53
Κατθγοριοποίθςθ Ομάδων• Οι ομάδεσ που προκφπτουν από το βιμα  ομαδοποίθςθσ εικόνων κατθγοριοποιοφνται ςε  «ςθμεία ενδιαφζρ...
Αρχι Λειτουργίασ f1, f2                      #55
Προτεινόμενα Χαρακτθριςτικά f3, f4• Τα δφο χαρακτθριςτικά του Quack (2008) οδθγοφν ςυχνά ςε ςφάλματα  λόγω ιδιαιτεροτιτων ...
Ανίχνευςθ Δραςτθριοτιτων• Δυνατότθτα για ανίχνευςθ δραςτθριοτιτων ςυγκεκριμζνου είδουσ• Εφαρμογι και ςε ςυλλογζσ με μικρό ...
Επιςκόπθςθ Πλθροφορίασ & Περιεχομζνου                               www.clusttour.gr                    #58
Επιςκόπθςθ Πόλθσ - ΢τοιχεία Διεπαφισ                   #59
Back-end εφαρμογισ                     #60
Πειραματικι Αξιολόγθςθ - Δεδομζνα• Ανίχνευςθ ςθμείων ενδιαφζροντοσ/δραςτθριοτιτων  – Συλλογι 200,000 εικόνων (Βαρκελϊνθ)• ...
Αξιολόγθςθ Προτεινόμενων Χαρακτθριςτικϊν                     #62
Αξιολόγθςθ ΢θμείων Ενδιαφζροντοσ#    ΢θμείο Ενδιαφζροντοσ   Αυτόματεσ Ετικζτεσ                        Ακρίβεια (m)1    Sag...
Αξιολόγθςθ Ανίχνευςθσ Δραςτθριοτιτων  MediaEval 2011                   #64
Επιςκόπθςθ ΢θμαντικϊν Περιοχϊν                            Sacre Coeur           Branly   Musée du Louvre                  ...
Ανεφρεςθ Μθ Προφανϊν ΢θμείων                 #66
Πολλαπλζσ Όψεισ Δθμοφιλϊν Μνθμείων                 #67
Χρονικι ΑνάλυςθΠεριοχζσ με ιδιαίτερα χρονικά χαρακτθριςτικά (π.χ. νυχτερινι ηωι)                                      #68
΢φνοψθ Αποτελεςμάτων• Εξαγωγι γνϊςθσ ςε μεγάλθ κλίμακα:  –   Σθμεία Ενδιαφζροντοσ  –   Δραςτθριότθτεσ  –   Δθμοτικότθτα Πε...
΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ  S. Papadopoulos, C. Zigkolis, Y. Kompatsiaris, A. Vakali. “Cluster-based Landmark  and Eve...
6Ανίχνευςθ Εννοιϊν με Χριςθ ΤεχνικϊνΘμι-επιβλεπόμενθσ Μάκθςθσ                         #71
Ανίχνευςθ Εννοιϊν ςε Περιεχόμενο• Κλαςικό πρόβλθμα: Σθμαςιολογικό κενό   – Αναντιςτοιχία μεταξφ «όψθσ» (επιφανειακά χαρακτ...
Προτεινόμενο Πλαίςιο Ανάλυςθσ                                Κεφάλαια 3-4                  #73
Παράδειγμα: Φαςματικι Ανάλυςθ          Σιμζσ δεφτερου ιδιοδιανφςματοσ                         #74
Σεχνικζσ ΢υνζνωςθσ         (1)                     #75
Σεχνικζσ ΢υνζνωςθσ         (2)                     #76
Πειραματικι Αξιολόγθςθ                                        ΢υνκετικά Δεδομζνα• Φφςθ δεδομζνων ειςόδου  – Είδοσ κατανομι...
Απόδοςθ Vs. Θόρυβοσ                  #78
Απόδοςθ Vs. Διαςτάςεισ Κοινοτιτων                   #79
Απόδοςθ Vs. Πρόβλθμα ΜάκθςθσΑρικμόσ εννοιϊνΑρικμόσ χαρακτθριςτικϊν                          #80
Αξιολόγθςθ ςτο MIR-Flickr• 25000 εικόνεσ + ετικζτεσ, 38 ζννοιεσ                            #81
Προτεινόμενθ Μζκοδοσ Vs. Hare & Lewis, 2010                      #82
Προτεινόμενθ Μζκοδοσ Vs.             Guillaumin et al., 2010                     #83
7Συμπεράςματα               #84
΢υμπεράςματαΠλεονεκτιματα Προτεινόμενων Μεκόδων• Κλιμακωςιμότθτα (105-106 ςτοιχεία)• Αξιοποίθςθ πολλϊν τφπων πλθροφορίασ• ...
Μελλοντικι ΖρευναΕφαρμογι ςε δυναμικά δεδομζνα•   Υπολογιςτικά προβλιματα (ανανζωςθ γράφου, επαυξθτικι ομαδοποίθςθ)•   Παρ...
Ευχαριςτίεσ• Ακθνά Βακάλθ• Γιάννθσ Κομπατςιάρθσ• Όλα τα μζλθ τθσ επιτροπισ΢ΤΝΕΡΓΑ΢ΙΕ΢• Χριςτοσ Ηιγκόλθσ (ομαδοποίθςθ εικόν...
;          Ευχαριςτϊ    #88
Upcoming SlideShare
Loading in …5
×

PhD Defense (in Greek)

863 views

Published on

Παρουσίαση της διδακτορικής μου διατριβής στο Τμήμα Πληροφορικής ΑΠΘ.

Published in: Education
  • Be the first to comment

PhD Defense (in Greek)

  1. 1. ΠΑΡΟΤ΢ΙΑ΢Θ ΔΙΔΑΚΣΟΡΙΚΘ΢ ΔΙΑΣΡΙΒΘ΢Μζκοδοι Εξόρυξθσ Γνϊςθσ ςε Συλλογζσ ΠεριεχομζνουΜεγάλθσ Κλίμακασ από Κοινωνικά ΔίκτυαΣυμεϊν ΠαπαδόπουλοσΕπιβλζπουςα: κακ. Ακθνά ΒακάλθΑριςτοτζλειο Πανεπιςτιμιο ΘεςςαλονίκθσΤμιμα ΠλθροφορικισΕργαςτιριο Γλωςςϊν Προγραμματιςμοφ και Τεχνολογίασ Λογιςμικοφ17 Φεβρουαρίου 2012
  2. 2. ΢φνοψθ Παρουςίαςθσ• Αντικείμενο & Συμβολζσ τθσ Διατριβισ• Στατιςτικζσ Ιδιότθτεσ Κοινωνικϊν Εφαρμογϊν• Ανίχνευςθ Κοινοτιτων ςε Γράφουσ• Ομαδοποίθςθ Κοινωνικοφ Περιεχομζνου• Εξαγωγι & Επιςκόπθςθ Πλθροφορίασ από Κοινωνικό Περιεχόμενο• Ανίχνευςθ Εννοιϊν με Χριςθ Τεχνικϊν Θμι- επιβλεπόμενθσ Μάκθςθσ• Συμπεράςματα & Μελλοντικι Ζρευνα #2
  3. 3. 1Αντικείμενο & Συμβολζσ τθσ Διατριβισ #3
  4. 4. Ευκαιρίεσ & ΠροκλιςεισΟ Παγκόςμιοσ Ιςτόσ (ΠΙ) αλλάηει: Web  Social WebΕυκαιρίεσ• Αντανάκλαςθ πραγματικότθτασ: Γεγονότα και αντικείμενα του πραγματικοφ κόςμου αναπαρίςτανται με περιεχόμενο ςτον ΠΙ• ΢υλλογικι ευφυία: Εκφράηονται πολλζσ διαφορετικζσ απόψεισ, αναπαραςτάςεισ, περιγραφζσ  δυνατότθτα για εξαγωγι ςυλλογικϊν ςυμπεραςμάτωνΠροκλιςεισ• Ετερογζνεια/Ζλλειψθ δομισ: απουςία ι προβλθματικι παρουςία μεταδεδομζνων (αςάφεια, διαφορετικζσ ςυμβάςεισ)• Κλίμακα: Τεράςτιοσ όγκοσ περιεχομζνου + μεταδεδομζνων  υπολογιςτικά προβλιματα• Θόρυβοσ: Χαμθλι ποιότθτα, διπλοτυπία, παραπλάνθςθ, ανακρίβεια• Δυναμικότθτα: Υψθλι μεταβλθτότθτα  εξαιρετικά δφςκολο να γίνουν παραδοχζσ για δομι και χαρακτθριςτικά #4
  5. 5. Εποπτικι Παρουςίαςθ Δεδομζνα - Ιδιότθτεσ - Δομι ΟμαδοποίθςθΠεριεχόμενο ΢υμπεριφορά οργάνωςθσ Εξόρυξθ γνϊςθσ #5
  6. 6. ΢υμβολζσ τθσ Διατριβισ• Κατανόθςθ ςυμπεριφοράσ/ιδιοτιτων κοινωνικϊν εφαρμογϊν• Ανίχνευςθ κοινοτιτων ςε κοινωνικό περιεχόμενο• Ομαδοποίθςθ περιεχομζνου (ετικετϊν & εικόνων) με χριςθ νζων μεκόδων ανίχνευςθσ κοινοτιτων• Εξόρυξθ και παρουςίαςθ γνϊςθσ από ςυλλογζσ περιεχομζνου μεγάλθσ κλίμακασ• Θμι-επιβλεπόμενθ μάκθςθ ςε περιεχόμενο με χριςθ τθσ δομισ κοινοτιτων #6
  7. 7. 2Στατιςτικζσ Ιδιότθτεσ Κοινωνικϊν Εφαρμογϊν #7
  8. 8. Κοινωνικζσ Εφαρμογζσ folksonomy - diggsonomyΒαςικζσ Λειτουργίεσ• Επιςιμανςθ (bookmarking): Εκδιλωςθ προτίμθςθσ ενδιαφζροντοσ• Επιςθμείωςθ (tagging): Απόδοςθ ςθμαςιολογικισ- ταξινομικισ πλθροφορίασ• Κοινωνικι δικτφωςθ (social networking): Δυνατότθτα για διλωςθ ςχζςεων μεταξφ των χρθςτϊνΠαραδείγματα: delicious, flickr, YouTube, last.fm, digg, bibsonomyΠρόβλθμα• Σφνκετα ςυςτιματα  Πϊσ ςυμπεριφζρονται; Ποιεσ οι ιδιότθτζσ τουσ;• Περιοριςμζνθ ποςότθτα προςοχισ χρθςτϊν (attention scarcity)  Πϊσ διαμορφϊνεται θ δθμοτικότθτα; #8
  9. 9. Άξονεσ Ανάλυςθσ Δθμοτικότθτασ• Κατανομζσ Μεγεκϊν: – Power law, λογαρικμικι κατανομι – Μθχανιςμόσ προνομιακισ προςάρτθςθσ• Χρονικι Εξζλιξθ: – Μοντζλο κυλιόμενθσ ςελιδοποιθμζνθσ λίςτασ• Χαρακτθριςτικά Κειμζνου: – Επιλογι χαρακτθριςτικϊν κειμζνου για πρόβλεψθ δθμοτικότθτασ• Δείκτεσ Κοινωνικισ Επιρροισ: – Κοινωνικι επιδεκτικότθτα, ςυςχζτιςθ – Κζρδοσ κοινωνικισ επιρροισ #9
  10. 10. Πειραματικι Ανάλυςθ• Συλλογι δεδομζνων από Digg ζντονο ενδιαφζρον• Στατιςτικά ςυλλογισ Β0 μεγάλθ διάρκεια• Επιπρόςκετθ ςυλλογι Β1 για υπολογιςμό δεικτϊν κοινωνικισ επιρροισ |D| ~100M, |R|>2M, |U|>340K #10
  11. 11. Κατανομζσ Μεγεκϊν 99% ιςτοριϊν < 100 ψιφουσ απόκλιςθ από power law90% περιςταςιακϊνχρθςτϊν λογαρικμικι κατανομι outliers (ιδρυτζσ εφαρμογισ) #11
  12. 12. Χρονικι Εξζλιξθ Μοντζλο κυλιόμενθσ Πειραματικι μζτρθςθ ςελιδοποιθμζνθσ λίςτασ μετάβαςθ ςτον τομζα Popular #12
  13. 13. Χαρακτθριςτικά Κειμζνου #13
  14. 14. Κοινωνικι Επιδεκτικότθτα vs. ΢υςχζτιςθ διαμορφωτζσ γνϊμθσ επθρεάηονται από το δίκτυό τουσδεν επθρεάηονταιαπό το δίκτυό τουσ #14
  15. 15. Κζρδοσ Κοινωνικισ Επιρροισ μθχανιςμόσ επιλογισ #15
  16. 16. Εφαρμογζσ #16
  17. 17. ΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ S. Papadopoulos, A. Vakali, Y. Kompatsiaris. “The Dynamics of Content Popularity in Social Media”. In International Journal of Data Warehousing and Mining 6(1), 2010 (Fourth Annual Excellence in Research Journal Award: Best Published Journal Article in IJDWM for 2010)ΚΕΦΑΛΑΙΟ S. Papadopoulos, F. Menemenis, A. Vakali, Y. Kompatsiaris. “Analysis of Content Popularity in Social Bookmarking Systems”. In book Evolving Application Domains of Data Warehousing and Mining: Trends and Solutions, edited by Dr. Pedro Furtado, pp. 233-257, IGI Publishing, 2009WORKSHOP S. Papadopoulos, A. Vakali, I. Kompatsiaris. “Digg it Up! Analyzing Popularity Evolution in a Web 2.0 Setting”. In Proceedings of Workshop on Mining Social Data (MSoDa 2008) at the 18th European Conference on Artificial Intelligence (ECAI 2008), Patras, Greece, July 2008 #17
  18. 18. 3Ανίχνευςθ Κοινοτιτων ςε Γράφουσ #18
  19. 19. Ανίχνευςθ Κοινοτιτων ςε ΚοινωνικόΠεριεχόμενο• Περιεχόμενο από Κοινωνικά Δίκτυα: Ποικιλία ςχζςεων (explicit) και ςυςχετίςεων (implicit)  Γράφοι• Δομι Κοινοτιτων: Πολφτιμο εργαλείο για τθ μελζτθ τθσ δομισ οργάνωςθσ και λειτουργίασ του ςυςτιματοσΠρόβλθμα• Εφαρμογζσ περιοριςμζνεσ ςε τυπικά κοινωνικά δίκτυα• Απουςία ςυςτθματικισ μελζτθσ ςε κζματα απόδοςθσ & εφαρμογισ ςε μεγάλθ κλίμακα: – Θεωρθτικι ανάλυςθ υπολογιςτικϊν χαρακτθριςτικϊν (χρόνοσ εκτζλεςθσ, απαιτιςεισ μνιμθσ, εφαρμογι ςε δυναμικό περιβάλλον) – Πειραματικι ςφγκριςθ μεταξφ δθμοφιλϊν μεκόδων ωσ προσ τρεισ παραμζτρουσ απόδοςθσ #19
  20. 20. Κατθγορίεσ ΜεκόδωνΒΑ΢ΙΚΕ΢ ΚΑΣΘΓΟΡΙΕ΢:• Ανίχνευςθ ςυνεκτικϊνυπογράφων• Ομαδοποίθςθ κόμβων• Βελτιςτοποίθςθ μζτρουποιότθτασ• Διαίρεςθ γράφου• Χριςθ μοντζλωνκοινοτιτων/διαδικαςιϊνΑΠΑΙΣΘ΢ΕΙ΢:• Εφαρμογι ςεεξελιςςόμενουσ γράφουσ• Εφαρμογι ςε πολφμεγάλθ κλίμακα #20
  21. 21. Αξιολόγθςθ Μεκόδων - ΑκρίβειαΑκρίβεια: ικανότθτα μεκόδων να ανακαλφπτουν τισ «ςωςτζσ» κοινότθτεσΜζκοδοι αξιολόγθςθσ ακρίβειασ• Επιςκόπθςθ αποτελεςμάτων, ςυνικωσ ςε μικροφσ γνωςτοφσ γράφουσ, π.χ. Zachary karate club (τυπικι πρακτικι)• Άμεςθ μζτρθςθ ςε ςυνκετικοφσ γράφουσ (τυπικι πρακτικι): Normalized Mutual Information (ΝΜΙ)• Ζμμεςθ αξιολόγθςθ (προτεινόμενθ πρακτικι): Χριςθ δομισ κοινοτιτων ςε κάποιο πρόβλθμα ανάκτθςθσ πλθροφορίασ (π.χ. ςφςταςθ ετικετϊν) και μζτρθςθ απόδοςθ του ςυςτιματοσ #21
  22. 22. Τπολογιςτικι Πολυπλοκότθτα #22
  23. 23. Απαιτιςεισ ςε Μνιμθ• Αποκικευςθ γράφου (το ίδιο για όλεσ τισ κακολικζσ μεκόδουσ εκτόσ από τοπικζσ μεκόδουσ και μεκόδουσ βαςιςμζνεσ ςε επεξεργαςία ροισ) – Πίνακασ γειτνίαςθσ – Λίςτα ακμϊν• Πρόςκετεσ δομζσ: – ςωροί μεγίςτου (CNM) – πίνακασ τμθματικότθτασ – ιδιοδιανφςματα• Μζκοδοι ομαδοποίθςθσ κόμβων με χριςθ πίνακα αποςτάςεων ~ n2 #23
  24. 24. Πειραματικι Αξιολόγθςθ ΢υνκετικά ΔεδομζναΕπιλεγμζνεσ μζκοδοι Γράφοι LFR• WALKTRAP (Pons & Latapy, 2006) VCLUST• CNM (Clauset et al., 2004)• LDEIGEN (Newman, 2006) QMAX• LOUVAIN (Blondel et al., 2008)• SPIN (Reichardt & Bornholdt, 2006)• LPROP (Raghavan et al., 2007) MODEL / PROCESS• MCL (Dongen, 2000)• INFOMAP (Rosvall & Bergstrom, 2008)Κριτιρια Επιλογισ• Δθμοτικότθτα μεκόδου• Εφαρμοςιμότθτα ςε γράφουσ μεγάλθσ κλίμακασ• Αντιπροςωπευτικότθτα• Διακεςιμότθτα υλοποίθςθσ #24
  25. 25. ΢υνκετικοί Γράφοι• Girvan-Newman• Lancichinetti-Fortunato-Radicchi Αρικμόσ κόμβων Μζςοσ βακμόσ Παράμετροσ πρόςμιξθσ #25
  26. 26. Πειραματικι Αξιολόγθςθ - Ακρίβεια• Μζγεκοσ γράφου: ςχετικά μικρι επιρροι• Μζςοσ βακμόσ: ςθμαντικι επιρροι• Παράμετροσ πρόςμιξθσ: απότομθ επιρροι• Συνολικά: – Υψθλι επίδοςθ: SPIN, WALKTRAP, INFOMAP, LPROP – INFOMAP, LPROP (υψθλι ευαιςκθςία) – Χαμθλι επίδοςθ: CNM, LDEIGEN #26
  27. 27. Πειραματικι Αξιολόγθςθ - Χρόνοσ Εκτζλεςθσ• Μζγεκοσ γράφου: ςχεδόν γραμμικι ςχζςθ (πλθν WALKTRAP, LPROP)• Μζςοσ βακμόσ: χειρότερθ από γραμμικι ςχζςθ• Παράμετροσ πρόςμιξθσ: μεταβλθτι επιρροι• Συνολικά: – Υψθλι επίδοςθ: LPROP, LOUVAIN – Σχετικά καλι επίδοςθ: INFOMAP, CNM – Πολφ χαμθλι επίδοςθ: SPIN, WALKTRAP #27
  28. 28. Πειραματικι Αξιολόγθςθ – Απαιτιςεισ Μνιμθσ• WALKTRAP: χειρότερθ επίδοςθ (8GB για γράφο 50Κ κόμβων)• MCL: δεφτεροσ χειρότεροσ (1.5GB για 100Κ κόμβουσ)• LOUVAIN: καλφτεροσ (18ΜΒ για 100Κ κόβμουσ)• Βακμόσ γράφου: Επθρεάηει όλεσ τισ μεκόδουσ (πλθν LOUVAIN και MCL) #28
  29. 29. ΢φνοψθ Αποτελεςμάτων• Πειραματικά αποτελζςματα:• Παρατθριςεισ: – Μεγάλοσ αρικμόσ μεκόδων, πλοφςιο υπόβακρο αλλά λίγεσ εφαρμογζσ ςε πραγματικά δεδομζνα – Ελάχιςτεσ ι κακόλου εφαρμογζσ ςε κοινωνικό περιεχόμενο – Ηθτοφμενο: Πρακτικζσ & κλιμακϊςιμεσ υλοποιιςεισ #29
  30. 30. ΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ S. Papadopoulos, Y. Kompatsiaris, A. Vakali, P. Spyridonos. “Community Detection in Social Media”. In Data Mining and Knowledge Discovery, June 2011, DOI: 10.1007/s10618-011-0224-z (Impact factor announced in 2009: 2.95)ΚΕΦΑΛΑΙΟ S. Nikolopoulos, E. Chatzilari, E. Giannakidou, S. Papadopoulos, I. Kompatsiaris, A. Vakali. “Leveraging Massive User Contributions for Knowledge Extraction”. In book Next Generation Data Technologies for Collective Computational Intelligence, Nik Bessis and Fatos Xhafa (Eds.), in “Studies in Computational Intelligence” book series, Vol. 352, pp. 415-443, Springer, 2011 #30
  31. 31. 4Ομαδοποίθςθ Κοινωνικοφ Περιεχομζνου #31
  32. 32. Ομαδοποίθςθ Κοινωνικοφ ΠεριεχομζνουΠρόβλθμα• Υψθλι πολυπλοκότθτα, δφςκολθ εφαρμογι ςε μεγάλεσ ςυλλογζσ περιεχομζνου• Ευαιςκθςία ςε κόρυβο• Μθ προφανισ τρόποσ ςυνδυαςμοφ διαφορετικϊν χαρακτθριςτικϊνΠροτεινόμενο Πλαίςιο: – Αλγόρικμοσ Bridge Bounding  τοπικότθτα υπολογιςμϊν – Αλγόρικμοσ SCAN++  αντοχι ςτο κόρυβο, χαμθλι πολυπλοκότθτα• Ομαδοποίθςθ Ετικετϊν: – Μελζτθ κεματολογίασ, ςφςταςθ ετικετϊν• Ομαδοποίθςθ Εικόνων: – Ταυτόχρονθ χριςθ οπτικϊν χαρακτθριςτικϊν και χαρακτθριςτικϊν κειμζνου #32
  33. 33. Προτεινόμενο Πλαίςιο Κεφάλαιο 3 Κεφάλαιο 5 Κεφάλαιο 6 #33
  34. 34. Σοπικι Ανίχνευςθ Κοινοτιτων: Bridge Bounding• Ανίχνευςθ κοινοτιτων = διαδικαςία εξερεφνθςθσ (ΒFS) γφρω από κόμβο εκκίνθςθσ (seed node) μζχρι να εντοπιςτοφν τα «όρια» τθσ κοινότθτασ  ιδανικόσ για κακοδθγοφμενθ «εξερεφνθςθ» μεγάλων ςυλλογϊν ακμζσ-γζφυρεσ #34
  35. 35. ΢υνάρτθςθ Local Bridging #35
  36. 36. Local Bridging Δεφτερθσ Σάξθσ τάξθ local bridging Πολυπλοκότθτα μζςοσ βακμόσ #36
  37. 37. Ανίχνευςθ Κοινοτιτων με Αντοχι ςτοΘόρυβο: SCAN++• Βαςικό χαρακτθριςτικό SCAN: – Αποφυγι ανάκεςθσ όλων των κόμβων ςε κοινότθτεσ  αντιμετϊπιςθ κορφβου (ακμϊν που δεν αντιςτοιχοφν ςε πραγματικζσ ςχζςεισ)• Περιοριςμοί SCAN: – Ανάγκθ για προςδιοριςμό παραμζτρων μ, ε – Μικρό ποςοςτό κάλυψθσ (υπερβολικά αυςτθρι διαλογι)• Επεκτάςεισ SCAN++: – Αναηιτθςθ χϊρου (μ,ε)  Αυτόματθ επιλογι παραμζτρων – Τοπικι επζκταςθ κοινοτιτων  επικάλυψθ, υψθλότερθ ανάκλθςθ #37
  38. 38. SCAN: Βαςικζσ Ζννοιεσ • Δομικι ομοιότθτα: • ε-γειτονιά: • (μ,ε)-πυρινασ: huboutlier (μ,ε)-πυρινασ (μ,ε)-πυρινασ μ = 5, ε = 0.72 μ = 6, ε = 0.675 #38
  39. 39. Αναηιτθςθ Παραμζτρων (μ,ε) Μικροί πυρινεσ υψθλισ Μεγάλοι πυρινεσ ποιότθτασ υψθλισ ποιότθτασΜικροί πυρινεσ Μεγάλοι πυρινεσχαμθλισ ποιότθτασ χαμθλισ ποιότθτασ #39
  40. 40. Επζκταςθ Κοινοτιτων #40
  41. 41. Παράδειγμα Εκτζλεςθσ SCAN++Εφρεςθ πυρινων για (μ1,ε1)Εφρεςθ πυρινων για (μi,εi)Επζκταςθ με μεγιςτοποίθςθ τμθματικότθτασ υπογράφουΧαρακτθριςμόσ υπόλοιπωνκόμβων ωσ hubs και outliers #41
  42. 42. Αξιολόγθςθ - Ομαδοποίθςθ Ετικετϊν• Μελζτθ κεματολογίασ• Σφςταςθ ετικετϊν #42
  43. 43. Αξιολόγθςθ - Μελζτθ Θεματολογίασ Τπολογιςτζσ Ιςτορία Μουςικι Επιςτιμθ Σαινίεσ Ηϊα #43 Bridge Bounding
  44. 44. Αξιολόγθςθ ΢θμαςιολογικισ ΢υνάφειασ• Για αξιολόγθςθ ςε μεγάλθ κλίμακα προτείνεται θ χριςθ του Normalized Google Distance (NGD):• Υπολογίηονται δφο κατανομζσ: – NGD μεταξφ ετικετϊν τθσ ίδιασ κοινότθτασ (Fsame) – NGD μεταξφ ετικετϊν διαφορετικϊν κοινοτιτων αλλά γειτονικϊν ςτο γράφο (Fdiff)• Χριςθ Kolmogorov-Smirnov τεςτ (μίασ πλευράσ) – Μθδενικι (null) υπόκεςθ: Fsame = Fdiff – Εναλλακτικι υπόκεςθ: Fsame < Fdiff• Για τισ ομάδεσ που εξάχκθκαν με τισ μεκόδουσ Bridge Bounding και SCAN θ μθδενικι υπόκεςθ απορρίφκθκε. #44
  45. 45. ΢φςταςθ Ετικετϊν• Χριςθ ιςτορικϊν δεδομζνων για αξιολόγθςθ• SCAN: υψθλότερθ ακρίβεια• SCAN++: υψθλότερθ ανάκλθςθ #45
  46. 46. Αξιολόγθςθ - Ομαδοποίθςθ Εικόνων΢υλλογιΓράφοσ ομοιότθτασ• Ομοιότθτα με βάςθ τα οπτικά χαρακτθριςτικά – SIFT  Bag-of-Words  histogram  Euclidean – SURF  VocTree  Geometric Verification (RANSAC)• Ομοιότθτα με βάςθ χαρακτθριςτικά ετικετϊν – Γράφοσ με βάςθ τθ ςυνεμφάνιςθ (COOC), πολφ γριγορθ καταςκευι – Γράφοσ με προβολι ςε χαμθλότερεσ διαςτάςεισ (LSI)• Υβριδικόσ Γράφοσ (HYB)• Ομαδοποίθςθ με χριςθ SCAN, SCAN+ / ςφγκριςθ με k-means #46
  47. 47. Αξιολόγθςθ ομάδων εικόνων (1)• HYB > VIS, TAG Γεωγραφικι• SCAN > k-means Ζρευνα χρθςτϊν πλθροφορία #47
  48. 48. Αξιολόγθςθ ομάδων εικόνων (2) #48
  49. 49. ΢υμπεράςματα• Προτεινόμενο πλαίςιο ομαδοποίθςθσ: – Αντοχι ςτο κόρυβο – Εφαρμογι ςε μεγάλθ κλίμακα – Ταυτόχρονθ αξιοποίθςθ διαφορετικϊν τφπων ομοιότθτασ k-means SCAN #49
  50. 50. ΢χετικζσ ΔθμοςιεφςεισΚΕΦΑΛΑΙΟ S. Papadopoulos, A. Vakali, Y. Kompatsiaris. “Community Detection in Collaborative Tagging Systems”. In Book Community-built Database: Research and Development, pp. 107-131, Springer, 2011΢ΤΝΕΔΡΙΑ S. Papadopoulos, Y. Kompatsiaris, A. Vakali. “A Graph-based Clustering Scheme for Identifying Related Tags in Folksonomies”. In Proceedings of DaWaK10, 12th International Conference on Data Warehousing and Knowledge discovery (Bilbao, Spain), Springer-Verlag, 65-76, 2010 (acceptance rate: 29%) S. Papadopoulos, C. Zigkolis, G. Tolias, Y. Kalantidis, P. Mylonas, Y. Kompatsiaris, A. Vakali. “Image Clustering through Community Detection on Hybrid Image Similarity Graphs”. In Proceedings of ICIP 2010, International Conference on Image Processing (Hong Kong), IEEE, pp. 2353-2356, October, 2010 (acceptance rate: 45%)WORKSHOP & ΑΝΑΦΟΡΕ΢ S. Papadopoulos, Y. Kompatsiaris, A. Vakali. “Leveraging Collective Intelligence through Community Detection in Tag Networks”. In Proceedings of CKCaR09 Workshop on Collective Knowledge Capturing and Representation, California, USA, Sep. 1, 2009 S. Papadopoulos, A. Skusa, A. Vakali, Y. Kompatsiaris, N. Wagner. “Bridge Bounding: A Local Approach for Efficient Community Discovery in Complex Networks”. In arXiv:0902.0871, February 2009 #50
  51. 51. 5Εξαγωγι & Επιςκόπθςθ Πλθροφορίασ απόΚοινωνικό Περιεχόμενο #51
  52. 52. Εξόρυξθ Γνϊςθσ από Κοινωνικό ΠεριεχόμενοΠρόβλθμα• Εξόρυξθ & προβολι γνϊςθσ από μεγάλο όγκο κοινωνικοφ περιεχομζνουΠροτεινόμενο Πλαίςιο• Ανίχνευςθ ΢θμείων Ενδιαφζροντοσ & Δραςτθριοτιτων: – Ενιαία προςζγγιςθ – Προςζγγιςθ προςαρμοςμζνθ ςε ανίχνευςθ δραςτθριοτιτων ςυγκεκριμζνου τφπου• Τψθλι ακρίβεια – Νζα χαρακτθριςτικά ομάδων – Τεχνικζσ ανκεκτικζσ ςτο κόρυβο• ΢υνδυαςμόσ πολλϊν τφπων πλθροφορίασ (γεωγραφικι, χρόνοσ, εξωτερικζσ πθγζσ)• Εφαρμογι ςε Μεγάλθ Κλίμακα• Εποπτικι Παρουςίαςθ Μεγάλων ΢υλλογϊν Περιεχόμενου #52
  53. 53. Ανίχνευςθ ΢θμείων Ενδιαφζροντοσ &Δραςτθριοτιτων Κεφάλαιο 4 #53
  54. 54. Κατθγοριοποίθςθ Ομάδων• Οι ομάδεσ που προκφπτουν από το βιμα ομαδοποίθςθσ εικόνων κατθγοριοποιοφνται ςε «ςθμεία ενδιαφζροντοσ» και «δραςτθριότθτεσ»• Χριςθ 4 χαρακτθριςτικϊν: – Χρονικι διάρκεια Quack et al. – Διαςπορά χριςθσ (2008) – Συνάφεια ςθμείου ενδιαφζροντοσ – Συνάφεια δραςτθριότθτασ #54
  55. 55. Αρχι Λειτουργίασ f1, f2 #55
  56. 56. Προτεινόμενα Χαρακτθριςτικά f3, f4• Τα δφο χαρακτθριςτικά του Quack (2008) οδθγοφν ςυχνά ςε ςφάλματα λόγω ιδιαιτεροτιτων των ομάδων.• Για αφξθςθ τθσ αξιοπιςτίασ κατάταξθσ προτάκθκαν τα χαρακτθριςτικά ςυνάφειασ με χριςθ ετικετϊν. ΢ΘΜΕΙΑ ΕΝΔΙΑΦΕΡΟΝΣΟ΢ ΔΡΑ΢ΣΘΡΙΟΣΘΣΕ΢ #56
  57. 57. Ανίχνευςθ Δραςτθριοτιτων• Δυνατότθτα για ανίχνευςθ δραςτθριοτιτων ςυγκεκριμζνου είδουσ• Εφαρμογι και ςε ςυλλογζσ με μικρό ποςοςτό γεωγραφικισ πλθροφορίασ #57
  58. 58. Επιςκόπθςθ Πλθροφορίασ & Περιεχομζνου www.clusttour.gr #58
  59. 59. Επιςκόπθςθ Πόλθσ - ΢τοιχεία Διεπαφισ #59
  60. 60. Back-end εφαρμογισ #60
  61. 61. Πειραματικι Αξιολόγθςθ - Δεδομζνα• Ανίχνευςθ ςθμείων ενδιαφζροντοσ/δραςτθριοτιτων – Συλλογι 200,000 εικόνων (Βαρκελϊνθ)• Ανίχνευςθ Δραςτθριοτιτων – Συλλογι αναφοράσ MediaEval 2011 (75,000 εικόνεσ)• Εποπτικι παρουςίαςθ περιεχομζνου & γνϊςθσ – Συλλογι 2,500,000 εικόνων (35 πόλεισ) #61
  62. 62. Αξιολόγθςθ Προτεινόμενων Χαρακτθριςτικϊν #62
  63. 63. Αξιολόγθςθ ΢θμείων Ενδιαφζροντοσ# ΢θμείο Ενδιαφζροντοσ Αυτόματεσ Ετικζτεσ Ακρίβεια (m)1 Sagrada Familia sagrada familia, sagrada, familia 15.22 Casa Batllo casa batllo, casa, passeig gracia 10.53 Casa Mila casa mila, casamila, casa milà 31.84 Cathedral (La Seu) barri gotic, barcelona cathedral, barri 40.55 Park Guell parc guell, park guell, guell 9.66 Barcelona Pavillon mies van der rohe, barcelona pavillon 110.37 La Boqueria la boqueria mercat, de sant josep 82.18 Arc de Triomf ciclic, bookstore, arte 56.09 Poble Espanyol poble espanyol, vidres, cristal 66.510 Santa Maria del Mar santa maria del mar, tapas, catedral 68.011 Macba macba, contemporary, museu 147.812 Barcelona Zoo zoo, patas monkey, freire 107.013 Marina Port Vell port vell, port, hafen 134.714 Camp Nou joan gamper trophy, camp nou 18.7 #63
  64. 64. Αξιολόγθςθ Ανίχνευςθσ Δραςτθριοτιτων MediaEval 2011 #64
  65. 65. Επιςκόπθςθ ΢θμαντικϊν Περιοχϊν Sacre Coeur Branly Musée du Louvre Pompidou Séverin Bundestag Weltzeituhr Museuminsel Gendarmenmarkt Potsdamer #65
  66. 66. Ανεφρεςθ Μθ Προφανϊν ΢θμείων #66
  67. 67. Πολλαπλζσ Όψεισ Δθμοφιλϊν Μνθμείων #67
  68. 68. Χρονικι ΑνάλυςθΠεριοχζσ με ιδιαίτερα χρονικά χαρακτθριςτικά (π.χ. νυχτερινι ηωι) #68
  69. 69. ΢φνοψθ Αποτελεςμάτων• Εξαγωγι γνϊςθσ ςε μεγάλθ κλίμακα: – Σθμεία Ενδιαφζροντοσ – Δραςτθριότθτεσ – Δθμοτικότθτα Περιοχϊν, Σθμείων Ενδιαφζροντοσ – Αξιοςθμείωτα Χρονικά Στοιχεία – Ιεραρχικι Παρουςίαςθ και Εξερεφνθςθ• Υψθλι ακρίβεια• Αξιοποίθςθ πολλϊν τφπων πλθροφορίασΜελλοντικι Εργαςία• Εφαρμογι ςε δυναμικό περιβάλλον #69
  70. 70. ΢χετικζσ ΔθμοςιεφςεισΠΕΡΙΟΔΙΚΟ S. Papadopoulos, C. Zigkolis, Y. Kompatsiaris, A. Vakali. “Cluster-based Landmark and Event Detection on Tagged Photo Collections”. In IEEE Multimedia 18(1), pp. 52-63, 2011 (Impact factor announced in 2009: 2.258, Special Issue acceptance rate: 25%)΢ΤΝΕΔΡΙΑ S. Papadopoulos, C. Zigkolis, S. Kapiris, Y. Kompatsiaris, A. Vakali. “City exploration by use of spatio-temporal analysis and clustering of user contributed photos” Demo paper in ICMR, Trento, Italy, April 17-20, 2011 (Best demo award) S. Papadopoulos, C. Zigkolis, S. Kapiris, Y. Kompatsiaris, A. Vakali. “ClustTour: City exploration by use of hybrid photo clustering”. In Proceedings of MM 10, the international Conference on Multimedia, ACM, New York, NY, 1617-1620, Firenze, Italy, Oct 25-29, 2010WORKSHOP S. Papadopoulos, C. Zigkolis, Y. Kompatsiaris, A. Vakali. “CERTH @ MediaEval 2011 SED Task” In Proceedings of MediaEval 2011 Workshop, Pisa, Italy, Sep 1-2, 2011 #70
  71. 71. 6Ανίχνευςθ Εννοιϊν με Χριςθ ΤεχνικϊνΘμι-επιβλεπόμενθσ Μάκθςθσ #71
  72. 72. Ανίχνευςθ Εννοιϊν ςε Περιεχόμενο• Κλαςικό πρόβλθμα: Σθμαςιολογικό κενό – Αναντιςτοιχία μεταξφ «όψθσ» (επιφανειακά χαρακτθριςτικά) και «νοιματοσ» (εννοιολογικοφ περιεχόμενου)• Ευκαιρία: – Χριςθ κοινωνικοφ περιεχόμενου για βελτίωςθ απόδοςθσ – Αξιοποίθςθ δομισ κοινοτιτων γράφων ομοιότθτασ – Συνζνωςθ χαρακτθριςτικϊν διαφορετικοφ τφπου• Προτεινόμενο πλαίςιο: – Θμι-επιβλεπόμενθ μάκθςθ με χριςθ «διανυςμάτων κοινοτιτων» – Πολλαπλζσ τεχνικζσ ςυνζνωςθσ χαρακτθριςτικϊν #72
  73. 73. Προτεινόμενο Πλαίςιο Ανάλυςθσ Κεφάλαια 3-4 #73
  74. 74. Παράδειγμα: Φαςματικι Ανάλυςθ Σιμζσ δεφτερου ιδιοδιανφςματοσ #74
  75. 75. Σεχνικζσ ΢υνζνωςθσ (1) #75
  76. 76. Σεχνικζσ ΢υνζνωςθσ (2) #76
  77. 77. Πειραματικι Αξιολόγθςθ ΢υνκετικά Δεδομζνα• Φφςθ δεδομζνων ειςόδου – Είδοσ κατανομισ – Ζνταςθ κορφβου• Παράμετροι πλαιςίου μάκθςθσ – Μθχανιςμόσ ςχθματιςμοφ γράφου – Διαςτάςεισ διανφςματοσ κοινοτιτων – Τεχνικι ςυνζνωςθσ χαρακτθριςτικϊν• Χαρακτθριςτικά του προβλιματοσ μάκθςθσ – Αρικμόσ δειγμάτων εκπαίδευςθσ – Διαςτάςεισ διανφςματοσ χαρακτθριςτικϊν – Αρικμόσ εννοιϊν προσ εκμάκθςθ – Εφαρμογι ςε επαγωγικό περιβάλλον #77
  78. 78. Απόδοςθ Vs. Θόρυβοσ #78
  79. 79. Απόδοςθ Vs. Διαςτάςεισ Κοινοτιτων #79
  80. 80. Απόδοςθ Vs. Πρόβλθμα ΜάκθςθσΑρικμόσ εννοιϊνΑρικμόσ χαρακτθριςτικϊν #80
  81. 81. Αξιολόγθςθ ςτο MIR-Flickr• 25000 εικόνεσ + ετικζτεσ, 38 ζννοιεσ #81
  82. 82. Προτεινόμενθ Μζκοδοσ Vs. Hare & Lewis, 2010 #82
  83. 83. Προτεινόμενθ Μζκοδοσ Vs. Guillaumin et al., 2010 #83
  84. 84. 7Συμπεράςματα #84
  85. 85. ΢υμπεράςματαΠλεονεκτιματα Προτεινόμενων Μεκόδων• Κλιμακωςιμότθτα (105-106 ςτοιχεία)• Αξιοποίθςθ πολλϊν τφπων πλθροφορίασ• Αντοχι ςε κόρυβοΠεριοριςμοί• Εφαρμογι ςε ςτατικζσ ςυλλογζσ δεδομζνων• Εφαρμογι ςε ζναν πυρινα (core) #85
  86. 86. Μελλοντικι ΖρευναΕφαρμογι ςε δυναμικά δεδομζνα• Υπολογιςτικά προβλιματα (ανανζωςθ γράφου, επαυξθτικι ομαδοποίθςθ)• Παρακολοφκθςθ μοντζλων/κατανομϊνΜθχανικι μάκθςθ ςε κλίμακα διαδικτφου• Αφξθςθ αρικμοφ εννοιϊν• Αφξθςθ χαρακτθριςτικϊν• Χριςθ κατανεμθμζνων τεχνικϊν (MapReduce)Αφξθςθ τθσ κλίμακασ αξιολόγθςθσ• Αξιοποίθςθ κοινότθτασ χρθςτϊν (crowdsourcing)Οπτικοποίθςθ μαηικϊν δεδομζνων• Διαδραςτικι εξερεφνθςθ ςυλλογϊν περιεχόμενου πολφ μεγάλθσ κλίμακασ #86
  87. 87. Ευχαριςτίεσ• Ακθνά Βακάλθ• Γιάννθσ Κομπατςιάρθσ• Όλα τα μζλθ τθσ επιτροπισ΢ΤΝΕΡΓΑ΢ΙΕ΢• Χριςτοσ Ηιγκόλθσ (ομαδοποίθςθ εικόνων, ανίχνευςθ ςθμείων ενδιαφζροντοσ & δραςτθριοτιτων)• Χριςτοσ Σαγϊνασ (θμι-επιβλεπόμενθ μάκθςθ ςε γράφουσ)• Στζφανοσ Καπίρθσ, Λάμπροσ Μακρισ (clusttour web interface)• Πλοφταρχοσ Σπυρίδωνοσ (πειραματικι ςφγκριςθ μεκόδων ανίχνευςθσ κοινοτιτων)• Φϊτθσ Μενεμενισ (ανίχνευςθ δθμοφιλϊν ιςτοριϊν με χριςθ χαρακτθριςτικϊν κειμζνου) #87
  88. 88. ; Ευχαριςτϊ #88

×