Γεώργιος Κορδοπάτης-Ζήλος

ISSEL
ISSELISSEL
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
Αυτόματος Εντοπισμός Γεωγραφικής
Θέσης εικόνων και βίντεο
Διπλωματική εργασία του
Κορδοπάτη-Ζήλου Γεώργιου
ΑΕΜ: 6673
υπό την επίβλεψη των
κ. Ανδρέα Λ. Συμεωνίδη
Επίκουρος Καθηγητής - ΑΠΘ
κ. Συμεών Παπαδόπουλο
Ερευνητής - ΙΠΤΗΛ ΕΚΕΤΑ
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Δομή της Παρουσίασης
 Ορισμός Προβλήματος
 Σκοπός Εργασίας
 Αλγόριθμος Γλωσσικού Μοντέλου
 Αλγόριθμος Σημασιολογική και Οπτική Ανάλυσης
 Αποτελέσματα
 Μελλοντική Εργασία
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Ορισμός Προβλήματος
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Σκοπός Εργασίας
• Δημιουργία ενός αυτόματου σύστηματος εντοπισμού
γεωγραφικές θέσης των πολυμέσων
Σύνολο
εκπαίδευσης
User Id: George
Tags: dog, New York,
Usa, Central park
Date: 11/4/2013
[40.71, -73.97]
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αυτόματος Εντοπισμός Θέσης με χρήση
Γλωσσικών Μοντέλων
• Υλοποίηση βασισμένη στη έρευνα (Van Laere et al.,
ICMR ‘11)
• Ομαδοποίηση με χρήση του 𝑘-means, και εξαγωγή
των 𝑥2
χαρακτηριστικά.
• Εφαρμογή γλωσσικών μοντέλων και αναζήτηση
ομοιότητας.
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Εισαγωγή δεδομένων στον αλγόριθμο
• Μορφή κειμένου
74,25981735@N00,52.470701,13.412504,street berlin bike sign perspective
460261,16884413@N08,40.626591,22.947993,white tower thessaloniki θεσσαλονίκη πύργοσ λευκόσ
1799632,9855426@N02,40.183594,116.556015,china beijing peking thegreatwall pekín
2870482,96661011@N00,30.2569,-87.63603,beach sunrise gulf alabama shores
αύξοντας αριθμός όνομα χρήστη γεωγραφικό μήκος γεωγραφικό πλάτος tags
• Δημιουργία Ν αντικειμένων 𝛪𝑖 = 𝑑𝑖, 𝑢𝑖, 𝑐𝑖 , 𝑡𝑖 , 𝑎𝑖
d ← ταυτότητα εικόνας
u ← όνομα χρήστη
c ← συντεταγμένες
t ← tags
• Παραδείγματα εγγραφών
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Ομαδοποίηση των εικόνων
• Ομαδοποίηση με τον αλγόριθμο 𝑘-means
• Δημιουργία K ομάδων (clusters), βάση των γεωγραφικών
τους συντεταγμένων 𝑐
K = 5
K = 100
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Υπολογισμός x2 χαρακτηριστικού
• Για κάθε ομάδα υπολογίζεται το x2 χαρακτηριστικό
μέγεθος των tags των εικόνων της
𝑥2
𝑎, 𝑡 =
𝑂𝑡𝑎−𝐸𝑡𝑎
2
𝐸𝑡𝑎
+
𝑂 𝑡 𝑎−𝐸 𝑡 𝑎
2
𝐸 𝑡 𝑎
+
𝑂 𝑡𝑎−𝐸 𝑡𝑎
2
𝐸 𝑡𝑎
+
𝑂 𝑡 𝑎−𝐸 𝑡 𝑎
2
𝐸 𝑡 𝑎
• 𝑂𝑦𝑥: ο αριθμός των εικόνων της περιοχής x που
εμφανίζεται το y tag
• 𝐸 𝑦𝑥: ο εκτιμώμενος αριθμός εμφανίσεων του tag y
στην περιοχή x.
𝐸 𝑦𝑥 = 𝛮 · 𝑃(𝑦) · 𝑃(𝑥)
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Δημιουργία Περιοχών
• Επιλογή m πρώτων λέξεων που σχηματίζουν το λεξιλόγιο v
κάθε ομάδας
• Δημιουργία Κ αντικειμένων 𝐴𝑗 = 𝑎𝑗, 𝑤𝑗 , 𝑣𝑗
a ← ταυτότητα cluster
w ← εικόνες του cluster
v ← λεξιλόγιο ομάδας
• Παραδείγματα περιοχών
CLUSTER ID VOCABULARY
1 india singapore thailand malaysia asia
3 england london uk spain france
5 japan china tokyo taiwan philippines
7 greece turkey istanbul egypt moscow
10 brasil brazil argentina chile buenosaires
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Γλωσσικό Μοντέλο (1/2)
• Ανάθεση των εικόνων του συνόλου ελέγχου στις
περιοχές βάση του τύπου:
𝑃 𝑎 𝑥 ∝ 𝑃 𝑎 ·
𝑡∈𝑥
𝑃 𝑡 𝑎
• Ο υπολογισμός των πιθανοφανειών P(t|a) δίνεται
από τον τύπο
𝑃 𝑡 𝑎 =
𝑂𝑡𝑎 + 𝜇 · 𝛼′∈𝛢 𝑂 𝑡𝛼′
𝛼′∈𝛢 𝑡′∈𝑉 𝑂 𝑡′ 𝛼′
𝑡′∈𝑉 𝑂 𝑡′ 𝑎 + 𝜇
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Γλωσσικό Μοντέλο (2/2)
• Τελική ανάθεση στην ομάδα όπου:
𝑎 𝑥 = 𝑎𝑟𝑔 𝑎∈𝐴 𝑚𝑎𝑥 𝑃 𝑎 ·
𝑡∈𝑥
𝑃 𝑡 𝑎
• Ως εκτιμώμενη θέση η:
𝑚𝑒𝑎𝑛(𝑎) = 𝑎𝑟𝑔 𝑥∈𝑎 𝑚𝑖𝑛
𝑦∈𝑎
𝑑(𝑥, 𝑦)
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αναζήτηση Ομοιότητας
• Υπολογισμός ομοιότητας Jaccard:
𝑠𝑗𝑎𝑐𝑐 𝑥, 𝑦 =
𝑥 ∩ 𝑦
𝑥 ∪ 𝑦
• Κέντρο βαρύτητας (center-of-gravity) των k πιο
όμοιων εικόνων:
𝑙𝑜𝑐 𝑥 =
1
𝑘
𝑖=1
𝑘
𝑠𝑖𝑚 𝑥, 𝑦𝑖
𝑎
· 𝑙𝑜𝑐 𝑦𝑖
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Σημασιολογική και Οπτική Ανάλυση για
τον Εντοπισμό Θέσης
• Σημασιολογική ανάλυση (text-based analysis)
– Υλοποιήθηκε με βάση τον αλγόριθμο γλωσσικού μοντέλου και
χρησιμοποιεί τον γεννητικού θεματικού αλγορίθμου LDA δυο
επιπέδων.
• Οπτική ανάλυση (visual-based analysis)
– Εξαγωγή των SURF+VLAD χαρακτηριστικά των εικόνων και
χρήση τεχνικών κοντινότερου γείτονα για τον υπολογισμό της
εκτιμώμενης θέση.
• Υβριδική Υλοποίηση (Hybrid Approach)
– μίξη των δύο τεχνικών
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Latent Dirichlet Allocation - LDA (1/2)
• Γεννητικό πιθανοκρατικό μοντέλο ενός σώματος
κειμένου (corpus)
• Βασική Αρχή
– τα έγγραφα αναπαρίστανται ως τυχαία μείγματα από
λανθάνοντα θέματα, όπου κάθε θέμα χαρακτηρίζεται από
μια κατανομή σε ένα λεξιλόγιο
• Χρήσιμοι όροι:
– «λέξη» : βασική μονάδα διακεκριμένων δεδομένων
αντικείμενο ενός λεξιλογίου, 𝑤
– «έγγραφο»: ακολουθία από N λέξεις, 𝒘 =(𝑤1, 𝑤2, … , 𝑤 𝛮)
– «σώμα» : είναι μια συλλογή M εγγράφων,
D= 𝒘1, 𝒘2, … , 𝒘 𝛭
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Latent Dirichlet Allocation - LDA (2/2)
• Βιβλιοθήκη JGibbLDA
[M]
[document-1]
[document-2]
...
[document-M]
Είσοδος
Πλήθος θεμάτων 𝑁𝐿
Παράμετρος 𝜶 𝑎 𝐿
Παράμετρος 𝜷 𝛽𝐿
Πλήθος λέξεων/θέμα 𝑊𝐿
𝑝(𝑤𝑖|𝑡𝑜𝑝𝑖𝑐𝑗) 𝛷𝑖𝑗
𝑝(𝑡𝑜𝑝𝑖𝑐𝑗|𝑑𝑜𝑐𝑢𝑚𝑒𝑛𝑡 𝑑) 𝛩𝑗𝑑
Λέξεις 𝑡𝑜𝑝𝑖c 𝑇
Αντιστοιχία λέξεων με δείκτες
(words – word indices)
𝑀
Έξοδοι
Παράμετροι
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Σημασιολογική Ανάλυση
• Απομάκρυνση των machine tags (π.χ. “geo:lat=… ”)
• Οριστική διαγραφή κενών εικόνων
Training Prediction
Spatial Clustering
& local LDAs
Filtering
Global LDA
& BoEW
Σημασιολογική Ανάλυση - Εκπαίδευση
1ο βήμα
• περιορισμός θορύβου
• πιο πλούσιες σε πληροφορία περιοχές
Assignment
in Areas
Similarity
Search
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
• Σχηματισμός περιοχών με εφαρμογή του 𝑘-means, συνολικού
αριθμού Κ
• Τοπικά θεματικά μοντέλα δημιουργούνται για τις εικόνες κάθε
περιοχής με χρήση LDA (100/20)
• Σχηματισμός αντικειμένων 𝐴𝑗 = 𝑎𝑗, 𝑤𝑗 , 𝜏𝑗
Training Prediction
Filtering
Global LDA
& BoEW
Spatial Clustering
& local LDAs
Σημασιολογική Ανάλυση - Εκπαίδευση
2ο βήμα
Assignment
in Areas
Similarity
Search
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
• Εξαγωγή καθολικού θεματικού μοντέλου με χρήση LDA (500/50)
σε ολόκληρο το σύνολο εκπαίδευσης
• Δημιουργία λεξιλογίου αποκλειόμενων λέξεων
(Bag-of-Excluded-Words, BoEW)
Training Prediction
Filtering
Global LDA
& BoEW
Spatial Clustering
& local LDAs
Σημασιολογική Ανάλυση - Εκπαίδευση
3ο βήμα
Assignment
in Areas
Similarity
Search
Assignment
in Areas
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Λέξεις Γενικού Ενδιαφέροντος
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Δημιουργία BoEW (1/3)
• Λίστα των “ενεργών” topics για κάθε εικόνα
– Γνωρίζουμε ότι 𝑗=0
𝑁 𝐺
𝛩 𝐺,𝑗𝑑 = 1
– Όριο “ενεργοποίησης” 𝑡 𝑎 =
1
0.9∗𝑁 𝐺
• Ιστογράμματος συχνότητας εμφάνισης των topics
μέσα στις περιοχές
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Δημιουργία BoEW (2/3)
• Λίστα των ανενεργών topic Ε με βάση την εντροπία
τους
– Υπολογισμός εντροπίας κάθε topic
𝐸 𝛸 = −
𝑖=0
𝑛
𝑝 𝑥𝑖 ∗ log(𝑝 𝑥𝑖 )
– Εμπειρικά ορίστηκε όριο 𝑡 𝑒=180
ΕΝΤΡΟΠΙΑ ΙΣΧΥΡΟΤΕΡΑ TAGS
409.84 sky clouds sunset blue sun
195.98 bike bicycle cycling race road
149.74 london uk england londres kingdom
68.35 greece athens ελλάδα hellas thessaloniki
65.46 barcelona spain catalunya españa cataluña
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Δημιουργία BoEW (3/3)
• Δημιουργία λεξιλογίου αποκλειόμενων λέξεων
– Κριτήριο εισαγωγής ενός tag στη BoEW:
max ← arg 𝑚𝑎𝑥𝑗 𝛷 𝐺,𝑖𝑗 ∈ 𝛦
– Η λέξη που καταχωρείται στο λεξιλογίου
αποκλειόμενων λέξεων είναι η 𝑀 𝐺,𝑚𝑎𝑥
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
• Φιλτράρισμα των tags που περιέχουν θόρυβο και όσων βρίσκονται στο
BoEW
• Υπολογισμός της Jaccard ομοιότητας μίας 𝑖 εικόνας με ένα topic 𝑗 που
ανήκει σε μία περιοχή 𝑘
𝑠𝑖𝑗𝑘 =
𝑡𝑖 ∩ 𝜏𝑗𝑘
𝑡𝑖 ∪ 𝜏𝑗𝑘
Training Prediction
Filtering
Global LDA
& BoEW
Spatial Clustering
& local LDAs
Σημασιολογική Ανάλυση -
Εκτίμηση τελικής θέσης (1/2)
Assignment
in Areas
Similarity
Search
Assignment
in Areas
Κριτήρια ανάθεσης κάθε εικόνας του συνόλου ελέγχου στις περιοχές
– Περιοχή που ανήκει το topic με την μεγαλύτερη τιμή ομοιότητας
tmax : 𝑎𝑟𝑒𝑎𝑖 = arg 𝑚𝑎𝑥𝑗,𝑘 𝑠𝑖𝑗𝑘
– Περιοχή με τον μεγαλύτερο μέσο όρο (ανάμεσα στα topics) ομοιότητας
tmean : 𝑎𝑟𝑒𝑎𝑖 = arg 𝑚𝑎𝑥𝑗 𝑘=0
𝑘
𝑠𝑖𝑗𝑘
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Σημασιολογική Ανάλυση -
Εκτίμηση τελικής θέσης (2/2)
Training Prediction
Filtering
Global LDA
& BoEW
Spatial Clustering
& local LDAs
Assignment
in Areas
Similarity
Search
• Έχοντας αναθέσει κάθε εικόνες σε μια περιοχή:
– 𝑘 εικόνες με τη μεγαλύτερη ομοιότητα
– τελική εκτίμηση της γεωγραφικής θέσης από το κέντρο
βαρύτητας (center-of-gravity)
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Οπτική Ανάλυση
• Υλοποίηση με βάση την (Spyromitros-Xioufis et al., WIAMIS ‘12)
• Εξαγωγή των βελτιστοποιημένων SURF+VLAD διανυσμάτων για
ολόκληρο το σύνολο εκπαίδευσης
• Κατάταξή τους σε πίνακα με χρήση τεχνικών IVFADC
• Αναζήτηση Product Quantization
• 1η υλοποίηση - vnn: τοποθέτηση κάθε εικόνας στον πιο κοντινό
οπτικά γείτονα 𝑘 = 1
• 2η υλοποίηση - vclust: εφαρμογή στοιχειώδους αλγορίθμου
χωρικής ομαδοποίησης για τους 𝑘 =20 κοντινότερους γείτονες
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αποτελέσματα - Γλωσσικό Μοντέλο (1/2)
• N = 3.281.022 και Τ =10.000 εικόνες
• K = {50, 500, 2.500, 5.000, 7.500, 10.000, 12.500, 15.000,
17.500, 20.000}
• m = {6 400, 640, 256 , 64, 28, 16, 10, 7, 5, 4}
• Language Model (LM): γλωσσικό μοντέλο με τελική εκτίμηση
της γεωγραφικής θέσης το κέντρο της ομάδας που έγινε η
ανάθεση.
• Hybrid Approach (HA): γλωσσικό μοντέλο με τελική εκτίμηση
της γεωγραφικής θέσης με τη χρήση της διαδικασίας
αναζήτησης ομοιότητας εντός της ομάδας ανάθεσης.
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αποτελέσματα - Γλωσσικό Μοντέλο (2/2)
Αριθμός Ομάδων (Κ)
Ακρίβεια 500 2 500 5 000 7 500 10 000 12 500 15 000 17 500 20 000
acc(1km) 4.45 5.87 6.53 7.03 8.55 10.33 11.41 11.89 14.83
acc(10km) 10.07 13.54 17.97 22.74 25.91 30.12 32.86 33.59 35.28
acc(100km) 15.07 22.18 27.66 32.49 38.15 40.45 42.97 43.03 44.60
acc(500km) 29.80 37.05 44.46 48.21 50.54 52.43 51.86 50.66 49.11
acc(1000km) 37.56 44.84 49.62 52.79 55.11 56.11 55.06 52.80 51.10
acc(5000km) 55.71 62.64 68.53 67.12 66.05 65.29 62.90 59.91 57.56
acc(10000km) 85.68 86.67 90.31 87.11 86.38 86.41 85.23 83.64 81.38
500 2500 5000 7500 10000 12500 15000 17500 20000
10
100
1.000
10.000
Αριθμός Ομάδων
ΜέσοΣφάλμαΑπόστασης(km)
1 tag 2 tags 3 tags 4 tags 5 tags [6,10] tags [11,75] tags
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αποτελέσματα - MediaEval 2013 (1/3)
• N = 8.539.050 και Τ =262.000 εικόνες
• Κ = 5.000
• Μετά το φιλτράρισμα απέμειναν Ν = 7.266.903
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αποτελέσματα - MediaEval 2013 (2/3)
Ακρίβεια tmax vnn tmean vclust hyb
acc(1km) 10.26 0.60 7.82 0.76 10.37
acc(10km) 23.53 0.99 19.86 1.16 23.70
acc(100km) 36.22 1.86 31.99 2.04 36.28
acc(500km) 47.20 6.49 43.31 6.64 47.36
acc(1000km) 53.12 13.43 49.74 13.50 53.27
acc(5000km) 70.28 38.15 68.61 38.40 68.61
acc(10000km) 91.57 81.67 90.81 81.68 90.79
median error 651 6715 1028 6692 681
0 1 2 3 4 5 [6,10] [11,75]
10
100
1.000
10.000
Αριθμός Tags
ΜέσοΣφάλμαΑπόστασης(km)
tmax
tmean
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Αποτελέσματα - MediaEval 2013 (2/3)
Αριθμός Ομάδων (Κ)
Ακρίβεια 5 000 10 000 15 000 20 000
acc(1km) 3.29 5.75 9.01 9.84
acc(10km) 12.30 17.23 20.32 21.10
acc(100km) 21.15 26.47 28.03 27.65
acc(500km) 33.86 37.86 34.29 31.60
acc(1000km) 41.57 41.81 37.50 34.02
acc(5000km) 56.41 55.58 51.25 46.65
acc(10000km) 85.91 85.55 83.46 81.17
Ονομασία Ομάδας
Ακρίβεια ΑΠΘ -
CERTH
DUoT UoS SCUoT CEA -
LIST
VIT RECOD
acc(1km) 10.26 2.80 23.15 20.70 26.00 0.74 20.14
acc(10km) 23.53 3.70 37.70 43.00 43.00 3.90 37.60
acc(100km) 36.22 4.70 43.82 55.30 50.00 15.24 47.66
acc(500km) 47.20 9.20 51.20 62.80 - 26.30 56.62
acc(1000km) 53.12 15.90 56.71 66.30 63.00 30.14 63.17
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
Μελλοντική Εργασία
• Όσον αφορά στην ανάλυση των μετα-δεδομένων μπορεί να
γίνει πειραματισμός για τα παρακάτω μεγέθη:
– # περιοχών K
– # των topics και των λέξεων/topics για τους τοπικούς και
του καθολικού LDAs
– Όριο εντροπίας
• Χρησιμοποιηθούν διαφορετικές μέθοδοι για την εύρεση των
κοντινότερων γειτόνων στην οπτική ανάλυση
• Αξιοποίηση περισσότερων μετα-δεδομένων, όπως η
ταυτότητα του χρήστη και η ανάλυση της εικόνας
• Χρήση γεωγραφικών λεξικών (gazetteers) και πληροφοριών
από το Internet
Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ
The end
Ευχαριστώ για την προσοχή σας!
1 of 32

Recommended

PurpleSpace_purplestories by
PurpleSpace_purplestoriesPurpleSpace_purplestories
PurpleSpace_purplestoriesFiona Anderson
67 views17 slides
Art Work1 by
Art Work1Art Work1
Art Work1tarif71
64 views6 slides
Prakash Resume by
Prakash ResumePrakash Resume
Prakash ResumeOmprakashyadav Hariprakashyadav
126 views7 slides
147 by
147147
147olenaterekha
34 views10 slides
Κατσαβέλη Γιώτα by
Κατσαβέλη ΓιώταΚατσαβέλη Γιώτα
Κατσαβέλη ΓιώταMaria Katsaveli
742 views12 slides
helen by
helenhelen
helenolenaterekha
41 views11 slides

More Related Content

Similar to Γεώργιος Κορδοπάτης-Ζήλος

Nikolaos Oikonomou by
Nikolaos OikonomouNikolaos Oikonomou
Nikolaos OikonomouISSEL
208 views35 slides
Stelios poulakakis daktylidis diploma thesis presentation by
Stelios poulakakis daktylidis diploma thesis presentationStelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentationISSEL
237 views30 slides
Περδικίδης Μιχάλης 7594 by
Περδικίδης Μιχάλης 7594Περδικίδης Μιχάλης 7594
Περδικίδης Μιχάλης 7594ISSEL
210 views16 slides
Νικόλαος Κατιρτζής 7185 by
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185ISSEL
134 views33 slides
Melpomeni Seraki Diploma Thesis Presentation by
Melpomeni Seraki Diploma Thesis PresentationMelpomeni Seraki Diploma Thesis Presentation
Melpomeni Seraki Diploma Thesis PresentationISSEL
69 views22 slides
Σπύρος Σκουμπάκης by
Σπύρος ΣκουμπάκηςΣπύρος Σκουμπάκης
Σπύρος ΣκουμπάκηςISSEL
181 views30 slides

Similar to Γεώργιος Κορδοπάτης-Ζήλος(20)

Nikolaos Oikonomou by ISSEL
Nikolaos OikonomouNikolaos Oikonomou
Nikolaos Oikonomou
ISSEL208 views
Stelios poulakakis daktylidis diploma thesis presentation by ISSEL
Stelios poulakakis daktylidis diploma thesis presentationStelios poulakakis daktylidis diploma thesis presentation
Stelios poulakakis daktylidis diploma thesis presentation
ISSEL237 views
Περδικίδης Μιχάλης 7594 by ISSEL
Περδικίδης Μιχάλης 7594Περδικίδης Μιχάλης 7594
Περδικίδης Μιχάλης 7594
ISSEL210 views
Νικόλαος Κατιρτζής 7185 by ISSEL
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185
ISSEL134 views
Melpomeni Seraki Diploma Thesis Presentation by ISSEL
Melpomeni Seraki Diploma Thesis PresentationMelpomeni Seraki Diploma Thesis Presentation
Melpomeni Seraki Diploma Thesis Presentation
ISSEL69 views
Σπύρος Σκουμπάκης by ISSEL
Σπύρος ΣκουμπάκηςΣπύρος Σκουμπάκης
Σπύρος Σκουμπάκης
ISSEL181 views
Content and Metadata Based Image Document Retrieval (in Greek) by Konstantinos Zagoris
Content and Metadata Based Image Document Retrieval (in Greek)Content and Metadata Based Image Document Retrieval (in Greek)
Content and Metadata Based Image Document Retrieval (in Greek)
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu... by Manos Tsardoulias
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos papathomas diploma thesis presentation by ISSEL
Evangelos papathomas diploma thesis presentationEvangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentation
ISSEL190 views
Σωτήρης Μπέης by ISSEL
Σωτήρης ΜπέηςΣωτήρης Μπέης
Σωτήρης Μπέης
ISSEL134 views
Lelis Αthanasios by ISSEL
Lelis ΑthanasiosLelis Αthanasios
Lelis Αthanasios
ISSEL226 views
Στέφανος Μπουρτζούδης by ISSEL
Στέφανος ΜπουρτζούδηςΣτέφανος Μπουρτζούδης
Στέφανος Μπουρτζούδης
ISSEL153 views
Konstantinos Koukoutegos Diploma Thesis Presentation by ISSEL
Konstantinos Koukoutegos Diploma Thesis PresentationKonstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis Presentation
ISSEL95 views
Δημιουργικός προγραμματισμός στη μουσική / Γιάννης Μυγδάνης, Μαίη Κοκκίδου by Vera Kriezi
Δημιουργικός προγραμματισμός στη μουσική / Γιάννης Μυγδάνης, Μαίη ΚοκκίδουΔημιουργικός προγραμματισμός στη μουσική / Γιάννης Μυγδάνης, Μαίη Κοκκίδου
Δημιουργικός προγραμματισμός στη μουσική / Γιάννης Μυγδάνης, Μαίη Κοκκίδου
Vera Kriezi231 views
μαθηματικα(παρεμβαση) by elenpap
μαθηματικα(παρεμβαση)μαθηματικα(παρεμβαση)
μαθηματικα(παρεμβαση)
elenpap324 views
μαθηματικα(παρεμβαση) by elenpap
μαθηματικα(παρεμβαση)μαθηματικα(παρεμβαση)
μαθηματικα(παρεμβαση)
elenpap313 views
Tέταρτη Διδακτική Παρέμβαση by elenpap
Tέταρτη Διδακτική ΠαρέμβασηTέταρτη Διδακτική Παρέμβαση
Tέταρτη Διδακτική Παρέμβαση
elenpap375 views
A by elenpap
AA
A
elenpap168 views

More from ISSEL

Camera-based localization of annotated objects in indoor environments by
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
12 views38 slides
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
6 views38 slides
Design and implementation of an automation mechanism to automatically develop... by
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
4 views17 slides
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ISSEL
6 views17 slides
Static Analysis of Python code and Identification of Potential Security Vulne... by
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...ISSEL
7 views16 slides
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...ISSEL
26 views27 slides

More from ISSEL(20)

Camera-based localization of annotated objects in indoor environments by ISSEL
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL12 views
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by ISSEL
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL6 views
Design and implementation of an automation mechanism to automatically develop... by ISSEL
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
ISSEL4 views
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by ISSEL
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ISSEL6 views
Static Analysis of Python code and Identification of Potential Security Vulne... by ISSEL
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
ISSEL7 views
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by ISSEL
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
ISSEL26 views
Design and Development of an Authorization and Access Control Mechanism for C... by ISSEL
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...
ISSEL13 views
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο... by ISSEL
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
ISSEL19 views
Analysis and profiling of developer profiles using data mining techniques fro... by ISSEL
Analysis and profiling of developer profiles using data mining techniques fro...Analysis and profiling of developer profiles using data mining techniques fro...
Analysis and profiling of developer profiles using data mining techniques fro...
ISSEL3 views
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση... by ISSEL
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
ISSEL8 views
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM by ISSEL
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEMTOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
ISSEL3 views
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ... by ISSEL
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ISSEL11 views
System Development for Prediction of Static Analysis Metrics of Source Code by ISSEL
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
ISSEL6 views
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ... by ISSEL
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
ISSEL11 views
Micro Front-ends and Microservices Architecture in Web Application Development by ISSEL
Micro Front-ends and Microservices Architecture in Web Application DevelopmentMicro Front-ends and Microservices Architecture in Web Application Development
Micro Front-ends and Microservices Architecture in Web Application Development
ISSEL8 views
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ... by ISSEL
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
ISSEL19 views
Indoor localization using wireless networks by ISSEL
Indoor localization using wireless networksIndoor localization using wireless networks
Indoor localization using wireless networks
ISSEL5 views
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων by ISSEL
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύωνΕντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
ISSEL10 views
Design and implementation of a big data architecture for storage, real-time p... by ISSEL
Design and implementation of a big data architecture for storage, real-time p...Design and implementation of a big data architecture for storage, real-time p...
Design and implementation of a big data architecture for storage, real-time p...
ISSEL9 views
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ... by ISSEL
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
ISSEL16 views

Γεώργιος Κορδοπάτης-Ζήλος

  • 1. ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Αυτόματος Εντοπισμός Γεωγραφικής Θέσης εικόνων και βίντεο Διπλωματική εργασία του Κορδοπάτη-Ζήλου Γεώργιου ΑΕΜ: 6673 υπό την επίβλεψη των κ. Ανδρέα Λ. Συμεωνίδη Επίκουρος Καθηγητής - ΑΠΘ κ. Συμεών Παπαδόπουλο Ερευνητής - ΙΠΤΗΛ ΕΚΕΤΑ
  • 2. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Δομή της Παρουσίασης  Ορισμός Προβλήματος  Σκοπός Εργασίας  Αλγόριθμος Γλωσσικού Μοντέλου  Αλγόριθμος Σημασιολογική και Οπτική Ανάλυσης  Αποτελέσματα  Μελλοντική Εργασία
  • 3. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Ορισμός Προβλήματος
  • 4. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Σκοπός Εργασίας • Δημιουργία ενός αυτόματου σύστηματος εντοπισμού γεωγραφικές θέσης των πολυμέσων Σύνολο εκπαίδευσης User Id: George Tags: dog, New York, Usa, Central park Date: 11/4/2013 [40.71, -73.97]
  • 5. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αυτόματος Εντοπισμός Θέσης με χρήση Γλωσσικών Μοντέλων • Υλοποίηση βασισμένη στη έρευνα (Van Laere et al., ICMR ‘11) • Ομαδοποίηση με χρήση του 𝑘-means, και εξαγωγή των 𝑥2 χαρακτηριστικά. • Εφαρμογή γλωσσικών μοντέλων και αναζήτηση ομοιότητας.
  • 6. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Εισαγωγή δεδομένων στον αλγόριθμο • Μορφή κειμένου 74,25981735@N00,52.470701,13.412504,street berlin bike sign perspective 460261,16884413@N08,40.626591,22.947993,white tower thessaloniki θεσσαλονίκη πύργοσ λευκόσ 1799632,9855426@N02,40.183594,116.556015,china beijing peking thegreatwall pekín 2870482,96661011@N00,30.2569,-87.63603,beach sunrise gulf alabama shores αύξοντας αριθμός όνομα χρήστη γεωγραφικό μήκος γεωγραφικό πλάτος tags • Δημιουργία Ν αντικειμένων 𝛪𝑖 = 𝑑𝑖, 𝑢𝑖, 𝑐𝑖 , 𝑡𝑖 , 𝑎𝑖 d ← ταυτότητα εικόνας u ← όνομα χρήστη c ← συντεταγμένες t ← tags • Παραδείγματα εγγραφών
  • 7. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Ομαδοποίηση των εικόνων • Ομαδοποίηση με τον αλγόριθμο 𝑘-means • Δημιουργία K ομάδων (clusters), βάση των γεωγραφικών τους συντεταγμένων 𝑐 K = 5 K = 100
  • 8. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Υπολογισμός x2 χαρακτηριστικού • Για κάθε ομάδα υπολογίζεται το x2 χαρακτηριστικό μέγεθος των tags των εικόνων της 𝑥2 𝑎, 𝑡 = 𝑂𝑡𝑎−𝐸𝑡𝑎 2 𝐸𝑡𝑎 + 𝑂 𝑡 𝑎−𝐸 𝑡 𝑎 2 𝐸 𝑡 𝑎 + 𝑂 𝑡𝑎−𝐸 𝑡𝑎 2 𝐸 𝑡𝑎 + 𝑂 𝑡 𝑎−𝐸 𝑡 𝑎 2 𝐸 𝑡 𝑎 • 𝑂𝑦𝑥: ο αριθμός των εικόνων της περιοχής x που εμφανίζεται το y tag • 𝐸 𝑦𝑥: ο εκτιμώμενος αριθμός εμφανίσεων του tag y στην περιοχή x. 𝐸 𝑦𝑥 = 𝛮 · 𝑃(𝑦) · 𝑃(𝑥)
  • 9. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Δημιουργία Περιοχών • Επιλογή m πρώτων λέξεων που σχηματίζουν το λεξιλόγιο v κάθε ομάδας • Δημιουργία Κ αντικειμένων 𝐴𝑗 = 𝑎𝑗, 𝑤𝑗 , 𝑣𝑗 a ← ταυτότητα cluster w ← εικόνες του cluster v ← λεξιλόγιο ομάδας • Παραδείγματα περιοχών CLUSTER ID VOCABULARY 1 india singapore thailand malaysia asia 3 england london uk spain france 5 japan china tokyo taiwan philippines 7 greece turkey istanbul egypt moscow 10 brasil brazil argentina chile buenosaires
  • 10. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Γλωσσικό Μοντέλο (1/2) • Ανάθεση των εικόνων του συνόλου ελέγχου στις περιοχές βάση του τύπου: 𝑃 𝑎 𝑥 ∝ 𝑃 𝑎 · 𝑡∈𝑥 𝑃 𝑡 𝑎 • Ο υπολογισμός των πιθανοφανειών P(t|a) δίνεται από τον τύπο 𝑃 𝑡 𝑎 = 𝑂𝑡𝑎 + 𝜇 · 𝛼′∈𝛢 𝑂 𝑡𝛼′ 𝛼′∈𝛢 𝑡′∈𝑉 𝑂 𝑡′ 𝛼′ 𝑡′∈𝑉 𝑂 𝑡′ 𝑎 + 𝜇
  • 11. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Γλωσσικό Μοντέλο (2/2) • Τελική ανάθεση στην ομάδα όπου: 𝑎 𝑥 = 𝑎𝑟𝑔 𝑎∈𝐴 𝑚𝑎𝑥 𝑃 𝑎 · 𝑡∈𝑥 𝑃 𝑡 𝑎 • Ως εκτιμώμενη θέση η: 𝑚𝑒𝑎𝑛(𝑎) = 𝑎𝑟𝑔 𝑥∈𝑎 𝑚𝑖𝑛 𝑦∈𝑎 𝑑(𝑥, 𝑦)
  • 12. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αναζήτηση Ομοιότητας • Υπολογισμός ομοιότητας Jaccard: 𝑠𝑗𝑎𝑐𝑐 𝑥, 𝑦 = 𝑥 ∩ 𝑦 𝑥 ∪ 𝑦 • Κέντρο βαρύτητας (center-of-gravity) των k πιο όμοιων εικόνων: 𝑙𝑜𝑐 𝑥 = 1 𝑘 𝑖=1 𝑘 𝑠𝑖𝑚 𝑥, 𝑦𝑖 𝑎 · 𝑙𝑜𝑐 𝑦𝑖
  • 13. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Σημασιολογική και Οπτική Ανάλυση για τον Εντοπισμό Θέσης • Σημασιολογική ανάλυση (text-based analysis) – Υλοποιήθηκε με βάση τον αλγόριθμο γλωσσικού μοντέλου και χρησιμοποιεί τον γεννητικού θεματικού αλγορίθμου LDA δυο επιπέδων. • Οπτική ανάλυση (visual-based analysis) – Εξαγωγή των SURF+VLAD χαρακτηριστικά των εικόνων και χρήση τεχνικών κοντινότερου γείτονα για τον υπολογισμό της εκτιμώμενης θέση. • Υβριδική Υλοποίηση (Hybrid Approach) – μίξη των δύο τεχνικών
  • 14. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Latent Dirichlet Allocation - LDA (1/2) • Γεννητικό πιθανοκρατικό μοντέλο ενός σώματος κειμένου (corpus) • Βασική Αρχή – τα έγγραφα αναπαρίστανται ως τυχαία μείγματα από λανθάνοντα θέματα, όπου κάθε θέμα χαρακτηρίζεται από μια κατανομή σε ένα λεξιλόγιο • Χρήσιμοι όροι: – «λέξη» : βασική μονάδα διακεκριμένων δεδομένων αντικείμενο ενός λεξιλογίου, 𝑤 – «έγγραφο»: ακολουθία από N λέξεις, 𝒘 =(𝑤1, 𝑤2, … , 𝑤 𝛮) – «σώμα» : είναι μια συλλογή M εγγράφων, D= 𝒘1, 𝒘2, … , 𝒘 𝛭
  • 15. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Latent Dirichlet Allocation - LDA (2/2) • Βιβλιοθήκη JGibbLDA [M] [document-1] [document-2] ... [document-M] Είσοδος Πλήθος θεμάτων 𝑁𝐿 Παράμετρος 𝜶 𝑎 𝐿 Παράμετρος 𝜷 𝛽𝐿 Πλήθος λέξεων/θέμα 𝑊𝐿 𝑝(𝑤𝑖|𝑡𝑜𝑝𝑖𝑐𝑗) 𝛷𝑖𝑗 𝑝(𝑡𝑜𝑝𝑖𝑐𝑗|𝑑𝑜𝑐𝑢𝑚𝑒𝑛𝑡 𝑑) 𝛩𝑗𝑑 Λέξεις 𝑡𝑜𝑝𝑖c 𝑇 Αντιστοιχία λέξεων με δείκτες (words – word indices) 𝑀 Έξοδοι Παράμετροι
  • 16. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Σημασιολογική Ανάλυση • Απομάκρυνση των machine tags (π.χ. “geo:lat=… ”) • Οριστική διαγραφή κενών εικόνων Training Prediction Spatial Clustering & local LDAs Filtering Global LDA & BoEW Σημασιολογική Ανάλυση - Εκπαίδευση 1ο βήμα • περιορισμός θορύβου • πιο πλούσιες σε πληροφορία περιοχές Assignment in Areas Similarity Search
  • 17. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ • Σχηματισμός περιοχών με εφαρμογή του 𝑘-means, συνολικού αριθμού Κ • Τοπικά θεματικά μοντέλα δημιουργούνται για τις εικόνες κάθε περιοχής με χρήση LDA (100/20) • Σχηματισμός αντικειμένων 𝐴𝑗 = 𝑎𝑗, 𝑤𝑗 , 𝜏𝑗 Training Prediction Filtering Global LDA & BoEW Spatial Clustering & local LDAs Σημασιολογική Ανάλυση - Εκπαίδευση 2ο βήμα Assignment in Areas Similarity Search
  • 18. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ • Εξαγωγή καθολικού θεματικού μοντέλου με χρήση LDA (500/50) σε ολόκληρο το σύνολο εκπαίδευσης • Δημιουργία λεξιλογίου αποκλειόμενων λέξεων (Bag-of-Excluded-Words, BoEW) Training Prediction Filtering Global LDA & BoEW Spatial Clustering & local LDAs Σημασιολογική Ανάλυση - Εκπαίδευση 3ο βήμα Assignment in Areas Similarity Search Assignment in Areas
  • 19. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Λέξεις Γενικού Ενδιαφέροντος
  • 20. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Δημιουργία BoEW (1/3) • Λίστα των “ενεργών” topics για κάθε εικόνα – Γνωρίζουμε ότι 𝑗=0 𝑁 𝐺 𝛩 𝐺,𝑗𝑑 = 1 – Όριο “ενεργοποίησης” 𝑡 𝑎 = 1 0.9∗𝑁 𝐺 • Ιστογράμματος συχνότητας εμφάνισης των topics μέσα στις περιοχές
  • 21. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Δημιουργία BoEW (2/3) • Λίστα των ανενεργών topic Ε με βάση την εντροπία τους – Υπολογισμός εντροπίας κάθε topic 𝐸 𝛸 = − 𝑖=0 𝑛 𝑝 𝑥𝑖 ∗ log(𝑝 𝑥𝑖 ) – Εμπειρικά ορίστηκε όριο 𝑡 𝑒=180 ΕΝΤΡΟΠΙΑ ΙΣΧΥΡΟΤΕΡΑ TAGS 409.84 sky clouds sunset blue sun 195.98 bike bicycle cycling race road 149.74 london uk england londres kingdom 68.35 greece athens ελλάδα hellas thessaloniki 65.46 barcelona spain catalunya españa cataluña
  • 22. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Δημιουργία BoEW (3/3) • Δημιουργία λεξιλογίου αποκλειόμενων λέξεων – Κριτήριο εισαγωγής ενός tag στη BoEW: max ← arg 𝑚𝑎𝑥𝑗 𝛷 𝐺,𝑖𝑗 ∈ 𝛦 – Η λέξη που καταχωρείται στο λεξιλογίου αποκλειόμενων λέξεων είναι η 𝑀 𝐺,𝑚𝑎𝑥
  • 23. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ • Φιλτράρισμα των tags που περιέχουν θόρυβο και όσων βρίσκονται στο BoEW • Υπολογισμός της Jaccard ομοιότητας μίας 𝑖 εικόνας με ένα topic 𝑗 που ανήκει σε μία περιοχή 𝑘 𝑠𝑖𝑗𝑘 = 𝑡𝑖 ∩ 𝜏𝑗𝑘 𝑡𝑖 ∪ 𝜏𝑗𝑘 Training Prediction Filtering Global LDA & BoEW Spatial Clustering & local LDAs Σημασιολογική Ανάλυση - Εκτίμηση τελικής θέσης (1/2) Assignment in Areas Similarity Search Assignment in Areas Κριτήρια ανάθεσης κάθε εικόνας του συνόλου ελέγχου στις περιοχές – Περιοχή που ανήκει το topic με την μεγαλύτερη τιμή ομοιότητας tmax : 𝑎𝑟𝑒𝑎𝑖 = arg 𝑚𝑎𝑥𝑗,𝑘 𝑠𝑖𝑗𝑘 – Περιοχή με τον μεγαλύτερο μέσο όρο (ανάμεσα στα topics) ομοιότητας tmean : 𝑎𝑟𝑒𝑎𝑖 = arg 𝑚𝑎𝑥𝑗 𝑘=0 𝑘 𝑠𝑖𝑗𝑘
  • 24. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Σημασιολογική Ανάλυση - Εκτίμηση τελικής θέσης (2/2) Training Prediction Filtering Global LDA & BoEW Spatial Clustering & local LDAs Assignment in Areas Similarity Search • Έχοντας αναθέσει κάθε εικόνες σε μια περιοχή: – 𝑘 εικόνες με τη μεγαλύτερη ομοιότητα – τελική εκτίμηση της γεωγραφικής θέσης από το κέντρο βαρύτητας (center-of-gravity)
  • 25. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Οπτική Ανάλυση • Υλοποίηση με βάση την (Spyromitros-Xioufis et al., WIAMIS ‘12) • Εξαγωγή των βελτιστοποιημένων SURF+VLAD διανυσμάτων για ολόκληρο το σύνολο εκπαίδευσης • Κατάταξή τους σε πίνακα με χρήση τεχνικών IVFADC • Αναζήτηση Product Quantization • 1η υλοποίηση - vnn: τοποθέτηση κάθε εικόνας στον πιο κοντινό οπτικά γείτονα 𝑘 = 1 • 2η υλοποίηση - vclust: εφαρμογή στοιχειώδους αλγορίθμου χωρικής ομαδοποίησης για τους 𝑘 =20 κοντινότερους γείτονες
  • 26. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αποτελέσματα - Γλωσσικό Μοντέλο (1/2) • N = 3.281.022 και Τ =10.000 εικόνες • K = {50, 500, 2.500, 5.000, 7.500, 10.000, 12.500, 15.000, 17.500, 20.000} • m = {6 400, 640, 256 , 64, 28, 16, 10, 7, 5, 4} • Language Model (LM): γλωσσικό μοντέλο με τελική εκτίμηση της γεωγραφικής θέσης το κέντρο της ομάδας που έγινε η ανάθεση. • Hybrid Approach (HA): γλωσσικό μοντέλο με τελική εκτίμηση της γεωγραφικής θέσης με τη χρήση της διαδικασίας αναζήτησης ομοιότητας εντός της ομάδας ανάθεσης.
  • 27. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αποτελέσματα - Γλωσσικό Μοντέλο (2/2) Αριθμός Ομάδων (Κ) Ακρίβεια 500 2 500 5 000 7 500 10 000 12 500 15 000 17 500 20 000 acc(1km) 4.45 5.87 6.53 7.03 8.55 10.33 11.41 11.89 14.83 acc(10km) 10.07 13.54 17.97 22.74 25.91 30.12 32.86 33.59 35.28 acc(100km) 15.07 22.18 27.66 32.49 38.15 40.45 42.97 43.03 44.60 acc(500km) 29.80 37.05 44.46 48.21 50.54 52.43 51.86 50.66 49.11 acc(1000km) 37.56 44.84 49.62 52.79 55.11 56.11 55.06 52.80 51.10 acc(5000km) 55.71 62.64 68.53 67.12 66.05 65.29 62.90 59.91 57.56 acc(10000km) 85.68 86.67 90.31 87.11 86.38 86.41 85.23 83.64 81.38 500 2500 5000 7500 10000 12500 15000 17500 20000 10 100 1.000 10.000 Αριθμός Ομάδων ΜέσοΣφάλμαΑπόστασης(km) 1 tag 2 tags 3 tags 4 tags 5 tags [6,10] tags [11,75] tags
  • 28. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αποτελέσματα - MediaEval 2013 (1/3) • N = 8.539.050 και Τ =262.000 εικόνες • Κ = 5.000 • Μετά το φιλτράρισμα απέμειναν Ν = 7.266.903
  • 29. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αποτελέσματα - MediaEval 2013 (2/3) Ακρίβεια tmax vnn tmean vclust hyb acc(1km) 10.26 0.60 7.82 0.76 10.37 acc(10km) 23.53 0.99 19.86 1.16 23.70 acc(100km) 36.22 1.86 31.99 2.04 36.28 acc(500km) 47.20 6.49 43.31 6.64 47.36 acc(1000km) 53.12 13.43 49.74 13.50 53.27 acc(5000km) 70.28 38.15 68.61 38.40 68.61 acc(10000km) 91.57 81.67 90.81 81.68 90.79 median error 651 6715 1028 6692 681 0 1 2 3 4 5 [6,10] [11,75] 10 100 1.000 10.000 Αριθμός Tags ΜέσοΣφάλμαΑπόστασης(km) tmax tmean
  • 30. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Αποτελέσματα - MediaEval 2013 (2/3) Αριθμός Ομάδων (Κ) Ακρίβεια 5 000 10 000 15 000 20 000 acc(1km) 3.29 5.75 9.01 9.84 acc(10km) 12.30 17.23 20.32 21.10 acc(100km) 21.15 26.47 28.03 27.65 acc(500km) 33.86 37.86 34.29 31.60 acc(1000km) 41.57 41.81 37.50 34.02 acc(5000km) 56.41 55.58 51.25 46.65 acc(10000km) 85.91 85.55 83.46 81.17 Ονομασία Ομάδας Ακρίβεια ΑΠΘ - CERTH DUoT UoS SCUoT CEA - LIST VIT RECOD acc(1km) 10.26 2.80 23.15 20.70 26.00 0.74 20.14 acc(10km) 23.53 3.70 37.70 43.00 43.00 3.90 37.60 acc(100km) 36.22 4.70 43.82 55.30 50.00 15.24 47.66 acc(500km) 47.20 9.20 51.20 62.80 - 26.30 56.62 acc(1000km) 53.12 15.90 56.71 66.30 63.00 30.14 63.17
  • 31. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ Μελλοντική Εργασία • Όσον αφορά στην ανάλυση των μετα-δεδομένων μπορεί να γίνει πειραματισμός για τα παρακάτω μεγέθη: – # περιοχών K – # των topics και των λέξεων/topics για τους τοπικούς και του καθολικού LDAs – Όριο εντροπίας • Χρησιμοποιηθούν διαφορετικές μέθοδοι για την εύρεση των κοντινότερων γειτόνων στην οπτική ανάλυση • Αξιοποίηση περισσότερων μετα-δεδομένων, όπως η ταυτότητα του χρήστη και η ανάλυση της εικόνας • Χρήση γεωγραφικών λεξικών (gazetteers) και πληροφοριών από το Internet
  • 32. Κορδοπάτης-Ζήλος Γιώργος ΤΗΜΜΥ - ΑΠΘ The end Ευχαριστώ για την προσοχή σας!