Defensa del Projecte de Final de Carrera de la Irene Gris, pels estudis de Grau en Enginyeria de Sistemes Audiovisuals a l'Escola d'Enginyeria de Terrassa (EET) de la Universitat Politècnica de Catalunya.
Més detalls: https://imatge.upc.edu/web/publications/pyxel-una-llibreria-lanotacio-automatica-de-fotografies
8. Requeriments
8
Crear un sistema complert i genéric d’anotació d’imatges
Extracció de
característiques;
visuals i textuals
Entrenament i
Detecció
Avaluació de la
qualitat de les
anotacions
automàtiques
Usuaris potencials → Estudiants universitaris
● Facilitar l’accés a llibreries externes als usuaris que s’inicien en la materia
● Proporcionar eines per obtenir el sistema complert de forma sencilla i ràpida.
Que es demana?
9. Requeriments
9
Crear un sistema complert i genéric d’anotació d’imatges
Que es demana?
Manual Annotations Model
Trainer
New Image New Annotation
Detector
Bloc: http://bitsearch.blogspot.com/search/label/classification
11. Requeriments
11
Extracció de característiques visuals
Extracció de
característiques SIFT
Generació d’un
vocabulari visual
Obtenció dels vectors de
característiques BoF
w1
w2
w3
w4
w1 w2 w3 w4
Clusterització
Paraules visuals
12. Requeriments
12
Extracció de característiques visuals
Extracció de
característiques SIFT
Generació d’un
vocabulari visual
Obtenció dels vectors de
característiques BoF
2 3 3 0
w1
w2
w3
w4
w1 w2 w3 w4
Vector de caraterístiques
13. Requeriments
13
Extracció de característiques textuals
Obtenir les metadades de
la imatge; etiquetes
Generació d’un
vocabulari textual
Obtenció dels vectors de
característiques TF-IDF
[ I, love, surf ]
Títol: “I love university concerts”
Metadades
Títol: “I love surf”
[ I, love, university, concerts ]
14. Requeriments
14
Extracció de característiques textuals
Obtenir les metadades de
la imatge; etiquetes
Generació d’un
vocabulari textual
Obtenció dels vectors de
característiques TF-IDF
TF-IDF → [ 0 , 0 , 0.3 , 0.3 , 0.3 ]
[ I , love, university, concerts, surf ]
[ university, concerts, surf, I, love ]
[ 0.3 , 0.3 , 0.3 , 0, 0 ]
Vocabulari/Diccionari → [ university, concerts, surf ]
15. Requeriments
15
Extracció de característiques textuals
Obtenir les metadades de
la imatge; etiquetes.
Generació d’un
vocabulari textual
Obtenció dels vectors de
característiques TFIDF
Vocabulari/Diccionari → [ university, concerts, surf ]
[ I, love, surf ]
[ I, love, university, concerts ] [ 1 , 1 , 0 ]
[ 0 , 0 , 1 ]
16. Requeriments
16
Mesures de qualitat
Que es demana?
docId1 Label1
docId2 Label1
docId3 Label2
docId4 Label3
.
.
.
docIdn Labeln
Avaluació F1
F1
docId1
Label1
docId2
Label4
docId3
Label2
docId4
Label3
.
.
cp = certs positius
fp = falsos positius
fn = falsos negatius
VeritatTerrenyAnotacionspredites
18. Estat de l’art
Extracció de característiques
visuals
18
NLTK
Natural
Language
ToolKit
Extracció de
característiques textuals
Reconeixement de patrons
23. Són la mateixa classe
Imatge Metadades
BofExtractor
Trainer
TFIDFExtractor
VisualVocabulary
Trainer
Model Visual Model Textual
TRAIN
TEST Imatge Metadades
BofExtractor TFIDFExtractor
DetectorDetectorVisual Model Textual Model
PredictedAnnotation PredictedAnnotation
TextualVocabulary
Evaluator
=
Evaluator
EntrenamentDisseny
23
25. Són la mateixa classe
Imatge Metadades
BofExtractor
Trainer
TFIDFExtractor
VisualVocabulary
Trainer
Visual Model Textual Model
TRAIN
TEST Imatge Metadades
BofExtractor TFIDFExtractor
DetectorDetectorVisual Model Textual Model
PredictedAnnotation PredictedAnnotation
TextualVocabulary
Evaluator Evaluator
DeteccióDisseny
25
27. Són la mateixa classe
Són la mateixa classe
Són la mateixa classe
Imatge Metadades
BofExtractor
Trainer
TFIDFExtractor
VisualVocabulary
Trainer
Visual Model Textual Model
TRAIN
TEST Imatge Metadades
BofExtractor TFIDFExtractor
DetectorDetectorVisual Model Textual Model
PredictedAnnotation PredictedAnnotation
TextualVocabulary
Evaluator Evaluator
Disseny
27
33. Avaluació i resultats
Detecció de productes de
supermercat en vídeos
egocèntrics
33
Sergi Imedio, “An investigation of eye gaze tracking utilities in image object recognition”. Dublin City University 2014.
35. Avaluació i resultats
Detecció d’esdeveniments en
fotografies d’Instagram
35
Els estudiants de GDSA han utilitzat Pyxel per fer un clasificador d’
imatges de tipus d’esdeveniments.
37. Conclusions
37
Objectius del projecte
Sistema complert d’anotacions d’imatges
● Extracció de característiques
● Anotació
● Avaluació
Utilització d’altres usuaris
● Han aconseguit dur a terme el que se'ls demanava utilitzant Pyxel
● Han extès la llibreria per ajustar-la a les eines amb les que han volgut fer el
processat
39. Conclusions
39
Participació al MediaEval2014
Manchon-Vizuete, D., Gris-Sarabia, I., Giro-i-Nieto, G. “UPC at MediaEval 2014 Social Event Detection Task”. Working Notes Proceedings of the MediaEval 2014
Workshop, Barcelona, Catalunya, Spain, October 16-17, 2014, CEUR-WS.org, online ceur-ws.org/Vol-1263/mediaeval2014_submission_58.pdf