In the bottom line, the present thesis presents solutions to real problems of the content-based image retrieval systems as image segmentation, text localization, relevance feedback algorithms and shape/word descriptors. All the proposed methods can be combined in order to create a fast and modern MPEG-7 compatible content-based retrieval image system.
The document proposes a new technique for automatic image annotation and retrieval using the Joint Composite Descriptor (JCD). It utilizes two sets of keywords - colors and words - to allow users to naturally specify queries. The JCD fusion combines the Color and Edge Directivity Descriptor (CEDD) and Fuzzy Color and Texture Histogram (FCTH) to compactly represent images. Color and Portrait Similarity Grades are calculated from the JCD to measure keyword similarity. Support Vector Machines further determine portrait similarity. The technique was implemented in an image retrieval web application and evaluated on databases, demonstrating effectiveness in retrieving results consistent with human perception.
Comparative Performance Evaluation of Image Descriptors Over IEEE 802.11b Noi...Konstantinos Zagoris
We evaluate the image retrieval
procedure over an IEEE 802.11b Ad Hoc network, operating
in 2.4GHz, using IEEE Distributed Coordination Function
CSMA/CA as the multiple access scheme. IEEE 802.11 is a
widely used network standard, implemented and supported
by a variety of devices, such as desktops, laptops, notebooks,
mobile phones etc., capable of providing a variety of different
services, such as file transfer, internet access et.al. Therefore,
we consider IEEE 802.11b being a suitable technology to
investigate the case of conducting image retrieval over a
wireless noisy channel. The model we use to simulate the noisy
environment is based on the scenario in which the wireless
network is located in an outdoor noisy environment, or in
an indoor environment of partial LOS - Line-of-sight power.
We used a large number of descriptors reported in literature
in order to evaluate which one has the best performance in
terms of Mean Average Precision - MAP values under those
circumstances. Experimental results on known benchmarking
database show that the majority of the descriptors appear to
have decreased performance when transferred and used in such
noisy environments.
Mammography is currently the dominant imaging modality for the early detection of breast cancer. However, its robustness in distinguishing malignancy is relatively low, resulting in a large number of unnecessary biopsies. A computer-aided diagnosis (CAD) scheme, capable of visually justifying its results, is expected to aid the decision made by radiologists. Content-based image retrieval (CBIR) accounts for a promising paradigm in this direction. Facing this challenge, we introduce a CBIR scheme that utilizes the extracted features as input to a support vector machine (SVM) ensemble. The final features used for CBIR comprise the participation value of each SVM. The retrieval performance of the proposed scheme has been evaluated quantitatively on the basis of the standard measures. In the experiments, a set of 90 mammograms is used, derived from a widely adopted digital database for screening mammography. The experimental results show the improved performance of the proposed scheme.
This document describes MMRetrieval.net, a multimodal search engine that allows retrieval of information from multiple modalities including text and images. It discusses challenges in multimodal retrieval like defining modality, fusing scores across modalities, and improving efficiency through two-stage retrieval. MMRetrieval.net was developed by researchers at DUTH to participate in the ImageCLEF 2010 Wikipedia retrieval task, where it achieved the second best performance overall by combining text and visual features through various fusion techniques. The system demonstrates the promise of multimodal search but also identifies open challenges around modality definitions, fusion methods, and scaling to large databases.
A system was developed able to retrieve specific documents from a document collection. In this system the query is given in text by the user and then transformed into image. Appropriate features were in order to capture the general shape of the query, and ignore details due to noise or different fonts. In order to demonstrate the effectiveness of our system, we used a collection of noisy documents and we compared our results with those of a commercial OCR package.
Handwritten and Machine Printed Text Separation in Document Images using the ...Konstantinos Zagoris
In a number of types of documents, ranging from forms to archive documents and books with annotations, machine printed and handwritten text may be present in the same document image, giving rise to significant issues within a digitisation and recognition pipeline. It is therefore necessary to separate the two types of text before applying different recognition methodologies to each. In this paper, a new approach is proposed which strives towards identifying and separating handwritten from machine printed text using the Bag of Visual Words paradigm (BoVW). Initially, blocks of interest are detected in the document image. For each block, a descriptor is calculated based on the BoVW. The final characterization of the blocks as Handwritten,Machine Printed or Noise is made by a Support Vector Machine classifier. The promising performance of the proposed approach is shown by using a consistent evaluation methodology which couples meaningful measures along with a new dataset.
Color reduction using the combination of the kohonen self organized feature m...Konstantinos Zagoris
The color of the digital images is one of the most important components of the image processing research area. In many applications such as image segmentation, analysis, compression and transition, it is preferable to reduce the colors as much as possible. In this paper, a color clustering technique which is the combination of a neural network and a fuzzy algorithm is proposed. Initially, the Kohonen Self Organized Featured Map (KSOFM) is applied to the original image. Then, the KSOFM results are fed to the Gustafson-Kessel (GK) fuzzy clustering algorithm as starting values. Finally, the output classes of GK algorithm define the numbers of colors of which the image will be reduced.
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)Konstantinos Zagoris
H-KWS 2014 is the Handwritten Keyword Spotting Competition organized in conjunction with ICFHR 2014 conference. The main objective of the competition is to record current advances in keyword spotting algorithms using established performance evaluation measures frequently encountered in the information retrieval literature. The competition comprises two distinct tracks, namely, a segmentation-based and a segmentation- free track. Five (5) distinct research groups have participated in the competition with three (3) methods for the segmentation- based track and four (4) methods for the segmentation-free track. The benchmarking datasets that were used in the contest contain both historical and modern documents from multiple writers. In this paper, the contest details are reported including the evaluation measures and the performance of the submitted methods along with a short description of each method.
The document proposes a new technique for automatic image annotation and retrieval using the Joint Composite Descriptor (JCD). It utilizes two sets of keywords - colors and words - to allow users to naturally specify queries. The JCD fusion combines the Color and Edge Directivity Descriptor (CEDD) and Fuzzy Color and Texture Histogram (FCTH) to compactly represent images. Color and Portrait Similarity Grades are calculated from the JCD to measure keyword similarity. Support Vector Machines further determine portrait similarity. The technique was implemented in an image retrieval web application and evaluated on databases, demonstrating effectiveness in retrieving results consistent with human perception.
Comparative Performance Evaluation of Image Descriptors Over IEEE 802.11b Noi...Konstantinos Zagoris
We evaluate the image retrieval
procedure over an IEEE 802.11b Ad Hoc network, operating
in 2.4GHz, using IEEE Distributed Coordination Function
CSMA/CA as the multiple access scheme. IEEE 802.11 is a
widely used network standard, implemented and supported
by a variety of devices, such as desktops, laptops, notebooks,
mobile phones etc., capable of providing a variety of different
services, such as file transfer, internet access et.al. Therefore,
we consider IEEE 802.11b being a suitable technology to
investigate the case of conducting image retrieval over a
wireless noisy channel. The model we use to simulate the noisy
environment is based on the scenario in which the wireless
network is located in an outdoor noisy environment, or in
an indoor environment of partial LOS - Line-of-sight power.
We used a large number of descriptors reported in literature
in order to evaluate which one has the best performance in
terms of Mean Average Precision - MAP values under those
circumstances. Experimental results on known benchmarking
database show that the majority of the descriptors appear to
have decreased performance when transferred and used in such
noisy environments.
Mammography is currently the dominant imaging modality for the early detection of breast cancer. However, its robustness in distinguishing malignancy is relatively low, resulting in a large number of unnecessary biopsies. A computer-aided diagnosis (CAD) scheme, capable of visually justifying its results, is expected to aid the decision made by radiologists. Content-based image retrieval (CBIR) accounts for a promising paradigm in this direction. Facing this challenge, we introduce a CBIR scheme that utilizes the extracted features as input to a support vector machine (SVM) ensemble. The final features used for CBIR comprise the participation value of each SVM. The retrieval performance of the proposed scheme has been evaluated quantitatively on the basis of the standard measures. In the experiments, a set of 90 mammograms is used, derived from a widely adopted digital database for screening mammography. The experimental results show the improved performance of the proposed scheme.
This document describes MMRetrieval.net, a multimodal search engine that allows retrieval of information from multiple modalities including text and images. It discusses challenges in multimodal retrieval like defining modality, fusing scores across modalities, and improving efficiency through two-stage retrieval. MMRetrieval.net was developed by researchers at DUTH to participate in the ImageCLEF 2010 Wikipedia retrieval task, where it achieved the second best performance overall by combining text and visual features through various fusion techniques. The system demonstrates the promise of multimodal search but also identifies open challenges around modality definitions, fusion methods, and scaling to large databases.
A system was developed able to retrieve specific documents from a document collection. In this system the query is given in text by the user and then transformed into image. Appropriate features were in order to capture the general shape of the query, and ignore details due to noise or different fonts. In order to demonstrate the effectiveness of our system, we used a collection of noisy documents and we compared our results with those of a commercial OCR package.
Handwritten and Machine Printed Text Separation in Document Images using the ...Konstantinos Zagoris
In a number of types of documents, ranging from forms to archive documents and books with annotations, machine printed and handwritten text may be present in the same document image, giving rise to significant issues within a digitisation and recognition pipeline. It is therefore necessary to separate the two types of text before applying different recognition methodologies to each. In this paper, a new approach is proposed which strives towards identifying and separating handwritten from machine printed text using the Bag of Visual Words paradigm (BoVW). Initially, blocks of interest are detected in the document image. For each block, a descriptor is calculated based on the BoVW. The final characterization of the blocks as Handwritten,Machine Printed or Noise is made by a Support Vector Machine classifier. The promising performance of the proposed approach is shown by using a consistent evaluation methodology which couples meaningful measures along with a new dataset.
Color reduction using the combination of the kohonen self organized feature m...Konstantinos Zagoris
The color of the digital images is one of the most important components of the image processing research area. In many applications such as image segmentation, analysis, compression and transition, it is preferable to reduce the colors as much as possible. In this paper, a color clustering technique which is the combination of a neural network and a fuzzy algorithm is proposed. Initially, the Kohonen Self Organized Featured Map (KSOFM) is applied to the original image. Then, the KSOFM results are fed to the Gustafson-Kessel (GK) fuzzy clustering algorithm as starting values. Finally, the output classes of GK algorithm define the numbers of colors of which the image will be reduced.
ICFHR 2014 Competition on Handwritten KeyWord Spotting (H-KWS 2014)Konstantinos Zagoris
H-KWS 2014 is the Handwritten Keyword Spotting Competition organized in conjunction with ICFHR 2014 conference. The main objective of the competition is to record current advances in keyword spotting algorithms using established performance evaluation measures frequently encountered in the information retrieval literature. The competition comprises two distinct tracks, namely, a segmentation-based and a segmentation- free track. Five (5) distinct research groups have participated in the competition with three (3) methods for the segmentation- based track and four (4) methods for the segmentation-free track. The benchmarking datasets that were used in the contest contain both historical and modern documents from multiple writers. In this paper, the contest details are reported including the evaluation measures and the performance of the submitted methods along with a short description of each method.
Θεματική Μοντελοποίηση και Σύστημα Συστάσεων Απαιτήσεων Λογισμικού με χρήση Μ...ISSEL
Το στάδιο του καθορισμού απαιτήσεων αποτελεί μία από τις σημαντικότερες προκλήσεις της Μηχανικής Λογισμικού. Οι ελλιπείς ή μη ορθά καθορισμένες απαιτήσεις έχουν ως συνέπεια καθυστερήσεις και αυξημένα κόστη κατά τη διαδικασία ανάπτυξης λογισμικού. Στο πλαίσιο αυτό, ένα σημαντικό τμήμα της έρευνας στη μηχανική απαιτήσεων εστιάζεται στη δημιουργία συστάσεων απαιτήσεων με βάση προϋπάρχοντα έργα λογισμικού, καθώς και στην κατανόηση και επικύρωση απαιτήσεων. Στην παρούσα διπλωματική εργασία, παρουσιάζεται ένα σύστημα θεματικής μοντελοποίησης για την ανάλυση λειτουργικών απαιτήσεων που αφορούν έργα λογισμικού. Για τον εντοπισμό των θεμάτων εντός των απαιτήσεων, το σύστημα χρησιμοποιεί το μοντέλο BERT, το οποίο βασίζεται στην αρχιτεκτονική Transformer. Επιπλέον, κάθε συστάδα έργων υφίσταται επαναληπτικά τη διαδικασία θεματικής μοντελοποίησης, η οποία δημιουργεί εσωτερικές συστάδες εντός των αρχικών. Ως αποτέλεσμα, οι απαιτήσεις κάθε έργου αναλύονται και ομαδοποιούνται σε διακριτές συστάδες, δίνοντας έτσι τη δυνατότητα στον μηχανικό να κατανοήσει καλύτερα το έργο υπό ανάλυση και να μπορεί εύκολα να το συγκρίνει με παρόμοια έργα. Οι εσωτερικές συστάδες χρησιμοποιούνται επιπλέον για την προσαρμογή (fine-tuning) του προ-εκπαιδευμένου μοντέλου παραγωγής κειμένου BART. Συγκεκριμένα, εξάγονται ζεύγη σχετικών απαιτήσεων που χρησιμοποιούνται για την εκπαίδευση του μοντέλου, ώστε να μπορεί να προτείνει νέες απαιτήσεις με βάση τις υπάρχουσες. Συνολικά, η αξιοποίηση των σημασιολογικών πληροφοριών διαδραματίζει καθοριστικό ρόλο στην ενίσχυση της συνάφειας των παραγόμενων συστάσεων. Αξιοποιώντας τεχνικές σημασιολογικής ανάλυσης, το σύστημα αποκτά βαθύτερη κατανόηση του υποκείμενου νοήματος μέσα στο κείμενο των Aπαιτήσεων. Μετά από την αξιολόγηση της προσέγγισης σε μια συλλογή απαιτήσεων από έργα λογισμικού, προκύπτει ότι μπορεί να είναι χρήσιμη για τους μηχανικούς κατά τη διαδικασία του καθορισμού απαιτήσεων σε νέα έργα λογισμικού.
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...ISSEL
Η ανίχνευση αντικειµένων από λίγα δείγµατα (FSOD) αποσκοπεί στην ανίχνευση αντικειµένων κλάσεων για τις οποίες υπάρχουν περιορισµένα δεδοµένα. Η προσαρµογή των σύγχρονων ανιχνευτών στο σενάριο περιορισµένων δεδοµένων παραµένει µια πρόκλη ση, καθώς τα περισσότερα µοντέλα απαιτούν τεράστιες ποσότητες δειγµάτων για να εκπαιδευτούν σωστά. Το FSOD αντιµετωπίζει αυτό το πρόβληµα µε την τεχνική ΜΕΤΑ εκπαίδευσης δύο κλάδων, κατά την οποία το µοντέλο εκπαιδεύεται επεισοδιακά. Χρησιµοποιώντας αυτή τη µέθοδο, ένα µοντέλο είναι σε θέση να ανιχνεύει νέες κατηγορίες δίχως ποτέ να έχει εκπαιδευτεί σε αυτές (meta-testing). Μια κοινή µέθοδος ανίχνευσης είναι η δηµιουργία προτύπων κατηγοριών από ένα σύνολο εικόνων υποστήριξης σε κάθε επεισόδιο και η εκµάθηση του τρόπου αντιστοίχησης αυτών µε κάθε εικόνα ερώτησης. Ωστόσο, οι περισσότερες προσεγγίσεις δηµιουργούν αυτά τα πρότυπα µεµονωµένα, χωϱίς να λαµβάνουν υπόψη όλες τις άλλες κλάσεις και τις συσχετίσεις τους, οι οποίες θα µπορούσαν να προσφέρουν κρίσιµη πληροφορία και να εµπλουτίσουν σηµαντικά κάθε ένα από αυτά. Στην παρούσα εργασία, προσπαθούµε να ενσωµατώσουµε αυτές τις συσχετίσεις σε ένα σύγχρονο µοντέλο χρησιµοποιώντας ένα γράφηµα προτύπων. Μέσω της αποτελεσµατικής µεταβίβασης µηνυµάτων µεταξύ όλων των κόµβων, κάθε πρότυπο εµπλουτίζεται από τους πιο παρόµοιους γείτονές του, γεγονός που µπορεί να αντισταθµίσει την περίπτωση των θορυβωδών προτύπων και να βελτιώσει την ακρίβεια ανίχνευσης νέων κλάσεων. Τα πειραµατικά αποτελέσµατα δείχνουν ότι οι προτεινόµενες µέθοδοι βελτιώνουν σηµαντικά την ακρίβεια ανίχνευσης meta-testing του βασικού µοντέλου στο PASCAL VOC σετ δεδοµένων, υπό διαφορετικό αριθµό δειγµάτων (shots) και µετρικών.
Theofilos Georgiadis: Library recommendation system for the reuse of software...Manos Tsardoulias
This system helps developers when searching for python libraries. The developer constructs the query in natural language and the system returns the 10 most relevant libraries. It is based on a graph, its nodes are constructed by keywords and libraries that was extracted from a set of open source projects. For every keyword that is present with a library we connect the two nodes with an edge. For every time that a keyword is present with a library, the weight of the edge is increased by one. Using this graph we extract representations of the graph's nodes. Lastly using these representations and a method for calculating the similarity, we calculate the similarity of each library with each keyword and we extract a recommendation for the 10 libraries with the highest value of similarity.
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...ISSEL
Το διευρυµένο τοπίο του λογισµικού ανοιχτού κώδικα OSS αποδεικνύει την αυξανόµενη παραγωγική δραστηριότητα των µηχανικών λογισµικού που συνεισφέρουν σε πολλαπλές πλατφόρµες και διάφορα έργα λογισµικού. Η συµµετοχή τους σε αυτά τα έργα αναδεικνύει το ευρύ ϕάσµα των δεξιοτήτων τους, από τη συγγραφή κώδικα έως τη συνεργασία τους µε άλλους µηχανικούς λογισµικού. Καθώς στο οικοσύστηµα του λογισµικού ανοιχτού κώδικα υπάρχει µια διαρκής και συνεχώς αυξανόµενη δραστηριότητα, είναι πολύ σηµαντική µια πιο ολοκληρωµένη κατανόηση των συνεισφορών και των δεξιοτήτων των µηχανικών λογισµικού. Σκοπός της παρούσας διπλωµατικής είναι να αξιοποιήσει δεδοµένα από την υποδοµή World of Code (WoC) που περιέχει συγκεντρωµένα δεδοµένα από τα περισσότερα δη µόσια συστήµατα ελέγχου εκδόσεων για να παρέχει µια πιο ολοκληρωµένη εικόνα του προφίλ ενός µηχανικού λογισµικού. Εξάγοντας, αναλύοντας και οπτικοποιώντας αυτά τα δεδοµένα, αναπτύχθηκε µια εφαρµογή που παρουσιάζει µια περιεκτική επισκόπηση των δραστηριοτήτων ενός µηχανικού στα έργα λογισµικού ανοικτού κώδικα. Η οπτική αναπαράσταση των δεδοµένων, µετατρέπει πολύπλοκα σύνολα δεδοµένων σε εύκολα κατανοητές γραφικές µορφές. Η αξιολόγηση της εφαρµογής σε ένα σύνολο µηχανικών λογισµικού δείχνει ότι πετυχαίνει τους στόχους της. Προσφέρει µια εικόνα της δραστηριότητας, του ϱόλου και των τεχνικών δεξιοτήτων ενός µηχανικού, ενισχύοντας τη διαφάνεια και την κατανόηση της συνεισφοράς του στο οικοσύστηµα του OSS.
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Manos Tsardoulias
Nowadays, software source code is mainly stored in software repositories and programming content websites. However, searching for code is troublesome, and, usually software engineers are forced to use conventional search engines which do not evaluate the usefulness of the results. The overall process proves to be highly time consuming and inefficient. To face these issues, software developers prefer recommendation systems that target query analysis and return relevant code examples. That undertaking, though, turned out to be extremely difficult due to syntactical differences between natural language and source code. Many of those systems present weaknesses regarding the form of the input queries (e.g. they do not receive input in natural language) and the quality and performance of their results. In addition, most of these systems utilize simplistic architectures and, as a result, do not capitalize the query and code semantics. A close analysis of the aforementioned problems resulted in the design and implementation of CODEtransformer, a system that improves upon the flaws of many code recommendation systems. Our system ensures data quality by mining code examples from popular GitHub repositories. These data are subject to preprocessing in order to maximize the extracted information. Afterwards, we train a state-of-the-art Neural Network which has the ability to accept natural language as input and perform semantic analysis on the code examples. We, then, construct a vector space consisting of code examples that ensures the best possible temporal response of each search. Ultimately, our system is not only evaluated by its performance compared to similar systems, but also through natural language queries, which are derived from Stack Overflow.
Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής ΝοημοσύνηςISSEL
To image inpainting είναι η διαδικασία επιδιόρθωσης μιας αλλοιωμένης ή/και κατεστραμμένης περιοχής σε μια εικόνα από την οποία απουσιάζει μέρος νοηματικής πληροφορίας και κατά συνέπεια παρουσιάζεται έλλειψη νοηματικής συνέχειας. Σχεδιάστηκε αρχικά με σκοπό την αποτελεσματική επιδιόρθωση κατ εστραμμένων περιοχών σε εικόνες. Γρήγορα, όμως, χρησιμοποιήθηκε με σκοπό την πλαστογράφηση και την παραπλάνηση. Τα τελευταία χρόνια, οι μέθοδοι που εφαρμόζουν inpainting σε εικόνες χρησι μοποιώντας μοντέλα τεχνητής νοημοσύνης, πετυχαίνουν όλο και ποιοτικότερα αποτελέσματα παρά γοντας εικόνες όπου η αλλοίωση τους, σε ορισμένες περιπτώσεις, είναι αδύνατον να εντοπιστεί με το ανθρώπινο μάτι. Κρίνεται αναγκαία λοιπόν η δημιουργία ενός μηχανισμού, που θα εντοπίζει αυτές ακριβώς τις αλλοιώσεις. Για το λόγο αυτό, η παρούσα διπλωματική εργασία εστιάζει στη μελέτη των μεθόδων εντοπισμού του inpainting σε εικόνες, αλλά και στην υλοποίηση ενός δικτύου τεχνητής νοημοσύνης ικανού να ανιχνεύει τις περιοχές όπου μια εικόνα έχει αλλοιωθεί μέσω inpainting. Εκ παιδεύτηκαν και έλεγχθηκαν συνολικά οχτώ δίκτυα, βασισμένα σε δύο αρχιτεκτονικές συνελικτικών νευρωνικών δικτύων, προτεινόμενες από σχετική βιβλιογραφία. Η εκπαίδευση πραγματοποιήθηκε με δύο διαφορετικά σύνολα ρυθμίσεων, για 10 και 50 εποχές αντίστοιχα και ως συνάρτηση κόστους χρησι μοποιήθηκε η Binary Cross Entropy (BCE). Επίσης, μελετήθηκε το κατά πόσο η χρήση ενός συνόλου δεδομένων αποτελούμενο από εικόνες που έχουν υποστεί inpainting σε σημασιολογικές περιοχές, βο ηθάει περισσότερο από ένα αντίστοιχο με εικόνες που έχουν υποστεί inpainting σε τυχαίες περιοχές στη διαδικασία του εντοπισμού του. Για το λόγο αυτό, δημιουργήθηκαν δύο σύνολα εκπαίδευσης (train set) από τα οποία το πρώτο αποτελείται από εικόνες με τυχαίες μάσκες inpainting, ενώ το δεύτερο απο εικόνες με μάσκες σημασιολογικής μορφής. Ο έλεγχος έγινε με τη χρήση ενός συνόλου ελέγχου (test set) αποτελούμενο και από τις 2 μορφές μασκών για να δοθεί μια αντικειμενική ερμηνεία των αποτε λεσμάτων. Σε κάθε ένα από τα εκπαιδευμένα δίκτυα, δόθηκε ως είσοδος μία έγχρωμη RGB είκονα I με σκοπό να παράξει στην έξοδο του την προβλεμόμενη μάσκα Mo. Τέλος, δεδομένης της πραγματικής μάσκας Mg πραγματοποιήθηκε 1-1 σύγκριση των αντίστοιχων εικονοστοιχείων και υπολογίστηκαν οι τιμές των μετρικών απόδοσης AUC και ΙοU. Αποδείχθηκε πως η εκπαίδευση με εικόνες που έχουν αλλοιωθεί σε τυχαίες περιοχές τους (τυχαίες μάσκες) οδηγεί σε καλύτερα αποτελέσματα εντοπισμού του inpainting, από ότι η εκπαίδευση με εικόνες που έχουν αλλοιωθεί σε σημασιολογικές περιοχές (αντικείμενα).
Image Inpainting Detection through Artificial Intelligence TechniquesISSEL
Image inpainting is the process of repairing an area in an image, from which a part of the semantic information is missing and consequently there is a lack of semantic continuity. Image inpainting was initially designed to effectively repair damaged areas in images. Ηowever, it was quickly used for the purpose of forgery and deception. In recent years, methods of applying image inpainting through artificial intelligence techniques came up and achieved high quality results, producing images where the presence of inpainting is almost impossible to detect with the human eye. Therefore, it is of critical importance to develop a method that will detect the affected areas in inpainted image. For this reason, the present thesis focuses on the study of image inpainting detection methods and the implementation of an artificial neural network capable of detecting areas where an image has been tampered by inpainting. A total of eight convolutional neural networks, based on two state of the art architectures, were trained and tested. The training process was based on two configurations sets (10 and 50 epochs respectively) adopting the binary cross entropy (BCE) as a loss function. Furthermore, it was also studied to what extent the use of a training dataset consisting of images that have been inpainted in semantic areas helps more than one whose images have been inpainted in random-form areas helps more in the image inpainting detection. For this reason, two training sets were created. The first one, is consisting of images with random-form inpainting masks, while the second one is consisting of images with semantic masks (objects). To evaluate the trained models, a test set consisting of both forms of masks were created in order to give an objective interpretation of the results. The aim is to train a model, capable of producing a predicted mask Mo as output, given an image I as input. Finally, the two commonly used pixel-wise metrics, IoU and AUC, were adopted to evaluate the performance. The metrics were calculated by using the ground truth Mg and the predicted mask Mo and by making a 1-1 comparison of their corresponding pixels. Τhe study proved that, models trained with a set of images that have been tampered in random areas (random masks) achieve better results comparing to models that were trained with a train set of images that have been tampered in semantic areas (semantic masks).
Θεματική Μοντελοποίηση και Σύστημα Συστάσεων Απαιτήσεων Λογισμικού με χρήση Μ...ISSEL
Το στάδιο του καθορισμού απαιτήσεων αποτελεί μία από τις σημαντικότερες προκλήσεις της Μηχανικής Λογισμικού. Οι ελλιπείς ή μη ορθά καθορισμένες απαιτήσεις έχουν ως συνέπεια καθυστερήσεις και αυξημένα κόστη κατά τη διαδικασία ανάπτυξης λογισμικού. Στο πλαίσιο αυτό, ένα σημαντικό τμήμα της έρευνας στη μηχανική απαιτήσεων εστιάζεται στη δημιουργία συστάσεων απαιτήσεων με βάση προϋπάρχοντα έργα λογισμικού, καθώς και στην κατανόηση και επικύρωση απαιτήσεων. Στην παρούσα διπλωματική εργασία, παρουσιάζεται ένα σύστημα θεματικής μοντελοποίησης για την ανάλυση λειτουργικών απαιτήσεων που αφορούν έργα λογισμικού. Για τον εντοπισμό των θεμάτων εντός των απαιτήσεων, το σύστημα χρησιμοποιεί το μοντέλο BERT, το οποίο βασίζεται στην αρχιτεκτονική Transformer. Επιπλέον, κάθε συστάδα έργων υφίσταται επαναληπτικά τη διαδικασία θεματικής μοντελοποίησης, η οποία δημιουργεί εσωτερικές συστάδες εντός των αρχικών. Ως αποτέλεσμα, οι απαιτήσεις κάθε έργου αναλύονται και ομαδοποιούνται σε διακριτές συστάδες, δίνοντας έτσι τη δυνατότητα στον μηχανικό να κατανοήσει καλύτερα το έργο υπό ανάλυση και να μπορεί εύκολα να το συγκρίνει με παρόμοια έργα. Οι εσωτερικές συστάδες χρησιμοποιούνται επιπλέον για την προσαρμογή (fine-tuning) του προ-εκπαιδευμένου μοντέλου παραγωγής κειμένου BART. Συγκεκριμένα, εξάγονται ζεύγη σχετικών απαιτήσεων που χρησιμοποιούνται για την εκπαίδευση του μοντέλου, ώστε να μπορεί να προτείνει νέες απαιτήσεις με βάση τις υπάρχουσες. Συνολικά, η αξιοποίηση των σημασιολογικών πληροφοριών διαδραματίζει καθοριστικό ρόλο στην ενίσχυση της συνάφειας των παραγόμενων συστάσεων. Αξιοποιώντας τεχνικές σημασιολογικής ανάλυσης, το σύστημα αποκτά βαθύτερη κατανόηση του υποκείμενου νοήματος μέσα στο κείμενο των Aπαιτήσεων. Μετά από την αξιολόγηση της προσέγγισης σε μια συλλογή απαιτήσεων από έργα λογισμικού, προκύπτει ότι μπορεί να είναι χρήσιμη για τους μηχανικούς κατά τη διαδικασία του καθορισμού απαιτήσεων σε νέα έργα λογισμικού.
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...ISSEL
Η ανίχνευση αντικειµένων από λίγα δείγµατα (FSOD) αποσκοπεί στην ανίχνευση αντικειµένων κλάσεων για τις οποίες υπάρχουν περιορισµένα δεδοµένα. Η προσαρµογή των σύγχρονων ανιχνευτών στο σενάριο περιορισµένων δεδοµένων παραµένει µια πρόκλη ση, καθώς τα περισσότερα µοντέλα απαιτούν τεράστιες ποσότητες δειγµάτων για να εκπαιδευτούν σωστά. Το FSOD αντιµετωπίζει αυτό το πρόβληµα µε την τεχνική ΜΕΤΑ εκπαίδευσης δύο κλάδων, κατά την οποία το µοντέλο εκπαιδεύεται επεισοδιακά. Χρησιµοποιώντας αυτή τη µέθοδο, ένα µοντέλο είναι σε θέση να ανιχνεύει νέες κατηγορίες δίχως ποτέ να έχει εκπαιδευτεί σε αυτές (meta-testing). Μια κοινή µέθοδος ανίχνευσης είναι η δηµιουργία προτύπων κατηγοριών από ένα σύνολο εικόνων υποστήριξης σε κάθε επεισόδιο και η εκµάθηση του τρόπου αντιστοίχησης αυτών µε κάθε εικόνα ερώτησης. Ωστόσο, οι περισσότερες προσεγγίσεις δηµιουργούν αυτά τα πρότυπα µεµονωµένα, χωϱίς να λαµβάνουν υπόψη όλες τις άλλες κλάσεις και τις συσχετίσεις τους, οι οποίες θα µπορούσαν να προσφέρουν κρίσιµη πληροφορία και να εµπλουτίσουν σηµαντικά κάθε ένα από αυτά. Στην παρούσα εργασία, προσπαθούµε να ενσωµατώσουµε αυτές τις συσχετίσεις σε ένα σύγχρονο µοντέλο χρησιµοποιώντας ένα γράφηµα προτύπων. Μέσω της αποτελεσµατικής µεταβίβασης µηνυµάτων µεταξύ όλων των κόµβων, κάθε πρότυπο εµπλουτίζεται από τους πιο παρόµοιους γείτονές του, γεγονός που µπορεί να αντισταθµίσει την περίπτωση των θορυβωδών προτύπων και να βελτιώσει την ακρίβεια ανίχνευσης νέων κλάσεων. Τα πειραµατικά αποτελέσµατα δείχνουν ότι οι προτεινόµενες µέθοδοι βελτιώνουν σηµαντικά την ακρίβεια ανίχνευσης meta-testing του βασικού µοντέλου στο PASCAL VOC σετ δεδοµένων, υπό διαφορετικό αριθµό δειγµάτων (shots) και µετρικών.
Theofilos Georgiadis: Library recommendation system for the reuse of software...Manos Tsardoulias
This system helps developers when searching for python libraries. The developer constructs the query in natural language and the system returns the 10 most relevant libraries. It is based on a graph, its nodes are constructed by keywords and libraries that was extracted from a set of open source projects. For every keyword that is present with a library we connect the two nodes with an edge. For every time that a keyword is present with a library, the weight of the edge is increased by one. Using this graph we extract representations of the graph's nodes. Lastly using these representations and a method for calculating the similarity, we calculate the similarity of each library with each keyword and we extract a recommendation for the 10 libraries with the highest value of similarity.
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...ISSEL
Το διευρυµένο τοπίο του λογισµικού ανοιχτού κώδικα OSS αποδεικνύει την αυξανόµενη παραγωγική δραστηριότητα των µηχανικών λογισµικού που συνεισφέρουν σε πολλαπλές πλατφόρµες και διάφορα έργα λογισµικού. Η συµµετοχή τους σε αυτά τα έργα αναδεικνύει το ευρύ ϕάσµα των δεξιοτήτων τους, από τη συγγραφή κώδικα έως τη συνεργασία τους µε άλλους µηχανικούς λογισµικού. Καθώς στο οικοσύστηµα του λογισµικού ανοιχτού κώδικα υπάρχει µια διαρκής και συνεχώς αυξανόµενη δραστηριότητα, είναι πολύ σηµαντική µια πιο ολοκληρωµένη κατανόηση των συνεισφορών και των δεξιοτήτων των µηχανικών λογισµικού. Σκοπός της παρούσας διπλωµατικής είναι να αξιοποιήσει δεδοµένα από την υποδοµή World of Code (WoC) που περιέχει συγκεντρωµένα δεδοµένα από τα περισσότερα δη µόσια συστήµατα ελέγχου εκδόσεων για να παρέχει µια πιο ολοκληρωµένη εικόνα του προφίλ ενός µηχανικού λογισµικού. Εξάγοντας, αναλύοντας και οπτικοποιώντας αυτά τα δεδοµένα, αναπτύχθηκε µια εφαρµογή που παρουσιάζει µια περιεκτική επισκόπηση των δραστηριοτήτων ενός µηχανικού στα έργα λογισµικού ανοικτού κώδικα. Η οπτική αναπαράσταση των δεδοµένων, µετατρέπει πολύπλοκα σύνολα δεδοµένων σε εύκολα κατανοητές γραφικές µορφές. Η αξιολόγηση της εφαρµογής σε ένα σύνολο µηχανικών λογισµικού δείχνει ότι πετυχαίνει τους στόχους της. Προσφέρει µια εικόνα της δραστηριότητας, του ϱόλου και των τεχνικών δεξιοτήτων ενός µηχανικού, ενισχύοντας τη διαφάνεια και την κατανόηση της συνεισφοράς του στο οικοσύστηµα του OSS.
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Manos Tsardoulias
Nowadays, software source code is mainly stored in software repositories and programming content websites. However, searching for code is troublesome, and, usually software engineers are forced to use conventional search engines which do not evaluate the usefulness of the results. The overall process proves to be highly time consuming and inefficient. To face these issues, software developers prefer recommendation systems that target query analysis and return relevant code examples. That undertaking, though, turned out to be extremely difficult due to syntactical differences between natural language and source code. Many of those systems present weaknesses regarding the form of the input queries (e.g. they do not receive input in natural language) and the quality and performance of their results. In addition, most of these systems utilize simplistic architectures and, as a result, do not capitalize the query and code semantics. A close analysis of the aforementioned problems resulted in the design and implementation of CODEtransformer, a system that improves upon the flaws of many code recommendation systems. Our system ensures data quality by mining code examples from popular GitHub repositories. These data are subject to preprocessing in order to maximize the extracted information. Afterwards, we train a state-of-the-art Neural Network which has the ability to accept natural language as input and perform semantic analysis on the code examples. We, then, construct a vector space consisting of code examples that ensures the best possible temporal response of each search. Ultimately, our system is not only evaluated by its performance compared to similar systems, but also through natural language queries, which are derived from Stack Overflow.
Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής ΝοημοσύνηςISSEL
To image inpainting είναι η διαδικασία επιδιόρθωσης μιας αλλοιωμένης ή/και κατεστραμμένης περιοχής σε μια εικόνα από την οποία απουσιάζει μέρος νοηματικής πληροφορίας και κατά συνέπεια παρουσιάζεται έλλειψη νοηματικής συνέχειας. Σχεδιάστηκε αρχικά με σκοπό την αποτελεσματική επιδιόρθωση κατ εστραμμένων περιοχών σε εικόνες. Γρήγορα, όμως, χρησιμοποιήθηκε με σκοπό την πλαστογράφηση και την παραπλάνηση. Τα τελευταία χρόνια, οι μέθοδοι που εφαρμόζουν inpainting σε εικόνες χρησι μοποιώντας μοντέλα τεχνητής νοημοσύνης, πετυχαίνουν όλο και ποιοτικότερα αποτελέσματα παρά γοντας εικόνες όπου η αλλοίωση τους, σε ορισμένες περιπτώσεις, είναι αδύνατον να εντοπιστεί με το ανθρώπινο μάτι. Κρίνεται αναγκαία λοιπόν η δημιουργία ενός μηχανισμού, που θα εντοπίζει αυτές ακριβώς τις αλλοιώσεις. Για το λόγο αυτό, η παρούσα διπλωματική εργασία εστιάζει στη μελέτη των μεθόδων εντοπισμού του inpainting σε εικόνες, αλλά και στην υλοποίηση ενός δικτύου τεχνητής νοημοσύνης ικανού να ανιχνεύει τις περιοχές όπου μια εικόνα έχει αλλοιωθεί μέσω inpainting. Εκ παιδεύτηκαν και έλεγχθηκαν συνολικά οχτώ δίκτυα, βασισμένα σε δύο αρχιτεκτονικές συνελικτικών νευρωνικών δικτύων, προτεινόμενες από σχετική βιβλιογραφία. Η εκπαίδευση πραγματοποιήθηκε με δύο διαφορετικά σύνολα ρυθμίσεων, για 10 και 50 εποχές αντίστοιχα και ως συνάρτηση κόστους χρησι μοποιήθηκε η Binary Cross Entropy (BCE). Επίσης, μελετήθηκε το κατά πόσο η χρήση ενός συνόλου δεδομένων αποτελούμενο από εικόνες που έχουν υποστεί inpainting σε σημασιολογικές περιοχές, βο ηθάει περισσότερο από ένα αντίστοιχο με εικόνες που έχουν υποστεί inpainting σε τυχαίες περιοχές στη διαδικασία του εντοπισμού του. Για το λόγο αυτό, δημιουργήθηκαν δύο σύνολα εκπαίδευσης (train set) από τα οποία το πρώτο αποτελείται από εικόνες με τυχαίες μάσκες inpainting, ενώ το δεύτερο απο εικόνες με μάσκες σημασιολογικής μορφής. Ο έλεγχος έγινε με τη χρήση ενός συνόλου ελέγχου (test set) αποτελούμενο και από τις 2 μορφές μασκών για να δοθεί μια αντικειμενική ερμηνεία των αποτε λεσμάτων. Σε κάθε ένα από τα εκπαιδευμένα δίκτυα, δόθηκε ως είσοδος μία έγχρωμη RGB είκονα I με σκοπό να παράξει στην έξοδο του την προβλεμόμενη μάσκα Mo. Τέλος, δεδομένης της πραγματικής μάσκας Mg πραγματοποιήθηκε 1-1 σύγκριση των αντίστοιχων εικονοστοιχείων και υπολογίστηκαν οι τιμές των μετρικών απόδοσης AUC και ΙοU. Αποδείχθηκε πως η εκπαίδευση με εικόνες που έχουν αλλοιωθεί σε τυχαίες περιοχές τους (τυχαίες μάσκες) οδηγεί σε καλύτερα αποτελέσματα εντοπισμού του inpainting, από ότι η εκπαίδευση με εικόνες που έχουν αλλοιωθεί σε σημασιολογικές περιοχές (αντικείμενα).
Image Inpainting Detection through Artificial Intelligence TechniquesISSEL
Image inpainting is the process of repairing an area in an image, from which a part of the semantic information is missing and consequently there is a lack of semantic continuity. Image inpainting was initially designed to effectively repair damaged areas in images. Ηowever, it was quickly used for the purpose of forgery and deception. In recent years, methods of applying image inpainting through artificial intelligence techniques came up and achieved high quality results, producing images where the presence of inpainting is almost impossible to detect with the human eye. Therefore, it is of critical importance to develop a method that will detect the affected areas in inpainted image. For this reason, the present thesis focuses on the study of image inpainting detection methods and the implementation of an artificial neural network capable of detecting areas where an image has been tampered by inpainting. A total of eight convolutional neural networks, based on two state of the art architectures, were trained and tested. The training process was based on two configurations sets (10 and 50 epochs respectively) adopting the binary cross entropy (BCE) as a loss function. Furthermore, it was also studied to what extent the use of a training dataset consisting of images that have been inpainted in semantic areas helps more than one whose images have been inpainted in random-form areas helps more in the image inpainting detection. For this reason, two training sets were created. The first one, is consisting of images with random-form inpainting masks, while the second one is consisting of images with semantic masks (objects). To evaluate the trained models, a test set consisting of both forms of masks were created in order to give an objective interpretation of the results. The aim is to train a model, capable of producing a predicted mask Mo as output, given an image I as input. Finally, the two commonly used pixel-wise metrics, IoU and AUC, were adopted to evaluate the performance. The metrics were calculated by using the ground truth Mg and the predicted mask Mo and by making a 1-1 comparison of their corresponding pixels. Τhe study proved that, models trained with a set of images that have been tampered in random areas (random masks) achieve better results comparing to models that were trained with a train set of images that have been tampered in semantic areas (semantic masks).
2. Περιεχόμενα Διατριβής
2
Μείωση των Χρωματικών Αποχρώσεων Συνδυάζοντας
το Kohonen Self-Organized Feature Map και τον
Ασαφή Αλγόριθμο Gustafson – Kessel
Αλγόριθμος Ανάδρασης με βάση τη Συνάφεια
Εντοπισμός Κειμένου σε Εικόνες Έγραφα
Χρησιμοποιώντας τα Δομικά Συστατικά των
Εγγράφων και Support Vector Machines
Ανάκτηση Εγγράφων - Εικόνων Με την Τεχνική
Εντοπισμού των Λέξεων
Συνεπτυγμένος Περιγραφέας Σχήματος Στα πρότυπα
των Περιγραφέων Σχήματος του MPEG-7
3. Ανάκτηση Εικόνων με βάσει το Περιεχόμενο
3
H Αναζήτηση και Παρουσίαση Παρόμοιων
Εικόνων από μία Βάση Δεδομένων Εικόνων που
είναι Σχετικές με το Αίτημα του Χρήστη
Χωρίς Οποιαδήποτε Επιπλέον Πληροφορία εκτός
από αυτήν που Προέρχεται από την Ανάλυση των
Εικονοστοιχείων της Εικόνας
4. Το Γενικό Πρόβλημα της Ανάκτησης Εικόνας
4
Η Ποιότητα Ανάκτησης (Ακρίβεια – Ανάκληση)
Η Ταχύτητα Ανάκτησης (Εξαγωγή
Χαρακτηριστικών - Δημιουργία Περιγραφέα –
Σύγκριση Περιγραφέα)
Μέγεθος Περιγραφέα (κόστος αποθήκευσης και
κατανάλωσης μνήμης)
6. Συνδυάζοντας το Kohonen Self-Organized
Feature Map και τον ασαφή αλγόριθμο
Gustafson – Kessel
ΜΕΙΩΣΗ ΤΩΝ ΧΡΩΜΑΤΙΚΩΝ ΑΠΟΧΡΩΣΕΩΝ
6
1.
7. Ορισμός του Προβλήματος
7
Η κβαντοποίηση των χρωματικών αποχρώσεων
είναι σημαντικό και χρήσιμο εργαλείο για την
συμπίεση, εμφάνιση και την μετάδοση μίας
εικόνας
Η μείωση των χρωματικών αποχρώσεων μίας
εικόνας είναι σημαντική διαδικασία για την
διαδικασία κατάτμηση μίας εικόνας
Προτείνεται μία Color Clustering τεχνική, η
οποία αποτελείται από τον συνδυασμό ενός
νευρωνικού δικτύου και ενός ασαφούς
αλγορίθμου
8. Παράδειγμα Μείωσης των Χρωματικών
Αποχρώσεων
8
Αρχική Εικόνα RGB χρωματική κατανομή
Εικόνα με μόνο 20 κύρια χρώματα Κατανομή των 20 χρωμάτων
9. Διάγραμμα της Προτεινόμενης Τεχνικής
9
Αρχική Εικόνα Δειγματοληψία
Ορισμός του Πλήθους
των Τελικών
Χρωμάτων
Εκπαίδευση του
KSOFM
Ταξινόμηση με τον
KSOFM
Aρχικοποίηση του
GK με τα εξαγόμενα
αποτελέσματα του
KSOFM
Εκτέλεση του GK
Tελική Ταξινόμηση
με τον GK
Τελική Εικόνα
10. Μορφοκλασματική Δειγματοληψία –
Καμπύλη του Hilbert
10
ΠΛΕΟΝΕΚΤΗΜΑΤΑ
Μικρός αριθμός των
εικονοστοιχείων – δειγμάτων
εκπαίδευσης
Η σχέση των γειτονικών
εικονοστοιχείων διατηρείτε
11. j k jky arg min x w
Kohonen Self Organized Featured Map
(KSOFM)
Ο λογάριθμος εκπαίδευσης του
KSOFM στηρίζεται στην
Ανταγωνιστική Εκμάθηση
11
X1
Xk
X3
X2
Yj
Y3
Y2
Y1
Competitive LayerInput Layer
......
......
Wj1
Wj2
Wj3
Wjk
Ο νικητής νευρώνας εξόδου
μεταβάλουν τα βάρη των
συνδέσεων τους:
jk k jkw n x w
12. Ασαφής Αλγόριθμος Gustafson - Kessel
Ο ασαφής αλγόριθμος Gustafson – Kessel (GK)
είναι μια προέκταση του ασαφή C-Mean
αλγορίθμου.
Δημιουργεί ελλειψοειδείς κλάσεις χρησιμοποιώντας
έναν πίνακα συνδιακύμανσης
Στηρίζεται στην Mahalanobis απόσταση
12
2 T
ik k i i k id x v A x v
16. Συμπεράσματα
18
Παρουσιάστηκε μία υβριδική (neuro-fuzzy)
τεχνική μείωσης των χρωματικών αποχρώσεων
μίας εικόνας
Έχει την ικανότητα να διατηρεί τα κύρια χρώματα
μια εικόνας ακόμα και αν το πλήθος αυτών είναι
πολύ μικρό
Ενοποιεί περιοχές που έχουν παρόμοια χρώματα
Μπορεί να θεωρεί ως μία ισχυρή τεχνική
κατάτμησης ψηφιακής εικόνας
17. Για εικόνες που περιέχουν πολλά χρώματα και
απεικονίζουν σκηνές
Αλγόριθμος Ανάδρασης με βάση τη
Συνάφεια
19
2.
18. Αλγόριθμος Ανάδρασης Συνάφειας
20
Πολλές φορές ο χρήστης δεν ξέρει τι ακριβώς
ψάχνει αλλά έχει μία γενική ιδέα
Ο χρήστης αλληλοεπιδρά με το Σύστημα
Ανάκτησης
Το σύστημα ανάκτησης του δίνει ένα σύνολο
αποτελεσμάτων
Ο χρήστης επιλέγει εκείνα που τον ενδιαφέρουν
Το Σύστημα Ανάκτησης χρησιμοποιεί αυτήν την
πληροφορία για να βελτιώσει τα αρχικά
αποτελέσματα της ανάκτησης
19. Προτεινόμενο Σύστημα Ανάδρασης Συνάφειας
για Εικόνες Φύσης
21
Στηρίζεται στους τέσσερις παρόμοιους με τους
MPEG-7 περιγραφείς που προτείνονται στην
εργασία «ACCURATE IMAGE RETRIEVAL
BASED ON COMPACT COMPOSITE
DESCRIPTORS AND RELEVANCE FEEDBACK
INFORMATION».
Αυτοί είναι:
Color and Edge Directivity Descriptor (CEDD)
Fuzzy Color and Texture Histogram (FCTH)
Και οι Compact μορφές τους (C.CEDD, C.FCTH)
Περιέχουν πληροφορίες υφής και χρώματος.
20. Η Διάταξη του Προτεινόμενου Αλγορίθμου
22
Ο Χρήστης Επιλέγει την Εικόνα
Ερώτημα
Ο Περιγραφέας της Εικόνας
Ερώτημα
Εμφάνιση των Αποτελεσμάτων
Ανάκτησης στο Χρήστη
Αρχικοποίηση του
διανύσματος W
Ο Χρήστης Επιλέγει Συναφή Εικόνα
από τα Αποτελέσματα
Μετασχηματισμός στο
διάνυσμα X
Μεταβολή των Τιμών του
διανύσματος W
Δημιουργία του Νέου
Περιγραφέα Ερώτημα
από το Διάνυσμα W
21. Αλγόριθμος Ανάδρασης Συνάφειας
23
Μετασχηματίζεται το μονοδιάστατο διάνυσμα των
περιγραφέων σε ένα τρισδιάστατο διάνυσμα με
βάση τα εσωτερικά χαρακτηριστικά τους
( )i k m x m y z
H x διάσταση αντιπροσωπεύει την υφή
H y διάσταση αντιπροσωπεύει τα
κύρια χρώματα
H z διάσταση αντιπροσωπεύει τις
αποχρώσεις των κύριων χρωμάτων
22. Αλγόριθμος Ανάδρασης Συνάφειας
24
Το τρισδιάστατο διάνυσμα θα αποθηκεύει την
πληροφορία που θα δίνεται από τον χρήστη
Οι αρχικές τιμές που περιέχει είναι οι τιμές του
περιγραφέα της εικόνας – ερώτημα
Όταν ο χρήστης επιλέγει μία εικόνα από τα
αποτελέσματα της αρχικής ανάκτησης, το
διάνυσμα του περιγραφέα αλλάζει τις τιμές του
τρισδιάστατου διανύσματος
23. 25
Αλγόριθμος Ανάδρασης Συνάφειας
, , , ,
, ,
1xt yt zt xt yt zt
i xt yt zt
W t W t
L t X W t
, , , ,
1 , ,
1
, ,
xq yq zq xq yq zq
xt yt zt
W t W t
L t h xq yq zq X W t
25. Συμπεράσματα
27
Παρουσιάστηκε ένας Αλγόριθμος Ανάδρασης
Συνάφειας
Βελτιώνει τα αποτελέσματα της αρχικής
ανάκτησης
Είναι πολύ εύκολος στην υλοποίησή του
Μικρό υπολογιστικό κόστος
26. Χρησιμοποιώντας τα δομικά συστατικά των
εγγράφων και Support Vector Machines
Εντοπισμός Κειμένου σε Εικόνες Έγραφα
28
3.
27. Το Πρόβλημα Εντοπισμού Κειμένου σε Εικόνες -
Έγγραφα
29
Στην σημερινή εποχή δημιουργούνται μεγάλες
ποσότητες ψηφιακών εγγράφων χωρίς καμία μετα
πληροφορία
Για την ανάλυσής τους από συστήματα όπως
Οπτικής Αναγνώρισης Χαρακτήρων (OCR),
Συστήματα Ανάκτησης Εγγράφων απαιτείται
συνήθως ο εντοπισμός της θέσης του κειμένου
στην εικόνα
Κάθε σύνολο από έγγραφα μπορεί να έχει τα δικά
του ιδιαίτερα χαρακτηριστικά
28. Προτείνουμε
30
Προτείνουμε μία μέθοδο εντοπισμού
ομοιόμορφου κειμένου
Στηρίζεται στα δομικά συστατικά των εγγράφων
και στα Support Vector Machines
Έχει την ικανότητα να προσαρμόζεται στις
ιδιαιτερότητες της κάθε βάσης εγγράφων -
εικόνων
29. Διάγραμμα της Προτεινόμενης Τεχνικής
Εφαρμογή ενός φίλτρου
Μεσαίας Τιμής και μίας
τεχνικής
δυαδικοποίησης
Εντοπισμός, Ενοποίηση
και Εξαγωγή Πλαισίων
Δημιουργία Περιγραφέα
για κάθε Πλαίσιο
Εντοπισμός των
Πλαισίων που περιέχουν
Κείμενο με τα Support
Vector Machines
Εξαγωγή ή Εντοπισμός
των Πλαισίων της
Εικόνας που περιέχουν
Κείμενο και Εμφάνισής
τους στον Χρήστη
31
30. Εντοπισμός, Ενοποίηση και Εξαγωγή Πλαισίων
32
Το Αρχικό Κείμενο Μετά την Διαδικασία Προ - Επεξεργασίας
Τα συνδεδεμένα Αντικείμενα Τα Επεκταμένα Συνδεδεμένα Αντικείμενα
Τα Τελικά Πλαίσια
31. Δημιουργία Περιγραφέα για κάθε Πλαίσιο
33
Ο Περιγραφέας αποτελείται από ένα σύνολο
δομημένων στοιχείων του εγγράφου
Δομημένο Στοιχείο είναι ένα 3x3 δυαδικό
παράθυρο
Υπάρχουν συνολικά 29 = 512 δομημένα στοιχεία
b0
b8 b7 b6
b5 b4 b3
b2 b1
Η σειρά εμφάνισης των
εικονοστοιχείων των
Δομημένων Στοιχείων
8
0
2i
j ji
i
L b
Το Δομημένο Στοιχείο L142
32. Δημιουργία Περιγραφέα για Κάθε Πλαίσιο
34
Ο περιγραφέας του κάθε πλαισίου είναι το
Ιστόγραμμα Εμφάνισης του κάθε Δομημένου
Συστατικού
Αρχικά ο περιγραφέας έχει μέγεθος ίσο με 510.
Όλα τα Δομημένα Συστατικά πλην του 1 και του 512
γιατί αυτά αντιστοιχούν σε καθαρά αντικείμενα
φόντου και προσκηνίου.
Εφαρμόζεται μία τεχνική μείωσης του μεγέθους του
περιγραφέα
Επιλέγονται αυτά τα Δομημένα Συστατικά που
αυξάνουν την διαχωριστικότητα μεταξύ πλαισίων που
περιέχουν κείμενο και αυτών που δεν περιέχουν.
33. Feature Standard Deviation Analysis of
Structure Elements (FSDASE)
35
Υπολογισμός της Τυπικής Απόκλισης των Πλαισίων
που περιέχουν κείμενο για κάθε ένα Δομημένο
Στοιχείο
Υπολογισμός της Τυπικής Απόκλισης των Πλαισίων
που δεν περιέχουν κείμενο για κάθε ένα Δομημένο
Στοιχείο
Κανονικοποίηση των δύο παραπάνω μεγεθών
Αφαιρούμε τα δύο παραπάνω μεγέθη για κάθε ένα
Δομημένο Στοιχείο
Αυτό που έχει τη μεγαλύτερη τιμή παίρνει την πρώτη
θέση στον καινούργιο περιγραφέα, αυτό που έχει την
δεύτερη μεγαλύτερη τιμή τη δεύτερη θέση κ.τ.λ.
34. Support Vector Machines
36
Βασίζονται στην Στατιστική Θεωρία της Μάθησης
Χρειάζονται δεδομένα εκπαίδευσης
Χωρίζουν το χώρο που βρίσκονται τα δεδομένα εκπαίδευσης σε
δύο κλάσεις
Τα δεδομένα εκπαίδευσης θα πρέπει να είναι γραμμικά
διαχωρίσιμα
35. Support Vector Machines
37
Εάν δεν είναι, μετασχηματίζεται ο χώρος έτσι ώστε να
είναι γραμμικά διαχωρίσιμα με την βοήθεια των “kernels”
Στην προτεινόμενη τεχνική χρησιμοποιήθηκε o kernel:
Radial Basis Function (exp{-γ|x-x`|)
Εφόσον διαχωριστεί ο χώρος με βάση τα δεδομένα
εκπαίδευσης, τα καινούργια δεδομένα καταχωρούνται
αναλόγως που βρίσκονται στο διαχωρίσιμο χώρο
Η κύρια δυσκολία της εκπαίδευσης των Support Vector
Machines έγκειται στην εύρεση των σωστών παραμέτρων
Στην προτεινόμενη τεχνική η εύρεση των παραμέτρων
έγινε χρησιμοποιώντας την τεχνική Parameter
Estimation Algorithm που χρησιμοποιείται στις μεθόδους
δυαδικοποίησης
36. Αξιολόγηση της προτεινόμενης τεχνικής
38
Χρησιμοποιήθηκε μία γνωστή βάση Εγγράφων –
Εικόνων
Document Image Database από το University
of Oulu
Περιέχει 233 έγγραφα – εικόνες ποικίλης μορφής
Για να αξιολογηθεί η ευελιξία της προτεινόμενης
τεχνικής δημιουργήθηκε μία καινούργια βάση από
την παραπάνω και προστέθηκε Gaussian και
Κρουστικός θόρυβος
48. Συμπεράσματα
50
Παρουσιάστηκε μία μέθοδο εύρεσης κειμένου σε έγγραφα
– εικόνες χρησιμοποιώντας τα δομημένα στοιχεία
εγγράφων
Μέσω μία τεχνητής υπολογίζεται ο κατάλληλος
περιγραφέας
Με βάση αυτού τα Support Vector Machines
αποφασίζουν εάν ένα πλαίσιο περιέχει κείμενο ή όχι.
Ο περιγραφέας μπορεί να μειωθεί ή να αυξηθεί αναλόγως
τα όρια της υπολογιστικής ισχύς που διαθέτεται.
Επίσης αξιολογήθηκε η προτεινόμενη μέθοδος σε μία
βάση την οποία προστέθηκε θόρυβος ώστε να αποδεχθεί
η ευελιξία της.
49. Με την τεχνική εντοπισμού των λέξεων
Ανάκτηση Εγγράφων - Εικόνων
51
4.
50. Με την τεχνική εντοπισμού των λέξεων
Η Αρχιτεκτονική του συστήματος Ανάκτησης Εικόνων - Εγγράφων
53
52. 55
Αναγνώριση όλων των Συνδεδεμένων Αντικειμένων (CCs)
Υπολογισμός του ποιο κοινού ύψους των Συνδεδεμένων
Αντικειμένων που περιέχονται στο κείμενο (CCch)
Απόρριψη των CCs που έχουνε ύψος κάτω του 70% του
CCch. Έτσι αφαιρούνται τα σημεία στίξης και ο θόρυβος.
Ανάπτυξη των αριστερών και δεξιών πλευρών κατά 20%
του CCch
Οι λέξεις αποτελούν τα ενωμένα επικαλυπτόμενα CCs
Χρησιμοποιώντας
την τεχνική των
Ενωμένων
Συστατικών
Κατάτμηση
Λέξεων
53. Width to Height Ratio
Word Area Density. Το ποσοστό των μαύρων
(αντικείμενο) εικονοστοιχείων που περιέχονται στο
ορθογώνιο πλαίσιο της λέξης.
Center of Gravity. Η ευκλείδεια απόσταση από το κέντρο
βαρύτητας μέχρι την πάνω αριστερή γωνία του ορθογώνιου
πλαισίου της λέξης:
(1,0) (0,1)
(0,0) (0,0)
,x y
M M
C C
M M
( , )
qp
pq
x y
x y
M f x y
width height
56
54. Vertical Projection. Τα πρώτα είκοσι (20) βάρη του
διακριτού μετασχηματισμού συνημίτονου (DCT) της λείας
και εξομαλυμένης κάθετης προβολής.
Αρχική Εικόνα
Η Κάθετη Προβολή
Εξομαλυμένη και
Κανονικοποιημένη
Προβολή
57
55. Top – Bottom Shape Projections. Ένα διάνυσμα 50 στοιχείων
Τα πρώτα 25 στοιχεία αποτελούνται από τα πρώτα 25 βάρη των διακριτού
μετασχηματισμού συνημίτονου της λείας και εξομαλυμένης Προβολής του Πάνω
Σχήματος
Τα υπόλοιπα 25 στοιχεία αποτελούνται από τα πρώτα 25 βάρη του διακριτού
μετασχηματισμού συνημίτονου της λείας και εξομαλυμένης Προβολής του Κάτω
Σχήματος
58
56. Upper Grid Features είναι ένα δέκα διαστάσεων
διάνυσμα με δυαδικές τιμές, το οποίο υπολογίζεται
από το πάνω μέρος της λέξης.
Down Grid Features είναι ένα δέκα διαστάσεων
διάνυσμα με δυαδικές τιμές, το οποίο υπολογίζεται
από το κάτω μέρος της λέξης.
59
59. Ο χρήστης πληκτρολογεί μία λέξη - ερώτημα
Το προτεινόμενο σύστημα δημιουργεί μία εικόνα της
παραπάνω λέξης με ύψος ίσο με το μέσο ύψος όλων των
λέξεων-πλαισίων που υπολογίστηκαν στο στάδιο
Κατάτμηση Λέξης στην Offline διεργασία.
Στην πειραματική βάση εγγράφων το μέσο ύψος είναι 50
Το όνομα της γραμματοσειράς της Εικόνας – Ερώτημα
είναι Arial
Η εξομαλυσμένη και κανονικοποιημένη διαδικασία των
χαρακτηριστικών εξαλείφει τις μικρές διαφορές που
υπάρχουν μεταξύ των διαφόρων γραμματοσειρών
62
60. 100 εικόνες – έγγραφα δημιουργήθηκαν τεχνητά
από διάφορα κείμενα
Έπειτα προστέθηκε Gaussian και Κρουστικός
Θόρυβος (40%).
64
61. Χρησιμοποιήθηκαν
τα μετρικά μεγέθη:
Average Precision
και NMRR
30 αναζητήσεις σε
100 έγγραφα εικόνες
Γραμματοσειρά της
εικόνας ερώτημα
είναι «Arial”
65
Mean Average
Precision:
99,519%
ANMRR:
0.0029%
75
80
85
90
95
100
1 5 9 13 17 21 25 29
Ανακτήσεις
Average Precision
0
0.2
0.4
0.6
0.8
1
1 5 9 13 17 21 25 29
Ανακτήσεις
NMRR
65. 69
Visual Studio
2008
Microsoft .NET
Framework 2.0
C# Language
Microsoft SQL
Server 2005
http://orpheus.ee.duth.gr/irs2_5/
66. Η λέξη – ερώτημα δίνεται από το χρήστη σε μορφή
κειμένου και μετατρέπεται σε εικόνα
Το προτεινόμενο σύστημα εξάγει 9 ισχυρά
χαρακτηριστικά τα οποία σχηματίζουν έναν
περιγραφέα για κάθε εικόνα - λέξη.
Τα χαρακτηριστικά αυτά περιγράφουν ικανοποιητικά
το σχήμα της λέξης ενώ ταυτόχρονα εξαλείφουν τις
μικρές διαφορές λόγω του θορύβου, μεγέθους και
τύπου γραμματοσειράς.
Με βάση τα πειραματικά αποτελέσματα το
προτεινόμενο σύστημα αποδίδει καλύτερα από ένα
εμπορικό OCR πακέτο.
70
67. Στα πρότυπα των περιγραφέων σχήματος του
MPEG-7
Συνεπτυγμένος Περιγραφέας Σχήματος
71
5.
68. MPEG - 7
72
Ο σκοπός του είναι να καθορίσει ένα πρότυπο περιγραφής
διαφόρων τύπων πολυμεσικής πληροφορίας
Ενώ τα άλλα πρότυπα (MPEG-1, MPEG-2, MPEG-4)
αντιπροσωπεύουν το περιεχόμενο (the bits), το MPEG-7
αντιπροσωπεύει την πληροφορία που διαχέεται στο
περιεχόμενο (the bits about the bits)
Επιπλέον, καθορίζει ένα πρότυπο αποθήκευσης (βάσεις
δεδομένων) των περιγραφέων
Οι περιγραφείς που περιέχει υποστηρίζουν μία μεγάλη
ποικιλία μορφών δεδομένων όπως ήχος, ομιλία, εικόνες,
γραφικά, 3D μοντέλα, συνθετικό ήχο, βίντεο κ.τ.λ.
69. Αρχές των MPEG-7 Περιγραφέων
73
Καθορίζει τις αρχές που θα πρέπει να υπακούν οι
περιγραφείς
Καλή Ακρίβεια στην Ανάκτηση
Ευρεία Εφαρμογή
Συνεπτυγμένη Μορφή
70. Ο υπολογισμός μπορεί πολύ εύκολα να παραλληλιστεί καθώς κάθε
χαρακτηριστικό υπολογίζεται ξεχωριστά
Το μπλοκ διάγραμμα υπολογισμού του CSPD
74
72. Vertical – Horizontal Projections. Είναι ένα διάνυσμα 20 διαστάσεων
Οι πρώτες 10 διαστάσεις αποτελούνται από τα πρώτα 10 κβαντισμένα βάρη του
διακριμένου μετασχηματισμού συνημίτονου της λείας και κανονικοποίημένης
Κάθετης Προβολής
Τα υπόλοιπα 10 στοιχεία αποτελούνται από τα πρώτα 10 κβαντισμένα βάρη του
διακριμένου μετασχηματισμού συνημίτονου της λείας και εξομαλυμένης
Οριζόντιας Προβολής
76
73. Top – Bottom Shape Projections. Ένα διάνυσμα 20 διαστάσεων
Οι πρώτες 10 διαστάσεις αποτελούνται από τα πρώτα 10 κβαντισμένα βάρη του
διακριμένου μετασχηματισμού συνημίτονου της λείας και κανονικοποίημένης
Προβολής του Πάνω Σχήματος
Τα υπόλοιπα 10 στοιχεία αποτελούνται από τα πρώτα 10 κβαντισμένα βάρη του
διακριμένου μετασχηματισμού συνημίτονου της λείας και εξομαλυμένης
Προβολής του Κάτω Σχήματος
77
74. Κβαντοποίηση Περιγραφέα
78
Μειώνεται αρκετά το μέγεθος του περιγραφέα χωρίς να
επηρεάζονται τα αποτελέσματα του.
Το MPEG-7 κβαντίζει αρκετούς από τους περιγραφείς που
περιέχει
Επειδή οι τιμές συγκεντρώνονται σε μικρές περιοχές θα πρέπει να
κβαντιστούνε μη – γραμμικά
Κάθε χαρακτηριστικό θα πρέπει να κβαντιστεί ξεχωριστά καθώς
δεν σχετίζονται μεταξύ τους
Η κβαντοποίηση πραγματοποιήθηκε με τον ασαφή αλγόριθμο
Gustafson – Kessel
Κάθε διάσταση του περιγραφέα αντιπροσωπεύεται με 3bits.
Οπότε το συνολικό μέγεθος είναι 3x41 = 123 bits
75. 79
Επιλέγουμε ένα πλήθος εικόνων που περιέχουν σχημάτα
και εξάγουμε από αυτά τον περιγραφέα.
Επιλέχθηκαν αυθαίρετα 1500 σχήματα και από αυτά
χρησιμοποιήθηκαν 1500 δείγματα για το Width to Height
Ratio και 15000 δείγματα (10x1500) για κάθε από τα
υπόλοιπα χαρακτηριστικά
Ορίσθηκε το πλήθος των κλάσεων του Gustafson –
Kessel ίσο με 8 (23)
O ασαφής αλγόριθμος Gustafson – Kessel δίνει 8
κέντρα κλάσεων και τους αντίστοιχους πίνακες Διασπορών
Μετατρέπονται οι συνεχές τιμές του σε δυαδικές τιμές
εύρους [000, 1111] δυαδικές ή σε ακέραιες τιμές εύρους
[0,7]
Κβαντοποίηση Περιγραφέα
77. Ως Επέκταση του Schema των MPEG – 7 Οπτικών Περιγραφέων
Schema του CSPD
81
78. Μέτρηση Ομοιότητας
82
Προτείνεται ως Μέτρηση Ομοιότητας την weight Minkowski
L1:
3 10
, 1 1 10 1 10 1
0 1
10 11Q S k n k n
k n
D Q S n Q S
Η παραπάνω απόσταση χρησιμοποιεί την ικανότητα του DCT να
αποθηκεύει περισσότερη πληροφορία στα πρώτα βάρη
Πειραματικές Μετρήσεις έδειξαν ότι η προτεινόμενη απόσταση
δίνει καλύτερα αποτελέσματα από ότι οι αποστάσεις:
normal Minkowski L1
Minkowski L2 (Euclidian Distance)
Bhattacharyya
The non-binary Tanimoto coefficient
79. Αλγόριθμος Ανάδρασης Συνάφειας
83
Υλοποιήθηκε ένας αλγόριθμος Ανάδρασης Συνάφειας που στηρίζεται στα
Support Vector Machines
Αρχικά το σύστημα παρουσιάζει τα αποτελέσματα αναζήτησης με βάση το
μετρητή ομοιότητας.
Ο χρήστης επιλέγει ποια θεωρεί σωστά και ποια όχι
Οι περιγραφείς των σχημάτων που επέλεξε ο χρήστης χρησιμοποιούνται ως
δεδομένα εκπαίδευσης των Support Vector Machines
Κανονικά, η έξοδος των Support Vector Machines είναι δυαδική, η οποία
καθορίζεται από το πρόσημο της συνάρτησης απόφασης
Είναι πιθανόν να υπολογιστεί η συνάρτηση συμμετοχής ενός δεδομένου στην μία
κλάση και κατά συνέπεια η ομοιότητα του κανονικοποιώντας την συνάρτηση
απόφασης
80. Αξιολόγηση Περιγραφέα
85
Τρείς διαφορετικές βάσεις
MPEG-7 CE1 Set B. Αποτελείται από 1400
σχήματα.
20 σελίδες-εικόνες από τα Γραπτά του George
Washington από τη Βιβλιοθήκη του Κογκρέσου.
Αποτελείται από 4847 χειρόγραφες λέξεις
Ελληνικά χειρόγραφα κείμενα που περιέχουν 173
λέξεις από διαφορετικούς ανθρώπους
81. Τα κίτρινα πλαίσια υλοποιήθηκαν μόνο για τα χειρόγραφα έγγραφα
H δομή του υλοποιημένου συστήματος ανάκτησης
90. Υπολογιστικό Κόστος
95
Windows
Platform
Intel Core 2
6400 CPU
Χρησιμοποιήθηκαν
και οι δύο πυρήνες
του επεξεργαστή
Ο χρόνος υπολογισμού του προτεινόμενου περιγραφέα για 1400 σχήματα
Ολικός χρόνος υπολογισμού του
προτεινόμενου περιγραφέα
Μέσος χρόνος υπολογισμού του προτεινόμενου
περιγραφέα για κάθε σχήμα
4396 milliseconds 3.14 milliseconds
91. Συμπεράσματα
96
Παρουσιάστηκε ένας περιγραφέας σχήματος
Έχει πολύ μικρό μέγεθος (μόνο 123 bits)
Έχει πολύ μικρό υπολογιστικό κόστος
Έχει ευρεία εφαρμογής χωρίς να περιορίζεται η
ακρίβεια της ανάκτησης
92. Δημοσιεύσεις
K .Zagoris, N. Papamarkos and I. Koustoudis, Color
Reduction using the combination of the Kohonen Self-
Organized Feature Map and the Gustafson-Kessel fuzzy
algorithm. International Conference on Machine Learning
and Data Mining MLDM´2007, 2007.
Konstantinos Zagoris, Nikos Papamarkos, Christodoulos
Chamzas: Web Document Image Retrieval System Based
on Word Spotting. ICIP 2006: 477-480
K. Zagoris, E. Kavallieratou and N. Papamarkos,
"Developing Document Image Retrieval System", "IADIS
International Conference on Computer Graphics and
Visualization 2008 ", July 22 to July 27, 2008, Amsterdam,
The Netherlands.
Konstantinos Zagoris, Savvas A. Chatzichristofis, Nikos
Papamarkos and Yiannis S. Boutalis, « img(Anaktisi): A
Web Content Based Image Retrieval System», 2nd
International Workshop on Similarity Search and
Applications, Prague, Czech Republic, 2009.
Konstantinos Zagoris and Nikos Papamarkos, “Text
Extraction using Document Structure Features and Support
Vector Machines”, 2009 IEEE International Conference on
Image Processing, Cairo, Egypt , November 7-11, 2009.
Έχει σταλεί για πιθανή δημοσίευση
Konstantinos Zagoris, Nikos Papamarkos, Ioannis
Koustoudis: Color Reduction using the Combination
of the Kohonen Self-Organized Feature Map and
the Gustafson-Kessel Fuzzy Algorithm. Trans.
MLDM 1(1): 31-46 (2008)
S. A. Chatzichristofis, K Zagoris, Y. S. Boutalis and
N. Papamarkos. «Accurate image retrieval based on
compact composite descriptors and relevance
feedback information.” International Journal of
Pattern Recognition and Artificial Intelligence
(IJPRAI), Έχει γίνει δεκτή για δημοσίευση, 2009.
Konstantinos Zagoris, Kavallieratou Ergina and
Nikos Papamarkos. «A Document Image Retrieval
System». Engineering Applications of Artificial
Intelligence. Έχει σταλεί για πιθανή δημοσίευση.
Konstantinos Zagoris and Nikos Papamarkos.” Text
Localization using Document Structure Elements
and Support Vector Machines”, Έχει σταλεί για πιθανή
δημοσίευση.
Konstantinos Zagoris, Kavallieratou Ergina and
Nikos Papamarkos, “Image Retrieval Systems
Based On Compact Shape Descriptor and
Relevance Feedback Information”, Visual
Communication and Image Representation, Έχει
σταλεί για πιθανή δημοσίευση.
97
Συνέδρια Περιοδικά