SlideShare a Scribd company logo
1 of 39
Ανάπτυξη Δυναμικού και
Προσωποποιημένου
Συστήματος
Ερωταπαντήσεων με Πηγή
το Διαδίκτυο
Εκπόνηση:
Σκαπέτης Χρήστος
ΑΕΜ:9378
Επιβλέποντες:
Καθ. Ανδρέας Συμεωνίδης
Υπ. Διδ. Νικόλαος Μάλαμας
Περιεχόμενα
01
04
02
05
03
06
Εισαγωγή Εργαλεία Υλοποίηση
Αποτελέσματα Συμπεράσματα Μελλοντικές
Επεκτάσεις
2
Εισαγωγή
01
3
Σκοπός
Δημιουργία ενός συστήματος ερωταπαντήσεων
● Δυναμικού
● Προσωποποιημένου
4
Σκοπός
Δημιουργία ενός συστήματος ερωταπαντήσεων
● Δυναμικού
○ Χρήση του διαδικτύου για την
πληροφορία
● Προσωποποιημένου
5
Σκοπός
Δημιουργία ενός συστήματος ερωταπαντήσεων
● Δυναμικού
○ Χρήση του διαδικτύου για την
πληροφορία
● Προσωποποιημένου
○ Χρήση πηγών μέσα από τη
συμπεριφορά του χρήστη
6
Σκοπός
Δημιουργία ενός συστήματος ερωταπαντήσεων
● Δυναμικού
○ Χρήση του διαδικτύου για την
πληροφορία
● Προσωποποιημένου
○ Χρήση πηγών μέσα από τη
συμπεριφορά του χρήστη
7
Εξόρυξη
της Απάντησης
Πρόβλημα
Προσπέλαση
της Πληροφορίας
01 02
8
Εργαλεία
02
9
Εργαλεία
Transformers Python Haystack Pipeline
01 02 03
10
Εργαλεία
Transformers
Νευρωνικές Αρχιτεκτονικές
με τη χρήση του μηχανισμού
της “προσοχής”
01
11
Εργαλεία
Transformers
● Παράλληλη
επεξεργασία Seq2seq
● Κωδικοποίηση σε
tokens
● Χρήση σε LLMs
01
12
Εργαλεία
Transformers
Αυτο-προσοχή
● Σταθμισμένος Μέσος
Όρος
● Διανύσματα Βαρών
● Παράλληλη
Επεξεργασία
● Διαφορετικά βάρη σε
διαφορετικό context
01
Κωδικοποίηση /
Αποκωδικοποίηση
● 8 επίπεδα RNN
● Κωδικοποίηση Θέσης
● Κανονικοποίηση
● Masking
13
Εργαλεία
Python
● Χρήση Python για το
backend
● Βιβλιοθήκες για τη
λήψη, χειραγώγηση και
αξιοποίηση της
πληροφορίας
02
14
Εργαλεία
Haystack Pipeline
03
● Μετατροπή της
πληροφορίας του
διαδικτύου σε αρχείο
● Αποθήκευσης σε
Document Store
● Pipeline και εξαγωγή
της απάντησης
15
Εργαλεία
● Ο Retriever ανακτά τα
αρχεία
● Ο Reader χρησιμοποιεί
μοντέλα για την
εξαγωγή της
απάντησης
Haystack Pipeline
03
16
Εργαλεία
Haystack Pipeline
03
• Χρήση του διαδικτύου
για απόκτηση
εγγράφων.
• Επιστροφή απάντησης
με σκορ, πηγή και
context.
17
Εργαλεία
Transformers Python Haystack Pipeline
01 02 03
18
Υλοποίηση
03
19
Υλοποίηση
20
Βήματα που απορρίφθηκαν
21
Μοντέλα
● English
● BERT
● 124M params
● English
● BERT
● 33,4M params
deepset/
roberta-base-squad
deepset/
minilm-uncased-squad
albert-xxlarge-v2
microsoft/
deberta-v3-base
deepset/gelectra-base-
germanqua
xlm-roberta-base
● English
● BERT
● 223M params
● Multilingual
● BERT
● 279M params
● Multilingual
● BERT
● 86M params
● Multilingual (German)
● BERT
● 109M params
22
Διεπαφή - Αναζήτηση
Μπάρα Αναζήτησης
Επιλογή Γλώσσας
Επιλογή Ιστοσελίδας
Επιλογή Μοντέλου
23
Διεπαφή - Απάντηση
24
Διεπαφή - Απάντηση
25
Αποτελέσματα
04
Model
Q Q Q
A
A A
26
Dataset Ερωτημάτων
Διαφορετικά Ερωτήματα ως προς:
● Το είδος (Κλειστά, ανοιχτά)
● Την απάντηση (Μονολεκτική, αναλυτική, αριθμός)
● Την διαδικασία (Μαθηματικά, αναζήτηση)
● Την γλώσσα (Αγγλικά, Γερμανικά)
● Την αντικειμενικότητα (Αντικειμενικά γεγονότα, υποκειμενικές απόψεις)
27
Στάδια Εκτέλεσης
Στάδιο 1
Στάδιο 2
28
Χρόνοι Εκτέλεσης
29
Ποιότητα Απαντήσεων
30
Ποιότητα Απαντήσεων
● Κοντινές επιδόσεις minilm και roberta-
base
● Gelectra έπεται
● Πολύ κακές επιδόσεις deberta και xlm-
roberta
31
● Υπεροχή του μοντέλου albert
Σωστές Απαντήσεις
32
Σωστές Απαντήσεις
33
Συμπεράσματα
05
34
Συμπεράσματα
● Το albert είναι εξαιρετικά χρονοβόρο.
● Τα μοντέλα minilm και roberta-base δίνουν απαντήσεις αποδεκτής ποιότητας σε
εύλογο χρονικό διάστημα.
● 2 από τα 3 πολυγλωσσικά μοντέλα είναι απογοητευτικά. Το τρίτο, το gelectra, είναι
ελαφρώς χειρότερο από τα αγγλικά μοντέλα.
● Επέκτασης τα βασικής αρχιτεκτονικής του pipeline με προσθήκη δυναμικών
στοιχείων
● Επιλογή μοντέλου roberta-base
35
Συμπεράσματα
● Προσωποποιημένες
Απαντήσεις
● Δυνατότητα Ιδιωτικών
Ερωτημάτων
● Φορητότητα
● Δυναμικός Χαρακτήρας
● Περιορισμένη Αναλυτικότητα
● Λιγότερες Λεπτομέρειες
● Αργή Απόκριση
36
Μελλοντικές
Επεκτάσεις
06
37
Μελλοντικές Επεκτάσεις
● Νέο βελτιωμένο User Interface
● Δημιουργία Widget ή Add-On για ιστοσελίδες
● Μεταφορά σε PaaS μορφή
● Χρήση άλλων μοντέλων (νέες Γλώσσες)
● Προσθήκη Λειτουργίας Αναζήτησης Βάθους
● Χρήση Διαφορετικών Readers
38
Σας Ευχαριστώ!
Do you have any questions?
skapetis@ece.auth.gr
39

More Related Content

Similar to Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ∆ιαδίκτυο

Aspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for ReviewsAspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for ReviewsISSEL
 
Georgia Pantalona
Georgia PantalonaGeorgia Pantalona
Georgia PantalonaISSEL
 
Anastasios Kakouris
Anastasios KakourisAnastasios Kakouris
Anastasios KakourisISSEL
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...ISSEL
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςISSEL
 
Bagia Rousopoulou
Bagia RousopoulouBagia Rousopoulou
Bagia RousopoulouISSEL
 
Χατζηελευθερίου Ειρήνη
Χατζηελευθερίου ΕιρήνηΧατζηελευθερίου Ειρήνη
Χατζηελευθερίου ΕιρήνηISSEL
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...ISSEL
 
Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...ISSEL
 
Segmentation fault (Web - Site - Project)
Segmentation fault (Web - Site - Project)Segmentation fault (Web - Site - Project)
Segmentation fault (Web - Site - Project)George Tzinos
 
Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485ISSEL
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούISSEL
 
Χριστίνα Μποϊδίδου
Χριστίνα ΜποϊδίδουΧριστίνα Μποϊδίδου
Χριστίνα ΜποϊδίδουISSEL
 
Anastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentAnastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentManos Anastasiadis
 
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...ISSEL
 
Understanding the importance of demographic background for the website aesth...
Understanding the importance of demographic background  for the website aesth...Understanding the importance of demographic background  for the website aesth...
Understanding the importance of demographic background for the website aesth...ISSEL
 
Ελένη Νησιώτη
Ελένη ΝησιώτηΕλένη Νησιώτη
Ελένη ΝησιώτηISSEL
 

Similar to Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ∆ιαδίκτυο (20)

Aspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for ReviewsAspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for Reviews
 
Παρουσίαση
ΠαρουσίασηΠαρουσίαση
Παρουσίαση
 
Παρουσίαση
ΠαρουσίασηΠαρουσίαση
Παρουσίαση
 
Georgia Pantalona
Georgia PantalonaGeorgia Pantalona
Georgia Pantalona
 
Anastasios Kakouris
Anastasios KakourisAnastasios Kakouris
Anastasios Kakouris
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
 
Bagia Rousopoulou
Bagia RousopoulouBagia Rousopoulou
Bagia Rousopoulou
 
Χατζηελευθερίου Ειρήνη
Χατζηελευθερίου ΕιρήνηΧατζηελευθερίου Ειρήνη
Χατζηελευθερίου Ειρήνη
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
 
Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...
 
Segmentation fault (Web - Site - Project)
Segmentation fault (Web - Site - Project)Segmentation fault (Web - Site - Project)
Segmentation fault (Web - Site - Project)
 
Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
 
Χριστίνα Μποϊδίδου
Χριστίνα ΜποϊδίδουΧριστίνα Μποϊδίδου
Χριστίνα Μποϊδίδου
 
PhD Defense (in Greek)
PhD Defense (in Greek)PhD Defense (in Greek)
PhD Defense (in Greek)
 
Anastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentAnastasiadis manosmsc2014present
Anastasiadis manosmsc2014present
 
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
 
Understanding the importance of demographic background for the website aesth...
Understanding the importance of demographic background  for the website aesth...Understanding the importance of demographic background  for the website aesth...
Understanding the importance of demographic background for the website aesth...
 
Ελένη Νησιώτη
Ελένη ΝησιώτηΕλένη Νησιώτη
Ελένη Νησιώτη
 

More from ISSEL

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...ISSEL
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...ISSEL
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...ISSEL
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...ISSEL
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςISSEL
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxISSEL
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...ISSEL
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...ISSEL
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνISSEL
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταISSEL
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...ISSEL
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ISSEL
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...ISSEL
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
 
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ISSEL
 
Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...ISSEL
 
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...ISSEL
 
Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...ISSEL
 

More from ISSEL (20)

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
 
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
 
Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
 
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
 
Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...
 

Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ∆ιαδίκτυο

Editor's Notes

  1. Αξιότιμοι καθηγητές της επιτροπής, αγαπητοί συμφοιτητές και συμφοιτήτριες, κυρίες και κύριοι, ονομάζομαι Σκαπέτης Χρήστος και θα σας παρουσιάσω την διπλωματική μου εργασία με όνομα "Ανάπτυξη Ιδιωτικού Δυναμικού Συστήματος Ερωταπαντήσεων με Πηγή το Διαδίκτυο".
  2. Θα ξεκινήσω με μια σύντομη εισαγωγή και με μια ανασκόπηση των εργαλείων που χρησιμοποιήθηκαν, θα συνεχίσω με την υλοποίηση, τα αποτελέσματα των πειραμάτων, τα συμπεράσματα και τις πιθανές μελλοντικές επεκτάσεις.
  3. Ο σκοπός αυτής της διπλωματικής είναι η ανάπτυξη ενός συστήματος ερωταπαντήσεων,
  4. δυναμικού, γιατί θα χρησιμοποιεί πληροφορία από το διαδίκτυο,
  5. και προσωποποιημένου, διότι θα γίνεται επιλογή και χρήση πηγών μέσα από την συμπεριφορά του χρήστη.
  6. Το πρόβλημα έχει δύο τμήματα. Την προσπέλαση της πληροφορίας, και την εξόρυξη της απάντησης από αυτήν.
  7. Οι τρανσφόρμερς, σύγχρονες νευρωνικές αρχιτεκτονικές, αποτελούν την βάση των μοντέλων που χρησιμοποιήθηκαν.
  8. Αυτές οι αρχιτεκτονικές κυριαρχούν στα σύγχρονα LLMs
  9. και διακρίνονται για ένα στάδιό τους, την αυτο-προσοχή, στο οποίο κάθε λέξη έχει διαφορετικό βάρος αναλόγως το context στο οποίο βρίσκεται.
  10. Για την ανάπτυξη του backend έγινε χρήση βιβλιοθηκών python, όπως η Beautiful Soup για την χειραγώγηση πληροφορίας στο διαδίκτυο, ή το Flask για το στήσιμο της διαδικτυακής εφαρμογής.
  11. Τέλος, τα pipelines, αλυσίδες επεξεργασίας δεδομένων, μετατρέπουν την πληροφορία σε αρχείο, την αποθηκεύουν στο Document Store,
  12. Τέλος, τα pipelines, αλυσίδες επεξεργασίας δεδομένων, μετατρέπουν την πληροφορία σε αρχείο, την αποθηκεύουν στο Document Store,
  13. Τέλος, τα pipelines, αλυσίδες επεξεργασίας δεδομένων, μετατρέπουν την πληροφορία σε αρχείο, την αποθηκεύουν στο Document Store,
  14. Εδώ βλέπετε ένα διάγραμμα ροής του αλγορίθμου. Στην αρχή, το σύστημα λαμβάνει ένα ερώτημα, ενεργοποιείται το Document Store, και γίνεται χρήση του για την απάντηση του ερωτήματος με τις πληροφορίες που έχουν ήδη αποθηκευτεί από τυχόν προηγούμενα ερωτήματα. Δημιουργείται ένα pipeline με όρισμα την ερώτηση, και δίνεται μια απάντηση μέσα από την ήδη αποθηκευμένη πληροφορία. Αν το σκορ της απάντησης είναι πάνω από ένα όριο, τότε τερματίζει ο αλγόριθμος. Αν είναι μικρότερο, τότε συνεχίζει στο επόμενο βήμα. Στο επόμενο βήμα, γίνεται χρήση του SERP API για την λήψη του info box και των συχνών ερωτήσεων της Google. Πλέον, με αυτές τις πληροφορίες ως πηγή, δημιουργείται ένα pipeline και εξάγεται μια απάντηση. Γίνεται ξανά έλεγχος για πιθανό τερματισμό του αλγορίθμου. Στην συνέχεια, λαμβάνονται τα 5 κορυφαία αποτελέσματα της μηχανής αναζήτησης της Google. Αν είναι ενεργή η λειτουργία βάθους, τότε εξάγονται οι σημαντικότερες λέξεις του ερωτήματος (θα είναι χρήσιμες αργότερα). Γίνεται προσπέλαση του κορυφαίου αποτελέσματος και με την λειτουργία βάθους ενεργή αποθηκεύονται όλοι οι υπερσύνδεσμοι σε αυτό. με την χρήση αυτού του κορυφαίου αποτελέσματος δημιουργείται ένα pipeline, και εξάγεται μια νέα απάντηση. Πραγματοποιείται ξανά έλεγχος για τερματισμό του αλγορίθμου. Τέλος, γίνεται προσπέλαση των υπόλοιπων 4 αποτελεσμάτων, και σε περίπτωση που η λειτουργία βάθους είναι ενεργή, προσπελάζονται και όλοι οι σύνδεσμοι που αποθηκεύτηκαν από το πρώτο αποτέλεσμα, εφόσον θεωρηθούν σχετικοί. Αυτή η συσχέτιση κρίνεται με την βοήθεια των σημαντικών λέξεων που απομονώθηκαν νωρίτερα από το ερώτημα. Πλέον, με το σύνολο της πληροφορίας, είτε με τα 4 αποτελέσματα είτε και με τους υπόλοιπους συνδέσμους, εξάγονται οι τελικές απαντήσεις και τερματίζεται ο αλγόριθμος.
  15. Εδώ βλέπετε ένα διάγραμμα ροής του αλγορίθμου. Στην αρχή, το σύστημα λαμβάνει ένα ερώτημα, ενεργοποιείται το Document Store, και γίνεται χρήση του για την απάντηση του ερωτήματος με τις πληροφορίες που έχουν ήδη αποθηκευτεί από τυχόν προηγούμενα ερωτήματα. Δημιουργείται ένα pipeline με όρισμα την ερώτηση, και δίνεται μια απάντηση μέσα από την ήδη αποθηκευμένη πληροφορία. Αν το σκορ της απάντησης είναι πάνω από ένα όριο, τότε τερματίζει ο αλγόριθμος. Αν είναι μικρότερο, τότε συνεχίζει στο επόμενο βήμα. Στο επόμενο βήμα, γίνεται χρήση του SERP API για την λήψη του info box και των συχνών ερωτήσεων της Google. Πλέον, με αυτές τις πληροφορίες ως πηγή, δημιουργείται ένα pipeline και εξάγεται μια απάντηση. Γίνεται ξανά έλεγχος για πιθανό τερματισμό του αλγορίθμου. Στην συνέχεια, λαμβάνονται τα 5 κορυφαία αποτελέσματα της μηχανής αναζήτησης της Google. Αν είναι ενεργή η λειτουργία βάθους, τότε εξάγονται οι σημαντικότερες λέξεις του ερωτήματος (θα είναι χρήσιμες αργότερα). Γίνεται προσπέλαση του κορυφαίου αποτελέσματος και με την λειτουργία βάθους ενεργή αποθηκεύονται όλοι οι υπερσύνδεσμοι σε αυτό. με την χρήση αυτού του κορυφαίου αποτελέσματος δημιουργείται ένα pipeline, και εξάγεται μια νέα απάντηση. Πραγματοποιείται ξανά έλεγχος για τερματισμό του αλγορίθμου. Τέλος, γίνεται προσπέλαση των υπόλοιπων 4 αποτελεσμάτων, και σε περίπτωση που η λειτουργία βάθους είναι ενεργή, προσπελάζονται και όλοι οι σύνδεσμοι που αποθηκεύτηκαν από το πρώτο αποτέλεσμα, εφόσον θεωρηθούν σχετικοί. Αυτή η συσχέτιση κρίνεται με την βοήθεια των σημαντικών λέξεων που απομονώθηκαν νωρίτερα από το ερώτημα. Πλέον, με το σύνολο της πληροφορίας, είτε με τα 4 αποτελέσματα είτε και με τους υπόλοιπους συνδέσμους, εξάγονται οι τελικές απαντήσεις και τερματίζεται ο αλγόριθμος.
  16. Για την απάντηση των ερωτημάτων χρησιμοποιήθηκαν 6 μοντέλα. 3 Αγγλικά, και 3 πολυγλωσσικά. Η επιλογή τους έγινε με βάση την γλώσσα εκπαίδευσης και το μέγεθός τους. Το albert είναι το μεγαλύτερο αγγλικό και ακολουθούν το roberta base squad και το minilm. Το gelectra base είναι πολυγλωσσικό με εξειδίκευση στα Γερμανικά.
  17. Όσον αφορά την διεπαφή, ο χρήστης χρησιμοποιεί την μπάρα αναζήτησης. Πέρα από το ερώτημά του, μπορεί να επιλέξει τη γλώσσα στην οποία αναζητά απάντηση, την ιστοσελίδα στην οποία θέλει να αναζητήσει την πληροφορία, αλλά και το μοντέλο το οποίο θα χρησιμοποιηθεί.
  18. Στην κορυφή των αποτελεσμάτων θα βρίσκεται το κορυφαίο αποτέλεσμα της αναζήτησης στον google, ενώ στο δεύτερο τμήμα βλέπουμε τις απαντήσεις αυτού του αποτελέσματος μαζί με το σκορ τους. Εδώ βλέπουμε, στο ερώτημα για το ποιος είναι ο πρόεδρος των ΗΠΑ, λαμβάνουμε κάποιες σωστές και κάποιες λανθασμένες απαντήσεις. Τέλος, βλέπουμε όλα τα αποτελέσματα, με το σύνολο των ιστοσελίδων και λοιπών πηγών. Η απάντηση, το σκορ, το λινκ της πηγής και το Context στο οποίο βρέθηκε η απάντηση.
  19. Στην κορυφή των αποτελεσμάτων θα βρίσκεται το κορυφαίο αποτέλεσμα της αναζήτησης στον google, ενώ στο δεύτερο τμήμα βλέπουμε τις απαντήσεις αυτού του αποτελέσματος μαζί με το σκορ τους. Εδώ βλέπουμε, στο ερώτημα για το ποιος είναι ο πρόεδρος των ΗΠΑ, λαμβάνουμε κάποιες σωστές και κάποιες λανθασμένες απαντήσεις. Τέλος, βλέπουμε όλα τα αποτελέσματα, με το σύνολο των ιστοσελίδων και λοιπών πηγών. Η απάντηση, το σκορ, το λινκ της πηγής και το Context στο οποίο βρέθηκε η απάντηση.
  20. Για τα πειράματα πραγματοποιήθηκαν 49 ερωτήματα. Έγινε προσπάθεια διαφοροποίησής τους με βάσει το είδος (Κλειστά, ανοιχτά), την απάντηση (Μονολεκτική, αναλυτική, αριθμός, ημερομηνία, ονοματεπώνυμο), την διαδικασία (Μαθηματικά, αναζήτηση), την γλώσσα (Αγγλικά, Γερμανικά) και την αντικειμενικότητα (Αντικειμενικά γεγονότα, υποκειμενικές απόψεις, επιστήμη). Εδώ βλέπετε την πλήρη λίστα.
  21. Για την σύγκριση των χρόνων εκτέλεσης θα μελετήσουμε 3 διαφορετικά μοντέλα στα 2 αυτά στάδιο του αλγορίθμου. Την απάντηση από το πρώτο αποτέλεσμα της Google, και την απάντηση από τα υπόλοιπα 4.
  22. Ο χρόνος εκτέλεσης του albert είναι απαγορευτικός για ένα τέτοιο σύστημα ενώ το minilm είναι ελαφρώς ταχύτερο από το roberta. Το δεύτερο στάδιο είναι αναμενόμενα πιο αργό αλλά όχι 4 φορές πιο αργό παρ' ότι έχει 4 φορές περισσότερη πληροφορία.
  23. Ας δούμε τώρα αναλυτικά ένα από αυτά τα ερωτήματα. Αριστερά βλέπουμε ένα διάγραμμα όπου στον χ άξονα είναι ο αριθμός της κάθε απάντησης (είναι ταξινομημένες σε αύξουσα σειρά με βάση το σκορ), και στον ψ άξονα είναι το σκορ της κάθε απάντησης. Το μοντέλο albert έχει το υψηλότερο σκορ, όπως είναι αναμενόμενο καθώς είναι και το μοντέλο με τις περισσότερες παραμέτρους. Μάλιστα, καθώς το σκορ της κορυφαίας απάντησης είναι τόσο υψηλό, τερματίζει ο αλγόριθμος νωρίτερα, οπότε και επιστρέφονται λιγότερες απαντήσεις. Το μοντέλο minilm έχει 4 στις 14 σωστές απαντήσεις, ενώ το roberta squad2 έχει 8 στις 14 παρ' ότι τα σκορ του είναι αρκετά χαμηλότερα. Τα 2 πολυγλωσσικά μοντέλα έχουν απογοητευτικές επιδόσεις.
  24. Παρατηρώντας τις κατανομές των σκορ του κάθε μοντέλου, βλέπουμε την υπεροχή του μοντέλου albert. Το minilm και το roberta base squad 2 έχουν αρκετά κοντινές επιδόσεις, ενώ ακολουθεί το gelectra, το Γερμανικό πολυγλωσσικό μοντέλο.
  25. Το albert είχε, αναμενόμενα, 48.5% σωστές απαντήσεις από το σύνολο των απαντήσεών του. Ακολουθεί με 46% το roberta base παρά τα χαμηλά του σκορ. Έπονται minilm και gelectra.
  26. Το albert είχε, αναμενόμενα, 48.5% σωστές απαντήσεις από το σύνολο των απαντήσεών του. Ακολουθεί με 46% το roberta base παρά τα χαμηλά του σκορ. Έπονται minilm και gelectra.
  27. Όπως είναι προφανές, το μοντέλο albert είναι εξαιρετικά χρονοβόρο, παρά τις κορυφαίες επιδόσεις, καθιστώντας το μη αποδεκτό για μια τέτοια εφαρμογή. Τα μοντέλα minilm και roberta-base δίνουν απαντήσεις αποδεκτής ποιότητας σε εύλογο χρονικό διάστημα, ενώ τα 2 από τα 3 πολυγλωσσικά μοντέλα είναι απογοητευτικά. Το τρίτο, το gelectra, είναι ελαφρώς χειρότερο από τα αγγλικά μοντέλα, αλλά είναι το κορυφαίο, όπως είναι λογικό, στα Γερμανικά ερωτήματα. Διαφορετικές μέθοδοι για τη λειτουργία βάθους οδηγούν σε ένα trade-off ταχύτητας και ακρίβειας. Τελικά όμως, η λειτουργία απορρίφθηκε, γιατί όπως είπα και νωρίτερα, στην πλειονότητα των περιπτώσεων οι απαντήσεις που προέρχονται από το βήμα δεν προσέδιδαν νέα πληροφορία ενώ ταυτόχρονα οι χρόνοι εκτέλεσης εκτινάσσονταν.
  28. Σε μια πιο γενική αξιολόγηση του συστήματος, οι απαντήσεις, σε σχέση με αντίστοιχους ψηφιακούς βοηθούς που είναι διαθέσιμοι, είναι πιο προσωποιημένες καθώς το document store αποθηκεύει τις πληροφορίες από τα προηγούμενα ερωτήματα. Επιπρόσθετα, δύναται να είναι πιο ιδιωτικές, καθώς αν γίνει χρήση των ήδη αποθηκευμένων πληροφοριών επιτυγχάνεται η απεξάρτηση από το διαδίκτυο. Τέλος, υπάρχει φορητότητα και δυναμικός χαρακτήρας. Όσον αφορά τις αδυναμίες, οι απαντήσεις δεν είναι αναλυτικές όπως σε κάποια LLMs, υπάρχουν λιγότερες λεπτομέρειες, και η απόκριση είναι σχετικά αργή.
  29. ===========================================================================Πιθανές μελλοντικές επεκτάσεις και βελτιώσεις του συστήματος είναι ένα Νέο Βελτιωμένο User Interface, η Δημιουργία Widget ή Add-On για ιστοσελίδες όπου οι πληροφορίες θα προέρχονται μόνο από αυτές, μεταφορά σε PaaS μορφή, όπως είναι το docker, και επιπλέον φορητότητα, και η Χρήση άλλων μοντέλων (πχ. νέες Γλώσσες). Ακόμα, υπάρχουν περιθώρια βελτιστοποίησης όσον αφορά την ταχύτητα με παραλληλοποίηση ακόμα περισσότερων τμημάτων του αλγορίθμου.