SlideShare a Scribd company logo
1 of 5
Download to read offline
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ
«Αυτόματη Ανaγνώριση του Stress σε
Οδηγούς Αυτοκινήτων»
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ
του
Ράμμου Αλέξανδρου
Επιβλέπων: Μεγαλοοικονόμου Βασίλειος
Καθηγητής του τμήματος Μηχανικών Η/Υ και Πληροφορικής
Υπεύθυνος Μεταδιδάκτορας: Mπόρας Ιωσήφ
Πάτρα, Ιούνιος 2015
Copyright © - All rights reserved Ράμμος Αλέξανδρος.
Με επιφύλαξη παντός δικαιώματος.
Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ΄
ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση,
αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή
ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και
να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν στη χρήση της
εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα.
Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο
εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευθεί ότι αντιπροσωπεύουν
τις επίσημες θέσεις του Πανεπιστημίου Πατρών.
...............................................
Ράμμος Αλέξανδρος
Διπλωματούχος Μηχανικός Ηλεκτρονικών Υπολογιστών και Πληροφορικής
Πανεπιστημίου Πατρών.
© 2015 – All rights reserved
3
Το “Stress” κατά τη διάρκεια της οδήγησης είναι ένας σημαντικός παράγοντας
πρόκλησης μοιραίων τροχαίων ατυχημάτων παγκοσμίως. Στόχος της παρούσας
διπλωματικής εργασίας είναι η ανάλυση βιοσημάτων με χρήση τεχνικών
επεξεργασίας σήματος και εξόρυξης γνώσης ωστέ να καθοριστεί, αν αυτό είναι
επιτεύξιμο, το σχετικό επίπεδο “Stress” ενός οδηγού. Συνολίκά, 11 σετ δεδομένων
συλλέχθηκαν από τη βάση δεδομένων του Physionet. Κάθε ένα απο αυτά τα σετ
δεδομένων περιλαμβάνει διάφορα βιοσήματα από οδηγούς οι οποίοι
ακολούθησαν μια συγκεκριμένη διαδρομή οδήγησης στην περιοχή της Βοστώνης.
Η διαδρομή αυτή επιλέχθηκε να είναι τέτοια ώστε να προκληθούν στους οδηγούς
τρία διαφορετικά επίπεδα “Stress”. Τα δεδομένα αυτά μπορούμε να τα βρούμε
στο: http://physionet.org/physiobank/database/drivedb/.
Πιο συγκεκριμένα, κάθε σετ δεδομένων περιλαμβάνει επτά βιοσήματα. Αυτά είναι
ένα ηλεκτροκαρδιογράφημα, ένα ηλεκτρομυογράφημα, δύο σήματα
αγωγιμότητας του δέρματος το ένα στο πόδι και το άλλο στο χέρι, ένα σήμα
καρδιακού ρυθμού, το οποίο προκύπτει από το ηλεκτροκαρδιογράφημα, και
τέλος ένα σήμα αναπνοής. Επίσης, υπάρχει και ενα έβδομο σήμα το οποίο καλείται
“marker” στόχος του οποίου είναι να διαχωρίζει τη κάθε περίοδο οδήγησης σε
διαστήματα ώστε να είναι σαφές το πότε ο κάθε οδηγός μεταβαίνει στις
περιόδους ξεκούρασης, οδήγησης στην πόλη και οδήγησης στην λεωφόρο. Τα
δεδομένα μας διασπώνται σε διαστήματα διάρκειας πέντε λεπτών κατά τη
διάρκεια των παραπάνω περιόδων ώστε να γίνει σαφής διάκριση μεταξύ τριών
καταστάσεων “Stress”. Οι τρείς αυτές καταστάσεις είναι η “Low-Stress”,
“Medium-Stress” και “High-Stress” όπου η “ Low-Stress” αντιστοιχεί στα χρονικά
διαστήματα ξεκούρασης η “ Medium-Stress ” στα χρονικά διαστήματα οδήγησης
στη λεωφόρο και η “ High-Stress” στα χρονικά διαστήματα οδήγησης στην πόλη.
Τα παραπάνω συμπεράσματα επικυρώνονται με τη χρήση ενός ερωτηματολογίου
που πραγματοποιήθηκε απο επιστήμονες του MIT. Για την όσο το δυνατον πιο
ακριβή διάκριση μεταξύ των τριών αυτών καταστάσεων, επιλέχθηκαν
συγκεκριμένα χαρακτηριστικά απο τα οποία δημιουργούμε πολυδιάστατα
διανύσματα ένα για κάθε 5-λεπτο διάστημα. Στη συνέχεια, σε αυτά τα
διανύσματα εφαρμόζουμε state of the art αλγόριθμους κατηγοριοποίησης όπως ο
Random Forest, ο BayesΝet, ο J48 και ο SMO και καταγράφεται η ακρίβεια τους.
Τέλος, καταγράφεται και αναλύεται το θεωρητικό υπόβαθρο το οποίο είναι
απαραίτητο για την κατανόηση των μεθόδων που χρησιμοποιούνται για την
επεξεργασία των δεδομένων μας και αλλά και τη διαδικασία εξόρυξης γνώσης
απο αυτά.
Λέξεις κλειδιά: Αναγνώριση Stress, επεξεργασία σήματος, εξόρυξη γνώσης, βιο-
σήματα, κατηγοριοποίηση.
4
Stress while driving is a major factor causing fatal road accidents worldwide. Main
goal of this thesis is the analysis of some bio-signals using signal processing and
data mining techniques in order to determine the relative “Stress” level of a driver.
Overall, 11 data sets were collected from MIT-BIH PhysioNet Multi-parameter
Database. Each of these data sets includes various bio-signals by drivers who
followed a specific driving route in the greater Boston area. This route was chosen
to cause drivers three different “Stress” levels. We can find those data in the
following link at Physionet’s database called Stress Recognition in Automobile
Drivers: http://physionet.org/physiobank/database/drivedb/.
To be more specific, each data set includes six bio-signals. These are an
electrocardiogram, an electromyogram, two skin conductance signals on the foot
and hand, a heart rate signal, which results from electrocardiogram, and finally a
respiration signal. Also, there is a seventh signal which is called “marker” whose
aim is to separates every driving route into intervals in order to know when a
driver goes to rest periods, city and highway driving periods. Our data were
splitted into intervals, each of them, lasting 5 minutes during the periods above to
make a clear distinction between three Stress conditions. These three states are
“Low-Stress”, “Medium-Stress” and “High-Stress” where the “Low-Stress”
corresponds to the rest periods, “High-Stress” to the city driving and “Medium-
Stress” to the highway driving. The above conclusions were validated using a
questionnaire conducted by scientists from MIT. For the most precise distinction
between these three states we select specific features from each 5-minute interval.
Then, we create multidimensional vectors for each interval. Finally, we apply state
of the art classification algorithms such as Random Forest, Bayesnet, J48 and SMO
and recorded their accuracy.
Finally, we give the theory behind the experiments in order to understand deeply
the methods we used for data mining and signal processing to our data.
Κeywords: Stress Recognition, signal processing, data mining, bio-signals,
classification.
5

More Related Content

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

Rammos_Alexandros_Diploma_Thesis_Description

  • 1. ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ «Αυτόματη Ανaγνώριση του Stress σε Οδηγούς Αυτοκινήτων» ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του Ράμμου Αλέξανδρου Επιβλέπων: Μεγαλοοικονόμου Βασίλειος Καθηγητής του τμήματος Μηχανικών Η/Υ και Πληροφορικής Υπεύθυνος Μεταδιδάκτορας: Mπόρας Ιωσήφ Πάτρα, Ιούνιος 2015 Copyright © - All rights reserved Ράμμος Αλέξανδρος.
  • 2. Με επιφύλαξη παντός δικαιώματος. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ΄ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν στη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευθεί ότι αντιπροσωπεύουν τις επίσημες θέσεις του Πανεπιστημίου Πατρών. ............................................... Ράμμος Αλέξανδρος Διπλωματούχος Μηχανικός Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστημίου Πατρών. © 2015 – All rights reserved
  • 3. 3 Το “Stress” κατά τη διάρκεια της οδήγησης είναι ένας σημαντικός παράγοντας πρόκλησης μοιραίων τροχαίων ατυχημάτων παγκοσμίως. Στόχος της παρούσας διπλωματικής εργασίας είναι η ανάλυση βιοσημάτων με χρήση τεχνικών επεξεργασίας σήματος και εξόρυξης γνώσης ωστέ να καθοριστεί, αν αυτό είναι επιτεύξιμο, το σχετικό επίπεδο “Stress” ενός οδηγού. Συνολίκά, 11 σετ δεδομένων συλλέχθηκαν από τη βάση δεδομένων του Physionet. Κάθε ένα απο αυτά τα σετ δεδομένων περιλαμβάνει διάφορα βιοσήματα από οδηγούς οι οποίοι ακολούθησαν μια συγκεκριμένη διαδρομή οδήγησης στην περιοχή της Βοστώνης. Η διαδρομή αυτή επιλέχθηκε να είναι τέτοια ώστε να προκληθούν στους οδηγούς τρία διαφορετικά επίπεδα “Stress”. Τα δεδομένα αυτά μπορούμε να τα βρούμε στο: http://physionet.org/physiobank/database/drivedb/. Πιο συγκεκριμένα, κάθε σετ δεδομένων περιλαμβάνει επτά βιοσήματα. Αυτά είναι ένα ηλεκτροκαρδιογράφημα, ένα ηλεκτρομυογράφημα, δύο σήματα αγωγιμότητας του δέρματος το ένα στο πόδι και το άλλο στο χέρι, ένα σήμα καρδιακού ρυθμού, το οποίο προκύπτει από το ηλεκτροκαρδιογράφημα, και τέλος ένα σήμα αναπνοής. Επίσης, υπάρχει και ενα έβδομο σήμα το οποίο καλείται “marker” στόχος του οποίου είναι να διαχωρίζει τη κάθε περίοδο οδήγησης σε διαστήματα ώστε να είναι σαφές το πότε ο κάθε οδηγός μεταβαίνει στις περιόδους ξεκούρασης, οδήγησης στην πόλη και οδήγησης στην λεωφόρο. Τα δεδομένα μας διασπώνται σε διαστήματα διάρκειας πέντε λεπτών κατά τη διάρκεια των παραπάνω περιόδων ώστε να γίνει σαφής διάκριση μεταξύ τριών καταστάσεων “Stress”. Οι τρείς αυτές καταστάσεις είναι η “Low-Stress”, “Medium-Stress” και “High-Stress” όπου η “ Low-Stress” αντιστοιχεί στα χρονικά διαστήματα ξεκούρασης η “ Medium-Stress ” στα χρονικά διαστήματα οδήγησης στη λεωφόρο και η “ High-Stress” στα χρονικά διαστήματα οδήγησης στην πόλη. Τα παραπάνω συμπεράσματα επικυρώνονται με τη χρήση ενός ερωτηματολογίου που πραγματοποιήθηκε απο επιστήμονες του MIT. Για την όσο το δυνατον πιο ακριβή διάκριση μεταξύ των τριών αυτών καταστάσεων, επιλέχθηκαν συγκεκριμένα χαρακτηριστικά απο τα οποία δημιουργούμε πολυδιάστατα διανύσματα ένα για κάθε 5-λεπτο διάστημα. Στη συνέχεια, σε αυτά τα διανύσματα εφαρμόζουμε state of the art αλγόριθμους κατηγοριοποίησης όπως ο Random Forest, ο BayesΝet, ο J48 και ο SMO και καταγράφεται η ακρίβεια τους. Τέλος, καταγράφεται και αναλύεται το θεωρητικό υπόβαθρο το οποίο είναι απαραίτητο για την κατανόηση των μεθόδων που χρησιμοποιούνται για την επεξεργασία των δεδομένων μας και αλλά και τη διαδικασία εξόρυξης γνώσης απο αυτά. Λέξεις κλειδιά: Αναγνώριση Stress, επεξεργασία σήματος, εξόρυξη γνώσης, βιο- σήματα, κατηγοριοποίηση.
  • 4. 4 Stress while driving is a major factor causing fatal road accidents worldwide. Main goal of this thesis is the analysis of some bio-signals using signal processing and data mining techniques in order to determine the relative “Stress” level of a driver. Overall, 11 data sets were collected from MIT-BIH PhysioNet Multi-parameter Database. Each of these data sets includes various bio-signals by drivers who followed a specific driving route in the greater Boston area. This route was chosen to cause drivers three different “Stress” levels. We can find those data in the following link at Physionet’s database called Stress Recognition in Automobile Drivers: http://physionet.org/physiobank/database/drivedb/. To be more specific, each data set includes six bio-signals. These are an electrocardiogram, an electromyogram, two skin conductance signals on the foot and hand, a heart rate signal, which results from electrocardiogram, and finally a respiration signal. Also, there is a seventh signal which is called “marker” whose aim is to separates every driving route into intervals in order to know when a driver goes to rest periods, city and highway driving periods. Our data were splitted into intervals, each of them, lasting 5 minutes during the periods above to make a clear distinction between three Stress conditions. These three states are “Low-Stress”, “Medium-Stress” and “High-Stress” where the “Low-Stress” corresponds to the rest periods, “High-Stress” to the city driving and “Medium- Stress” to the highway driving. The above conclusions were validated using a questionnaire conducted by scientists from MIT. For the most precise distinction between these three states we select specific features from each 5-minute interval. Then, we create multidimensional vectors for each interval. Finally, we apply state of the art classification algorithms such as Random Forest, Bayesnet, J48 and SMO and recorded their accuracy. Finally, we give the theory behind the experiments in order to understand deeply the methods we used for data mining and signal processing to our data. Κeywords: Stress Recognition, signal processing, data mining, bio-signals, classification.
  • 5. 5