3. 3
Το “Stress” κατά τη διάρκεια της οδήγησης είναι ένας σημαντικός παράγοντας
πρόκλησης μοιραίων τροχαίων ατυχημάτων παγκοσμίως. Στόχος της παρούσας
διπλωματικής εργασίας είναι η ανάλυση βιοσημάτων με χρήση τεχνικών
επεξεργασίας σήματος και εξόρυξης γνώσης ωστέ να καθοριστεί, αν αυτό είναι
επιτεύξιμο, το σχετικό επίπεδο “Stress” ενός οδηγού. Συνολίκά, 11 σετ δεδομένων
συλλέχθηκαν από τη βάση δεδομένων του Physionet. Κάθε ένα απο αυτά τα σετ
δεδομένων περιλαμβάνει διάφορα βιοσήματα από οδηγούς οι οποίοι
ακολούθησαν μια συγκεκριμένη διαδρομή οδήγησης στην περιοχή της Βοστώνης.
Η διαδρομή αυτή επιλέχθηκε να είναι τέτοια ώστε να προκληθούν στους οδηγούς
τρία διαφορετικά επίπεδα “Stress”. Τα δεδομένα αυτά μπορούμε να τα βρούμε
στο: http://physionet.org/physiobank/database/drivedb/.
Πιο συγκεκριμένα, κάθε σετ δεδομένων περιλαμβάνει επτά βιοσήματα. Αυτά είναι
ένα ηλεκτροκαρδιογράφημα, ένα ηλεκτρομυογράφημα, δύο σήματα
αγωγιμότητας του δέρματος το ένα στο πόδι και το άλλο στο χέρι, ένα σήμα
καρδιακού ρυθμού, το οποίο προκύπτει από το ηλεκτροκαρδιογράφημα, και
τέλος ένα σήμα αναπνοής. Επίσης, υπάρχει και ενα έβδομο σήμα το οποίο καλείται
“marker” στόχος του οποίου είναι να διαχωρίζει τη κάθε περίοδο οδήγησης σε
διαστήματα ώστε να είναι σαφές το πότε ο κάθε οδηγός μεταβαίνει στις
περιόδους ξεκούρασης, οδήγησης στην πόλη και οδήγησης στην λεωφόρο. Τα
δεδομένα μας διασπώνται σε διαστήματα διάρκειας πέντε λεπτών κατά τη
διάρκεια των παραπάνω περιόδων ώστε να γίνει σαφής διάκριση μεταξύ τριών
καταστάσεων “Stress”. Οι τρείς αυτές καταστάσεις είναι η “Low-Stress”,
“Medium-Stress” και “High-Stress” όπου η “ Low-Stress” αντιστοιχεί στα χρονικά
διαστήματα ξεκούρασης η “ Medium-Stress ” στα χρονικά διαστήματα οδήγησης
στη λεωφόρο και η “ High-Stress” στα χρονικά διαστήματα οδήγησης στην πόλη.
Τα παραπάνω συμπεράσματα επικυρώνονται με τη χρήση ενός ερωτηματολογίου
που πραγματοποιήθηκε απο επιστήμονες του MIT. Για την όσο το δυνατον πιο
ακριβή διάκριση μεταξύ των τριών αυτών καταστάσεων, επιλέχθηκαν
συγκεκριμένα χαρακτηριστικά απο τα οποία δημιουργούμε πολυδιάστατα
διανύσματα ένα για κάθε 5-λεπτο διάστημα. Στη συνέχεια, σε αυτά τα
διανύσματα εφαρμόζουμε state of the art αλγόριθμους κατηγοριοποίησης όπως ο
Random Forest, ο BayesΝet, ο J48 και ο SMO και καταγράφεται η ακρίβεια τους.
Τέλος, καταγράφεται και αναλύεται το θεωρητικό υπόβαθρο το οποίο είναι
απαραίτητο για την κατανόηση των μεθόδων που χρησιμοποιούνται για την
επεξεργασία των δεδομένων μας και αλλά και τη διαδικασία εξόρυξης γνώσης
απο αυτά.
Λέξεις κλειδιά: Αναγνώριση Stress, επεξεργασία σήματος, εξόρυξη γνώσης, βιο-
σήματα, κατηγοριοποίηση.
4. 4
Stress while driving is a major factor causing fatal road accidents worldwide. Main
goal of this thesis is the analysis of some bio-signals using signal processing and
data mining techniques in order to determine the relative “Stress” level of a driver.
Overall, 11 data sets were collected from MIT-BIH PhysioNet Multi-parameter
Database. Each of these data sets includes various bio-signals by drivers who
followed a specific driving route in the greater Boston area. This route was chosen
to cause drivers three different “Stress” levels. We can find those data in the
following link at Physionet’s database called Stress Recognition in Automobile
Drivers: http://physionet.org/physiobank/database/drivedb/.
To be more specific, each data set includes six bio-signals. These are an
electrocardiogram, an electromyogram, two skin conductance signals on the foot
and hand, a heart rate signal, which results from electrocardiogram, and finally a
respiration signal. Also, there is a seventh signal which is called “marker” whose
aim is to separates every driving route into intervals in order to know when a
driver goes to rest periods, city and highway driving periods. Our data were
splitted into intervals, each of them, lasting 5 minutes during the periods above to
make a clear distinction between three Stress conditions. These three states are
“Low-Stress”, “Medium-Stress” and “High-Stress” where the “Low-Stress”
corresponds to the rest periods, “High-Stress” to the city driving and “Medium-
Stress” to the highway driving. The above conclusions were validated using a
questionnaire conducted by scientists from MIT. For the most precise distinction
between these three states we select specific features from each 5-minute interval.
Then, we create multidimensional vectors for each interval. Finally, we apply state
of the art classification algorithms such as Random Forest, Bayesnet, J48 and SMO
and recorded their accuracy.
Finally, we give the theory behind the experiments in order to understand deeply
the methods we used for data mining and signal processing to our data.
Κeywords: Stress Recognition, signal processing, data mining, bio-signals,
classification.