2. Άδειες Χρήσης
• Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
χρήσης Creative Commons.
• Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται
σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης
αναφέρεται ρητώς.
2
3. Χρηματοδότηση
• Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια
του εκπαιδευτικού έργου του διδάσκοντα.
• Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο
Αιγαίου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του
εκπαιδευτικού υλικού.
• Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού
Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και
συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό
Κοινωνικό Ταμείο) και από εθνικούς πόρους.
3
4. Περιεχόμενα Διάλεξης
Ανάλυση Διακύμανσης (ANOVA)
Κατά έναν Παράγοντα (One – Way Anova)
Κατά δύο Παράγοντες (Two – Way Anova)
5. Ανάλυση Διακύμανσης (ANOVA)
Η Ανάλυση Διακύμανσης χρησιμοποιείται για την εκτίμηση της πιθανότητας οι
διαφορές στους μέσους να είναι στατιστικά σημαντικές.
Αποτελεί επέκταση του t-test. Η διαφορά της από αυτό είναι ότι ενώ το t-test εξετάζει
τη διαφορά μεταξύ των μέσων για δύο ομάδες, η ANOVA εξετάζει τις διαφορές στους
μέσους για περισσότερες από δύο ομάδες.
Για να εφαρμοστεί η ANOVA θα πρέπει να υπάρχει μία κατηγορική μεταβλητή με
περισσότερες από δύο ομάδες και μία ποσοτική μεταβλητή.
Προϋποθέσεις Εφαρμογής της ANOVA
• Κανονικότητα σε κάθε υποομάδα – υποκατηγορία.
Για τον έλεγχο της κανονικότητας χρησιμοποιούμε τα κατάλοιπα. Τα κατάλοιπα μπορώ
είτε να τα υπολογίσω, είτε να χρησιμοποιήσω την εντολή για την Ανάλυση Διακύμανσης
με την οποία αποθηκεύονται.
• Ομοσκεδαστικότητα, δηλαδή να ισχύει η ισότητα των διακυμάνσεων
Εάν δεν ισχύει η προϋπόθεση προχωρούμε στο αντίστοιχο μη παραμετρικό Kruskal Wallis
Test ή Friedman
6. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Η Ανάλυση Διακύμανσης Κατά έναν Παράγοντα (One – Way Anova) εξετάζει τις
διαφορές μεταξύ περισσότερων από δύο ομάδων μια κατηγορικής ανεξάρτητης
μεταβλητής σε μία εξαρτημένη ποσοτική μεταβλητή.
Η0: Δεν υπάρχει διαφορά στις μέσες τιμές των i δειγμάτων ή
Η0: μi=μj, i,j = 1,2,…,n
Η1: Δύο τουλάχιστον μέσοι διαφέρουν ή
Η1: μi≠μj, i,j = 1,2,…,n
Για να τρέξουμε την Ανάλυση Διακύμανσης μπορούμε να χρησιμοποιήσουμε τις δύο εντολές του SPSS. Η διαφορά
είναι ότι με τη δεύτερη εντολή αποθηκεύονται τα κατάλοιπα ενώ με την πρώτη δεν αποθηκεύονται και ο ερευνητής
θα πρέπει να τα υπολογίσει μόνος του. Για το λόγο αυτό, θα δείξουμε και τις δύο εντολές αλλά στα παραδείγματα θα
χρησιμοποιούμε το δεύτερο τρόπο.
7. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Επιστρέφοντας στο αρχείο advertisments.sav έστω ότι θέλουμε να ελέγξουμε την
υπόθεση ότι δεν υπάρχει στατιστικά σημαντική διαφορά στο μέσο αριθμό των λέξεων
με περισσότερες από τρεις συλλαβές στις διαφημίσεις των περιοδικών ανάλογα με το
επίπεδο εκπαίδευσης.
Η0: μ1=μ2=μ3
Η1: Δύο τουλάχιστον μέσοι διαφέρουν
8. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Επιλέγουμε τα
περιγραφικά
στατιστικά και τον
έλεγχο για την
ομοσκεδαστικότητα
Με την
εντολή
Post Hoc
γίνονται οι
ανά δύο
συγκρίσεις
των
μέσων.
9. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Με την επιλογή Post
Hoc γίνονται οι ανά δύο
συγκρίσεις των μέσων.
Μπορούμε να
επιλέξουμε διάφορα test
για τις ανά δύο
συγκρίσεις.
Με την επιλογή Save
αποθηκεύονται τα
κατάλοιπα.
Με την επιλογή
Options
αποθηκεύουμε τα
περιγραφικά
στατιστικά και το
τεστ για την
ομοσκεδαστικότητα
10. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Έχοντας τρέξει την ANOVA στο data
view έχει δημιουργηθεί μία νέα
μεταβλητή, τα κατάλοιπα (RES_1).
Μπορούμε έτσι να προχωρήσουμε στον
έλεγχο της πρώτης προϋπόθεσης που
αφορά την κανονικότητα
11. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Η υπόθεση που ελέγχουμε είναι:
Η0: Η μεταβλητή «κατάλοιπα» ακολουθεί την Κανονική Κατανομή
Η1: Η μεταβλητή «κατάλοιπα» δεν ακολουθεί την Κανονική Κατανομή
Επειδή το δείγμα είναι μεγάλο κοιτάζω το
Kolmogorov Smirnov.
Sig = 0.003< 0.05 επομένως απορρίπτω την
Η0, δηλαδή η μεταβλητή δεν ακολουθεί
Κανονική Κατανομή
12. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Εφόσον δεν ισχύει η προϋπόθεση της Κανονικότητας των
καταλοίπων θα έπρεπε να προχωρήσουμε σε μη παραμετρικό τεστ.
Για εκπαιδευτικούς λόγους θα προχωρήσουμε με την ANOVA.
Έχουμε ήδη τρέξει την ANOVΑ.
13. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Περιγραφικά στατιστικά για τις μεταβλητές
Ο δεύτερος έλεγχος που αφορά την ομοσκεδαστικότητα
Η υπόθεση που ελέγχουμε είναι:
Η0: Οι διακυμάνσεις είναι ίσες στις τρεις ομάδες
Η1: Δύο τουλάχιστον διακυμάνσεις διαφέρουν
Sig=0.213>0.05 επομένως δεχόμαστε την Η0
14. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Ο έλεγχος που πραγματοποιείται είναι αν υπάρχει στατιστικά σημαντική διαφορά στο μέσο
αριθμό των λέξεων με περισσότερες από τρεις συλλαβές στις διαφημίσεις των περιοδικών
ανάλογα με το επίπεδο εκπαίδευσης.
Η0: μ1=μ2=μ3
Η1: Δύο τουλάχιστον μέσοι διαφέρουν
p-value=0.157>0.05 άρα δεχόμαστε την Ηο
Δηλαδή δεν υπάρχει στατιστικά σημαντική διαφορά στο μέσο αριθμό των λέξεων με
περισσότερες από τρεις συλλαβές στις διαφημίσεις των περιοδικών ανάλογα με το επίπεδο
εκπαίδευσης.
Πίνακας Ανάλυσης Διακύμανσης
15. Ανάλυση Διακύμανσης κατά έναν Παράγοντα
Post Hoc Tests
Με τα Post Hoc Tests γίνονται οι
ανά δύο συγκρίσεις ώστε να δούμε
σε ποια ζεύγη οι μέσοι διαφέρουν.
Οι διαφορές υποδηλώνονται με
αστερίσκο δίπλα από την τιμή που
υπάρχει στη στήλη Mean
Difference. Έχουν έννοια όταν
απορρίπτεται η μηδενική υπόθεση.
Στο συγκεκριμένο παράδειγμα δεν έχουν
νόημα διότι δεχθήκαμε ότι δεν υπάρχει
διαφορά στους μέσους ανάλογα με το
επίπεδο εκπαίδευσης.
16. Non Parametric Test – k Interdependent Samples
Εφόσον δεν ισχύει η προϋπόθεση της Κανονικότητας των καταλοίπων, εφαρμόζουμε το μη
παραμετρικό τεστ Kruskal Wallis.
17. Non Parametric Test – k Independent Samples
Ορίζουμε τις ομάδες για τις οποίες θα γίνει
ο έλεγχος.
18. Non Parametric Test – k Interdependent Samples
Sig.=0,113>0.05, επομένως δεχόμαστε τη
μηδενική υπόθεση.
Δηλαδή δεν υπάρχει στατιστικά σημαντική
διαφορά στο μέσο αριθμό των λέξεων με
περισσότερες από τρεις συλλαβές στις
διαφημίσεις των περιοδικών ανάλογα με το
επίπεδο εκπαίδευσης.
19. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Η Ανάλυση Διακύμανσης Κατά δύο παράγοντες (Two– Way Anova) αναλύει μία εξαρτημένη ποσοτική μεταβλητή
που επηρεάζεται από δύο κατηγορικές ανεξάρτητες μεταβλητές.
Οι δύο έλεγχοι που γίνονται είναι οι ακόλουθοι:
1ος έλεγχος
Η0: Δεν υπάρχει διαφορά στις μέσες τιμές των i δειγμάτων που οφείλονται στον πρώτο παράγοντα ή
Η0: μi=μj, i,j = 1,2,…,n
Η1: Δύο τουλάχιστον μέσοι διαφέρουν ή
Η1: μi≠μj, i,j = 1,2,…,n
2ος έλεγχος
Η0: Δεν υπάρχει διαφορά στις μέσες τιμές των i δειγμάτων που οφείλονται στο δεύτερο παράγοντα ή
Η0: μi=μj, i,j = 1,2,…,n
Η1: Δύο τουλάχιστον μέσοι διαφέρουν ή
Η1: μi≠μj, i,j = 1,2,…,n
Προϋποθέσεις Εφαρμογής της ANOVA
• Κανονικότητα σε κάθε υποομάδα – υποκατηγορία.
•Ομοσκεδαστικότητα
Εάν δεν ισχύει η προϋπόθεση προχωρούμε στο αντίστοιχο μη παραμετρικό τεστ Friedman
20. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Επιστρέφοντας στο αρχείο advertisments.sav έστω ότι θέλουμε να ελέγξουμε την
υπόθεση ότι δεν υπάρχει στατιστικά σημαντική διαφορά στο μέσο αριθμό των λέξεων
με περισσότερες από τρεις συλλαβές στις διαφημίσεις των περιοδικών ανάλογα:
- με το επίπεδο εκπαίδευσης
- την ηλικιακή κατηγορία
Για το επίπεδο εκπαίδευσης:
Η0: μ1=μ2=μ3
Η1: Δύο τουλάχιστον μέσοι διαφέρουν
Για την ηλικιακή κατηγορία:
Η0: μ1=μ2=μ3
Η1: Δύο τουλάχιστον μέσοι διαφέρουν
22. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Επιλέγουμε τα Post Hoc για τις
ανά δύο συγκρίσεις των μέσων και
για τις δύο κατηγορικές
μεταβλητές
Αποθηκεύουμε τα
κατάλοιπα
Επιλέγουμε το τεστ για
την ισότητα των
διακυμάνσεων και κάποια
περιγραφικά στατιστικά
23. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Η υπόθεση που ελέγχουμε είναι:
Η0: Η μεταβλητή «κατάλοιπα» ακολουθεί την Κανονική Κατανομή
Η1: Η μεταβλητή «κατάλοιπα» δεν ακολουθεί την Κανονική Κατανομή
Επειδή το δείγμα είναι μεγάλο κοιτάζω το
Kolmogorov Smirnov.
Sig = 0.200> 0.05 επομένως δέχομαι την Η0,
δηλαδή η μεταβλητή ακολουθεί Κανονική
Κατανομή
24. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Ο δεύτερος έλεγχος που αφορά την ομοσκεδαστικότητα
Η υπόθεση που ελέγχουμε είναι:
Η0: Οι διακυμάνσεις είναι ίσες στις τρεις ομάδες
Η1: Δύο τουλάχιστον διακυμάνσεις διαφέρουν
Sig=0.057>0.05 επομένως οριακά δεχόμαστε την Η0
25. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Η0: μ1=μ2=μ3 έναντι της Η1: 2 τουλάχιστον μέσοι διαφέρουν. Sig.=0,032<0,05 επομένως απορρίπτουμε την Η0, δηλαδή
υπάρχει στατιστικά σημαντική διαφορά στο μέσο αριθμό των λέξεων με περισσότερες από τρεις συλλαβές στις διαφημίσεις
των περιοδικών ανάλογα με το επίπεδο εκπαίδευσης.
Η0: μ1=μ2=μ3 έναντι της Η1: 2 τουλάχιστον μέσοι διαφέρουν. sig=0,696>0,05 επομένως δεχόμαστε την Η0, δηλαδή δεν
υπάρχει στατιστικά σημαντική διαφορά στο μέσο αριθμό των λέξεων με περισσότερες από τρεις συλλαβές στις διαφημίσεις
των περιοδικών ανάλογα με την ηλικιακή κατηγορία.
Η0: δεν υπάρχει αλληλεπίδραση εκπαιδευτικού επιπέδου και ηλικίας έναντι της Η1: υπάρχει αλληλεπίδραση εκπαιδευτικού
επιπέδου και ηλικίας. sig=0,048<0,05 επομένως απορρίπτουμε την Η0, δηλαδή υπάρχει αλληλεπίδραση εκπαιδευτικού
επιπέδου και ηλικίας.
26. Ανάλυση Διακύμανσης κατά Δύο Παράγοντες
Εφόσον απορρίψαμε την Η0 για τη μεταβλητή Επίπεδο εκπαίδευσης τα Post Hoc Tests
έχουν νόημα. Υπάρχουν διαφορές στους μέσους για τις ομάδες 1 - 2.
Post Hoc Tests