SlideShare a Scribd company logo
1 of 5
Download to read offline
Σελίδα 1 από 5
Analyze - Nonparametric
tests - chi square
Μεθοδολογία Εκπαιδευτικής Έρευνας: Ποσοτικές Προσεγγίσεις
Εργαστήριο SPSS Τρίτη, 12-1-2010
Υπεύθυνος Καθηγητής: Παπαπέτρου Σάββας
Εργαστηριακός Συνεργάτης Λαβίδας Κωνσταντίνος
Μη παραμετρικά κριτήρια
Το x2
χρησιμοποιείται στον έλεγχο υποθέσεων ποιοτικών δεδομένων (nominal,
ordinal), είναι δηλαδή κατάλληλο μόνο για προβλέψεις σχετικά με το πόσοι
συμμετέχοντες θα βρεθούν σε κάθε κατηγορία της κατηγορική μεταβλητής.
Προσοχή: Ο ερευνητής πρέπει να εξασφαλίσει ότι ένας ικανός αριθμός
συμμετεχόντων της έρευνας θα βρεθεί σε κάθε κατηγορία, έτσι σε κάθε κατηγορία θα
πρέπει να έχουμε περίπου 20 συμμετέχοντες.
1η
περίπτωση
Chi square as a’ goodness – of – fit’ test
Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που
προέρχονται μόνο από ένα δείγμα (δείκτης καλής προσαρμογής ή καταλληλότητας – chi
square as a’ goodness – of – fit’ test)
Δραστηριότητα 1η
Ένας ερευνητής μελετώντας τον τρόπο που 120 φοιτητές οργανώνουν τη μελέτη τους
βρίσκει ότι:
Μεθοδική ακανόνιστη Συνδυαστική
51 27 42
Πρόκειται για τυχαίες διαφορές ή πράγματι οι φοιτητές σήμερα οργανώνουν τη
μελέτη τους «μεθοδικά»;
Το σίγουρο είναι ότι αν οι διαφορές αυτές ήταν τυχαίες θα έπρεπε να είχαμε συχνότητες
σε όλες τις περιπτώσεις 40, (Αναμενόμενες συχνότητες – expected frequencies).
Πως θα περάσουμε τα δεδομένα;
Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση
περιπτώσεων – weight cases) για να τοποθετήσετε
τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με
το στατιστικό κριτήριο x2
των έλεγχο υποθέσεων στον πληθυσμό του δείγματος.
Άσκηση 1η
Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού
του δείγματος που μελετάμε είναι ικανοποιημένοι ή όχι από την δουλεία τους (Job
Satisfaction).
Σελίδα 2 από 5
2η
περίπτωση
Έλεγχος ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών - chi square as a
test of independence.
Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που
προέρχονται από δύο ή περισσότερα δείγματα (x2
για ανεξαρτησία) εξετάζοντας αν οι
συχνότητες προέκυψαν τυχαία ή συστηματικά.
Στην περίπτωση ελέγχου της ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών:
θα πρέπει καταρχήν να προσδιορίσουμε εννοιολογικά ποια είναι η ανεξάρτητη
μεταβλητή, γραμμές του πίνακα διασταύρωσης και ποια η εξαρτημένη, στήλες του
πίνακα διασταύρωσης . Συνήθως ανεξάρτητη μεταβλητή θεωρείται αυτή που
προηγείται χρονικά.
Στην συγκεκριμένη περίπτωση τον ερμηνευτικό ρόλο των δειγμάτων αντί του μέσου
όρου όπως στην περίπτωση ποσοτικών μεταβλητών θα παίξει η σχετική συχνότητα
των κατηγοριών της ανεξάρτητης μεταβλητής (τοποθετημένη στην γραμμή του
πίνακα διασταύρωσης) ως ποσοστά επί του συνόλου της κάθε γραμμής.
Ο έλεγχος χ2
χρησιμοποιείται για να ελέγξει την ανεξαρτησία ή όχι των κατηγορικών
μεταβλητών.
Ø Δεν δίνει πληροφορίες, για το αν η έλλειψη ανεξαρτησίας αφορά όλο τον
πίνακα ή ένα μόνο τμήμα του.
Αυτό το προσδιορίζουμε από τα υπόλοιπα (residuals) κυρίως τα
προσαρμοσμένα (adjusted) τα οποία ακολουθούν κατά προσέγγιση την τυπική
κανονική κατανομή, άρα τιμές μεγαλύτερες από 1,96 κατά απόλυτη τιμή
οδηγούν με μεγαλύτερη ισχύ στην ένδειξη ανεξαρτησίας. Επίσης τα
προσαρμοσμένα υπόλοιπα που έχουν τιμές πάντοτε μεγαλύτερες από τα
τυποποιημένα υπόλοιπα (standardized), τα οποία ακολουθούν περίπου την
τυπική κανονική κατανομή, με τυπική απόκλιση <=1, έχουν μεγαλύτερη ισχύ
από τα τυποποιημένα για την ανάδειξη σημαντικών αποκλίσεων.
Ø Δίνει πληροφορίες, για την ένταση της σχέσης, με μέτρα που βασίζονται στο
x2 στατιστικό όπως (συντελεστής συνάφειας, phi, V του Gramer) αλλά και
μέτρα αναλογικής μείωσης του σφάλματος πρόβλεψης όπως (Lambda,
συντελεστής αβεβαιότητας) «για παράδειγμα, στην περίπτωση αυτή αν το
μέτρο έχει τιμή 0,234, σημαίνει ότι έχουμε 23,4% μείωση του σφάλματος
πρόβλεψης της μιας μεταβλητής από την άλλη σε σχέση με το σφάλμα που θα
κάναμε αν προβλέπαμε στην τύχη».
Ø Δεν δίνει πληροφορίες, για την φύση της σχέσης, στην περίπτωση δύο
κατηγορικών μεταβλητών. Στην περίπτωση δύο μεταβλητών διάταξης έχει
νόημα η φύση της σχέσης θετική ή αρνητική και προσδιορίζεται με μέτρα
όπως συντελεστής gamma, Tau-b, Tau-c του Kendall και συντελεστής d του
Somers.
Σελίδα 3 από 5
Προσοχή:
Προϋποθέσεις χρήσης του Χ2
Οι αναμενόμενες συχνότητες στα κελιά δεν πρέπει να είναι μικρότερες του 1 και
μόνο το 20% των κελιών θα μπορεί να έχει αναμενόμενη συχνότητα κάτω από 5.
Λύση στο πρόβλημα αυτό.
Συνήθως φροντίζουμε, για να αποφύγουμε το παραπάνω πρόβλημα να παίρνουμε
μεγάλο δείγμα τουλάχιστον 20 Χ (κΧν) όπου κ και ν κατηγορίες των δύο
κατηγορικών μεταβλητών.
Και αν οι προϋποθέσεις δεν ισχύουν;
Ø Η διαδικασία που χρησιμοποιείται συνήθως για την ικανοποίηση της
παραπάνω προϋπόθεσης, είναι η συγχώνευση κατηγοριών και δημιουργία
ευρύτερων κατηγοριών, με ότι αυτό μπορεί να σημαίνει για την αξιοπιστία της
έρευνας.
Ø Διόρθωση Fisher, στις περιπτώσεις που έχουμε πίνακα συνάφειας 2χ2 (δύο
κατηγορικές μεταβλητές με δύο κατηγορίες η κάθε μία), σύμφωνα με την
ακριβή διαδικασία (exact test) η οποία αποτελεί «διόρθωση του Fisher» δεν
υπάρχει πρόβλημα στην χρήση του τεστ ακόμη και αν η παραπάνω
προϋπόθεση των αναμενόμενων συχνοτήτων κάτω από 5, δεν ισχύει.
Σελίδα 4 από 5
Analyze – Descriptive
Statistics – Crosstabs
(πίνακας διασταύρωσης)
Δραστηριότητα 2η
Ένας ερευνητής θέλει να ελέγξει αν μια μέθοδος διδασκαλίας είναι
αποτελεσματικότερη από τον παραδοσιακό τρόπο διδασκαλίας. Επιλέγει δύο τμήματα
(ισοδύναμα όσον αφορά τις γνώσεις) από ένα σχολείο και ζητά από έναν δάσκαλο να
διδάξει με τον παραδοσιακό τρόπο (42 μαθητές) ενώ αυτός διδάσκει με την νέα
μέθοδο διδασκαλίας (44 μαθητές). Μετά την ολοκλήρωση της διδασκαλίας ο
ερευνητής υποβάλει και τα δύο τμήματα σε γραπτή δοκιμασία. Τα αποτελέσματα
φαίνονται στον παρακάτω πίνακα.
Επίδοση των μαθητώνΜέθοδος
διδασκαλίας Χαμηλή Μέτρια Υψηλή Σύνολα
Νέα Μέθοδος 6 15 23 44
Παραδ. Μέθοδος 10 8 24 42
Σύνολα 16 23 47 86
Οι αναμενόμενες συχνότητες έτσι ώστε να ισχύει η ανεξαρτησία των μεταβλητών
(δηλαδή η μηδενική υπόθεση) υπολογίζονται από τον τύπο:
T
SG
=
*
A (Γ: τιμή στην
αντίστοιχη γραμμή, Σ: τιμή στην αντίστοιχη στήλη, Τ: γενικό σύνολο)
Ερωτήσεις
Ποια είναι η ανεξάρτητη μεταβλητή και ποια η εξαρτημένη;
Γράψτε τις υποθέσεις του προβλήματος.
Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση
περιπτώσεων – weight cases) για να τοποθετήσετε
τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με
το στατιστικό κριτήριο x2
των έλεγχο υποθέσεων
στον πληθυσμό του δείγματος.
Δραστηριότητα 3η
Από το αρχείο δεδομένων «talsmple.sav» μας ενδιαφέρει στην αναζήτηση της
πιθανής σχέσης μεταξύ των μεταβλητών βάρος (baros_nn) και ύψος (ypsos_nn) των
μαθητών του δείγματος.
Αν υπάρχει σχέση, ποια είναι η φύση1
της σχέσης των δύο αυτών μεταβλητών.
Άσκηση 2η
Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού
του δείγματος που μελετάμε είναι ικανοποιημένοι από την δουλεία τους (Job
Satisfaction) σε σχέση με το κατά πόσο αισθάνονται ικανοποιημένοι από την ζωή
τους (Is life exciting or dull).
Άσκηση 3η
Να χρησιμοποιηθεί το αρχείο gss.sav για να απαντηθούν τα παρακάτω
ερωτήματα:
o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες πιστεύουν
στον ίδιο βαθμό ότι υπάρχει μετά θάνατο ζωή (μεταβλητή postlife). Τι
συμπεραίνετε;
1
Π.χ. αύξουσα ή φθίνουσα.
Σελίδα 5 από 5
1. Ποια είναι η εξαρτημένη μεταβλητή;
2. Αν η μηδενική υπόθεση «αληθεύει» ποια είναι η καλύτερη
πρόγνωση για το ποσοστό των ανθρώπων που πιστεύουν στη μετά
θάνατο ζωή;
o Να ελεγχθεί κατά πόσο η πίστη στη μετά θάνατο ζωή και το επίπεδο
εκπαίδευσης (μεταβλητή degree) είναι ανεξάρτητες. Ποιο είναι το
συμπέρασμά σας;
o Να εκλεχθεί κατά πόσο η σχέση ανάμεσα στην πίστη στη μετά θάνατο
ζωή και το επίπεδο εκπαίδευσης είναι ίδια για γυναίκες και άνδρες.
o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες είχαν τις ίδιες
προτιμήσεις απέναντι στους Perot, Bush και Clinton (μεταβλητή pres92).
(Πρέπει να εξαιρεθούν οι άνθρωποι που ψήφισαν Other.)
o Να ελεγχθεί η υπόθεση ότι η κατανομή της μεταβλητής Ζώδια (zodiac)
κατανέμεται ομοιόμορφα.
Άσκηση 4η
Να χρησιμοποιηθεί το αρχείο salary.sav για να απαντηθούν τα παρακάτω
ερωτήματα:
o Να ελεγχθεί η υπόθεση η ταξινόμηση επαγγελμάτων (jobcat) και οι
ομάδες φύλου με φυλή ( μεταβλητη sexrace) είναι ανεξάρτητες.
1. Τι πρόβλημα συναντάμε με το x2
test στον πίνακα (jobcat) x
(sexrace);
2. Τι μπορείτε να κάνετε ώστε το x2
test να γίνει κατάλληλο;
3. Βασιζόμενοι στον καινούργιο πίνακα τι συμπεραίνετε για τη
μηδενική υπόθεση;

More Related Content

Similar to Lesson 8 spss lab

ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdf
ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdfΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdf
ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdfEleniKarafoti
 
2o μάθημα.ppt.ppt
2o μάθημα.ppt.ppt2o μάθημα.ppt.ppt
2o μάθημα.ppt.pptssuserdf7768
 
Τεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευσηΤεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευσηStesia Papavasileiou
 
03. Είδη Επιδημιολογικών Μελετών (Θ).ppt
03. Είδη Επιδημιολογικών Μελετών (Θ).ppt03. Είδη Επιδημιολογικών Μελετών (Θ).ppt
03. Είδη Επιδημιολογικών Μελετών (Θ).pptDimitrisGoulas
 
Στατιστική
ΣτατιστικήΣτατιστική
ΣτατιστικήEyurt
 
Στατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4οΣτατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4οVassilis Markos
 
8th Lecture OPEN.pptx
8th Lecture OPEN.pptx8th Lecture OPEN.pptx
8th Lecture OPEN.pptxssuser96d4212
 
Μέθοδοι Κοινωνικής Έρευνας methods of social search
Μέθοδοι Κοινωνικής Έρευνας methods of social searchΜέθοδοι Κοινωνικής Έρευνας methods of social search
Μέθοδοι Κοινωνικής Έρευνας methods of social searchechrysisapps
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΡεβέκα Θεοδωροπούλου
 
στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2Kozalakis
 
σημειώσεις Minitab
σημειώσεις Minitabσημειώσεις Minitab
σημειώσεις MinitabHERCULANDER
 

Similar to Lesson 8 spss lab (14)

ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdf
ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdfΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdf
ΜΕΘΟΔΟΓΙΑ ΠΕΙΡΑΜΑΤΙΚΗΣ ΕΡΕΥΝΑΣ.pdf
 
2o μάθημα.ppt.ppt
2o μάθημα.ppt.ppt2o μάθημα.ppt.ppt
2o μάθημα.ppt.ppt
 
Τεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευσηΤεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευση
 
03. Είδη Επιδημιολογικών Μελετών (Θ).ppt
03. Είδη Επιδημιολογικών Μελετών (Θ).ppt03. Είδη Επιδημιολογικών Μελετών (Θ).ppt
03. Είδη Επιδημιολογικών Μελετών (Θ).ppt
 
Στατιστική
ΣτατιστικήΣτατιστική
Στατιστική
 
Στατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4οΣτατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4ο
 
8th Lecture OPEN.pptx
8th Lecture OPEN.pptx8th Lecture OPEN.pptx
8th Lecture OPEN.pptx
 
6_independent samples t-test.pdf
6_independent samples t-test.pdf6_independent samples t-test.pdf
6_independent samples t-test.pdf
 
αξιολόγηση ερευνητικής εργασίας
αξιολόγηση ερευνητικής εργασίαςαξιολόγηση ερευνητικής εργασίας
αξιολόγηση ερευνητικής εργασίας
 
Μέθοδοι Κοινωνικής Έρευνας methods of social search
Μέθοδοι Κοινωνικής Έρευνας methods of social searchΜέθοδοι Κοινωνικής Έρευνας methods of social search
Μέθοδοι Κοινωνικής Έρευνας methods of social search
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
 
στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2
 
σημειώσεις Minitab
σημειώσεις Minitabσημειώσεις Minitab
σημειώσεις Minitab
 
Στοιχεία Ερευνητικής Μεθοδολογίας - Σύνταξη Ερωτηματολογίων
Στοιχεία Ερευνητικής Μεθοδολογίας - Σύνταξη ΕρωτηματολογίωνΣτοιχεία Ερευνητικής Μεθοδολογίας - Σύνταξη Ερωτηματολογίων
Στοιχεία Ερευνητικής Μεθοδολογίας - Σύνταξη Ερωτηματολογίων
 

Lesson 8 spss lab

  • 1. Σελίδα 1 από 5 Analyze - Nonparametric tests - chi square Μεθοδολογία Εκπαιδευτικής Έρευνας: Ποσοτικές Προσεγγίσεις Εργαστήριο SPSS Τρίτη, 12-1-2010 Υπεύθυνος Καθηγητής: Παπαπέτρου Σάββας Εργαστηριακός Συνεργάτης Λαβίδας Κωνσταντίνος Μη παραμετρικά κριτήρια Το x2 χρησιμοποιείται στον έλεγχο υποθέσεων ποιοτικών δεδομένων (nominal, ordinal), είναι δηλαδή κατάλληλο μόνο για προβλέψεις σχετικά με το πόσοι συμμετέχοντες θα βρεθούν σε κάθε κατηγορία της κατηγορική μεταβλητής. Προσοχή: Ο ερευνητής πρέπει να εξασφαλίσει ότι ένας ικανός αριθμός συμμετεχόντων της έρευνας θα βρεθεί σε κάθε κατηγορία, έτσι σε κάθε κατηγορία θα πρέπει να έχουμε περίπου 20 συμμετέχοντες. 1η περίπτωση Chi square as a’ goodness – of – fit’ test Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που προέρχονται μόνο από ένα δείγμα (δείκτης καλής προσαρμογής ή καταλληλότητας – chi square as a’ goodness – of – fit’ test) Δραστηριότητα 1η Ένας ερευνητής μελετώντας τον τρόπο που 120 φοιτητές οργανώνουν τη μελέτη τους βρίσκει ότι: Μεθοδική ακανόνιστη Συνδυαστική 51 27 42 Πρόκειται για τυχαίες διαφορές ή πράγματι οι φοιτητές σήμερα οργανώνουν τη μελέτη τους «μεθοδικά»; Το σίγουρο είναι ότι αν οι διαφορές αυτές ήταν τυχαίες θα έπρεπε να είχαμε συχνότητες σε όλες τις περιπτώσεις 40, (Αναμενόμενες συχνότητες – expected frequencies). Πως θα περάσουμε τα δεδομένα; Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση περιπτώσεων – weight cases) για να τοποθετήσετε τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με το στατιστικό κριτήριο x2 των έλεγχο υποθέσεων στον πληθυσμό του δείγματος. Άσκηση 1η Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού του δείγματος που μελετάμε είναι ικανοποιημένοι ή όχι από την δουλεία τους (Job Satisfaction).
  • 2. Σελίδα 2 από 5 2η περίπτωση Έλεγχος ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών - chi square as a test of independence. Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που προέρχονται από δύο ή περισσότερα δείγματα (x2 για ανεξαρτησία) εξετάζοντας αν οι συχνότητες προέκυψαν τυχαία ή συστηματικά. Στην περίπτωση ελέγχου της ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών: θα πρέπει καταρχήν να προσδιορίσουμε εννοιολογικά ποια είναι η ανεξάρτητη μεταβλητή, γραμμές του πίνακα διασταύρωσης και ποια η εξαρτημένη, στήλες του πίνακα διασταύρωσης . Συνήθως ανεξάρτητη μεταβλητή θεωρείται αυτή που προηγείται χρονικά. Στην συγκεκριμένη περίπτωση τον ερμηνευτικό ρόλο των δειγμάτων αντί του μέσου όρου όπως στην περίπτωση ποσοτικών μεταβλητών θα παίξει η σχετική συχνότητα των κατηγοριών της ανεξάρτητης μεταβλητής (τοποθετημένη στην γραμμή του πίνακα διασταύρωσης) ως ποσοστά επί του συνόλου της κάθε γραμμής. Ο έλεγχος χ2 χρησιμοποιείται για να ελέγξει την ανεξαρτησία ή όχι των κατηγορικών μεταβλητών. Ø Δεν δίνει πληροφορίες, για το αν η έλλειψη ανεξαρτησίας αφορά όλο τον πίνακα ή ένα μόνο τμήμα του. Αυτό το προσδιορίζουμε από τα υπόλοιπα (residuals) κυρίως τα προσαρμοσμένα (adjusted) τα οποία ακολουθούν κατά προσέγγιση την τυπική κανονική κατανομή, άρα τιμές μεγαλύτερες από 1,96 κατά απόλυτη τιμή οδηγούν με μεγαλύτερη ισχύ στην ένδειξη ανεξαρτησίας. Επίσης τα προσαρμοσμένα υπόλοιπα που έχουν τιμές πάντοτε μεγαλύτερες από τα τυποποιημένα υπόλοιπα (standardized), τα οποία ακολουθούν περίπου την τυπική κανονική κατανομή, με τυπική απόκλιση <=1, έχουν μεγαλύτερη ισχύ από τα τυποποιημένα για την ανάδειξη σημαντικών αποκλίσεων. Ø Δίνει πληροφορίες, για την ένταση της σχέσης, με μέτρα που βασίζονται στο x2 στατιστικό όπως (συντελεστής συνάφειας, phi, V του Gramer) αλλά και μέτρα αναλογικής μείωσης του σφάλματος πρόβλεψης όπως (Lambda, συντελεστής αβεβαιότητας) «για παράδειγμα, στην περίπτωση αυτή αν το μέτρο έχει τιμή 0,234, σημαίνει ότι έχουμε 23,4% μείωση του σφάλματος πρόβλεψης της μιας μεταβλητής από την άλλη σε σχέση με το σφάλμα που θα κάναμε αν προβλέπαμε στην τύχη». Ø Δεν δίνει πληροφορίες, για την φύση της σχέσης, στην περίπτωση δύο κατηγορικών μεταβλητών. Στην περίπτωση δύο μεταβλητών διάταξης έχει νόημα η φύση της σχέσης θετική ή αρνητική και προσδιορίζεται με μέτρα όπως συντελεστής gamma, Tau-b, Tau-c του Kendall και συντελεστής d του Somers.
  • 3. Σελίδα 3 από 5 Προσοχή: Προϋποθέσεις χρήσης του Χ2 Οι αναμενόμενες συχνότητες στα κελιά δεν πρέπει να είναι μικρότερες του 1 και μόνο το 20% των κελιών θα μπορεί να έχει αναμενόμενη συχνότητα κάτω από 5. Λύση στο πρόβλημα αυτό. Συνήθως φροντίζουμε, για να αποφύγουμε το παραπάνω πρόβλημα να παίρνουμε μεγάλο δείγμα τουλάχιστον 20 Χ (κΧν) όπου κ και ν κατηγορίες των δύο κατηγορικών μεταβλητών. Και αν οι προϋποθέσεις δεν ισχύουν; Ø Η διαδικασία που χρησιμοποιείται συνήθως για την ικανοποίηση της παραπάνω προϋπόθεσης, είναι η συγχώνευση κατηγοριών και δημιουργία ευρύτερων κατηγοριών, με ότι αυτό μπορεί να σημαίνει για την αξιοπιστία της έρευνας. Ø Διόρθωση Fisher, στις περιπτώσεις που έχουμε πίνακα συνάφειας 2χ2 (δύο κατηγορικές μεταβλητές με δύο κατηγορίες η κάθε μία), σύμφωνα με την ακριβή διαδικασία (exact test) η οποία αποτελεί «διόρθωση του Fisher» δεν υπάρχει πρόβλημα στην χρήση του τεστ ακόμη και αν η παραπάνω προϋπόθεση των αναμενόμενων συχνοτήτων κάτω από 5, δεν ισχύει.
  • 4. Σελίδα 4 από 5 Analyze – Descriptive Statistics – Crosstabs (πίνακας διασταύρωσης) Δραστηριότητα 2η Ένας ερευνητής θέλει να ελέγξει αν μια μέθοδος διδασκαλίας είναι αποτελεσματικότερη από τον παραδοσιακό τρόπο διδασκαλίας. Επιλέγει δύο τμήματα (ισοδύναμα όσον αφορά τις γνώσεις) από ένα σχολείο και ζητά από έναν δάσκαλο να διδάξει με τον παραδοσιακό τρόπο (42 μαθητές) ενώ αυτός διδάσκει με την νέα μέθοδο διδασκαλίας (44 μαθητές). Μετά την ολοκλήρωση της διδασκαλίας ο ερευνητής υποβάλει και τα δύο τμήματα σε γραπτή δοκιμασία. Τα αποτελέσματα φαίνονται στον παρακάτω πίνακα. Επίδοση των μαθητώνΜέθοδος διδασκαλίας Χαμηλή Μέτρια Υψηλή Σύνολα Νέα Μέθοδος 6 15 23 44 Παραδ. Μέθοδος 10 8 24 42 Σύνολα 16 23 47 86 Οι αναμενόμενες συχνότητες έτσι ώστε να ισχύει η ανεξαρτησία των μεταβλητών (δηλαδή η μηδενική υπόθεση) υπολογίζονται από τον τύπο: T SG = * A (Γ: τιμή στην αντίστοιχη γραμμή, Σ: τιμή στην αντίστοιχη στήλη, Τ: γενικό σύνολο) Ερωτήσεις Ποια είναι η ανεξάρτητη μεταβλητή και ποια η εξαρτημένη; Γράψτε τις υποθέσεις του προβλήματος. Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση περιπτώσεων – weight cases) για να τοποθετήσετε τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με το στατιστικό κριτήριο x2 των έλεγχο υποθέσεων στον πληθυσμό του δείγματος. Δραστηριότητα 3η Από το αρχείο δεδομένων «talsmple.sav» μας ενδιαφέρει στην αναζήτηση της πιθανής σχέσης μεταξύ των μεταβλητών βάρος (baros_nn) και ύψος (ypsos_nn) των μαθητών του δείγματος. Αν υπάρχει σχέση, ποια είναι η φύση1 της σχέσης των δύο αυτών μεταβλητών. Άσκηση 2η Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού του δείγματος που μελετάμε είναι ικανοποιημένοι από την δουλεία τους (Job Satisfaction) σε σχέση με το κατά πόσο αισθάνονται ικανοποιημένοι από την ζωή τους (Is life exciting or dull). Άσκηση 3η Να χρησιμοποιηθεί το αρχείο gss.sav για να απαντηθούν τα παρακάτω ερωτήματα: o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες πιστεύουν στον ίδιο βαθμό ότι υπάρχει μετά θάνατο ζωή (μεταβλητή postlife). Τι συμπεραίνετε; 1 Π.χ. αύξουσα ή φθίνουσα.
  • 5. Σελίδα 5 από 5 1. Ποια είναι η εξαρτημένη μεταβλητή; 2. Αν η μηδενική υπόθεση «αληθεύει» ποια είναι η καλύτερη πρόγνωση για το ποσοστό των ανθρώπων που πιστεύουν στη μετά θάνατο ζωή; o Να ελεγχθεί κατά πόσο η πίστη στη μετά θάνατο ζωή και το επίπεδο εκπαίδευσης (μεταβλητή degree) είναι ανεξάρτητες. Ποιο είναι το συμπέρασμά σας; o Να εκλεχθεί κατά πόσο η σχέση ανάμεσα στην πίστη στη μετά θάνατο ζωή και το επίπεδο εκπαίδευσης είναι ίδια για γυναίκες και άνδρες. o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες είχαν τις ίδιες προτιμήσεις απέναντι στους Perot, Bush και Clinton (μεταβλητή pres92). (Πρέπει να εξαιρεθούν οι άνθρωποι που ψήφισαν Other.) o Να ελεγχθεί η υπόθεση ότι η κατανομή της μεταβλητής Ζώδια (zodiac) κατανέμεται ομοιόμορφα. Άσκηση 4η Να χρησιμοποιηθεί το αρχείο salary.sav για να απαντηθούν τα παρακάτω ερωτήματα: o Να ελεγχθεί η υπόθεση η ταξινόμηση επαγγελμάτων (jobcat) και οι ομάδες φύλου με φυλή ( μεταβλητη sexrace) είναι ανεξάρτητες. 1. Τι πρόβλημα συναντάμε με το x2 test στον πίνακα (jobcat) x (sexrace); 2. Τι μπορείτε να κάνετε ώστε το x2 test να γίνει κατάλληλο; 3. Βασιζόμενοι στον καινούργιο πίνακα τι συμπεραίνετε για τη μηδενική υπόθεση;