SlideShare a Scribd company logo
1 of 81
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ
- ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
• Διασπορά – (διακύμανση, εύρος μεταβολής κλπ)
– μας πληροφορεί για τη διασπορά των δεδομένων
συνήθως γύρω από τη μέση τιμή
• Ασυμμετρία
– μετράει το βαθμό της συμμετρίας των δεδομένων ως
προς τη συχνότητά – κατανομή τους γύρω από τη μέση
τιμή.
• Κύρτωση
– μετράει το βαθμό συγκέντρωσης των δεδομένων γύρω
από τη μέση τιμή.
– Η κύρτωση δείχνει την αιχμηρότητα ή την πλάτυνση της
κατανομής
• Τα μέτρα διασποράς που θα εξετάσουμε είναι τα
εξής:
– α) Το εύρος μεταβολής,
– β) το ενδοτεταρτημοριακό εύρος,
– γ) η μέση απόκλιση,
– δ) η μέση απόκλιση τετραγώνου,
– ε) ο συντελεστής μεταβλητικότητας
Εύρος Μεταβολής
• Το Εύρος μεταβολής είναι
– το απλούστερο μέτρο διασποράς
– υπολογίζεται ως η διαφορά μεταξύ της
μεγαλύτερης και της μικρότερης τιμής
• Το Εύρος μεταβολής δεν θεωρείται
αξιόπιστο
– γιατί εξαρτάται μόνο από τις δύο ακραίες
τιμές των δεδομένων.
– αν διαφορά των ακραίων τιμών είναι πολύ
μεγάλη, τότε και το εύρος θα είναι ανάλογο
– Χρήση. Π.χ. ΧΑΑ
𝛦 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
• Έστω οι παρακάτω παρατηρήσεις. Να βρεθεί
το εύρος μεταβολής
• 52, 21, 31, 41, 23, 42, 44,
• 54, 55, 56, 57, 60, 61, 62,
• 64, 65, 66, 67, 68, 75, 74,
• 59, 85, 85, 84, 86, 90, 95
• 78, 87, 92, 93, 45, 89, 90
𝛦 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 =95-21=74
Ενδοτεταρτημοριακό Εύρος
• Η απόσταση μεταξύ πρώτου και τρίτου
τεταρτημόριου μας δίνει το
– ενδοτεταρτημοριακό εύρος,
•το οποίο συμβολίζεται με IQR.
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
• Το 50% των τιμών των δεδομένων βρίσκεται
σε ένα εύρος 9.990 ευρώ.
• Με άλλα λόγια, οι μισοί από τους ανθρώπους
που έχουμε στο δείγμα μας έχουν εισόδημα από
13.928 ευρώ έως 23.918 ευρώ.
Χ Εισόδημα
Q1 13.928
Q2 18.549
Q3 23.918
𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 23.918 − 13.928 = 9.990
Τάξεις fi Fi
30-40 5 5
40-50 12 17
50-60 19 36
60-70 30 66
70-80 17 83
80-90 10 93
90-100 7 100
100
21
,
54
)
17
25
(
19
10
50
)
25
,
0
( 1
1






 
i
i
i
F
N
f
x
Q

294
,
75
)
66
75
(
17
10
70
)
75
,
0
( 1
3






 
i
i
i
F
N
f
x
Q

21
2
,
54
2
,
75
1
3




 Q
Q
IQR
Να βρεθεί το ενδοτεταρτημοριακό εύρος στα
παρακάτω ταξινομημένα δεδομένα
Κλάσεις
1 – 3 1
3 – 5 4
5 – 7 5
7 – 9 6
9 – 11 4
Σύνολο 20
Κλάσεις
1 – 3 1 1
3 – 5 4 5
5 – 7 5 10
7 – 9 6 16
9 – 11 4 20
Σύνολο 20
Κλάσεις
1 – 3 1 1
3 – 5 4 5
5 – 7 5 10
7 – 9 6 16
9 – 11 4 20
Σύνολο 20
Κλάσεις
1 – 3 1 1
3 – 5 4 5
5 – 7 5 10
7 – 9 6 16
9 – 11 4 20
Σύνολο 20
Μέση Απόκλιση
• Η Μέση Απόκλιση (Μ. Α.) ορίζεται ως ο μέσος
αριθμητικός των απόλυτων αποκλίσεων
(διαφορών) των τιμών μιας μεταβλητής Χ από
το μέσο αριθμητικό τους.
•
• Το άθροισμα των αποκλίσεων είναι ίσο με
μηδέν,
– γι αυτό υπολογίζουμε το άθροισμα των
απόλυτων αποκλίσεων
n
x
x
A
M
i 


.
.
Μέση Απόκλιση
• Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5
υπαλλήλων.
• Χ: 1000, 900, 1300, 700, 800
• Η μέση τιμή είναι 940
• Υπολογίζουμε τις αποκλίσεις κάθε τιμής από τη
μέση τιμή. Για παράδειγμα η πρώτη απόκλιση
είναι ίση με: .
• Αθροίζουμε τις αποκλίσεις, και υπολογίζουμε τη
Μέση Απόκλιση ως εξής:
168
5
840
.
. 




n
x
x
A
M
i
940
1000 

 x
xi
Μέση Απόκλιση
• Μ. Α. = 37 δρχ.
• Η τιμή Μ. Α. =37 σημαίνει ότι το ημερομίσθιο κάθε
εργάτη αποκλίνει (διαφέρει), κατά μέσο όρο, από το
μέσο ημερομίσθιο κατά 37
• Η Μέση Απόκλιση πλεονεκτεί από τα δύο
προηγούμενα μέτρα διασποράς (R και Q),
– γιατί λαμβάνει υπόψη όλες τις τιμές της μεταβλητής.
• Μειονεκτεί όμως, διότι δεν επιδέχεται αλγεβρικό
χειρισμό,
37
10
370
.
. 




n
x
x
A
M
i
472

x
Τυπική Απόκλιση και Διακύμανση
• Το σημαντικότερο στατιστικό μέτρο διασποράς
των τιμών μιας μεταβλητής Χ γύρω από το
μέσο αριθμητικό τους είναι η Τυπική Απόκλιση
– Υπολογίζεται με την τετραγωνική ρίζα του μέσου
αριθμητικού των τετραγώνων των αποκλίσεων των
τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό
τους.
• Η τυπική απόκλιση συμβολίζεται με το σ στην
περίπτωση του πληθυσμού και S στην
περίπτωση του δείγματος
Τυπική απόκλιση και Διακύμανση
• Το τετράγωνο της τυπικής απόκλισης, ονομάζεται
διακύμανση και συμβολίζεται με
– σ2 για δεδομένα πληθυσμού
– S2 για δεδομένα δείγματος.
• Η τυπική απόκλιση εκφράζεται στις μονάδες που
εκφράζεται και η υπό μελέτη μεταβλητή Χ,
– ενώ η διακύμανση εκφράζεται στο τετράγωνο της
μεταβλητής Χ.
Υπολογισμός Διακυμάνσεως και Τυπικής
Αποκλίσεως
• Όταν τα δεδομένα αφορούν πληθυσμό
– μ είναι ο μέσος του πληθυσμού και
– Ν το πλήθος των δεδομένων του πληθυσμού.
• Όταν τα δεδομένα αποτελούν ένα δείγμα




2
2 )
( 
 i
x
1
)
( 2
2




n
x
s i

• Mε τον όρο "βαθμοί ελευθερίας" εννοούμε το
πλήθος των στατιστικών δεδομένων,
– τα οποία διαμορφώνονται ελεύθερα χωρίς κανένα
περιορισμό.
• Για τον υπολογισμό όμως της διακυμάνσεως ενός
δείγματος προκύπτουν n αποκλίσεις .
• Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι
ανεξάρτητες,
– γιατί η n-στή απόκλιση από το χ είναι καθορισμένη
(περιορισμένη),
– διότι ο υπολογισμός του μέσου αριθμητικού αποτελεί
ένα περιορισμό ότι άρα μόνο οι n - 1
αποκλίσεις είναι ανεξάρτητες (αδέσμευτες)
– επομένως, για τον υπολογισμό της διακυμάνσεως
παραμένουν n-1 βαθμοί ελευθερίας.
)
( x
xi

0
)
( 

 x
xi
• Για τον πληθυσμό:
• Για το δείγμα:
N
f i
i
2
2 )
( 





1
)
( 2
2




n
x
f
s i
i 
𝒙𝒊 𝒙𝒊 − 𝝁 𝒙𝒊 − 𝝁 𝟐
12 12 − 15,4 = −3,4 11,56
15 15 − 15,4 = −0,4 0,16
19 19 − 15,4 = 3,6 12,96
11 11 − 15,4 = −4,4 19,36
21 21 − 15,4 = 5,6 31,36
14 14 − 15,4 = −1,4 1,96
19 19 − 15,4 = 3,6 12,96
12 12 − 15,4 = −3,4 11,56
13 13 − 15,4 = −2,4 5,76
18 18 − 15,4 = 2,6 6,76
Σύνολο 𝒙𝒊 − 𝝁
𝜨
𝒊=𝟏
= 𝟎 𝒙𝒊 − 𝝁 𝟐
𝜨
𝒊=𝟏
= 𝟏𝟏𝟒, 𝟒
𝜇 =
1
𝛮
𝑥𝑖
𝑁
𝑖=1
= 15,4 𝜎2 =
1
𝛮
𝑥𝑖 − 𝜇 2
𝛮
𝑖=1
=
1
10
114,4 = 11,44
• Να βρεθεί η διακύμανση στο παρακάτω
δείγμα:
• 1, 3, 5, 4
Παραδείγματα
• Για τον πληθυσμό:
N
f i
i
2
2 )
( 





Τάξεις xi fi fi*xi
30-40 35 5 175
40-50 45 12 540
50-60 55 19 1045
60-70 65 30 1950
70-80 75 17 1275
80-90 85 10 850
90-100 95 7 665
100 6500
65
100
6500




N
x
f i
i

Παραδείγματα
232
100
23200
)
( 2
2






i
i
i
f
f 


Τάξεις xi fi fi*xi
30-40 35 5 175 -30 900 4500
40-50 45 12 540 -20 400 4800
50-60 55 19 1045 -10 100 1900
60-70 65 30 1950 0 0 0
70-80 75 17 1275 10 100 1700
80-90 85 10 850 20 400 4000
90-100 95 7 665 30 900 6300
100 6500 23200
Σύνολο
Σύνολο


i
x 2
)
( 

i
i
x
f
2
)
( 

i
x
Να βρεθεί η διακύμανση
1 2
2 3
3 5
4 3
5 2
1 2 1*2=3
2 3 6
3 5 15
4 3 12
5 2 10
1 2
2 3 -1 1 3
3 5 0 0 0
4 3 1 1 3
5 2 2 4 8
Κλάσεις
Συχνότητα
f
0 – 10 2
10 – 20 3
20 – 30 5
30 – 40 3
40 – 50 2
Σύνολο 15
Να βρεθεί η διακύμανση
Συντελεστής Μεταβλητότητας
• H τυπική απόκλιση δεν δίνει τη δυνατότητα
– να αποφανθούμε για το εάν η διασπορά είναι μικρή
ή μεγάλη.
– να συγκρίνουμε τη διασπορά κατανομών που
μετριούνται σε διαφορετική κλίμακα
– να συγκρίνουμε τη διασπορά κατανομών τα οποία
εκφράζονται σε διαφορετικές μονάδες.
• Λύση στο πρόβλημα αποτελεί η χρήση του
συντελεστής μεταβλητότητας
– συμβολίζεται με CV
– Ο συντελεστής μεταβλητικότητας είναι
καθαρός αριθμός (χωρίς μονάδες μετρήσεως)
Συντελεστής Μεταβλητικότητας
• Για τον πληθυσμό έχουμε:
• Για το δείγμα:
• Ο συντελεστής μεταβλητότητας είναι η τυπική
απόκλιση ως ποσοστό του μέσου.
• Είναι δυνατό να εκφράσουμε το συντελεστή
μεταβλητότητας σε αριθμό και όχι σε ποσοστό.
𝐶𝑉 =
𝜎
𝜇
100%
𝐶𝑉 =
𝑠
𝑥
100%
• Διαιρούμε την τυπική απόκλιση με το μέσο
– μέτρα που είναι εκφρασμένα στις ίδιες φυσικές
μονάδες.
• Για παράδειγμα,
– διαιρούμε κιλά με κιλά, ευρώ με ευρώ, κλπ.
– Επομένως, οι μονάδες εξαφανίζονται και ο
συντελεστής μεταβλητότητας μένει ένα καθαρό
ποσοστό (ή ένας καθαρός αριθμός).
• Π.χ. ζητούμε τη σύγκριση της τυπικής
απόκλισης μιας κατανομής βαρών με μια
αναστημάτων
– Πρόβλημα: Διαφορετικές μονάδες μέτρησης
– Λύση: Συντελεστής μεταβλητικότητας
• Σε ένα Τμήμα οι φοιτητές παρακολουθούν
στατιστική και οικονομικά και υποβάλλονται
σε εβδομαδιαία τεστ.
• Στο τέλος της χρονιάς οι φοιτητές έχουν
– μέσο όρο βαθμολογίας στη στατιστική 5,5 με
τυπική απόκλιση 0,9
– ενώ στα οικονομικά έχουν μέσο όρο 7,5 και
τυπική απόκλιση 1,1.
• Σε ποιο μάθημα οι φοιτητές αποδίδουν με τη
μικρότερη διασπορά (με μεγαλύτερη συνέπεια);
• Απάντηση: Θα υπολογίσουμε τους
συντελεστές μεταβλητότητας για τα δύο
μαθήματα αντίστοιχα:
• Στα οικονομικά υπάρχει μεγαλύτερη τυπική
απόκλιση.
• Ωστόσο, προσέξτε ότι ο μέσος όρος στα
οικονομικά είναι μεγαλύτερος από το μέσο όρο
στη στατιστική.
𝐶𝑉𝛴𝜏𝛼𝜏 =
𝑠
𝑥
100% =
0,9
5,5
100% = 16,36%
𝐶𝑉𝛰𝜄𝜅 =
𝑠
𝑥
100% =
1,1
7,5
100% = 14,67%
• Ο συντελεστής μεταβλητότητας στα οικονομικά
είναι χαμηλότερος από ότι στην στατιστική,
– γεγονός που σημαίνει ότι οι φοιτητές είναι
περισσότερο συνεπείς στην απόδοσή τους στα
οικονομικά σε σχέση με τη στατιστική.
– Η σχετική διασπορά στη στατιστική είναι
μεγαλύτερη.
𝐶𝑉𝛴𝜏𝛼𝜏 =
𝑠
𝑥
100% =
0,9
5,5
100% = 16,36%
𝐶𝑉𝛰𝜄𝜅 =
𝑠
𝑥
100% =
1,1
7,5
100% = 14,67%
• Να βρεθεί ποιο από τα δυο παρακάτω δείγματα
προέρχεται από τον πληθυσμό που έχει τη
μεγαλύτερη διασπορά με βάση το συντελεστή
μεταβλητότητας.
• Υ: 1, 6, 9, 4
• X: 101 , 104, 102, 103
1
6 1 1
9 4 16
4 -1 1
0
101
104 1,5 2,25
102 -0,5 0,25
103 0,5 0,25
0
• Παρατηρούμε ότι η εκτίμηση του δείκτη
μεταβλητότητας για τον πρώτο πληθυσμό (με βάση
το πρώτο δείγμα) είναι πολύ υψηλότερη, γεγονός
που οφείλεται όχι μόνο στη διασπορά των
δεδομένων (αποκλίσεις από τη μέση τιμή είναι
μεγαλύτερες στο πρώτο δείγμα), αλλά και στο μικρό
κατ’ απόλυτη τιμή μέγεθος της μέσης τιμής (είναι 5
ενώ στο δεύτερο δείγμα 102,5).
ΜΕΤΡΑ ΑΣΥΜΜΕΤΡΙΑΣ
• Για να περιγραφεί ικανοποιητικά μια κατανομή
συχνοτήτων απαιτείται ο προσδιορισμός
τεσσάρων βασικών στατιστικών παραμέτρων:
– i) Κεντρική Τάση
– ii) Διασπορά,
– iii) Ασυμμετρία και
– iv) Κύρτωση
• Η ασυμμετρία (skewness) δείχνει πόσο
συμμετρικά γύρω από το μέσο κατανέμονται οι
παρατηρήσεις, τα δεδομένα μας.
ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ
• Απλά δεδομένα - Ασυμμετρία πληθυσμού
• Απλά δεδομένα - Ασυμμετρία δείγματος
2
2
2
)
(
μ 




N
x
xi
N
xi
3
3
)
(
μ




3
3
σ
μ

G
𝐺 =
1
𝑛 − 1
𝑥𝑖 − 𝑥
𝑠
3
𝑘
𝑖=1
Ασυμμετρία στα απλά δεδομένα - πληθυσμός
𝐺 =
𝜇3
𝜎3
 Με το γράμμαμi συμβολίζονται οι κεντρικές ροπές, δηλαδή οι διαφορέςαπό
τη μέση τιμή υψωμένεςστον δείκτη i,𝜇𝑖 =
𝛴(𝑥𝑖−𝜇)𝑖
𝛮
.
 𝜇3 είναι ητρίτη κεντρική ροπή και ισούται με 𝜇3 =
𝛴(𝑥𝑖−𝜇)3
𝛮
.
 𝜎3
είναι ητυπική απόκλιση υψωμένη στην τρίτη. Αφού υπολογίσουμε τη
διακύμανση, η οποία σημειωτέον είναι ηδεύτερη κεντρική ροπή 𝜎2
= 𝜇2 =
𝛴(𝑥𝑖−𝜇)2
𝛮
.
Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3
(𝑥𝑖 − 𝜇)2
1 -2 -8 4
2 -1 -1 1
3 0 0 0
5 2 8 4
4 1 1 1
𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3
𝛴(𝑥𝑖 − 𝜇)2
15 0 10
Να βρεθεί η ασυμμετρία στον παρακάτω πληθυσμό,
Χ: 1, 2, 3, 5, 4
Λύση
Βήμα 1ο
. Υπολογίζουμε τη μέση τιμή
𝜇 =
𝛴𝑥𝑖
𝑛
=
15
5
= 3
Βήμα 2ο
. Υπολογίζουμε την τρίτη κεντρική ροπή 𝜇3 =
𝛴(𝑥𝑖−𝜇)3
𝛮
=
0
5
= 0.
Παράδειγμα
Να βρεθεί η ασυμμετρία στον παρακάτω πληθυσμό,
Χ: 1, 2, 3, 5, 4
Λύση
Βήμα 1ο
. Υπολογίζουμε τη μέση τιμή
𝜇 =
𝛴𝑥𝑖
𝑛
=
15
5
= 3
Βήμα 2ο
. Υπολογίζουμε την τρίτη κεντρική ροπή 𝜇3 =
𝛴(𝑥𝑖−𝜇)3
𝛮
=
0
5
= 0. Επειδή το 𝜇3
είναι ο αριθμητής της ασυμμετρίας και ισούται με το μηδέν, έπεται ότι το
αποτέλεσμα του συντελεστή ασυμμετρίας είναι μηδέν, συνεπώς θα μπορούσαμε να
σταματήσουμε στο σημείο αυτό, αλλά για να ολοκληρώσουμε την προσέγγιση θα
εξετάσουμε και το βήμα 3ο
.
Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3
(𝑥𝑖 − 𝜇)2
1 -2 -8 4
2 -1 -1 1
3 0 0 0
5 2 8 4
4 1 1 1
𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3
𝛴(𝑥𝑖 − 𝜇)2
15 0 10
Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3
(𝑥𝑖 − 𝜇)2
1 -2 -8 4
2 -1 -1 1
3 0 0 0
5 2 8 4
4 1 1 1
𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3
𝛴(𝑥𝑖 − 𝜇)2
15 0 10
Να βρεθεί η ασυμμετρία στο
παρακάτω δείγμα
Χ
1
2
12
15
Χ
1 -4 16 -64
2 -3 9 -27
12 7 49 343
15 74 252
• Στη διεθνή βιβλιογραφία χρησιμοποιούνται
διάφορες παραλλαγές του προηγούμενου τύπου
με σκοπό την κατά το δυνατό καλύτερη
προσέγγιση της πραγματικής ασυμμετρίας του
πληθυσμού.
•
• Μο είναι η επικρατούσα τιμή και Μd είναι η διάμεσος
𝐺 =
𝑛
𝑛 − 1 𝑛 − 2
𝑓𝑖
𝑥𝑖 − 𝑥
𝑠
3
𝑘
𝑖=1
𝜋𝜌ώ𝜏𝜊𝜍 𝜎𝜐𝜈𝜏𝜀𝜆𝜀𝜎𝜏ή𝜍 𝜆𝜊𝜉ό𝜏𝜂𝜏𝛼𝜍 𝜏𝜊𝜐 𝑃𝑒𝑎𝑟𝑠𝑜𝑛 =
𝑥 − 𝑀𝑜
𝑠
𝛿𝜀ύ𝜏𝜀𝜌𝜊𝜍 𝜎𝜐𝜈𝜏𝜀𝜆𝜀𝜎𝜏ή𝜍 𝜆𝜊𝜉ό𝜏𝜂𝜏𝛼𝜍 𝜏𝜊𝜐 𝑃𝑒𝑎𝑟𝑠𝑜𝑛 =
3 𝑥 − 𝑀𝑑
𝑠
G=0 ή μ3=0 Συμμετρική
Συμμετρική
0
1
2
3
4
5
6
7
1 2 3 4 5 6 7
G>0 ή μ3>0 Θετική Ασυμμετρία
Θετική Ασσυμετρία
0
2
4
6
8
10
12
1 2 3 4 5 6 7
G<0 ή μ3<0 Αρνητική Ασυμμετρία
Αρνητική Ασσυμετρία
0
2
4
6
8
10
12
1 2 3 4 5 6 7
• Να βρεθεί ο συντελεστής Pearson
Τάξεις fi xi fixi xi-μ (χi-μ)2
fi(χi-μ)2
fi(χi-μ)3
[1-3] 2 2 4 -4 16 32 -128
[3-5] 5 4 20 -2 4 20 -40
[5-7] 7 6 42 0 0 0 0
[7-9] 5 8 40 2 4 20 40
[9-11] 2 10 20 4 16 32 128
Σ 21 126 104 0
6
21
126
Σf
Σf
μ
i
i


 i
x
0
21
0
)
μ
(
μ
3
3 





i
i
i
f
f 
3
3
σ
μ
G 
0
μ3 
94
,
10
22
,
2
σ
2,22
σ
95
,
4
21
104
)
(
3
3
2
2












i
i
i
f
f
Συμμετρική
0
94
,
10
0
σ
μ
G 3
3



Τάξεις fi xi fixi xi-μ (χi-μ)2
fi(χi-μ)2
fi(χi-μ)3
[1-3] 2 2 4 -4 16 32 -128
[3-5] 5 4 20 -2 4 20 -40
[5-7] 7 6 42 0 0 0 0
[7-9] 5 8 40 2 4 20 40
[9-11] 2 10 20 4 16 32 128
Σ 21 126 104 0
Να βρεθεί η ασυμμετρία
1 2
2 3
3 5
4 3
5 2
1 2 1*2=3
2 3 6
3 5 15
4 3 12
5 2 10
1 2
2 3 -1 1 3
3 5 0 0 0
4 3 1 1 3
5 2 2 4 8
1 2
2 3 -1 -1 -3
3 5 0 0 0
4 3 1 1 3
5 2 2 8 16
ΚΥΡΤΩΣΗ
• Δύο ή περισσότερες κατανομές συχνοτήτων να
έχουν
– τον ίδιο μέσο αριθμητικό,
– την ίδια τυπική απόκλιση και
– να είναι συμμετρικές,
• αλλά να διαφέρουν ως προς την κύρτωση,
• δηλαδή ως προς την συγκέντρωση των
παρατηρήσεων γύρω από το μέσο –
αιχμηρότητα της κορυφής
• Η κύρτωση (kurtosis) δείχνει κατά πόσο τα
δεδομένα της κατανομής σχηματίζουν έντονη
κορυφή στο μέσο τους.
ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ
• Απλά δεδομένα - Κύρτωση πληθυσμού
• Απλά δεδομένα - Κύρτωση δείγματος
2
2
2
)
(
μ 




N
x
xi
N
xi
4
4
)
(
μ




4
4
σ
μ

K
𝐾 =
1
(𝑛 − 1)𝑠4
𝑥𝑖 − 𝑥 4
𝑛
𝑖=1
ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ
• Ομαδοποιημένα - Κύρτωση πληθυσμού
• Ομαδοποιημένα – Κύρτωση δείγματος
2
2
2
)
(
μ 






i
i
i
f
x
f
i
i
i
f
f




4
4
)
(
μ


4
4
σ
μ

K
𝛫 =
1
𝑛 − 1
𝑓𝑖
𝑥𝑖 − 𝑥
𝑠
4
𝑘
𝑖=1
• Κατανομές συχνοτήτων που οι τιμές τους
διασπείρονται πάρα πολύ αριστερά και δεξιά του
μέσου αριθμητικού χαρακτηρίζονται ως
πλατύκυρτες και έχουν συντελεστή K<3
(Excel K<0)
Πλατύκυρτη
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7 8 9 10 11 12 13
• Οι "Κανονικές Κατανομές" που οι τιμές μιας
μεταβλητής ισοκατανέμονται αριστερά και δεξιά
του μέσου αριθμητικού χαρακτηρίζονται ως
Μεσόκυρτες K=3 (Excel K=0)
Μεσόκυρτη
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7
• Τέλος, κατανομές συχνοτήτων που παρουσιάζουν
μεγάλη συγκέντρωση τιμών στην περιοχή του μέσου
αριθμητικού χαρακτηρίζονται ως Λεπτόκυρτες και
έχουν K>3 (Excel K>0)
Λεπτόκυρτη
0
5
10
15
20
25
1 2 3 4 5 6 7
Πλατύκυρτη
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7 8 9 10 11 12 13
Μεσόκυρτη
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7
Λεπτόκυρτη
0
5
10
15
20
25
1 2 3 4 5 6 7
• Να βρεθεί η κύρτωση στον πληθυσμό:
• Χ: 5, 0, 1, 2, 1, 4, 1
5 3 9 81
0 -2 4 16
1 -1 1 1
2 0 0 0
1 -1 1 1
4 2 4 16
1 -1 1 1
0
5 3 9 81
0 -2 4 16
1 -1 1 1
2 0 0 0
1 -1 1 1
4 2 4 16
1 -1 1 1
0
5 3 9 81
0 -2 4 16
1 -1 1 1
2 0 0 0
1 -1 1 1
4 2 4 16
1 -1 1 1
0
5 3 9 81
0 -2 4 16
1 -1 1 1
2 0 0 0
1 -1 1 1
4 2 4 16
1 -1 1 1
0
5 3 9 81
0 -2 4 16
1 -1 1 1
2 0 0 0
1 -1 1 1
4 2 4 16
1 -1 1 1
0
• Να υπολογιστεί η διακύμανση στο παρακάτω
δείγμα:
• Χ: 1, 2, 3
1 -1 1 1
2 0 0 0
3 1 1 1
0
1 -1 1 1
2 0 0 0
3 1 1 1
0
1 -1 1 1
2 0 0 0
3 1 1 1
0
• Να βρεθεί η κύρτωση
Τάξεις fi
[1-3] 2
[3-5] 5
[5-7] 7
[7-9] 5
[9-11] 2
Σ 21
4
4
σ
μ
K 
• Να βρεθεί η κύρτωση
6
21
126
Σf
Σf
μ
i
i


 i
x
38
,
56
21
1184
)
μ
(
μ
4
4 





i
i
i
f
f 
Τάξεις fi xi fixi xi-μ (χi-μ)2
fi(χi-μ)2
(χi-μ)4
fi(χi-μ)4
[1-3] 2 2 4 -4 16 32 256 512
[3-5] 5 4 20 -2 4 20 16 80
[5-7] 7 6 42 0 0 0 0 0
[7-9] 5 8 40 2 4 20 16 80
[9-11] 2 10 20 4 16 32 256 512
Σ 21 126 104 1184
4
4
σ
μ
K 
38
,
56
μ4 
3
3
,
2
95
,
24
38
,
56
σ
μ
K 4
4




24,95
σ
95
,
4
21
104
)
( 4
2
2









i
i
i
f
x
f
Τάξεις fi xi fixi xi-μ (χi-μ)2
fi(χi-μ)2
(χi-μ)4
fi(χi-μ)4
[1-3] 2 2 4 -4 16 32 256 512
[3-5] 5 4 20 -2 4 20 16 80
[5-7] 7 6 42 0 0 0 0 0
[7-9] 5 8 40 2 4 20 16 80
[9-11] 2 10 20 4 16 32 256 512
Σ 21 126 104 1184
Πλατύκυρτη

More Related Content

Similar to ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt

εργασια στατιστικη-1
εργασια στατιστικη-1εργασια στατιστικη-1
εργασια στατιστικη-1Aggelos Ser
 
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας Θανάσης Δρούγας
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΡεβέκα Θεοδωροπούλου
 
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματος
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματοςQuality Control. Aξιοπιστία εργαστηριακού αποτελέσματος
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματοςKonstantinos Floridis
 
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗ
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗ
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗIlias Pappas
 
Important Probability distributions (in Greek)
Important Probability distributions (in Greek)Important Probability distributions (in Greek)
Important Probability distributions (in Greek)Achilleas Papatsimpas
 
εργασια στατιστικη-1
εργασια στατιστικη-1εργασια στατιστικη-1
εργασια στατιστικη-1Aggelos Ser
 
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση Κινδύνων
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση ΚινδύνωνΗ Κατανομή Γάμμα ως μοντέλο στη Διοίκηση Κινδύνων
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση ΚινδύνωνLeonidas Souliotis
 
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗ
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗ
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗEIRINI KATSIDONIOTAKI
 
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015Θανάσης Δρούγας
 

Similar to ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt (12)

εργασια στατιστικη-1
εργασια στατιστικη-1εργασια στατιστικη-1
εργασια στατιστικη-1
 
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
 
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματος
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματοςQuality Control. Aξιοπιστία εργαστηριακού αποτελέσματος
Quality Control. Aξιοπιστία εργαστηριακού αποτελέσματος
 
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗ
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗ
ΟΙΚΟΝΟΜΕΤΡΙΑ-ΠΑΡΟΥΣΙΑΣΗ
 
194441315 στατιστικη
194441315 στατιστικη194441315 στατιστικη
194441315 στατιστικη
 
Important Probability distributions (in Greek)
Important Probability distributions (in Greek)Important Probability distributions (in Greek)
Important Probability distributions (in Greek)
 
εργασια στατιστικη-1
εργασια στατιστικη-1εργασια στατιστικη-1
εργασια στατιστικη-1
 
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση Κινδύνων
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση ΚινδύνωνΗ Κατανομή Γάμμα ως μοντέλο στη Διοίκηση Κινδύνων
Η Κατανομή Γάμμα ως μοντέλο στη Διοίκηση Κινδύνων
 
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗ
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗ
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΑΤΣΙΔΟΝΙΩΤΑΚΗ ΕΙΡΗΝΗ
 
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015
επαναληπτικά θέματα μαθηματικά γενικής παιδείας 2015
 
Απλά Στατιστικά Εργαλεία Η/Υ
Απλά Στατιστικά Εργαλεία Η/ΥΑπλά Στατιστικά Εργαλεία Η/Υ
Απλά Στατιστικά Εργαλεία Η/Υ
 

ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt

  • 1. ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ • Διασπορά – (διακύμανση, εύρος μεταβολής κλπ) – μας πληροφορεί για τη διασπορά των δεδομένων συνήθως γύρω από τη μέση τιμή • Ασυμμετρία – μετράει το βαθμό της συμμετρίας των δεδομένων ως προς τη συχνότητά – κατανομή τους γύρω από τη μέση τιμή. • Κύρτωση – μετράει το βαθμό συγκέντρωσης των δεδομένων γύρω από τη μέση τιμή. – Η κύρτωση δείχνει την αιχμηρότητα ή την πλάτυνση της κατανομής
  • 2. • Τα μέτρα διασποράς που θα εξετάσουμε είναι τα εξής: – α) Το εύρος μεταβολής, – β) το ενδοτεταρτημοριακό εύρος, – γ) η μέση απόκλιση, – δ) η μέση απόκλιση τετραγώνου, – ε) ο συντελεστής μεταβλητικότητας
  • 3. Εύρος Μεταβολής • Το Εύρος μεταβολής είναι – το απλούστερο μέτρο διασποράς – υπολογίζεται ως η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής • Το Εύρος μεταβολής δεν θεωρείται αξιόπιστο – γιατί εξαρτάται μόνο από τις δύο ακραίες τιμές των δεδομένων. – αν διαφορά των ακραίων τιμών είναι πολύ μεγάλη, τότε και το εύρος θα είναι ανάλογο – Χρήση. Π.χ. ΧΑΑ 𝛦 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
  • 4. • Έστω οι παρακάτω παρατηρήσεις. Να βρεθεί το εύρος μεταβολής • 52, 21, 31, 41, 23, 42, 44, • 54, 55, 56, 57, 60, 61, 62, • 64, 65, 66, 67, 68, 75, 74, • 59, 85, 85, 84, 86, 90, 95 • 78, 87, 92, 93, 45, 89, 90 𝛦 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 =95-21=74
  • 5. Ενδοτεταρτημοριακό Εύρος • Η απόσταση μεταξύ πρώτου και τρίτου τεταρτημόριου μας δίνει το – ενδοτεταρτημοριακό εύρος, •το οποίο συμβολίζεται με IQR. 𝐼𝑄𝑅 = 𝑄3 − 𝑄1
  • 6. • Το 50% των τιμών των δεδομένων βρίσκεται σε ένα εύρος 9.990 ευρώ. • Με άλλα λόγια, οι μισοί από τους ανθρώπους που έχουμε στο δείγμα μας έχουν εισόδημα από 13.928 ευρώ έως 23.918 ευρώ. Χ Εισόδημα Q1 13.928 Q2 18.549 Q3 23.918 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 23.918 − 13.928 = 9.990
  • 7. Τάξεις fi Fi 30-40 5 5 40-50 12 17 50-60 19 36 60-70 30 66 70-80 17 83 80-90 10 93 90-100 7 100 100 21 , 54 ) 17 25 ( 19 10 50 ) 25 , 0 ( 1 1         i i i F N f x Q  294 , 75 ) 66 75 ( 17 10 70 ) 75 , 0 ( 1 3         i i i F N f x Q  21 2 , 54 2 , 75 1 3      Q Q IQR
  • 8. Να βρεθεί το ενδοτεταρτημοριακό εύρος στα παρακάτω ταξινομημένα δεδομένα Κλάσεις 1 – 3 1 3 – 5 4 5 – 7 5 7 – 9 6 9 – 11 4 Σύνολο 20
  • 9.
  • 10. Κλάσεις 1 – 3 1 1 3 – 5 4 5 5 – 7 5 10 7 – 9 6 16 9 – 11 4 20 Σύνολο 20
  • 11. Κλάσεις 1 – 3 1 1 3 – 5 4 5 5 – 7 5 10 7 – 9 6 16 9 – 11 4 20 Σύνολο 20
  • 12. Κλάσεις 1 – 3 1 1 3 – 5 4 5 5 – 7 5 10 7 – 9 6 16 9 – 11 4 20 Σύνολο 20
  • 13. Μέση Απόκλιση • Η Μέση Απόκλιση (Μ. Α.) ορίζεται ως ο μέσος αριθμητικός των απόλυτων αποκλίσεων (διαφορών) των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους. • • Το άθροισμα των αποκλίσεων είναι ίσο με μηδέν, – γι αυτό υπολογίζουμε το άθροισμα των απόλυτων αποκλίσεων n x x A M i    . .
  • 14. Μέση Απόκλιση • Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων. • Χ: 1000, 900, 1300, 700, 800 • Η μέση τιμή είναι 940 • Υπολογίζουμε τις αποκλίσεις κάθε τιμής από τη μέση τιμή. Για παράδειγμα η πρώτη απόκλιση είναι ίση με: . • Αθροίζουμε τις αποκλίσεις, και υπολογίζουμε τη Μέση Απόκλιση ως εξής: 168 5 840 . .      n x x A M i 940 1000    x xi
  • 15. Μέση Απόκλιση • Μ. Α. = 37 δρχ. • Η τιμή Μ. Α. =37 σημαίνει ότι το ημερομίσθιο κάθε εργάτη αποκλίνει (διαφέρει), κατά μέσο όρο, από το μέσο ημερομίσθιο κατά 37 • Η Μέση Απόκλιση πλεονεκτεί από τα δύο προηγούμενα μέτρα διασποράς (R και Q), – γιατί λαμβάνει υπόψη όλες τις τιμές της μεταβλητής. • Μειονεκτεί όμως, διότι δεν επιδέχεται αλγεβρικό χειρισμό, 37 10 370 . .      n x x A M i 472  x
  • 16. Τυπική Απόκλιση και Διακύμανση • Το σημαντικότερο στατιστικό μέτρο διασποράς των τιμών μιας μεταβλητής Χ γύρω από το μέσο αριθμητικό τους είναι η Τυπική Απόκλιση – Υπολογίζεται με την τετραγωνική ρίζα του μέσου αριθμητικού των τετραγώνων των αποκλίσεων των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους. • Η τυπική απόκλιση συμβολίζεται με το σ στην περίπτωση του πληθυσμού και S στην περίπτωση του δείγματος
  • 17. Τυπική απόκλιση και Διακύμανση • Το τετράγωνο της τυπικής απόκλισης, ονομάζεται διακύμανση και συμβολίζεται με – σ2 για δεδομένα πληθυσμού – S2 για δεδομένα δείγματος. • Η τυπική απόκλιση εκφράζεται στις μονάδες που εκφράζεται και η υπό μελέτη μεταβλητή Χ, – ενώ η διακύμανση εκφράζεται στο τετράγωνο της μεταβλητής Χ.
  • 18. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως • Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού και – Ν το πλήθος των δεδομένων του πληθυσμού. • Όταν τα δεδομένα αποτελούν ένα δείγμα     2 2 ) (   i x 1 ) ( 2 2     n x s i 
  • 19. • Mε τον όρο "βαθμοί ελευθερίας" εννοούμε το πλήθος των στατιστικών δεδομένων, – τα οποία διαμορφώνονται ελεύθερα χωρίς κανένα περιορισμό. • Για τον υπολογισμό όμως της διακυμάνσεως ενός δείγματος προκύπτουν n αποκλίσεις . • Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες, – γιατί η n-στή απόκλιση από το χ είναι καθορισμένη (περιορισμένη), – διότι ο υπολογισμός του μέσου αριθμητικού αποτελεί ένα περιορισμό ότι άρα μόνο οι n - 1 αποκλίσεις είναι ανεξάρτητες (αδέσμευτες) – επομένως, για τον υπολογισμό της διακυμάνσεως παραμένουν n-1 βαθμοί ελευθερίας. ) ( x xi  0 ) (    x xi
  • 20. • Για τον πληθυσμό: • Για το δείγμα: N f i i 2 2 ) (       1 ) ( 2 2     n x f s i i 
  • 21. 𝒙𝒊 𝒙𝒊 − 𝝁 𝒙𝒊 − 𝝁 𝟐 12 12 − 15,4 = −3,4 11,56 15 15 − 15,4 = −0,4 0,16 19 19 − 15,4 = 3,6 12,96 11 11 − 15,4 = −4,4 19,36 21 21 − 15,4 = 5,6 31,36 14 14 − 15,4 = −1,4 1,96 19 19 − 15,4 = 3,6 12,96 12 12 − 15,4 = −3,4 11,56 13 13 − 15,4 = −2,4 5,76 18 18 − 15,4 = 2,6 6,76 Σύνολο 𝒙𝒊 − 𝝁 𝜨 𝒊=𝟏 = 𝟎 𝒙𝒊 − 𝝁 𝟐 𝜨 𝒊=𝟏 = 𝟏𝟏𝟒, 𝟒 𝜇 = 1 𝛮 𝑥𝑖 𝑁 𝑖=1 = 15,4 𝜎2 = 1 𝛮 𝑥𝑖 − 𝜇 2 𝛮 𝑖=1 = 1 10 114,4 = 11,44
  • 22. • Να βρεθεί η διακύμανση στο παρακάτω δείγμα: • 1, 3, 5, 4
  • 23.
  • 24. Παραδείγματα • Για τον πληθυσμό: N f i i 2 2 ) (       Τάξεις xi fi fi*xi 30-40 35 5 175 40-50 45 12 540 50-60 55 19 1045 60-70 65 30 1950 70-80 75 17 1275 80-90 85 10 850 90-100 95 7 665 100 6500 65 100 6500     N x f i i 
  • 25. Παραδείγματα 232 100 23200 ) ( 2 2       i i i f f    Τάξεις xi fi fi*xi 30-40 35 5 175 -30 900 4500 40-50 45 12 540 -20 400 4800 50-60 55 19 1045 -10 100 1900 60-70 65 30 1950 0 0 0 70-80 75 17 1275 10 100 1700 80-90 85 10 850 20 400 4000 90-100 95 7 665 30 900 6300 100 6500 23200 Σύνολο Σύνολο   i x 2 ) (   i i x f 2 ) (   i x
  • 26. Να βρεθεί η διακύμανση 1 2 2 3 3 5 4 3 5 2
  • 27. 1 2 1*2=3 2 3 6 3 5 15 4 3 12 5 2 10
  • 28. 1 2 2 3 -1 1 3 3 5 0 0 0 4 3 1 1 3 5 2 2 4 8
  • 29. Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 3 40 – 50 2 Σύνολο 15 Να βρεθεί η διακύμανση
  • 30. Συντελεστής Μεταβλητότητας • H τυπική απόκλιση δεν δίνει τη δυνατότητα – να αποφανθούμε για το εάν η διασπορά είναι μικρή ή μεγάλη. – να συγκρίνουμε τη διασπορά κατανομών που μετριούνται σε διαφορετική κλίμακα – να συγκρίνουμε τη διασπορά κατανομών τα οποία εκφράζονται σε διαφορετικές μονάδες. • Λύση στο πρόβλημα αποτελεί η χρήση του συντελεστής μεταβλητότητας – συμβολίζεται με CV – Ο συντελεστής μεταβλητικότητας είναι καθαρός αριθμός (χωρίς μονάδες μετρήσεως)
  • 31. Συντελεστής Μεταβλητικότητας • Για τον πληθυσμό έχουμε: • Για το δείγμα: • Ο συντελεστής μεταβλητότητας είναι η τυπική απόκλιση ως ποσοστό του μέσου. • Είναι δυνατό να εκφράσουμε το συντελεστή μεταβλητότητας σε αριθμό και όχι σε ποσοστό. 𝐶𝑉 = 𝜎 𝜇 100% 𝐶𝑉 = 𝑠 𝑥 100%
  • 32. • Διαιρούμε την τυπική απόκλιση με το μέσο – μέτρα που είναι εκφρασμένα στις ίδιες φυσικές μονάδες. • Για παράδειγμα, – διαιρούμε κιλά με κιλά, ευρώ με ευρώ, κλπ. – Επομένως, οι μονάδες εξαφανίζονται και ο συντελεστής μεταβλητότητας μένει ένα καθαρό ποσοστό (ή ένας καθαρός αριθμός). • Π.χ. ζητούμε τη σύγκριση της τυπικής απόκλισης μιας κατανομής βαρών με μια αναστημάτων – Πρόβλημα: Διαφορετικές μονάδες μέτρησης – Λύση: Συντελεστής μεταβλητικότητας
  • 33. • Σε ένα Τμήμα οι φοιτητές παρακολουθούν στατιστική και οικονομικά και υποβάλλονται σε εβδομαδιαία τεστ. • Στο τέλος της χρονιάς οι φοιτητές έχουν – μέσο όρο βαθμολογίας στη στατιστική 5,5 με τυπική απόκλιση 0,9 – ενώ στα οικονομικά έχουν μέσο όρο 7,5 και τυπική απόκλιση 1,1. • Σε ποιο μάθημα οι φοιτητές αποδίδουν με τη μικρότερη διασπορά (με μεγαλύτερη συνέπεια);
  • 34. • Απάντηση: Θα υπολογίσουμε τους συντελεστές μεταβλητότητας για τα δύο μαθήματα αντίστοιχα: • Στα οικονομικά υπάρχει μεγαλύτερη τυπική απόκλιση. • Ωστόσο, προσέξτε ότι ο μέσος όρος στα οικονομικά είναι μεγαλύτερος από το μέσο όρο στη στατιστική. 𝐶𝑉𝛴𝜏𝛼𝜏 = 𝑠 𝑥 100% = 0,9 5,5 100% = 16,36% 𝐶𝑉𝛰𝜄𝜅 = 𝑠 𝑥 100% = 1,1 7,5 100% = 14,67%
  • 35. • Ο συντελεστής μεταβλητότητας στα οικονομικά είναι χαμηλότερος από ότι στην στατιστική, – γεγονός που σημαίνει ότι οι φοιτητές είναι περισσότερο συνεπείς στην απόδοσή τους στα οικονομικά σε σχέση με τη στατιστική. – Η σχετική διασπορά στη στατιστική είναι μεγαλύτερη. 𝐶𝑉𝛴𝜏𝛼𝜏 = 𝑠 𝑥 100% = 0,9 5,5 100% = 16,36% 𝐶𝑉𝛰𝜄𝜅 = 𝑠 𝑥 100% = 1,1 7,5 100% = 14,67%
  • 36. • Να βρεθεί ποιο από τα δυο παρακάτω δείγματα προέρχεται από τον πληθυσμό που έχει τη μεγαλύτερη διασπορά με βάση το συντελεστή μεταβλητότητας. • Υ: 1, 6, 9, 4 • X: 101 , 104, 102, 103
  • 37. 1 6 1 1 9 4 16 4 -1 1 0
  • 38. 101 104 1,5 2,25 102 -0,5 0,25 103 0,5 0,25 0
  • 39. • Παρατηρούμε ότι η εκτίμηση του δείκτη μεταβλητότητας για τον πρώτο πληθυσμό (με βάση το πρώτο δείγμα) είναι πολύ υψηλότερη, γεγονός που οφείλεται όχι μόνο στη διασπορά των δεδομένων (αποκλίσεις από τη μέση τιμή είναι μεγαλύτερες στο πρώτο δείγμα), αλλά και στο μικρό κατ’ απόλυτη τιμή μέγεθος της μέσης τιμής (είναι 5 ενώ στο δεύτερο δείγμα 102,5).
  • 40. ΜΕΤΡΑ ΑΣΥΜΜΕΤΡΙΑΣ • Για να περιγραφεί ικανοποιητικά μια κατανομή συχνοτήτων απαιτείται ο προσδιορισμός τεσσάρων βασικών στατιστικών παραμέτρων: – i) Κεντρική Τάση – ii) Διασπορά, – iii) Ασυμμετρία και – iv) Κύρτωση • Η ασυμμετρία (skewness) δείχνει πόσο συμμετρικά γύρω από το μέσο κατανέμονται οι παρατηρήσεις, τα δεδομένα μας.
  • 41. ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ • Απλά δεδομένα - Ασυμμετρία πληθυσμού • Απλά δεδομένα - Ασυμμετρία δείγματος 2 2 2 ) ( μ      N x xi N xi 3 3 ) ( μ     3 3 σ μ  G 𝐺 = 1 𝑛 − 1 𝑥𝑖 − 𝑥 𝑠 3 𝑘 𝑖=1
  • 42. Ασυμμετρία στα απλά δεδομένα - πληθυσμός 𝐺 = 𝜇3 𝜎3  Με το γράμμαμi συμβολίζονται οι κεντρικές ροπές, δηλαδή οι διαφορέςαπό τη μέση τιμή υψωμένεςστον δείκτη i,𝜇𝑖 = 𝛴(𝑥𝑖−𝜇)𝑖 𝛮 .  𝜇3 είναι ητρίτη κεντρική ροπή και ισούται με 𝜇3 = 𝛴(𝑥𝑖−𝜇)3 𝛮 .  𝜎3 είναι ητυπική απόκλιση υψωμένη στην τρίτη. Αφού υπολογίσουμε τη διακύμανση, η οποία σημειωτέον είναι ηδεύτερη κεντρική ροπή 𝜎2 = 𝜇2 = 𝛴(𝑥𝑖−𝜇)2 𝛮 .
  • 43. Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3 (𝑥𝑖 − 𝜇)2 1 -2 -8 4 2 -1 -1 1 3 0 0 0 5 2 8 4 4 1 1 1 𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3 𝛴(𝑥𝑖 − 𝜇)2 15 0 10 Να βρεθεί η ασυμμετρία στον παρακάτω πληθυσμό, Χ: 1, 2, 3, 5, 4 Λύση Βήμα 1ο . Υπολογίζουμε τη μέση τιμή 𝜇 = 𝛴𝑥𝑖 𝑛 = 15 5 = 3 Βήμα 2ο . Υπολογίζουμε την τρίτη κεντρική ροπή 𝜇3 = 𝛴(𝑥𝑖−𝜇)3 𝛮 = 0 5 = 0.
  • 44. Παράδειγμα Να βρεθεί η ασυμμετρία στον παρακάτω πληθυσμό, Χ: 1, 2, 3, 5, 4 Λύση Βήμα 1ο . Υπολογίζουμε τη μέση τιμή 𝜇 = 𝛴𝑥𝑖 𝑛 = 15 5 = 3 Βήμα 2ο . Υπολογίζουμε την τρίτη κεντρική ροπή 𝜇3 = 𝛴(𝑥𝑖−𝜇)3 𝛮 = 0 5 = 0. Επειδή το 𝜇3 είναι ο αριθμητής της ασυμμετρίας και ισούται με το μηδέν, έπεται ότι το αποτέλεσμα του συντελεστή ασυμμετρίας είναι μηδέν, συνεπώς θα μπορούσαμε να σταματήσουμε στο σημείο αυτό, αλλά για να ολοκληρώσουμε την προσέγγιση θα εξετάσουμε και το βήμα 3ο .
  • 45. Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3 (𝑥𝑖 − 𝜇)2 1 -2 -8 4 2 -1 -1 1 3 0 0 0 5 2 8 4 4 1 1 1 𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3 𝛴(𝑥𝑖 − 𝜇)2 15 0 10
  • 46. Χ 𝑥𝑖 − 𝜇 (𝑥𝑖 − 𝜇)3 (𝑥𝑖 − 𝜇)2 1 -2 -8 4 2 -1 -1 1 3 0 0 0 5 2 8 4 4 1 1 1 𝛴𝑥𝑖 𝛴(𝑥𝑖 − 𝜇)3 𝛴(𝑥𝑖 − 𝜇)2 15 0 10
  • 47. Να βρεθεί η ασυμμετρία στο παρακάτω δείγμα Χ 1 2 12 15
  • 48. Χ 1 -4 16 -64 2 -3 9 -27 12 7 49 343 15 74 252
  • 49. • Στη διεθνή βιβλιογραφία χρησιμοποιούνται διάφορες παραλλαγές του προηγούμενου τύπου με σκοπό την κατά το δυνατό καλύτερη προσέγγιση της πραγματικής ασυμμετρίας του πληθυσμού. • • Μο είναι η επικρατούσα τιμή και Μd είναι η διάμεσος 𝐺 = 𝑛 𝑛 − 1 𝑛 − 2 𝑓𝑖 𝑥𝑖 − 𝑥 𝑠 3 𝑘 𝑖=1 𝜋𝜌ώ𝜏𝜊𝜍 𝜎𝜐𝜈𝜏𝜀𝜆𝜀𝜎𝜏ή𝜍 𝜆𝜊𝜉ό𝜏𝜂𝜏𝛼𝜍 𝜏𝜊𝜐 𝑃𝑒𝑎𝑟𝑠𝑜𝑛 = 𝑥 − 𝑀𝑜 𝑠 𝛿𝜀ύ𝜏𝜀𝜌𝜊𝜍 𝜎𝜐𝜈𝜏𝜀𝜆𝜀𝜎𝜏ή𝜍 𝜆𝜊𝜉ό𝜏𝜂𝜏𝛼𝜍 𝜏𝜊𝜐 𝑃𝑒𝑎𝑟𝑠𝑜𝑛 = 3 𝑥 − 𝑀𝑑 𝑠
  • 50. G=0 ή μ3=0 Συμμετρική Συμμετρική 0 1 2 3 4 5 6 7 1 2 3 4 5 6 7
  • 51. G>0 ή μ3>0 Θετική Ασυμμετρία Θετική Ασσυμετρία 0 2 4 6 8 10 12 1 2 3 4 5 6 7
  • 52. G<0 ή μ3<0 Αρνητική Ασυμμετρία Αρνητική Ασσυμετρία 0 2 4 6 8 10 12 1 2 3 4 5 6 7
  • 53. • Να βρεθεί ο συντελεστής Pearson Τάξεις fi xi fixi xi-μ (χi-μ)2 fi(χi-μ)2 fi(χi-μ)3 [1-3] 2 2 4 -4 16 32 -128 [3-5] 5 4 20 -2 4 20 -40 [5-7] 7 6 42 0 0 0 0 [7-9] 5 8 40 2 4 20 40 [9-11] 2 10 20 4 16 32 128 Σ 21 126 104 0 6 21 126 Σf Σf μ i i    i x 0 21 0 ) μ ( μ 3 3       i i i f f  3 3 σ μ G 
  • 54. 0 μ3  94 , 10 22 , 2 σ 2,22 σ 95 , 4 21 104 ) ( 3 3 2 2             i i i f f Συμμετρική 0 94 , 10 0 σ μ G 3 3    Τάξεις fi xi fixi xi-μ (χi-μ)2 fi(χi-μ)2 fi(χi-μ)3 [1-3] 2 2 4 -4 16 32 -128 [3-5] 5 4 20 -2 4 20 -40 [5-7] 7 6 42 0 0 0 0 [7-9] 5 8 40 2 4 20 40 [9-11] 2 10 20 4 16 32 128 Σ 21 126 104 0
  • 55. Να βρεθεί η ασυμμετρία 1 2 2 3 3 5 4 3 5 2
  • 56. 1 2 1*2=3 2 3 6 3 5 15 4 3 12 5 2 10
  • 57. 1 2 2 3 -1 1 3 3 5 0 0 0 4 3 1 1 3 5 2 2 4 8
  • 58. 1 2 2 3 -1 -1 -3 3 5 0 0 0 4 3 1 1 3 5 2 2 8 16
  • 59. ΚΥΡΤΩΣΗ • Δύο ή περισσότερες κατανομές συχνοτήτων να έχουν – τον ίδιο μέσο αριθμητικό, – την ίδια τυπική απόκλιση και – να είναι συμμετρικές, • αλλά να διαφέρουν ως προς την κύρτωση, • δηλαδή ως προς την συγκέντρωση των παρατηρήσεων γύρω από το μέσο – αιχμηρότητα της κορυφής • Η κύρτωση (kurtosis) δείχνει κατά πόσο τα δεδομένα της κατανομής σχηματίζουν έντονη κορυφή στο μέσο τους.
  • 60. ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ • Απλά δεδομένα - Κύρτωση πληθυσμού • Απλά δεδομένα - Κύρτωση δείγματος 2 2 2 ) ( μ      N x xi N xi 4 4 ) ( μ     4 4 σ μ  K 𝐾 = 1 (𝑛 − 1)𝑠4 𝑥𝑖 − 𝑥 4 𝑛 𝑖=1
  • 61. ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ • Ομαδοποιημένα - Κύρτωση πληθυσμού • Ομαδοποιημένα – Κύρτωση δείγματος 2 2 2 ) ( μ        i i i f x f i i i f f     4 4 ) ( μ   4 4 σ μ  K 𝛫 = 1 𝑛 − 1 𝑓𝑖 𝑥𝑖 − 𝑥 𝑠 4 𝑘 𝑖=1
  • 62. • Κατανομές συχνοτήτων που οι τιμές τους διασπείρονται πάρα πολύ αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως πλατύκυρτες και έχουν συντελεστή K<3 (Excel K<0) Πλατύκυρτη 0 0,5 1 1,5 2 2,5 3 3,5 1 2 3 4 5 6 7 8 9 10 11 12 13
  • 63.
  • 64. • Οι "Κανονικές Κατανομές" που οι τιμές μιας μεταβλητής ισοκατανέμονται αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως Μεσόκυρτες K=3 (Excel K=0) Μεσόκυρτη 0 0,5 1 1,5 2 2,5 3 3,5 1 2 3 4 5 6 7
  • 65.
  • 66. • Τέλος, κατανομές συχνοτήτων που παρουσιάζουν μεγάλη συγκέντρωση τιμών στην περιοχή του μέσου αριθμητικού χαρακτηρίζονται ως Λεπτόκυρτες και έχουν K>3 (Excel K>0) Λεπτόκυρτη 0 5 10 15 20 25 1 2 3 4 5 6 7
  • 67.
  • 68. Πλατύκυρτη 0 0,5 1 1,5 2 2,5 3 3,5 1 2 3 4 5 6 7 8 9 10 11 12 13 Μεσόκυρτη 0 0,5 1 1,5 2 2,5 3 3,5 1 2 3 4 5 6 7 Λεπτόκυρτη 0 5 10 15 20 25 1 2 3 4 5 6 7
  • 69. • Να βρεθεί η κύρτωση στον πληθυσμό: • Χ: 5, 0, 1, 2, 1, 4, 1
  • 70. 5 3 9 81 0 -2 4 16 1 -1 1 1 2 0 0 0 1 -1 1 1 4 2 4 16 1 -1 1 1 0
  • 71. 5 3 9 81 0 -2 4 16 1 -1 1 1 2 0 0 0 1 -1 1 1 4 2 4 16 1 -1 1 1 0
  • 72. 5 3 9 81 0 -2 4 16 1 -1 1 1 2 0 0 0 1 -1 1 1 4 2 4 16 1 -1 1 1 0
  • 73. 5 3 9 81 0 -2 4 16 1 -1 1 1 2 0 0 0 1 -1 1 1 4 2 4 16 1 -1 1 1 0
  • 74. 5 3 9 81 0 -2 4 16 1 -1 1 1 2 0 0 0 1 -1 1 1 4 2 4 16 1 -1 1 1 0
  • 75. • Να υπολογιστεί η διακύμανση στο παρακάτω δείγμα: • Χ: 1, 2, 3
  • 76. 1 -1 1 1 2 0 0 0 3 1 1 1 0
  • 77. 1 -1 1 1 2 0 0 0 3 1 1 1 0
  • 78. 1 -1 1 1 2 0 0 0 3 1 1 1 0
  • 79. • Να βρεθεί η κύρτωση Τάξεις fi [1-3] 2 [3-5] 5 [5-7] 7 [7-9] 5 [9-11] 2 Σ 21 4 4 σ μ K 
  • 80. • Να βρεθεί η κύρτωση 6 21 126 Σf Σf μ i i    i x 38 , 56 21 1184 ) μ ( μ 4 4       i i i f f  Τάξεις fi xi fixi xi-μ (χi-μ)2 fi(χi-μ)2 (χi-μ)4 fi(χi-μ)4 [1-3] 2 2 4 -4 16 32 256 512 [3-5] 5 4 20 -2 4 20 16 80 [5-7] 7 6 42 0 0 0 0 0 [7-9] 5 8 40 2 4 20 16 80 [9-11] 2 10 20 4 16 32 256 512 Σ 21 126 104 1184 4 4 σ μ K 
  • 81. 38 , 56 μ4  3 3 , 2 95 , 24 38 , 56 σ μ K 4 4     24,95 σ 95 , 4 21 104 ) ( 4 2 2          i i i f x f Τάξεις fi xi fixi xi-μ (χi-μ)2 fi(χi-μ)2 (χi-μ)4 fi(χi-μ)4 [1-3] 2 2 4 -4 16 32 256 512 [3-5] 5 4 20 -2 4 20 16 80 [5-7] 7 6 42 0 0 0 0 0 [7-9] 5 8 40 2 4 20 16 80 [9-11] 2 10 20 4 16 32 256 512 Σ 21 126 104 1184 Πλατύκυρτη