Upcoming SlideShare
×

# deaths in Greece regions Statgraphics

654 views

Published on

we analysed the different ratio of deaths per 100.000 through the different regions of Greece by using Statgraphics

0 Likes
Statistics
Notes
• Full Name
Comment goes here.

Are you sure you want to Yes No
Your message goes here
• Be the first to comment

• Be the first to like this

Views
Total views
654
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
4
0
Likes
0
Embeds 0
No embeds

No notes for slide

### deaths in Greece regions Statgraphics

1. 1. ΟΙΚΟΝΟΜΙΚΟ ΡΑΝΕΡΙΣΤΘΜΙΟ ΑΘΘΝΩΝ Διατμθματικό ΜΒΑ FULL TIME Θηκόγρ α μμ α 1 2 3 4 5 6 p la ce 7 8 9 10 11 12 13 750 850 950 1050 1150 1250 1350 death ΜΑΘΗΜΑ: ΠΟ΢ΟΣΙΚΕ΢ ΜΕΘΟΔΟΙ ΘΕΜΑ : ΟΙ ΘΑΝΑΣΟΙ ΑΠΟ ΣΟ 1994-2009 ΢ΣΙ΢ ΠΕΡΙΦΕΡΕΙΕ΢ ΣΗ΢ ΕΛΛΑΔΟ΢ΕΙΣΘΓΘΤΘΣ: ΣΦΑΚΙΑΝΑΚΘΣΟΜΑΔΑ Ε΢ΓΑΣΙΑΣ: Α. ΑΛΕΞΑΝΔ΢ΑΚΘ Δ. ΔΕΜΙ΢ΘΣ Α. ΧΑ΢ΜΡΑ Δ. ΧΑΤΗΟΡΟΥΛΟΥ Ακινα 2011
2. 2. ΠΙΝΑΚΑ΢ ΠΕΡΙΕΧΟΜΕΝΩΝΡΙΝΑΚΑΣ ΡΕ΢ΙΕΧΟΜΕΝΩΝ ............................................................................................................................. 2Ρρόλογοσ ........................................................................................................................................................ 31. Ειςαγωγι .................................................................................................................................................... 4 1.1. Σθνπόο ............................................................................................................................................... 4 1.2. Γεδνκέλα-Πεγή................................................................................................................................. 5 1.3. Σπκβνιηζκνί δεδνκέλσλ .................................................................................................................. 5Κεθάιαην 1 .................................................................................................................................................... 7 1.1.Ρεριγραφικι Ανάλυςθ και Γραφικι απεικόνιςθ . ................................................................................ 7 1.1.1. One-Variable Analysis - death ...................................................................................................... 7 1.3. MULTIPLE VARIANCE ANALYSIS ......................................................................................................... 12 1.4. TWO – SAMPLE COMPARISON ANALYSIS .......................................................................................... 13 1.4.1. TWO – SAMPLE COMPARISON ANALYSIS: ................................................................................. 13 Σφγκριςθ του πλθκυςμοφ Ανατολικισ Μακεδονίασ Θράκθ=1 με τον πλθκυςμό Ρελοπόννθςοσ =9. . 13 1.4.2. TWO – SAMPLE COMPARISON ANALYSIS: ................................................................................. 17 Σφγκριςθ του πλθκυςμοφ Κεντρικισ Μακεδονίασ (Θεςςαλονίκθ)=2 με τον πλθκυςμό Αττικισ =10 .. 17 1.4.3. Σφγκριςθ ανάμεςα ςτον αρικμό των ςυνολικών κανάτων ςε Ελλάδα και Βουλγαρία. ............. 22ΚΕΦΑΛΑΙΟ 2 ................................................................................................................................................. 25ADVANCED PROCEDURES ............................................................................................................................. 25 2.1. ANOVA ANALYSIS ............................................................................................................................... 25 2.1.1. ANOVA ANALYSIS ωσ προσ τθν περιοχι .................................................................................... 25 2.1.2. ANOVA ANALYSIS ωσ προσ τθν χρονιά ....................................................................................... 31 2.1.3. Ζλεγχοσ για αναηιτθςθ κατανομισ που να αντιπροςωπεφει τθν γενικι κατανομι των κανάτων ςτθν Ελλάδα ......................................................................................................................................... 33 2.2. Ρ΢ΟΒΛΕΨΘ ........................................................................................................................................ 36Συμπεράςματα ............................................................................................................................................. 40Βιβλιογραφία................................................................................................................................................ 41 2
3. 3. Πρόλογοσ Η εξγαζία απηή έγηλε ζηα πιαίζηα ηνπ καζήκαηνο «Πνζνηηθέο κέζνδνη γηα ηειήςε Δπηρεηξεζηαθώλ Απνθάζεσλ» ηνπ πξώηνπ εμακήλνπ ηνπ ηκήκαηνοΓηαηκεκαηηθνύ ΜΒΑ Full Time. Ήηαλ κηα εμαηξεηηθή επθαηξία λα εξεπλήζνπκε θαηλα αλαθαιύςνπκε ρξήζηκεο κεζόδνπο αλάιπζεο θαη επεμεξγαζίαο ζηαηηζηηθώλδεδνκέλσλ κέζσ απιώλ θαη πην εμεηδηθεπκέλσλ κεζόδσλ. Η κειέηε όισλ απηώλ ησλ κεζόδσλ θαη ε ρξεζηκόηεηα ηνπο είλαη ηδηαίηεξαπνιύηηκε ζηελ εμαγσγή ζπκπεξαζκάησλ βαζηζκέλσλ ζηε ρξήζεεξσηεκαηνινγίσλ δειαδή ηεο πξσηνγελήο αιιά θαη ηεο δεπηεξνγελήο έξεπλαο.Κάηη ηέηνην ζα γίλεη απόιπηα θαηαλνεηό ζηε ζπλέρεηα ηεο εξγαζίαο πνπ βαζίζηεθεζε απηή αθξηβώο ηε ινγηθή θαη ζηα απνηειέζκαηά ηεο. Οινθιεξώλνληαο ηνλ πξόινγν πνπ ζα ζαο εηζάγεη ζην θύξην κέξνο ηεοεξγαζίαο ζα ζέιακε λα επραξηζηήζνπκε ηδηαίηεξα ηνλ θαζεγεηή καο ζην κάζεκααπηό, θύξην Σθαθηαλάθε, πνπ ήηαλ ν θπξηόηεξνο αξσγόο ζε απηή καο ηελπξνζπάζεηα. Χσξίο ηε βνήζεηά ηνπ ζίγνπξα ε εξγαζία καο ζα είρε ειιείςεηο νηνπνίεο απνθεύρζεθαλ ράξε ζηηο ζπκβνπιέο πνπ καο έδσζε όπνηε απηέορξεηάζηεθαλ. Αζήλα, Ιαλνπάξηνο 2011 Αιεμαλδξάθε Αξγπξή Γεκίξεο Γεκήηξηνο Χάξκπα Απνζηνιία Χαηδνπνύινπ Γηνλπζία 3
4. 4. 1. Ειςαγωγή1.1. Σκοπός Σθνπόο ηεο ζπγθεθξηκέλεο εξγαζίαο ήηαλ ε κειέηε ησλ ζαλάησλ σοπνζνζηό αλά 100.000 θαηνίθνπο ζε δηάθνξεο πεξηνρέο ηεο Διιάδαο. Σηόρνο καοήηαλ λα δνύκε πνηεο γεσγξαθηθέο πεξηνρέο ηεο ρώξαο καο έρνπλ παξόκνηνπνζνζηό ζαλάησλ θαη λα πξνζπαζήζνπκε λα εξκελεύζνπκε ηπρόλ νκνηόηεηεοθαη δηαθνξέο. Αθόκα ζηόρνο ήηαλ θαη ε κειινληηθή πξόβιεςε ησλ ζαλάησλ.Δπηπξνζζέησο πξνζπαζήζακε λα δνύκε πνηεο γεσγξαθηθέο πεξηνρέο, αλππάξρνπλ, κπνξνύλ λα αληηθαηνπηξίζνπλ θαη ζε πνην βαζκό ηελ πνξεία ησλζαλάησλ ζε όιε ηελ ρώξα έηζη ώζηε λα εμάγνπκε έλα δηάζηξσκα κε βάζε ηννπνίν λα κπνξνύκε λα θάλνπκε κειινληηθέο εθηηκήζεηο θαη γεληθεύζεηο γηα όιν ηνλειιεληθό πιεζπζκό. Γηα όιε ηελ εξγαζία ρξεζηκνπνηήζακε δηάζηεκαεκπηζηνζύλεο 95%. 4
5. 5. 1.2. Δεδομένα-Πηγή Τα δεδνκέλα ηα πήξακε από ηελ Δπξσπατθή Σηαηηζηηθή ππεξεζία θαηαθνξνύζαλ ηνπο ζαλάηνπο σο λνύκεξν αλά 100.000 πιεζπζκνύ από ην 1994κέρξη ην 2008 γηα δηάθνξεο γεσγξαθηθέο πεξηνρέο ηεο ρώξαο καο. Αθόκα πήξακεζηνηρεία γηα ην γεληθό πνζνζηό ηεο Διιάδαο αιιά θαη ηεο Βνπιγαξίαο.1.3. Συμβολιζμοί δεδομένων Σην πξόγξακκα έρνπκε θάλεη ρξήζε ησλ εμήο κεηαβιεηώλ:  Death: όπνπ ζπκβνιίδεη ην αξηζκό ησλ ζαλάησλ αλά 100.000 θαηνίθνπο  Place : όπνπ ζπκβνιίδεη ηηο πεξηνρέο όπνπ 1= Αλαηνιηθή Μαθεδνλία, Θξάθε 2=Κεληξηθή Μαθεδνλία 3=Γπηηθή Μαθεδνλία 4=Θεζζαιία 5=Ήπεηξνο 6=Ιόληα Νεζηά 7=Γπηηθή Διιάδα 5
6. 6. 8=Σηεξεά Διιάδα 9=Πεινπόλεζνο 10=Αηηηθή 11=Βόξεην Αηγαίν 12=Νόηην Αηγαίν 13=Κξήηε Year : ην έηνο ζην νπνίν αλαθέξεηαη ην death Total deaths : όπνπ ζπκβνιίδεη ηνπο ζπλνιηθνύο ζαλάηνπο ηεο Διιάδαο θαη Βνπιγαξίαο Country: όπνπ ζπκβνιίδεη ηελ ρώξα από όπνπ πξνέξρνληαη νη ζάλαηνη κε 1= Διιάδα 2= Βνπιγαξία 6
7. 7. Κεθάιαην 1 1.1.Περιγραφική Ανάλυςη και Γραφική απεικόνιςη .1.1.1. One-Variable Analysis - deathData variable: death (per 100.000 habitans)195 values ranging from 757,7 to 1333,3Summary Statistics for deathCount 195Average 1010,83Standard deviation 122,081Coeff. of variation 12,0774%Minimum 757,7Maximum 1333,3Range 575,6Stnd. skewness 0,983902Stnd. kurtosis -1,11866Πίνακας 1 Από ηνλ πίλαθα 1 παξαηεξνύκε πσο νη ηηκέο ηεο κεηαβιεηήο deathαθνινπζνύλ ηελ θαλνληθή θαηαλνκή θαζώο ε Standared skewness θαη εStandared Kurtosis είλαη κέζα ζηα επηηξεπηά όξηα (–2,2) θαη κάιηζηα είλαη πνιύθνληά ζηηο ηηκέο 1 θαη –1 αληίζηνηρα. Γειαδή ε θαηαλνκή καο έρεη πνιύ κηθξήαξηζηεξή αζπκκεηξία θαη θύξησζε ζε ζρέζε κε ηελ θαλνληθή θαηαλνκή ζε βαζκόηέηνην πνπ κπνξνύκε λα ζεσξήζνπκε ηελ θαηαλνκή καο σο θαλνληθή. Βάζεαπηνύ αλακέλνπκε ηα δεδνκέλα καο λα είλαη ζηαηηζηηθά ζεκαληηθά. 7
8. 8. Ιζηόγρ αμ μ α 80 60 freq u en cy 40 20 0 720 920 1120 1320 1520 deathΓράφημα 1 Παξαηεξώληαο ην Ιζηόγξακκα ζην γξάθεκα 1 βιέπνπκε θαη γξαθηθάπιένλ πσο ε θαηαλνκή καο έρεη κηα ειαθξά δεμηά αζπκκεηξία. Θηκόγρ α μμ α 750 850 950 1050 1150 1250 1350 deathΓράφημα 2 Από ην γξάθεκα 2 παξαηεξνύκε πσο δελ ππάξρνπλ outliers νύηεsuspected outliers θαη πσο ε θαηαλνκή καο έρεη κηα ειαθξά αξλεηηθή θύξησζε. 8
9. 9. Frequency Tabulation for death Lower Upper Relative Cumulative Cum. Rel.Class Limit Limit Midpoint Frequency Frequency Frequency Frequency at or below 720,0 0 0,0000 0 0,00001 720,0 808,889 764,444 8 0,0410 8 0,04102 808,889 897,778 853,333 35 0,1795 43 0,22053 897,778 986,667 942,222 34 0,1744 77 0,39494 986,667 1075,56 1031,11 64 0,3282 141 0,72315 1075,56 1164,44 1120,0 28 0,1436 169 0,86676 1164,44 1253,33 1208,89 20 0,1026 189 0,96927 1253,33 1342,22 1297,78 6 0,0308 195 1,00008 1342,22 1431,11 1386,67 0 0,0000 195 1,00009 1431,11 1520,0 1475,56 0 0,0000 195 1,0000 above 1520,0 0 0,0000 195 1,0000Πίνακας 2Mean = 1010,83 Standard deviation = 122,081 Σηνλ παξαπάλσ πίλαθα βιέπνπκε ηηο ηηκέο θαη ηελ ζπρλόηεηα εκθάληζεοησλ ζηνηρείσλ ρσξηζκέλα ζε θιάζεηο. 9
10. 10. Quantile Plot 1 p rop o rtio n 0,8 0,6 0,4 0,2 0 750 850 950 1050 1150 1250 1350 deathΓράφημα 3 Δι άγρα μ μα Σκεδα ζμού 750 850 950 1050 1150 1250 1350 deathΓράφημα 4 Σην γξάθεκα 4 απεηθνλίδνληαη νη δηάθνξεο ηηκέο πνπ κπνξεί λα πάξεη εκεηαβιεηή death. 10
11. 11. Percentiles for death Percentiles1,0% 760,65,0% 821,310,0% 855,425,0% 912,250,0% 1020,775,0% 1084,890,0% 1177,195,0% 1213,199,0% 1317,2Πίνακας 3 Σηνλ παξαπάλσ πίλαθα βιέπνπκε όηη γηα ην πιεζπζκό καο ζε πνζνζηό90% νη ζάλαηνη θπκαίλνληαη από 821,3 αλά 100.000 θαηνίθνπο σο 1213,1 αλά100.000 θαηνίθνπο. Symmetry Plot 400 d ista n ce a b ove me d ia n 300 200 100 0 0 100 200 300 400 distance below medianΓράφημα 5 Σην παξαπάλσ γξάθεκα παξαηεξνύκε ηηο απνθιίζεηο θάζε παξαηήξεζεοαπό ηνλ δηάκεζν. 11
12. 12. 1.3. MULTIPLE VARIANCE ANALYSIS Σύκθσλα κε ην αθόινπζν πίλαθα δελ ππάξρεη θαλνληθόηεηα αλάκεζα ζεόιεο ηηο κεηαβιεηέο, θαζώο ηα stnd. Skewness θαη stnd. Kurtosis είλαη εθηόο ησλαπνδεθηώλ νξίσλ [-2,2]. Άξα γηα λα εμεηάζνπκε ηελ όπνηα ζπζρέηηζε κεηαμύ ησλκεηαβιεηώλ ζα επηιέμνπκε ηελ Spearman Rank Correlation.Summary Statistics death year placeCount 195 195 195Average 1010,83 2001,0 7,0Standard deviation 122,081 4,33161 3,75129Coeff. of variation 12,0774% 0,216473% 53,5898%Minimum 757,7 1994,0 1,0Maximum 1333,3 2008,0 13,0Range 575,6 14,0 12,0Stnd. skewness 0,983902 0,0 0,0Stnd. kurtosis -1,11866 -3,45168 -3,46213Πίνακας 4 Σύκθσλα κε ηνλ αθόινπζν πίλαθα παξαηεξνύκε όηη δελ ππάξρεη θακίαζπζρέηηζε κεηαμύ ησλ κεηαβιεηώλ καο , όπσο ήηαλ θαη αλακελόκελν , θαζώο ζεόιεο ηηο πεξηπηώζεηο ην P-Value είλαη κεγαιύηεξν από ην 0,05 γηα έλα δηάζηεκαεκπηζηνζύλεο 95%.Spearman Rank Correlations death year placedeath 0,0872 -0,0909 (195) (195) 0,2245 0,2055year 0,0872 0,0000 (195) (195) 0,2245 1,0000place -0,0909 0,0000 (195) (195) 0,2055 1,0000Πίνακας 5 12
13. 13. 1.4. TWO – SAMPLE COMPARISON ANALYSIS1.4.1. TWO – SAMPLE COMPARISON ANALYSIS:Σύγκριςη του πληθυςμού Ανατολικήσ Μακεδονίασ Θράκη=1 με τονπληθυςμό Πελοπόννηςοσ =9. Γηα λα πξνβνύκε ζηελ ζύγθξηζε ησλ δπν πιεζπζκώλ ζα πξέπεη πξώηαλα δνύκε αλ αθνινπζνύλ ηελ θαλνληθή θαηαλνκή, αλ ηα δηαζηήκαηαεκπηζηνζύλεο γηα 95% ηεο κεηαβιεηήο ζάλαηνο γηα ην δπν ηηκέο εκθαλίδνπλ θνηλάζεκεία, θαη ηέινο ζα εμεηάζνπκε ην Kolmogorov-Smirnov Test γηα λα δσ αλππάξρεη ή όρη ζεκαληηθή ζηαηηζηηθή δηαθνξά αλάκεζα ζηνπο δύν πιεζπζκνύο.Από ηα παξαπάλσ ζα νδεγεζνύκε ζε ζύγθξηζε ησλ κέζσλ ή ζε ζύγθξηζε ησλδηακέζσλ. Αο αξρίζνπκε ινηπόλ ηνλ έιεγρν.Summary Statistics SELECT(death;place=1) SELECT(death;place=9)Count 15 15Average 1044,41 1164,51Standard deviation 23,0713 26,1065Coeff. of variation 2,20902% 2,24183%Minimum 1013,3 1126,4Maximum 1095,8 1219,0Range 82,5 92,6Stnd. skewness 1,28182 0,505692Stnd. kurtosis 0,0425351 -0,108468Πίνακας 6 Από ηνλ Πίλαθα 6 παξαηεξνύκε πσο θαη νη δύν πιεζπζκνί εκθαλίδνπλθαλνληθόηεηα ζηελ θαηαλνκή ηνπο θαζώο νη ηηκέο ηεο θύξησζεο θαη ηεοαζπκκεηξίαο θαη γηα ηνπο δπν πιεζπζκνύο βξίζθνληαη κέζα ζηα απνδεθηά όξηα(-2,+2). Έηζη παίξλνπκε ην πξάζηλν θσο θαη πξνρσξάκε ζηνλ επόκελν έιεγρν. 13
14. 14. Comparison of Standard Deviations SELECT(death;place=1) SELECT(death;place=9)Standard deviation 23,0713 26,1065Variance 532,283 681,547Df 14 14Ratio of Variances = 0,78099295,0% Confidence Intervals Standard deviation of SELECT(death;place=1): [16,8911; 36,3856] Standard deviation of SELECT(death;place=9): [19,1132; 41,1724] Ratio of Variances: [0,262202; 2,32625]F-test to Compare Standard Deviations Null hypothesis: sigma1 = sigma2 Alt. hypothesis: sigma1 NE sigma2 F = 0,780992 P-value = 0,650039 Do not reject the null hypothesis for alpha = 0,05.Πίνακας 7 Όπσο παξαηεξνύκε ν ιόγνο ησλ δηαθπκάλζεσλ ησλ δύν πιεζπζκώλθπκαίλεηαη από 0,262 έσο θαη 2,32. ην γεγνλόο όηη ην εύξνο πεξηιακβάλεη ηελκνλάδα καο δίλεη ηελ δπλαηόηεηα λα ππνζέζνπκε πσο νη θαηαλνκέο ησλαπνθιίζεσλ ησλ δύν πιεζπζκώλ είλαη ίδηεο θαη επνκέλσο παίξλνπκε θαη ηνδεύηεξν πξάζηλν θσο ώζηε λα ζπλερίζνπκε κε ηνλ ηειεπηαίν έιεγρν ηνKolmogorov-Smirnov Test.Kolmogorov-Smirnov TestEstimated overall statistic DN = 1,0Two-sided large sample K-S statistic = 2,73861Approximate P value = 6,11805E-7Πίνακας 8 Παξαηεξνύκε όηη ην P-value είλαη κηθξόηεξν από ην 0,05 νπόηε κε 95%πηζαλόηεηα ππάξρεη ζηαηηζηηθή ζεκαληηθή δηαθνξά αλάκεζα ζηνπο πιεζπζκνύοπνπ εμεηάδνπκε. Λόγν απηνύ ζα πάκε λα ζπγθξίλνπκε ηηο δηάκεζνπο ησλ δύνπιεζπζκώλ. 14
15. 15. Comparison of MediansMedian of sample 1: 1038,9Median of sample 2: 1167,5Mann-Whitney (Wilcoxon) W test to compare medians Null hypothesis: median1 = median2 Alt. hypothesis: median1 NE median2 Average rank of sample 1: 8,0 Average rank of sample 2: 23,0 W = 112,5 P-value = 0,00000339552 Reject the null hypothesis for alpha = 0,05.Πίνακας 9 Παξαηεξώληαο ηελ ζύγθξηζε ησλ δηακέζσλ βιέπνπκε πσο κε 95%πηζαλόηεηα νη δπν πιεζπζκνί, δειαδή νη ζάλαηνη από ηελ Αλαηνιηθή Μαθεδνλίαθαη Θξάθε θαη νη ζάλαηνη από ηελ Πεινπόλλεζν, δηαθέξνπλ ζηαηηζηηθά ζεκαληηθάθαη ηα λνύκεξα ησλ ζαλάησλ αθνινπζνύλ δηαθνξεηηθή πνξεία. Πην ζπγθεθξηκέλαν δηάκεζνο ηεο Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο είλαη 1038,9 ζάλαηνη αλά100.000 θαηνίθσλ ελώ ηεο Πεινπνλλήζνπ 1167,5 ζάλαηνη αλά 100.000 θαηνίθσλ.Παξαηεξνύκε ινηπόλ πσο ππάξρεη κηα απμεκέλε ζλεζηκόηεηα ησλ θαηνίθσλ ηεοΠεινπνλλήζνπ γη απηό ην ζθνπό θαιό ζα ήηαλ λα επηιέμνπκε γηα ηόπν δηακνλήοκαο ηελ Αλαηνιηθή Μαθεδνλία θαη Θξάθε. Τα παξαπάλσ αλαπαξηζηνύληαη θαηδηαγξακκαηηθά ζηα γξαθήκαηα 6 θαη 7. 15
16. 16. SELECT(death;place=1) 10 freq u en cy 6 2 2 6 10 1000 1040 1080 1120 1160 1200 1240 SELECT(death;place=9)Γράφημα 6 Quantile-Quantile Plot 1240 1200 S E L E CT(d e ath ;p lace= 9 ) 1160 1120 1080 1040 1000 1000 1040 1080 1120 1160 1200 1240 SELECT(death;place=1)Γράφημα 7 16
17. 17. 1.4.2. TWO – SAMPLE COMPARISON ANALYSIS:Σύγκριςη του πληθυςμού Κεντρικήσ Μακεδονίασ (Θεςςαλονίκη)=2 μετον πληθυςμό Αττικήσ =10 Καη πάιη όπσο θαη ζηελ πξνεγνύκελε ζύγθξηζε ζα πξέπεη λα θάλνπκεπξώηα θάπνηνπο ειέγρνπο . Αξρηθά γηα λα πξνβώ ζηελ ζύγθξηζε ησλ δπνπιεζπζκώλ ζα πξέπεη πξώηα λα δνύκε αλ αθνινπζνύλ ηελ θαλνληθή θαηαλνκή,αλ ηα δηαζηήκαηα εκπηζηνζύλεο γηα 95% ηεο κεηαβιεηήο ζάλαηνο γηα ηηο δπν ηηκέοεκθαλίδνπλ θνηλά ζεκεία, θαη ηέινο ζα εμεηάζνπκε ην Kolmogorov-Smirnov Testγηα λα δσ αλ ππάξρεη ή όρη ζεκαληηθή ζηαηηζηηθή δηαθνξά αλάκεζα ζηνπο δύνπιεζπζκνύο. Από ηα παξαπάλσ ζα νδεγεζνύκε ζε ζύγθξηζε ησλ κέζσλ ή ζεζύγθξηζε ησλ δηακέζσλ. Απηή ηελ θνξά ζπγθξίλνπκε δπν αζηηθέο πεξηνρέο θαηαλακέλνπκε λα ππάξρεη παξόκνηνο αξηζκόο ζαλάησλ αλά 100.000 θαη ζηνπο δπνπιεζπζκνύο. Αο αξρίζνπκε ινηπόλ ηνλ έιεγρν γηα λα δνύκε αλ ζα επαιεζεπηνύλ νηπξνζδνθίεο καο.Summary Statistics SELECT(death;place=2) SELECT(death;place=10)Count 15 15Average 879,68 868,8Standard deviation 26,4494 14,2551Coeff. of variation 3,00671% 1,64078%Minimum 837,7 845,3Maximum 936,4 892,9Range 98,7 47,6Stnd. skewness 1,3236 0,142912Stnd. kurtosis 0,553786 -0,835711Πίνακας 10 Από ηνλ παξαπάλσ πίλαθα βιέπνπκε πσο θαη νη δπν πιεζπζκνίαθνινπζνύλ ηελ θαλνληθή θαηαλνκή θαζώο ε αζπκκεηξία ηνπο θαη ε θύξησζεηνπο βξίζθνληαη κέζα ζηα όξηα ηνπ [-2,2]. Έρνπκε ινηπόλ ην πξώην πξάζηλν θσοώζηε λα ζπλερίζνπκε ζηνλ επόκελν έιεγρν. 17
18. 18. Comparison of Standard Deviations SELECT(death;place=2) SELECT(death;place=10)Standard deviation 26,4494 14,2551Variance 699,573 203,207Df 14 14Ratio of Variances = 3,4426695,0% Confidence Intervals Standard deviation of SELECT(death;place=2): [19,3643; 41,7133] Standard deviation of SELECT(death;place=10): [10,4365; 22,4816] Ratio of Variances: [1,1558; 10,2543]F-test to Compare Standard Deviations Null hypothesis: sigma1 = sigma2 Alt. hypothesis: sigma1 NE sigma2 F = 3,44266 P-value = 0,0273551 Reject the null hypothesis for alpha = 0,05.Πίνακας 11 Διέγρνληαο ηνλ ιόγν ησλ δηαθπκάλζεσλ παξαηεξώ όηη ν ιόγνο είλαη απόηελ ηηκή 1,15 έσο 10,25 θαη δελ εζσθιείεη ηελ κνλάδα. Άξα ππάξρεη ζηαηηζηηθάζεκαληηθή δηαθνξά αλάκεζα ζηηο απνθιίζεηο ησλ δύν θαηαλνκώλ. Αιιά αοεμεηάζνπκε θαη ην Kolmogorov-Smirnov Test.Kolmogorov-Smirnov TestEstimated overall statistic DN = 0,266667Two-sided large sample K-S statistic = 0,730297Approximate P value = 0,660386Πίνακας 12 Ο ζπγθεθξηκέλνο έιεγρνο καο δείρλεη πσο δελ ππάξρεη δηαθνξά αλάκεζαζηηο θαηαλνκέο. Όκσο ιόγν ηνπ δεύηεξνπ ειέγρνπ πνπ καο ππόδεημε πσοππάξρεη ζηαηηζηηθά ζεκαληηθά δηαθνξά αλάκεζα ζηηο απνθιίζεηο ησλ θαηαλνκώλζα νδεγεζνύκε ζε ζύγθξηζε ησλ δηακέζσλ. 18
19. 19. Comparison of MediansMedian of sample 1: 876,5Median of sample 2: 864,7Mann-Whitney (Wilcoxon) W test to compare medians Null hypothesis: median1 = median2 Alt. hypothesis: median1 NE median2 Average rank of sample 1: 17,0667 Average rank of sample 2: 13,9333 W = -23,5 P-value = 0,340084 Do not reject the null hypothesis for alpha = 0,05.Πίνακας 13 Η ζύγθξηζε ησλ κέζσλ καο απνθαιύπηεη θαη καο επαιεζεύεη απηά πνπαλακέλακε. Φαίλεηαη ινηπόλ πσο νη ζάλαηνη ηεο πεξηνρήο ηεο ΚεληξηθήοΜαθεδνλίαο θαη ηεο Αηηηθήο έρνπλ ην ίδην δηάκεζν θαη έηζη αλά 100.000 θαηνίθνποαλακέλνπκε ηνπο ίδηνπο ζαλάηνπο θαη ζηηο δπν πεξηνρέο. Οπόηε αλάκεζα ζεΘεζζαινλίθε θαη Αζήλα όπνην ηόπν δηακνλήο θαη λα επηιέμνπκε ζα έρνπκε ηηοίδηεο πηζαλόηεηεο λα πεζάλνπκε. Τα παξαπάλσ θαίλνληαη θαη δηαγξακκαηηθά ζηα γξαθήκαηα 8, 9 θαη 10πνπ αθνινπζνύλ. 19
20. 20. SELECT(death;place=2) 8 4 freq u en cy 0 4 8 830 850 870 890 910 930 950 SELECT(death;place=10) Γράφημα 8 Box-and-Whisker PlotSELECT(death;place=2)SELECT(death;place=10) 830 850 870 890 910 930 950 Γράφημα 9 20
21. 21. Quantile-Quantile Plot 950 S E L E CT(d e ath ;p lace= 1 0) 930 910 890 870 850 830 830 850 870 890 910 930 950 SELECT(death;place=2)Γράφημα 10 21
22. 22. 1.4.3. Σύγκριςη ανάμεςα ςτον αριθμό των ςυνολικών θανάτων ςεΕλλάδα και Βουλγαρία. Σε αυτό το ςθμείο κα μελετιςουμε τουσ κανάτουσ ανά 100.000 κατοίκουσ ςεόλθ τθν Ελλθνικι επικράτεια και κα τον ςυγκρίνουμε με αυτόν τθσ Βουλγαρίασ.Αναμζνουμε πωσ θ γεωγραφικι εγγφτθτα θ οποία υπάρχει κα παίξει ςθμαντικό ρόλοαλλά επίςθσ ςθμαντικό ρόλο κα παίξει και το γεγονόσ πωσ θ Ελλάδα είναι πιοανεπτυγμζνθ χώρα από τθν Βουλγαρία.Summary Statistics SELECT(total deaths;country=1) SELECT(total deaths;country=2)Count 16 14Average 948,113 1423,51Standard deviation 12,9937 39,4759Coeff. of variation 1,37048% 2,77314%Minimum 925,5 1359,8Maximum 977,0 1475,3Range 51,5 115,5Stnd. skewness 0,796583 -0,485075Stnd. kurtosis 0,251281 -0,798578Πίνακας 14 Για να μπορζςουμε να πάμε ςε ςφγκριςθ των δυο πλθκυςμών κα πρζπει πρώτανα ελζγξουμε αν οι κατανομζσ ακολουκοφν τθν κανονικι κατανομι. Ραρατθρώντασ τονΡίνακα 20 βλζπουμε ότι και οι δφο κατανομζσ ζχουν αςυμμετρία και κφρτωςθ πουβρίςκεται μζςα ςτα όρια (-2,+2) και μάλιςτα βρίςκονται μζςα ςτο (-1,+1) οπότεμποροφμε να ποφμε πωσ ακολουκοφν τθν κανονικι κατανομι.Comparison of Standard Deviations SELECT(total deaths;country=1) SELECT(total deaths;country=2)Standard deviation 12,9937 39,4759Variance 168,837 1558,35Df 15 13Ratio of Variances = 0,10834495,0% Confidence Intervals Standard deviation of SELECT(total deaths;country=1): [9,59854; 20,1103] Standard deviation of SELECT(total deaths;country=2): [28,6182; 63,5973] Ratio of Variances: [0,035491; 0,316895]F-test to Compare Standard Deviations Null hypothesis: sigma1 = sigma2 Alt. hypothesis: sigma1 NE sigma2 F = 0,108344 P-value = 0,000122118 Reject the null hypothesis for alpha = 0,05.Πίνακας 15 22
23. 23. Ππωσ βλζπουμε παραπάνω ο λόγοσ των διαςπορών των δυο κατανομών είναιαπό 0,035 ζωσ 0,316 γεγονόσ που δεν μασ επιτρζπει να καταλιξουμε ςτο ςυμπζραςμαπωσ οι διαςπορζσ των δυο κατανομών είναι ίδιεσ. Οπότε κα πρζπει να πάμε ςεςφγκριςθ των διαμζςων. Ασ δοφμε όμωσ πρώτα και το Kolmogorov-Smirnov Test.Kolmogorov-Smirnov TestEstimated overall statistic DN = 1,0Two-sided large sample K-S statistic = 2,73252Approximate P value = 6,53982E-7Πίνακας 16 Στθν ςφγκριςθ των διαμζςων μασ οδθγεί και το Kolmogorov-Smirnov Testκακώσ για 95% διάςτθμα εμπιςτοςφνθσ μασ δείχνει πωσ υπάρχει ςτατιςτικά ςθμαντικιδιαφορά ανάμεςα ςτισ κατανομζσ.Comparison of MediansMedian of sample 1: 946,7Median of sample 2: 1428,85Mann-Whitney (Wilcoxon) W test to compare medians Null hypothesis: median1 = median2 Alt. hypothesis: median1 NE median2 Average rank of sample 1: 8,5 Average rank of sample 2: 23,5 W = 112,0 P-value = 0,00000357121 Reject the null hypothesis for alpha = 0,05.Πίνακας 17 Ραρατθροφμε πωσ υπάρχει μια πολφ μεγάλθ διαφορά ανάμεςα ςτουσδιαμζςουσ γεγονόσ που μασ δείχνει πωσ οι κάνατοι ςτθν Βουλγαρία είναι για 95%διάςτθμα εμπιςτοςφνθσ περιςςότεροι ανά 100.000 κατοίκουσ ςε ςχζςθ με τθν Ελλάδα.Τθν διαφορά αυτι μποροφμε να τθν δοφμε και οπτικά ςτα Γραφιματα 11 και 12 πουακολουκοφν 23
24. 24. Θηκόγρ α μμ αSELECT(total deaths;country= 1)SELECT(total deaths;country= 2) 920 1020 1120 1220 1320 1420 1520 . Γράφημα 11 SELECT(total deaths;country= 1) 24 14 freq u en cy 4 6 16 890 1090 1290 1490 1690 1890 SELECT(total deaths;country= 2) Γράφημα 12 24
25. 25. ΚΕΦΑΛΑΙΟ 2 ADVANCED PROCEDURES 2.1. ANOVA ANALYSIS 2.1.1. ANOVA ANALYSIS ωσ προσ την περιοχή Τώξα ζα ζπγθξίλνπκε όιεο ηηο γεσγξαθηθέο πεξηνρέο ηεο Διιάδνο έηζη όπσο ηηο είρακε ρσξίζεη ώζηε λα βξνύκε ην θαιύηεξν κέξνο γηα λα δεηο θαζώο θαη ην ρεηξόηεξν από πιεπξάο πηζαλόηεηαο ζαλάηνπ. Αθόκα αλακέλνπκε λα θάλνπκε θάπνηεο νκαδνπνηήζεηο, δειαδή λα βξνύκε πεξηνρέο πνπ νη θαηαλνκέο ηνπο ζπκπεξηθέξνληαη αλάινγα. Summary Statistics for deathplace Count Average Standard deviation Coeff. of variation Minimum Maximum Range Stnd. skewness Stnd. kurtosis1 15 1044,41 23,0713 2,20902% 1013,3 1095,8 82,5 1,28182 0,04253512 15 879,68 26,4494 3,00671% 837,7 936,4 98,7 1,3236 0,5537863 15 980,2 28,4299 2,90042% 939,1 1048,9 109,8 1,51503 0,761434 15 1039,53 37,1686 3,57553% 981,2 1110,6 129,4 0,722892 -0,4456455 15 1039,61 25,4186 2,44502% 983,6 1076,7 93,1 -0,848323 0,2465816 15 1098,25 52,5776 4,78741% 1015,1 1184,8 169,7 0,0827112 -0,6749227 15 986,96 19,3432 1,95988% 939,6 1021,2 81,6 -1,17856 1,297288 15 1077,07 31,6408 2,93768% 1021,3 1136,5 115,2 -0,300857 -0,1029199 15 1164,51 26,1065 2,24183% 1126,4 1219,0 92,6 0,505692 -0,10846810 15 868,8 14,2551 1,64078% 845,3 892,9 47,6 0,142912 -0,83571111 15 1239,21 52,0733 4,20212% 1159,2 1333,3 174,1 0,679159 -0,6096112 15 804,727 31,0329 3,85632% 757,7 868,1 110,4 0,599153 -0,25630413 15 917,833 16,2866 1,77446% 886,5 949,2 62,7 0,0175638 -0,0335558Total 195 1010,83 122,081 12,0774% 757,7 1333,3 575,6 0,983902 -1,11866 Πίνακας 18 Σηνλ Πίλαθα 18 παξαηεξνύκε πσο νη θαηαλνκέο όισλ ησλ πεξηνρώλ αθνινπζνύλ ηελ θαλνληθή θαηαλνκή. Με βάζε ην παξαπάλσ ζα εξγαζηνύκε κε Παξακεηξηθέο κεζόδνπο θαη κε Pearson. 25
26. 26. Table of Means with 95,0 percent LSD intervals Stnd. error Count Mean (pooled s) Lower limit Upper limit SELECT(death;place=1) 15 1044,41 8,17504 1033,01 1055,82 SELECT(death;place=2) 15 879,68 8,17504 868,274 891,086 SELECT(death;place=3) 15 980,2 8,17504 968,794 991,606 SELECT(death;place=4) 15 1039,53 8,17504 1028,12 1050,93 SELECT(death;place=5) 15 1039,61 8,17504 1028,2 1051,01 SELECT(death;place=6) 15 1098,25 8,17504 1086,84 1109,65 SELECT(death;place=7) 15 986,96 8,17504 975,554 998,366 SELECT(death;place=8) 15 1077,07 8,17504 1065,66 1088,47 SELECT(death;place=9) 15 1164,51 8,17504 1153,11 1175,92 SELECT(death;place=10) 15 868,8 8,17504 857,394 880,206 SELECT(death;place=11) 15 1239,21 8,17504 1227,81 1250,62 SELECT(death;place=12) 15 804,727 8,17504 793,321 816,132 SELECT(death;place=13) 15 917,833 8,17504 906,428 929,239 Total 195 1010,83Πίνακας 19 Σηνλ παξαπάλσ πίλαθα βιέπνπκε ηελ κέζε ηηκή θαη ηελ απόθιηζε γηα θάζεηηκή μερσξηζηά.Variance Check Test P-ValueLevenes 3,53062 0,000100919Πίνακας 20 26
27. 27. Σηνλ πίλαθα 20 παξαηεξνύκε όηη ην P-Value είλαη κηθξόηεξν ηνπ 0,05 , άξαππάξρεη κηα ζεκαληηθή δηαθνξά κεηαμύ ησλ ηππηθώλ απνθιίζεσλ ζ ηα δεδνκέλακαο νπόηε ζα πάκε ζε έιεγρν Kruskal-Wallis Test.Kruskal-Wallis Test for death by placeplace Sample Size Average Rank1 15 118,8672 15 33,43333 15 77,43334 15 115,0675 15 116,8336 15 146,4677 15 79,68 15 139,0679 15 172,13310 15 28,533311 15 186,412 15 8,9666713 15 51,2Test statistic = 180,379 P-Value = 0,0Πίνακας 21 Ο πίλαθαο 21 καο δείρλεη όηη ππάξρεη ιόγνο γηα πεξηζζόηεξε κειέηε-εμέηαζε ησλ δεδνκέλσλ, θαζώο ην P-Value είλαη ίζν κε κεδέλ. Έηζη πξνρσξάκεζε αλάιπζε Myltiple Range Test , ώζηε λα δνύκε αλ νη ζάλαηνη δηαθέξνπλ κεηαμύηνπο αλάινγα κε ην ηόπν δηακνλήο. Όπσο παξαηεξνύκε ζην πίλαθα 22 πνπ αθνινπζεί ππάξρεη κηανκνηνγέλεηα κεηαμύ Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο θαη Θεζζαιίαο,Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο θαη Ηπείξνπ, Κεληξηθήο Μαθεδνλίαο θαηΑηηηθήο, Γπηηθήο Μαθεδνλίαο θαη Γπηηθήο Διιάδαο, Θεζζαιίαο θαη Ηπείξνπ θαηηέινο Ιόλησλ Νεζηώλ θαη Σηεξεάο Διιάδαο όζνλ αλαθνξά ηνπο ζαλάηνπο.Multiple Range Tests for death by placeMethod: 95,0 percent LSDplace Count Mean Homogeneous Groups12 15 804,727 X10 15 868,8 X2 15 879,68 X13 15 917,833 X3 15 980,2 X7 15 986,96 X4 15 1039,53 X5 15 1039,61 X1 15 1044,41 X8 15 1077,07 X6 15 1098,25 X9 15 1164,51 X11 15 1239,21 X 27
28. 28. Contrast Sig. Difference +/- Limits 1-2 * 164,733 22,8114 1-3 * 64,2133 22,8114 1-4 4,88667 22,8114 1-5 4,80667 22,8114 1-6 * -53,8333 22,8114 1-7 * 57,4533 22,8114 1-8 * -32,6533 22,8114 1-9 * -120,1 22,8114 1 - 10 * 175,613 22,8114 1 - 11 * -194,8 22,8114 1 - 12 * 239,687 22,8114 1 - 13 * 126,58 22,8114 2-3 * -100,52 22,8114 2-4 * -159,847 22,8114 2-5 * -159,927 22,8114 2-6 * -218,567 22,8114 2-7 * -107,28 22,8114 2-8 * -197,387 22,8114 2-9 * -284,833 22,8114 2 - 10 10,88 22,8114 2 - 11 * -359,533 22,8114 2 - 12 * 74,9533 22,8114 2 - 13 * -38,1533 22,8114 3-4 * -59,3267 22,8114 3-5 * -59,4067 22,8114 3-6 * -118,047 22,8114 3-7 -6,76 22,8114 3-8 * -96,8667 22,8114 3-9 * -184,313 22,8114 3 - 10 * 111,4 22,8114 3 - 11 * -259,013 22,8114 3 - 12 * 175,473 22,8114 3 - 13 * 62,3667 22,8114 4-5 -0,08 22,8114 4-6 * -58,72 22,8114 4-7 * 52,5667 22,8114 4-8 * -37,54 22,8114 4-9 * -124,987 22,8114 4 - 10 * 170,727 22,8114 4 - 11 * -199,687 22,8114 4 - 12 * 234,8 22,8114 4 - 13 * 121,693 22,8114 5-6 * -58,64 22,8114 5-7 * 52,6467 22,8114 5-8 * -37,46 22,8114 5-9 * -124,907 22,8114 5 - 10 * 170,807 22,8114 5 - 11 * -199,607 22,8114 5 - 12 * 234,88 22,8114 5 - 13 * 121,773 22,8114 6-7 * 111,287 22,8114 6-8 21,18 22,8114 6-9 * -66,2667 22,8114 6 - 10 * 229,447 22,8114 6 - 11 * -140,967 22,8114 6 - 12 * 293,52 22,8114 28
29. 29. 6 - 13 * 180,413 22,8114 7-8 * -90,1067 22,8114 7-9 * -177,553 22,8114 7 - 10 * 118,16 22,8114 7 - 11 * -252,253 22,8114 7 - 12 * 182,233 22,8114 7 - 13 * 69,1267 22,8114 8-9 * -87,4467 22,8114 8 - 10 * 208,267 22,8114 8 - 11 * -162,147 22,8114 8 - 12 * 272,34 22,8114 8 - 13 * 159,233 22,8114 9 - 10 * 295,713 22,8114 9 - 11 * -74,7 22,8114 9 - 12 * 359,787 22,8114 9 - 13 * 246,68 22,8114 10 - 11 * -370,413 22,8114 10 - 12 * 64,0733 22,8114 10 - 13 * -49,0333 22,8114 11 - 12 * 434,487 22,8114 11 - 13 * 321,38 22,8114 12 - 13 * -113,107 22,8114Πίνακας 22* denotes a statistically significant difference. Σηνλ πίλαθα 22 εμεηάδνληαη όιεο νη πεξηνρέο αλά δπν ώζηε λα δνύκε αλκεηαμύ ηνπο δηαθέξνπλ ζηαηηζηηθά ζεκαληηθά ή όρη. Τα απνηειέζκαηα θαίλνληαηζηνλ Πίλαθα 21 όπνπ βιέπνπκε πνηεο πεξηνρέο κπνξνύλ λα απνηειέζνπλ κηανκνηνγελνπνηεκέλε νκάδα. Σε ζπλδπαζκό θαη κε ην γξάθεκα 13 βιέπνπκε πσο ηνπο ιηγόηεξνποζαλάηνπο αλά 100.000 θαηνίθνπο έρεη ε πεξηνρή ηνπ Νόηηνπ Αηγαίνπ. Έηζη αλζέιακε λα επηιέμνπκε λα αλνίμνπκε έλα γξαθείν θεδεηώλ ζε κηα πεξηνρή ζηελΔιιάδα ηόηε δελ ζα επηιέγακε ζίγνπξα ηελπεξηνρή ηνπ Νόηηνπ Αηγαίνπ.Αθνινπζνύλ ε πεξηνρή ηεο Αηηηθήο θαη ηεο Κεληξηθήο Μαθεδνλίαο όπνπαπνηεινύλ ίζσο έθπιεμε ιόγν ησλ επηβαξύλζεσλ πνπ πξνθαινύλ νη ξπζκνί ηεοπόιεο αιιά πηζαλόηαηα αληηζηαζκίδνληαη από ηηο πςεινύ επηπέδνπ ππεξεζίεοπγείαο. Αθόκα ζε απηέο ηηο πεξηνρέο δεη πεξηζζόηεξνο ελεξγόο πιεζπζκόο νπόηεπηζαλόηαηα ν κέζνο όξνο ειηθίαο είλαη κηθξόηεξνο νπόηε ιηγόηεξνη θαη νη ζάλαηνη.Έπεηηα αθνινπζεί ε Κξήηε. Σηελ ζπλέρεηα αθνινπζνύλ ε Γπηηθή Μαθεδνλία θη εΓπηηθή Διιάδα. Αλακέλακε νη δπν απηέο πεξηνρέο λα βξίζθνληαη θνληά θαζώοπαξνπζηάδνπλ γεσγξαθηθή εγγύηεηα. Σηελ ζπλέρεηα αθνινπζνύλ νη πεξηνρέο ηεο 29
30. 30. Αλαηνιηθήο Μαθεδνλίαο Θξάθεο, ηεο Θεζζαιίαο θαη ηεο Ηπείξνπ πνπ κπνξνύλλα απνηειέζνπλ κηα απηνηειή νκάδα. Έπεηηα βξίζθνληαη νη πεξηνρέο ηεο ΣηεξεάοΔιιάδαο θαη ησλ Ιόλησλ λήζσλ. Έπεηηα αθνινπζεί ε Πεινπόλλεζνο θαη ζηεληειεπηαία ζέζε βξίζθνληαη ηα Νεζηά ηνπ Βόξεηνπ Αηγαίνπ. Η ηειεπηαία απηή ζέζεκαο πξνθαιεί κηα έθπιεμε δηόηη ηα λεζηά Ννηίνπ Αηγαίνπ έρνπλ ην κηθξόηεξναξηζκό ζαλάησλ ελώ ηα λεζηά ηνπ Βνξείνπ Αηγαίνπ εκθαλίδνπλ ηνλ κεγαιύηεξναξηζκό. Κάηη ηέηνην ζίγνπξα δελ ην αλακέλακε θαζώο θαη νη δπν πεξηνρέο είλαηλεζησηηθέο θαη αλακέλακε λα ζπκπεξηθέξνληαη κε ηνλ ίδην ηξόπν. Σε απηνύο ηνποδπν πιεζπζκνύο ζα κπνξνύζε λα γίλεη πεξαηηέξσ αλάιπζε θαη έξεπλα γηα λαβξνύκε ηνπο ιόγνπο νη νπνίνη επεξεάδνπλ ηνπο ζαλάηνπο ζε απηνύο ηνποπιεζπζκνύο. Θηκόγρ α μμ α 1 2 3 4 5 6 p la ce 7 8 9 10 11 12 13 750 850 950 1050 1150 1250 1350 deathΓράφημα 13 30
31. 31. 2.1.2. ANOVA ANALYSIS ωσ προσ την χρονιά Πηζηέςακε πσο έρεη αμία λα εξεπλήζνπκε αλ θάπνηα ρξνληά κέζα από ηνδείγκα καο ν αξηζκόο ησλ ζαλάησλ αλά 100.000 είρε θάπνηα ηδηαίηεξε κεηαβνιήώζηε κεηά λα αλαδεηήζνπκε ηα αίηηα απηήο ηεο κεηαβνιήο. Έηζη απνθαζίζακε λαζπγθξίλνπκε όιεο ηηο ρξνλνινγίεο κεηαμύ ηνπο.Summary Statistics for deathyear Count Average Standard deviation Coeff. of variation Minimum Maximum Range Stnd. skewness Stnd. kurto1994 13 1006,58 129,86 12,9011% 850,0 1304,9 454,9 1,2833 0,6667091995 13 1013,99 138,656 13,6743% 842,9 1317,2 474,3 1,33458 0,3342591996 13 1007,97 147,27 14,6106% 760,6 1333,3 572,7 0,786205 0,6991561997 13 980,038 111,685 11,396% 789,2 1177,1 387,9 0,0524268 -0,1691261998 13 1004,44 129,804 12,9231% 757,7 1258,1 500,4 0,00474072 0,2899771999 13 1010,6 124,294 12,2991% 823,1 1239,1 416,0 0,457455 -0,4335742000 13 1028,63 140,059 13,6161% 797,3 1281,4 484,1 0,398136 -0,3445172001 13 995,846 123,243 12,3758% 782,4 1206,6 424,2 -0,0330508 -0,3451012002 13 1014,48 127,956 12,613% 821,3 1209,8 388,5 -0,00947284 -0,9982542003 13 1025,09 122,604 11,9603% 837,7 1262,6 424,9 0,365671 -0,249072004 13 1007,9 122,941 12,1977% 783,9 1213,1 429,2 -0,368267 -0,4349442005 13 1000,95 107,898 10,7796% 809,8 1194,2 384,4 -0,216354 -0,187042006 13 1008,82 120,982 11,9925% 786,6 1211,5 424,9 -0,297118 -0,1588442007 13 1035,05 117,948 11,3954% 822,0 1220,1 398,1 -0,184856 -0,3996512008 13 1022,07 118,568 11,6008% 788,3 1180,4 392,1 -1,00789 -0,30066Total 195 1010,83 122,081 12,0774% 757,7 1333,3 575,6 0,983902 -1,11866Πίνακας 23 Ο πίλαθαο 23 καο δείρλεη πσο όιεο νη θαηαλνκέο αθνινπζνύλ ηελ θαλνληθήθαηαλνκή.Table of Means for death by year with 95,0 percent LSD intervals Stnd. erroryear Count Mean (pooled s) Lower limit Upper limit1994 13 1006,58 34,9448 957,827 1055,341995 13 1013,99 34,9448 965,234 1062,751996 13 1007,97 34,9448 959,211 1056,731997 13 980,038 34,9448 931,28 1028,81998 13 1004,44 34,9448 955,68 1053,21999 13 1010,6 34,9448 961,842 1059,362000 13 1028,63 34,9448 979,873 1077,392001 13 995,846 34,9448 947,088 1044,62002 13 1014,48 34,9448 965,719 1063,242003 13 1025,09 34,9448 976,334 1073,852004 13 1007,9 34,9448 959,142 1056,662005 13 1000,95 34,9448 952,188 1049,72006 13 1008,82 34,9448 960,057 1057,572007 13 1035,05 34,9448 986,288 1083,82008 13 1022,07 34,9448 973,311 1070,83Total 195 1010,83Πίνακας 24 31
32. 32. Στον πίνακα αυτό μποροφμε να δοφμε τθν μζςθ τιμι κανάτων ανά 100.000 γιαόλεσ τισ χρονολογίεσ κακώσ και το εφροσ κανάτων τθσ κάκε χρονιάσ. Ππωσ μασ δείχνει ο πίνακασ 25 θ μεταβλθτι year δεν παρουςιάηει ςθμαντικιδιαφορά όςο αναφορά τθ τυπικι απόκλιςθ, γι΄αυτό το λόγο κα προχωριςουμε ςτοAnova Table.Variance Check Test P-ValueLevenes 0,135351 0,999929Πίνακας 25 Σύκθσλα ινηπόλ κε ηνλ πίλαθα 26 δελ ην F-ratio είλαη θάησ από 5 (0,15)θαη ην p-value 0,9999 άξα δελ ππάξρεη ιόγνο γηα πεξαηηέξσ αλάιπζε.ANOVA Table for death by yearSource Sum of Squares Df Mean Square F-Ratio P-ValueBetween groups 33883,3 14 2420,23 0,15 0,9999Within groups 2,85747E6 180 15874,8Total (Corr.) 2,89135E6 194Πίνακας 26 Θηκ όγρ α μμ α 1994 1995 1996 1997 1998 1999 2000 ye a r 2001 2002 2003 2004 2005 2006 2007 2008 750 850 950 1050 1150 1250 1350 deathΓράφημα 14 32
33. 33. 2.1.3. Έλεγχοσ για αναζήτηςη κατανομήσ που να αντιπροςωπεύει τηνγενική κατανομή των θανάτων ςτην Ελλάδα Σε απηό ην ζεκείν ζα εξεπλήζνπκε ηελ ύπαξμε κηαο θαηαλνκήο ε νπνία ζαείλαη αληηπξνζσπεπηηθή ηνπ αξηζκνύ ησλ ζαλάησλ αλά 100.000 όιεο ηεοΔιιάδαο. Σε πεξίπησζε πνπ βξεζεί κηα ηέηνηα θαηαλνκή ζα κπνξνύκε κειεηώληαοηελ πνξεία ησλ ζαλάησλ ζε απηή ηελ πεξηνρή λα εμάγνπκε ζπκπεξάζκαηα γηα ηελπνξεία ησλ ζαλάησλ ζε όιε ηελ Διιάδα. Γη απηό ησλ ιόγν ζα ηξέμνπκε κηαπνιιαπιή παιηλδξόκεζε κε όιεο ηηο πεξηνρέο θαη κε ηνλ γεληθό αξηζκό ηεοΔιιάδαο ειπίδνληαο πσο απηόο ν αξηζκόο ζα απνηειέζεη νκνγελνπνηεκέλενκάδα κε θάπνηα άιιε πεξηνρή.Summary Statistics Count Average Standard deviation Coeff. of variation Minimum Maximum RangeSELECT(death;place=1) 15 1044,41 23,0713 2,20902% 1013,3 1095,8 82,5SELECT(death;place=2) 15 879,68 26,4494 3,00671% 837,7 936,4 98,7SELECT(death;place=3) 15 980,2 28,4299 2,90042% 939,1 1048,9 109,8SELECT(death;place=4) 15 1039,53 37,1686 3,57553% 981,2 1110,6 129,4SELECT(death;place=5) 15 1039,61 25,4186 2,44502% 983,6 1076,7 93,1SELECT(death;place=6) 15 1098,25 52,5776 4,78741% 1015,1 1184,8 169,7SELECT(death;place=7) 15 986,96 19,3432 1,95988% 939,6 1021,2 81,6SELECT(death;place=8) 15 1077,07 31,6408 2,93768% 1021,3 1136,5 115,2SELECT(death;place=9) 15 1164,51 26,1065 2,24183% 1126,4 1219,0 92,6SELECT(death;place=10) 15 868,8 14,2551 1,64078% 845,3 892,9 47,6SELECT(death;place=11) 15 1239,21 52,0733 4,20212% 1159,2 1333,3 174,1SELECT(death;place=12) 15 804,727 31,0329 3,85632% 757,7 868,1 110,4SELECT(death;place=13) 15 917,833 16,2866 1,77446% 886,5 949,2 62,7SELECT(total deaths;country=1) 16 948,113 12,9937 1,37048% 925,5 977,0 51,5Total 211 1006,07 118,564 11,7848% 757,7 1333,3 575,6 Stnd. skewness Stnd. kurtosisSELECT(death;place=1) 1,28182 0,0425351SELECT(death;place=2) 1,3236 0,553786SELECT(death;place=3) 1,51503 0,76143SELECT(death;place=4) 0,722892 -0,445645SELECT(death;place=5) -0,848323 0,246581SELECT(death;place=6) 0,0827112 -0,674922SELECT(death;place=7) -1,17856 1,29728SELECT(death;place=8) -0,300857 -0,102919SELECT(death;place=9) 0,505692 -0,108468SELECT(death;place=10) 0,142912 -0,835711SELECT(death;place=11) 0,679159 -0,60961SELECT(death;place=12) 0,599153 -0,256304SELECT(death;place=13) 0,0175638 -0,0335558SELECT(total deaths;country=1) 0,796583 0,251281Total 1,67676 -0,739706Πίνακας 27 33
34. 34. Κάλνπκε έιεγρν γηα λα δνύκε αλ όιεο νη θαηαλνκέο αθνινπζνύλ ηελθαλνληθή θαηαλνκή. Πξάγκαηη ε αζπκκεηξία θαη ε θύξησζε βξίζθεηαη ζε όιεο ηηοθαηαλνκέο κέζα ζηα επηηξεπηά όξηα (-2, +2). Έπεηηα πξνρσξάκε ζην δεύηεξν έιεγρν, ζηνλ έιεγρν ησλ ηππηθώλαπνθιίζεσλ . Όπσο θαίλεηαη ζην πίλαθα 28 ππάξρεη ζεκαληηθή δηαθνξά κεηαμύησλ δηαζπνξώλ .Variance Check Test P-ValueLevenes 3,97134 0,00000929523Πίνακας 28Δλ ζπλερεία ζα πξνρσξήζνπκε ζηελ One Way Anova Analysis. Όπσο θαίλεηαηαπό ηνλ αθόινπζν πίλαθα ππάξρεη ζεκαληηθή δηαθνξά κεηαμύ ησλ κέζσλ , άξαθαη ιόγνο γηα πεξαηηέξσ αλάιπζε.ANOVA TableSource Sum of Squares Df Mean Square F-Ratio P-ValueBetween groups 2,76707E6 13 212851, 226,68 0,0000Within groups 184982, 197 938,995Total (Corr.) 2,95205E6 210Πίνακας 29 Έηζη ζπλερίδνπκε ηελ αλάιπζε καο κε ην Multiple Range Test.Multiple Range TestsMethod: 95,0 percent LSD Count Mean Homogeneous GroupsSELECT(death;place=12) 15 804,727 XSELECT(death;place=10) 15 868,8 XSELECT(death;place=2) 15 879,68 XSELECT(death;place=13) 15 917,833 XSELECT(total deaths;country=1) 16 948,113 XSELECT(death;place=3) 15 980,2 XSELECT(death;place=7) 15 986,96 XSELECT(death;place=4) 15 1039,53 XSELECT(death;place=5) 15 1039,61 XSELECT(death;place=1) 15 1044,41 XSELECT(death;place=8) 15 1077,07 XSELECT(death;place=6) 15 1098,25 XSELECT(death;place=9) 15 1164,51 XSELECT(death;place=11) 15 1239,21 XΠίνακας 30 34
35. 35. Όπσο βιέπνπκε από ηνλ πίλαθα 30 θαη ην Γξάθεκα 15 δπζηπρώο ναξηζκόο ησλ ζαλάησλ αλά 100.000 όιεο ηεο ειιεληθήο επηθξαηείαο δελνκνγελνπνηήζεθε κε θάπνηα άιιε νκάδα. Όκσο βξίζθεηαη αλάκεζα ζηελ Κξήηεθαη ηελ νκάδα ηεο Γπηηθήο Διιάδαο θαη Γπηηθήο Μαθεδνλίαο. Έηζη ην κόλν πνπκπνξνύκε λα πνύκε είλαη όηη κειεηώληαο ηνλ αξηζκό ησλ ζαλάησλ ηεο Κξήηεο θαηηεο νκάδαο ηεο Γπηηθήο Διιάδαο θαη Γπηηθήο Μαθεδνλίαο ζα κπνξνύκε λα έρνπκεκόλν κηα γεληθή εηθόλα γηα ην πνπ ζα βξίζθεηαη ν αξηζκόο ζαλάησλ αλά 100.00όιεο ηεο Διιάδαο ρσξίο όκσο νη εθηηκήζεηο καο λα κπνξνύλ λα ρξεζηκνπνηεζνύλκε ζηαηηζηηθά ζεκαληηθή ζπκαληηθόηεηα . Box-and-Whisker Plot SELECT(death;place=1) SELECT(death;place=2) SELECT(death;place=3) SELECT(death;place=4) SELECT(death;place=5) SELECT(death;place=6) SELECT(death;place=7) SELECT(death;place=8) SELECT(death;place=9) SELECT(death;place=10) SELECT(death;place=11) SELECT(death;place=12) SELECT(death;place=13) total deaths in Bulgaria total deaths in g reece 750 950 1150 1350 1550 responseΓράφημα 15 35
36. 36. 2.2. ΠΡΟΒΛΕΨΗ Σε απηό ην ζεκείν ζα δνύκε αλ κπνξνύκε λα πξνβιέςνπκε ηνλ αξηζκό ηνππνζνζηνύ ησλ κειινληηθώλ ζαλάησλ ζε όιε ηελ ειιεληθή επηθξάηεηα Σηεζπγθεθξηκέλε πεξίπησζε πξόθεηηαη γηα κηα ρξνλνζεηξά, , νπόηε ζαπξνζπαζήζνπκε αξρηθά λα βξνύκε ην πην αληηπξνζσπεπηηθό κνληέιν. Γηα εκάοην πην αληηπξνζσπεπηηθό κνληέιν είλαη ην κνληέιν Δ., θαζώο έρεη ην κηθξόηεξνAIC θαη πεξλάεη όια ηα ηεζη, όπσο δείρλνπλ νη πίλαθεο 31 θαη 32.Model ComparisonData variable: SELECT(total deaths;country=1)Number of observations = 16Start index = 1994Sampling interval = 1,0 year(s)Models(D) Quadratic trend = 67006,4 + -67,6944 t + 0,0173319 t^2(E) Exponential trend = exp(3,30308 + 0,00177432 t)(F) S-curve trend = exp(10,4054 + -7107,29 /t)(H) Simple exponential smoothing with alpha = 0,2769(I) Browns linear exp. smoothing with alpha = 0,1918(J) Holts linear exp. smoothing with alpha = 0,1269 and beta = 0,221(K) Browns quadratic exp. smoothing with alpha = 0,1384(M) ARIMA(0,1,1) with constant(N) ARIMA(1,1,1) with constant(O) ARIMA(2,1,1) with constant(P) ARIMA(0,1,2) with constant(Q) ARIMA(1,1,2) with constantEstimation PeriodModel RMSE MAE MAPE ME MPE AIC(D) 10,5734 7,8933 0,831363 2,25526E-11 -0,0108133 4,96669(E) 10,2197 7,88696 0,830698 0,0514536 -0,00540694 4,77364(F) 10,2203 7,88665 0,830667 0,0514592 -0,0054075 4,77374(H) 12,2996 9,44614 0,990859 3,91358 0,398348 5,01913(I) 12,8539 9,84298 1,03285 4,70361 0,483628 5,10729(J) 11,3341 8,6281 0,909615 -1,41322 -0,162346 4,98063(K) 13,0345 10,1667 1,06726 4,38306 0,450798 5,1352(M) 9,97413 7,186 0,757683 -1,22956 -0,139387 4,84999(N) 10,2754 6,99878 0,73836 -1,66801 -0,185027 5,03451(O) 9,84537 6,01996 0,634457 -0,467139 -0,0579374 5,074(P) 11,1833 7,84451 0,825349 0,403938 0,0314757 5,20384(Q) 10,7199 7,13046 0,751947 -1,46817 -0,164197 5,24421Πίνακας 31 36
37. 37. Model RMSE RUNS RUNM AUTO MEAN VAR(D) 10,5734 OK OK OK OK OK(E) 10,2197 OK OK OK OK OK(F) 10,2203 OK OK OK OK OK(H) 12,2996 OK OK OK OK OK(I) 12,8539 OK OK OK OK OK(J) 11,3341 OK OK OK OK OK(K) 13,0345 OK OK OK OK OK(M) 9,97413 OK OK OK OK OK(N) 10,2754 OK OK OK OK OK(O) 9,84537 OK OK OK OK OK(P) 11,1833 OK OK OK OK OK(Q) 10,7199 OK OK OK OK OKΠίνακας 32Forecast Table for SELECT(total deaths;country=1)Model: Exponential trend = exp(3,30308 + 0,00177432 t)Period Data Forecast Residual1994 932,6 935,497 -2,897081995 941,8 937,158 4,641571996 940,7 938,823 1,877281997 925,5 940,49 -14,991998 947,6 942,16 5,439811999 949,3 943,833 5,466632000 963,3 945,51 17,79052001 936,6 947,189 -10,58872002 945,8 948,871 -3,070762003 957,3 950,556 6,744142004 948,7 952,244 -3,543952005 941,2 953,935 -12,7352006 941,5 955,629 -14,12912007 977,0 957,326 19,67382008 960,9 959,026 1,873662009 960,0 960,729 -0,729476 Lower 95,0% Upper 95,0%Period Forecast Limit Limit2010 962,436 936,859 988,712011 964,145 938,004 991,015Πίνακας 33 37
38. 38. Time Seq uence Plot for SELECT(total deaths;country= 1) Exponential trend = exp(3,30308 + 0,00177432 t) 1000 S E L E CT(to ta l d e ath s;co un try= 1) actual forecast 980 95,0% limits 960 940 920 1990 1994 1998 2002 2006 2010 2014Γράφημα 16 Σην γξάθεκα 16 κπνξνύκε λα δνύκε κε ηελ θόθθηλε γξακκή ην κνληέινκαο , ελώ νη δύν θόθθηλέο γξακκέο πνπ είλαη πάλσ θαη θάησ από ηε γξακκή ηνπκνληέινπ αληηπξνζσπεύνπλ ηηο πηζαλέο απνθιίζεηο. Γεληθά αλακέλνπκε όηη γηαηνλ επόκελν ρξόλν νη ζάλαηνη ζηελ Διιάδα ζα είλαη πεξίπνπ 962,436 κε άλσόξην 988,71 θαη θάησ όξην 936,859, θάηη πνπ θαίλεηαη θαη απν ηνλ πίλαθα 33. Σεαπηό ην ζεκείν λα επηζεκάλνπκε όηη θαζώο έρνπκε 15 παξαηεξήζεηο κπνξνύκελα θάλνπκε πξόβιεςε γηα 15/10 ρξόληα δειαδή γηα ηα επόκελα 1,5 ρξόληα, άξαε πξνβιεπηηθή ηθαλόηεηα ηνπ κνληέινπ καο αλαθέξεηαη θπξίσο ζην 2010 , ελώβάδνπκε ηελ πξόβιεςε γηα ην 2011 κε πνιιέο επηθπιάμεηο, θαζώο δελ κπνξνύκελα βαζηζηνύκε ζε απηέο. 38
39. 39. Forecast Plot for SELECT(total deaths;country=1) Exponential trend = exp(3,30308 + 0,00177432 t) 1010 S E L E CT(to ta l d e ath s;co un try= 1) actual forecast 990 95,0% limits 970 950 930 2009 2009,4 2009,8 2010,2 2010,6 2011Γράφημα 17 Σην γξάθεκα 17 κπνξνύκε λα δνύκε πσο ζα θπκαλζνύλ νη ζάλαηνη ηνποκήλεο ηνπ 2010.Παξαηεξνύκε ινηπόλ όηη ππάξρεη κηα ζηαδηαθή αύμεζε ησλζαλάησλ ζην πέξαζκα ηνπ ρξόλνπ. Residual Partial Autocorrelations for SELECT(total deaths;country=1) Exponential trend = exp(3,30308 + 0,00177432 t) 1 P a rtia l A u to co rre la tio n s 0,6 0,2 -0,2 -0,6 -1 0 1 2 3 4 5 6 lagΓράφημα 18 Σην γξάθεκα 18 βιέπνπκε όηη ε πξόβιεςε καο είλαη κέζα ζηα όξηα, άξα επξόβιεςε καο είλαη απνδεθηή. 39
40. 40. ΢υμπεράςματα Ο αξηζκόο ησλ ζαλάησλ αλά 100.000 θαηνίθνπο ζηελ Διιεληθή επηθξάηεηααπμάλεηαη κε έλαλ ξπζκό πνπ κπνξεί λα πεξηγξαθεί από ην κνληέιν: Exponential trend = exp(3,30308 + 0,00177432 t) Όκσο ν ξπζκόο απηόο δελ είλαη ν ίδηνο ζε θάζε γεσγξαθηθή πεξηνρή απόηηο 13 πνπ κειεηήζακε. Δλδηαθέξνλ είρε ην γεγνλόο όηη εκθαλίζηεθαλ πνιύκεγάιεο αλάκεζα ζε πιεζπζκνύο πνπ αλακέλακε λα έρνπλ όκνηα θαηαλνκή. Γηαπαξάδεηγκα ν αξηζκόο ησλ ζαλάησλ ησλ θαηνίθσλ ηνπ Νόηηνπ Αηγαίνπ αλά100.000 ήηαλ ν κηθξόηεξνο όιεο ηεο ρώξαο ελώ ζην άιιν άθξν ήηαλ ν αξηζκόοησλ ζαλάησλ αλά 100.000 ησλ θαηνίθσλ ηνπ Βνξείνπ Αηγαίνπ. Κάηη ηέηνην δελκπνξνύκε λα εμεγήζνπκε θαη απαηηείηαη πεξαηηέξσ έξεπλα γηα ηελ αλάιπζε ηνπζέκαηνο. Αθόκα από ηελ One-way Anova σο πξνο ηελ ρξνληά θαηαιήμακε πσο δελππήξρε θάπνηα ρξνληά από ην δείγκα καο πνπ νη ζάλαηνη λα απνηεινύζαλμερσξηζηή θαηαλνκή θαη λα είραλ κηα κε αλακελόκελε ηηκή. Άιισζηε γηα ηνρξνληθό δηάζηεκα ηνπ δείγκαηνο δελ ππήξμε θάπνην ηδηαίηεξα θαηαζηξνθηθόγεγνλόο όπσο ηζρπξόο ζεηζκόο, πόιεκνο ή θάπνηα αζζέλεηα κε πςειό πνζνζηόζλεζηκόηεηαο πνπ λα κπνξνύζε λα απμήζεη δξακαηηθά ην πνζνζηό ησλ ζαλάησλεθείλεο ηεο ρξνληάο 40
41. 41. Βιβλιογραφία Black Ken, 2008, Business Statistics for Contemporary Decision Making, Wiley Editions Σεκεηώζεηο Μαζήκαηνο «Πνζνηηθέο Μέζνδνη γηα Λήςε Δπηρεηξεκαηηθώλ Απνθάζεσλ» Πεγή ησλ δεδνκέλσλ: Δπξσπατθή Σηαηηζηηθή ππεξεζία 41