SlideShare a Scribd company logo
1 of 13
Download to read offline
Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και
παραδείγματα.
Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος.
MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’
e-mail: s_4goum@yahoo.com, My Blog
29/1/2011
ΕΙΣΑΓΩΓΗ
Τα μαθηματικά είναι επιστημονικός κλάδος όπου οι εφαρμογές τους αποτελούν
αναπόσπαστο τμήμα σε πλήθος άλλων επιστημών και αντιμετώπισης ζητημάτων,
όπως η έρευνα, η διοίκηση, η οικονομία, η αστρονομία, η φυσική κτλ.
Στην εργασία αυτή θα ασχοληθούμε με ένα τμήμα των μαθηματικών όπου αφορά
την ποσοτικοποίηση των οικονομικών μεγεθών. Το αντικείμενο αυτό ονομάζεται
οικονομετρία και εφαρμόζεται σε πληθώρα οικονομικών ζητημάτων, επιχειρησιακής
ερευνάς και διοίκησης. Η οικονομετρία προσπαθεί να δώσει υπόσταση και να
αναπτύξει τις σχέσεις της οικονομικής θεωρίας. Η μαθηματική, στατιστική και
οικονομική ανάλυση συνδυάζονται με σκοπό την εκτίμηση των οικονομικών
σχέσεων. Όπως γνωρίζουμε, όλες οι επιστήμες διέπονται από θεωρίες, ωστόσο μια
θεωρία, δεν μπορεί να σταθεί αν δεν υπάρξει η επαλήθευσή της και ο έλεγχος.
Σκοποί της οικονομετρίας είναι οι εξής1
. 1) Εμπειρική επαλήθευση ή έλεγχος μιας
θεωρίας. 2) Άσκηση οικονομικής πολίτικης 3) Πρόβλεψη οικονομικών μεγεθών. Τα
στάδια της οικονομετρικής αναλύσεως συνοψίζονται κατά σειρά στα εξής:
Στάδιο 1- Οικονομική Θεωρία.
Στάδιο 2- Οικονομικό υπόδειγμα.
Στάδιο 3- Οικονομετρικό υπόδειγμα.
Στάδιο 4- Εκτίμηση του υποδείγματος (Δεδομένα και Οικονομετρικές Μέθοδοι).
Στάδιο 5- Έλεγχος υποδείγματος.
Στάδιο 6- Χρήση υποδείγματος (Προβλέψεις, Οικονομική Πολιτική, Έλεγχος
Θεωρίας).
1
1
Βλ. ‘’Εισαγωγή στην Οικονομετρία’’ Γ.Κ. Χρήστου
2
ΠΕΡΙΛΗΨΗ
Στην εργασία αυτή θα μελετήσουμε και θα παρουσιάσουμε την πολλαπλή
γραμμική παλινδρόμηση, η οποία αποτελεί μια από της βασικές μεθόδους εκτίμησης
στην οικονομετρία. Η πολλαπλή παλινδρόμηση αποτελεί μια σχέση/ εξάρτηση
μεταξύ πολλών μεταβλητών. Δεν θα σταθούμε τόσο στην ανάπτυξη της θεωρίας και
την θεμελίωση των μαθηματικών τεχνικών όσο στην παρουσίαση της μεθόδου
υπολογισμού και εκτίμησης των σχέσεων. Αυτό που θα χρειαστούμε είναι το excel
2003 (ή 2007) και ένα βιβλίο οικονομετρίας στο οποίο θα μπορούμε να ανατρέξουμε
για την ορθή τεκμηρίωση των αποτελεσμάτων μας.
Έχουμε επιλέξει τρεις χρηματιστηριακούς δείκτες, FTSE-100 (Αγγλία), Dow-
Jones (ΗΠΑ) και Xerta-DAX (Γερμανία) και υπολογίσαμε την μέση εβδομαδιαία
απόδοση για το διάστημα 1/1/2009 έως 1/12/2010. Θα επιχειρήσουμε να εξετάσουμε
την επίδραση στο χρηματιστήριο της Γερμανίας από τα άλλα δυο χρηματιστήρια.
Με τη χρήση του excel θα εκτιμήσουμε ένα πολλαπλό γραμμικό υπόδειγμα της
μορφής Yt= b0+b1*X1t+b2*X2t+ut.
Όπου Υ Απόδοση Γερμανίας, Χ1 Απόδοση Αγγλίας και Χ2 Απόδοση ΗΠΑ.
(Σημ: Υ εξαρτημένη μεταβλητή. Χ1,Χ2 ανεξάρτητες-ερμηνευτικές μεταβλητές)
ΣΧΟΛΙΑ
Οι λόγοι οι οποίοι επιλέξαμε τις μέσες εβδομαδιαίες αποδόσεις είναι οι εξής:
1) Επειδή τα χρηματιστήρια που επιλέξαμε δεν κλείνουν την ίδια ώρα, θα είχαμε
σοβαρό και ουσιαστικό πρόβλημα για τον προσδιορισμό των τιμών και των
αποδόσεων. Για να λάβουμε τις ημερήσιες τιμές θα πρέπει να χρηματιστήρια να
κλείνουν την ίδια ή περίπου την ίδια ώρα. Στην περίπτωσή μας, οι αγορές που
επιλέχθηκαν έχουν μεγάλη διαφορά στην ώρα κλεισίματος, οπότε δεν είναι ούτε
εφικτό ούτε ευνόητο να χρησιμοποιήσουμε τις ημερήσιες τιμές κλεισίματος.
2) Στις ημερήσιες χρηματιστηριακές τιμές παρουσιάζεται έντονη διακύμανση, ως εκ
τούτου τα γραμμικά μοντέλα δεν είναι κατάλληλα για την εκτίμηση των δεδομένων,
διότι δεν έχουν την δυνατότητα να ‘’συλλάβουν’’ αυτή την έντονη μεταβλητότητα.
Έχει αποδειχτεί από αναλυτές-ερευνητές ότι τα οικονομετρικά γραμμικά μοντέλα με
χρήση ημερήσιων τιμών αποτυγχάνουν τόσο στην εκτίμηση των ερμηνευτικών
μεταβλητών όσο και στις προβλέψεις,. Ωστόσο, ένα γραμμικό μοντέλο μπορεί να
αποδειχτεί χρήσιμο όταν λαμβάνουμε λιγότερο συχνές παρατηρήσεις (π.χ.
3
εβδομαδιαίες, μηνιαίες), η εκτίμηση του οποίου θα μας εξηγήσει την γενικότερη
πορεία της αγοράς.
Αντιθέτως, οι ημερήσιες τιμές προσφέρονται για τεχνική ανάλυση (technical
analysis), με την οποία έχουμε την δυνατότητα να προβλέψουμε την εξέλιξη ενός
δείκτη/ μιας μετοχής για πολύ βραχυχρόνιο και βραχυχρόνιο ορίζοντα. Στις μεθόδους
τεχνικής ανάλυσης συγκαταλέγονται τα εξής: 1) Κινητοί Μέσοι Όροι (Moving
Average), Τάση (Trend), Ζώνες Bollinger (Bollinger Bands), Ταλαντωτές
(Oscillators), Όγκος Συναλλαγών (Volume), Δείκτης Σύγκλισης-Απόκλισης
(MACD), Σχηματισμοί (Patterns) κτλ.
ΘΕΩΡΙΑ
Αρχικά θα αναφερθούμε στην απλή γραμμική παλινδρόμηση η οποία αποτελεί
σχέση μεταξύ δυο μεταβλητών. Σκοπός μας είναι να αναπτύξουμε το βασικό
θεωρητικό υπόβαθρο και να παρουσιάσουμε μερικά παράδειγμα με τη χρήση του
excel. Για περεταίρω ανάλυση σε θεωρητική βάση, ο αναγνώστης μπορεί να
συμβουλευτεί κάποιο βιβλίο οικονομετρίας.
1) Απλή Γραμμική Παλινδρόμηση: Yt=a+b*Xt+ut.
X Ανεξάρτητη μεταβλητή, Υ Εξαρτημένη μεταβλητή, u Κατάλοιπα (σφάλμα).
Παράδειγμα: Έστω ότι θέλουμε να εξετάσουμε την επίδραση του Επιτοκίου (r) στην
Προσφορά Χρήματος (Μ). Αφού λάβουμε τις τιμές σχηματίζουμε το υπόδειγμα
Mt=a+b*rt+ut. Με κατάλληλες μεθόδους (π.χ. μέθοδο ελάχιστων τετραγώνων OLS)
εκτιμούμε τους συντελεστές a,b. Όπως είναι φυσικό τα ζεύγη τιμών (Χ,Υ) δεν θα
ταυτίζονται επακριβώς με την γραμμή της παλινδρόμησης (μερικές τιμές θα είναι
πάνω στην γραμμή, ενώ μερικές άλλες θα είναι εκτός της γραμμής 2
), με αποτέλεσμα
να υπάρχει πάντοτε σφάλμα (u).
2) Πολλαπλή Γραμμική Παλινδρόμηση:Yt=b0+b1*X1t+b2*X2t+b3*X3t+.+ bn*Xnt+ut.
Xi Ανεξάρτητες (ερμηνευτικές) μεταβλητές, Υ Εξαρτημένη μεταβλητή,
u Κατάλοιπα (σφάλμα).
2
Βλέπε παρακάτω, Γράφημα 1
4
Παράδειγμα: Έστω ότι θέλουμε να εκτιμήσουμε την επίδραση στην τιμή (Ρ) ενός
προϊόντος από τους Μισθούς (I) και το Κόστος Πρώτων Υλών (C). Αν υποθέσουμε
ότι υπάρχει γραμμική σχέση μεταξύ αυτών των μεταβλητών, τo υπόδειγμα θα έχει
την εξής μορφή: Ρt= b0+b1*Ιt+b2*Ct +ut.
Βασικό συστατικό για να λάβουμε ορθές εκτιμήσεις είναι τα κατάλοιπα να
ακολουθούν την κανονική κατανομή, με μέσο μηδέν και σταθερή διακύμανση
u~N(0,σ2
), να μην συσχετίζονται (δηλαδή το ut να μην εμφανίζει σχέση με το us άρα
E(utus)=0 για t≠s) καθώς επίσης να μην υπάρχουν ακριβείς γραμμικές σχέσεις
(συγγραμικότητα) μεταξύ των ερμηνευτικών μεταβλητών (Xi). Ωστόσο, επειδή στην
πράξη οι υποθέσεις αυτές συμβαίνουν σπάνια, αν τα κατάλοιπα ακολουθούν μια
κατανομή που να προσεγγίζει ικανοποιητικά την κανονική κατανομή, υποθέτουμε ότι
η κατανομή είναι η κανονική συνεχίζοντας την διαδικασία και στο τέλος
διορθώνουμε τους συντελεστές μας. Στην περίπτωση που τα κατάλοιπα ακολουθούν
μια κατανομή η οποία δεν είναι η κανονική ούτε την προσεγγίζει, τότε καταφεύγουμε
σε άλλες τεχνικές ανάλυσης. Όσο αφορά την γραμμική σχέση μεταξύ των
ερμηνευτικών μεταβλητών προσπαθούμε να ελέγξουμε για την ύπαρξη έντονης
συσχέτισης μεταξύ τους. Η ύπαρξη γραμμικών σχέσεων, θα οδηγήσει σε λανθασμένα
αποτελέσματα, συνεπώς οφείλουμε να αναδιαρθρώσουμε το μοντέλο μας.
ΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΑΠΛΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ME TO EXCEL 2003 3
.
Στο παρακάτω γράφημα (Γράφημα 1) έχουμε απεικονίσει την απλή γραμμική
παλινδρόμηση Yt=a+b*Xt+ut. Η κατασκευή του γραφήματος στο excel 2003 έγινε ως
εξής
Αρχικά εισάγουμε τα δεδομένα μας στο φύλλο excel.
Από το Μενού Εισαγωγή Γράφημα Διασπορά (ΧΥ)4
. Στο παράθυρο που
εμφανίζεται εισάγουμε τα δεδομένα μας στην ‘’Περιοχή Δεδομένων‘’. Πατώντας
‘’Επόμενο….’’ κατασκευάζουμε το διάγραμμα διασποράς των ζευγών (Χ,Υ). Εν
συνεχεία θα προσθέσουμε στο γράφημα την γραμμή παλινδρόμησης.
Επιλέγοντας τα σημεία (Χ,Υ) του γραφήματος και με δεξί κλικ εμφανίζεται ένα νέο
παράθυρο. Επιλεγούμε το ‘’Προσθήκη Γραμμής Τάσης’’. Στην καρτέλα ‘’Τύπος’’ ,
3
Βλ. Φύλλο ‘’rates’’ του excel.
4
Επιλεγούμε το πρώτο γράφημα που έχει μόνο τα σημεία
επιλεγούμε ‘’Γραμμικός’’ ενώ στην καρτέλα ‘’Επιλογές’’ επιλεγούμε τα ‘’Προβολή
εξίσωσης στο γράφημα’’ και ‘’Προβολή τιμής R-τετράγωνο’’
ΓΡΑΦΗΜΑ 1.
y = 0,7041x + 0,0003
R
2
= 0,8169
-0,08
-0,06
-0,04
-0,02
0
0,02
0,04
0,06
-0,1 -0,05 0 0,05 0,1
X
Y
Σειρά1
Γραμμική (Σειρά1)
Από το γράφημα παρατηρούμε ότι τα πραγματικά δεδομένα δεν ταυτίζονται
επακριβώς με την γραμμή παλινδρόμησης, ωστόσο η προσέγγιση επιτυγχάνεται σε
ικανοποιητικό βαθμό.
Η γραμμή η οποία διέρχεται από τα ζεύγη τιμών (Χ,Υ) ονομάζεται γραμμή
παλινδρόμησης (regression line). Το ερώτημα που ανακύπτει είναι αν αυτή η γραμμή
είναι η βέλτιστη ή θα μπορούσαν να υπάρξουν και επιπλέον γραμμές οι οποίες θα
ερμήνευαν ικανοποιητικά τα δεδομένα μας.
Η ιδιότητα η οποία διέπει την απλή γραμμική παλινδρόμηση είναι ότι η τεχνική
που συνηθίζεται να χρησιμοποιείται είναι η μέθοδος ελάχιστων τετραγώνων (OLS), η
οποία αναπτύχτηκε από τους Gauss-Markov και ελαχιστοποιεί το άθροισμα των
τετραγώνων των καταλοίπων (SSE). Ελάχιστο άθροισμα καταλοίπων συνεπάγεται
καλύτερη ερμηνευτικότητα στο υπόδειγμα. Συμπεραίνουμε λοιπόν ότι η γραμμική
αυτή σχέση, με την μέθοδο OLS, είναι η καλύτερη που θα μπορούσε να εξευρεθεί.
Εναλλακτικές μέθοδοι οι οποίες χρησιμοποιήθηκαν μετέπειτα και βασιστήκαν στην
OLS είναι η γενικευμένη μέθοδος ελάχιστων τετραγώνων (GLS), η μέθοδος μέγιστης
πιθανοφάνειας (Maximum Likelihood), η ραχοειδής παλινδρόμησης (Ridge
Regression), η σταθμική μέθοδος ελαχίστων τετραγώνων (Weighted Least Square)
κ.α.
5
Τελειώνοντας, να αναφέρουμε ότι εκτός των γραμμικών τεχνικών υπάρχουν
βεβαίως και οι μη-γραμμικές τεχνικές, με τις οποίες δεν θα ασχοληθούμε στην
παρούσα ενότητα, όπως η μη γραμμική μέθοδος ελαχίστων τετραγώνων, η
μαθηματική βελτιστοποίηση, η μη-παραμετρική παλινδρόμηση, ο τετραγωνικός
προγραμματισμός κ.α.
ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ EXCEL (Για να κατεβάσετε το αρχείο excel πιεστέ εδώ)
Στο αρχείο excel έχουμε τρία φύλλα εργασίας. (rates, regression,stats)
Η διαδικασία της παλινδρόμησης στο excel 2003 έχει ως εξής (με παρόμοιο τρόπο
γίνεται και στο excel 2007)
--------ΣΤΑΔΙΟ Α (Φύλλο excel ‘’rates’’)
1) Εισαγωγή δεδομένων (Φύλλο ‘’rates’’). Στην πρώτη γραμμή έχουμε τις κεφαλίδες
των σειρών.
2) Από το μενού ‘’Εργαλεία’’ ‘’Πρόσθετα’’ Επιλογή το ‘’Πακέτο Εργαλείων
Ανάλυσης’’. Προσθέσαμε ένα νέο πακέτο εργαλείων.
3) Από το μενού ‘’Εργαλεία’’ ‘’Ανάλυση Δεδομένων’’ Επιλογή την
‘’Παλινδρόμηση’’.
4) Στο παράθυρο της παλινδρόμησης που εμφανίζεται εισάγουμε τα εξής:
(Προσοχή! Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών)
α) Περιοχή Εισόδου Υ Επιλεγούμε την περιοχή κελίων με τα δεδομένα του
δείκτης της Γερμανίας (Α1:A99).
β) Περιοχή Εισόδου Χ Επιλεγούμε τα δεδομένα των δεικτών της Αγγλίας και των
ΗΠΑ (B1:C99).
γ) Επιλεγούμε επίσης τα ‘’Ετικέτες’’ και ‘’Βαθμός Εμπιστοσύνης 95%’’.
δ) Επιλεγούμε το ‘’Νέο Φύλλο Εργασίας’’ και το ‘’Υπόλοιπα’’.
Με την επιλογή ‘’Υπόλοιπα’’ θα εκτιμήσουμε τα σφάλματα (u) της παλίνδρομης,
όπου , τα οποία παρουσιάζονται στην περιοχή ‘’Έξοδος Υπολοίπων/ Φύλλο
∧
−= YYu
excel regression’’.
6
7
Πατάμε το ΟΚ και σε ένα νέο φύλλο εργασίας (Φύλλο ‘’regression’’) υπολογίζονται
τα στοιχεία της παλινδρόμησης τα οποία παρουσιάζονται στους παρακάτω πίνακες.
(βλ. Πίνακες 1,2,3)
--------ΣΤΑΔΙΟ Β (Φύλλο excel ‘’regression’’)
Από τα δεδομένα των Υπολοίπων (Έξοδος Υπολοίπων) θα κατασκευάσουμε ένα
τυπικό γράφημα της κατανομής που ακολουθούν.
1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το
‘’Ιστόγραμμα’’. (βλ. παρακάτω, Γράφημα 2)
2) Στην ‘’Περιοχή Εισόδου’’, εισάγω τα δεδομένα των υπολοίπων (Φύλλο excel
‘’regression’’/ C50:C147). Επιλέγω επίσης και το ‘’Ετικέτες’’.
3) Στην ‘’Περιοχή Εξόδου’’, επιλέγω μια κενή περιοχή κελιών (έστω 4x4).
Επιλεγώ επίσης τα ‘’Αθροιστική Σχετική Συχνότητα’’ και το ‘’Έξοδος
Γραφήματος’’.
Πατάμε ΟΚ και κατασκευάζουμε το διάγραμμα κατανομής των υπολοίπων, το οποίο
παρατηρούμε ότι προσεγγίζει την κανονική κατανομή (βλ. Γράφημα ‘’Ιστόγραμμα’’/
Φύλλο excel ‘’regression’’).
Τέλος από το μενού ’’Εισαγωγή’’ ‘’Γράφημα (γραμμές)’’. Πιέζουμε το
‘’Επόμενο’’ και στην ‘’Περιοχή Δεδομένων’’ επιλέγω τα δεδομένα των υπολοίπων
(Φύλλο ‘’regression’’/ C50:C147) και το ‘’Σειρά σε Στήλες’’. Πατώντας
‘’Επόμενο…’’ φτάνω μέχρι το τέλος και κατασκευάζω το γράφημα των υπολοίπων
(βλ. ‘’Γράφημα Υπολοίπων’’/ Φύλλο excel ‘’regression’’).
.
8
----ΣΤΑΔΙΟ Γ (Φύλλο excel ‘’stats’’). Περιγραφικά στατιστικά των δεδομένων μας.
1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το
‘’Περιγραφικά Στατιστικά’’.
2) Στην ‘’Περιοχή Εισόδου’’ επιλέγω τα δεδομένα των υπολοίπων (‘’Φύλλο
regression’’/ C50:C147), καθώς επίσης και το ‘’Νέο Φύλλο’’, ‘’Περιληπτικά
Στατιστικά’’.
3) Πιέζοντας το ΟΚ, εμφανίζονται τα περιγραφικά στατιστικά του Φύλλου ‘’stats’’.
Η ιδία διαδικασία ισχύει για την εύρεση των περιγραφικών στατιστικών των
αποδόσεων των δεικτών (Φύλλο ‘’rates’’/ Α2:A99, B2:B99, C2:C99).
Στο φύλλο excel ‘’stats’’ έχουμε υπολογίσει τα περιγραφικά στατιστικά (μέση τιμή,
διακύμανση, κύρτωση κτλ) τόσο των δεικτών όσο και των σφαλμάτων.
ΦΥΛΛΟ EXCEL ‘’regression’’ (Ανάλυση Παλινδρόμησης)
Στον πρώτο πίνακα παρουσιάζονται τα γενικά στατιστικά της παλινδρόμησης, στον
δεύτερο η ανάλυση διακύμανσης, ενώ στον τρίτο τα στατιστικά των συντελεστών.
ΠΙΝΑΚΑΣ 1. (ΣΤΑΤΙΣΤΙΚΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ)
Στατιστικά παλινδρόμησης
Πολλαπλό R 0,903435424
R Τετράγωνο 0,816195565
Προσαρμοσμένο R Τετράγωνο 0,812325998
Τυπικό σφάλμα 0,012336364
Μέγεθος δείγματος 98
ΠΙΝΑΚΑΣ 2. (ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ)
βαθμοί ελευθερίας SS MS F Σημαντικότητα F
Παλινδρόμηση 2 0,064200174 0,032100087 210,9268438 1,14001E-35
Υπόλοιπο 95 0,014457659 0,000152186
Σύνολο 97 0,078657833
ΠΙΝΑΚΑΣ 3. (ΣΥΝΤΕΛΕΣΤΕΣ)
Συντελεστές
Τυπικό
σφάλμα t τιμή-P
Κατώτερο
95%
Υψηλότερο
95%
Κατώτερο
95,0%
Υψηλότερο
95,0%
Τεταγμένη επί
την αρχή (b0) 0,000767503 0,001251986 0,61302813 0,5413226 -0,001718 0,00325301 -0,001718 0,00325301
FTSE-100 (b1) 0,622396658 0,125692912 4,9517244 3,188E-06 0,3728647 0,87192863 0,372865 0,87192863
Dow Jones
(b2) 0,492589505 0,125888417 3,91290571 0,0001713 0,2426694 0,74250961 0,242669 0,74250961
ΚΑΤΑΝΟΜΗ ΚΑΤΑΛΟΙΠΩΝ
ΓΡΑΦΗΜΑ 2.
9
ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ: t-stat, F-stat, Jarque-Bera. (Φύλλο excel ‘regression’)
Από την οικονομετρία γνωρίζουμε μερικούς ελέγχους τους οποίους διεξάγουμε για
να αποφανθούμε για την στατιστική σημαντικότητα τόσο των συντελεστών όσο και
της παλινδρόμησης.
Η παλινδρόμηση, όπως ήδη έχουμε αναφέρει, έχει την μορφή
Yt=b0+b1*X1t+b2*X2t. Στον ‘’Πίνακα 3/ Στήλη Συντελεστές’’ (βλ. παραπάνω),
έχουν εκτιμηθεί οι συντελεστές της παλινδρόμησης, οπότε καταλήγουμε στην μορφή
Yt=0,00076+0,622*X1t+0,492*X2t. (Δεν έχουμε γράψει τα τελευταία δεκαδικά ψηφιά
για λόγους κομψότητας….).
Όλοι οι έλεγχοι έγιναν σε επίπεδο σημαντικότητας α=5%. Το μέγεθος του
δείγματος είναι Τ=98 παρατηρήσεις, ενώ ο αριθμός των συντελεστών του
υποδείγματός μας είναι k=2 (b1, b2). Οι έλεγχοι που έχουμε διενεργήσει είναι οι εξής:
(Στο αρχείο excel παρουσιάζεται η διαδικασία αναλυτικά, με τις αντίστοιχες
συναρτήσεις)
1) Έλεγχος σημαντικότητας των συντελεστών (t-statistic).
H0: bi=0
H1: bi<>0
Aν > | τότε απορρίπτω την H0, άρα ο συντελεστής
είναι στατιστικά σημαντικός.
|
1,2/
|
−− kTa
t)(| ibstatistict −
Για την τιμή t-statistic των συντελεστών θα ανατρέξουμε στον Πίνακα 3/ Στήλη t
2) Έλεγχος σημαντικότητας της παλινδρόμησης (F-statistic).
H0: Παλινδρόμηση μη σημαντική
H1: Παλινδρόμηση σημαντική
Aν > τότε απορρίπτω την H0, άρα η
παλινδρόμηση είναι στατιστικά σημαντική.
)(regressionstatisticF −
1,, −− kTka
F
Για την τιμή F-statistic της παλινδρόμησης θα ανατρέξουμε στον Πίνακα 2/
Στήλη F.
10
3) Έλεγχος κανονικότητας διαταρακτικού όρου (X2
).
H0: u~N(0,σ2
)
H1: u<>N(0,σ2
)
Aν 5
statisticBeraJarque _− > τότε απορρίπτω την H0, άρα τα κατάλοιπα δεν
ακολουθούν την κανονική κατανομή.
2
2,a
X
Οι συναρτήσεις του excel που έχουμε χρησιμοποιήσει για τις κρίσιμες τιμές των
στατιστικών ελέγχων είναι οι κάτωθι.
1) TINV
1,2/ −− kTa
t
2) FIVN
1,, −− kTka
F
3) CHIINV 2
,Ta
X
ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
(βλ. παραπάνω Πίνακες 1,2,3 και Φύλλο excel ‘’regression’’)
Το κυριότερο που μας ενδιαφέρει από τα στοιχεία της παλινδρόμησης
Yt=b0+b1*X1t+b2*X2t. είναι η στατιστική σημαντικότητά της (F-statistic), η
σημαντικότητα των συντελεστών (t-statistic) καθώς και ο συντελεστής
προσδιορισμού R2
. Το R2
δείχνει το βαθμό προσαρμογής της γραμμής της
παλινδρόμησης στα δεδομένα μας. Οι τιμές που λαμβάνει είναι στο διάστημα (0,1).
Όσο πλησιάζουμε προς την μονάδα τόσο καλύτερη είναι η παλινδρόμηση.
Στην περίπτωσή μας από το Φύλλο ‘’regression’’/ Έξοδος Συμπεράσματος το
R2
=0.816, οπότε αντιλαμβανόμαστε ότι η ερμηνευτικότητα της παλινδρόμηση είναι
ικανοποιητική6
. Το προσαρμοσμένο R2
είναι μια βελτιωμένη εκδοχή του απλού R2
.
Παρατηρούμε επίσης ότι οι συντελεστές b1 και b2 είναι στατιστικά σημαντικοί, ενώ
αντιθέτως ο σταθερός όρος b0 δεν είναι στατιστικά σημαντικός (βλ. Φύλλο excel
‘’regression’’/ Στατιστικοί Έλεγχοι). Βέβαια, εκείνο που μας ενδιαφέρει κυρίως
11
5
=BeraJarque −
24
)3(
6
(*
22
−
+
kS
T ), όπου
Τ Μέγεθος Δείγματος S Τιμή Ασυμμετρίας [κατάλοιπα (u)], k Τιμή Κύρτωσης [κατάλοιπα (u)].
6
Οι εμπειρικές μελέτες έχουν δείξει ότι για την ικανοποιητική ερμηνεία των χρονολογικών σειρών το
R2
της παλινδρόμησης θα πρέπει υπερβαίνει το 0.8, ενώ για διαστρωματικά δεδομένα το R2
θα πρέπει
να είναι μεγαλύτερο το 0.6.
12
είναι η στατιστική σημαντικότητα των ερμηνευτικών μεταβλητών (b1 ,b2) και όχι
τόσο του σταθερού όρου (b0). Να προσθέσουμε επίσης ότι οι συντελεστές b1, b2
δείχνουν την ποσοστιαία μεταβολή της εξαρτημένης μεταβλητής (Υ), όταν οι
ανεξάρτητες (Χ1, Χ2) μεταβάλλονται κατά 1%. Άρα, όταν η απόδοση της Αγγλίας
(Χ1) μεταβάλλεται κατά 1%, η μεταβολή του δείκτη της Γερμανίας είναι
b1=0,6223%, ενώ όταν μεταβάλλεται ο δείκτης των ΗΠΑ (Χ2) κατά 1% τότε η
επίδραση στην απόδοση της Γερμανίας είναι b2=0,4925% (βλ Πίνακα 3/ Στήλη
Συντελεστές).
Επιπλέον διαπιστώνουμε ότι η τιμή F-statistic της παλινδρόμησης (βλ. Φύλλο excel
‘’regression’’/ Στατιστικοί Έλεγχοι) είναι πολύ υψηλή, γεγονός που δείχνει το
υπόδειγμα είναι στατιστικά σημαντικό. Τέλος, εστιάζοντας στην τιμή Jarque-Bera,
εξακριβώνουμε ότι τα κατάλοιπα ακολουθούν την κανονική κατανομή.
ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ.
Όπως γνωρίζουμε από την γεωμετρία, κάθε συνάρτηση της μορφής Y=
b0+b1*X1+b2*X2 παριστάνει ένα επίπεδο στο χώρο. Είναι λοιπόν κατανοητό ότι η
σχέση που έχει εκτιμηθεί μεταξύ των δεικτών παριστάνει ένα επίπεδο. Στο παρακάτω
γράφημα έχουμε σχεδιάσει την γραφική παράσταση με τη βοήθεια του MatLab.
Δυστυχώς οι δυνατότητες του excel είναι πολύ περιορισμένες στα γραφήματα,
ωστόσο παρέχει τη δυνατότητα απεικόνισης διμεταβλητής συνάρτησης με τη χρήση
των γραφημάτων ‘’Επιφάνεια’’.
ΣΥΝΟΨΗ ΣΥΝΑΡΤΗΣΕΩΝ EXCEL
Οι συναρτήσεις που χρησιμοποιήσαμε για να εκτιμήσουμε την παλινδρόμηση Y=
b0+b1*X1+b2*X2 και για να διενεργήσουμε τους στατιστικούς ελέγχους ήταν οι εξής:
Μενού Εργαλεία Ανάλυση Δεδομένων Παλινδρόμηση
Μενού Εργαλεία Ανάλυση Δεδομένων Ιστόγραμμα
Μενού Εργαλεία Ανάλυση Δεδομένων Περιγραφικά Στατιστικά
TINV (κρίσιμη τιμή t -κατανομής)
1,2/ −− kTa
t
FIVN (κρίσιμη τιμή F -κατανομής)
1,, −− kTka
F
CHIINV (κρίσιμη τιμή X2
-κατανομής)2
,Ta
X
Γραφήματα Διασπορά (ΧΥ) και Προσθήκη Γραμμής Τάσης
Γραφήματα Γραμμή
13

More Related Content

Similar to Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docxΘεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Γιάννης Πλατάρος
 
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docxΘεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
ssuser3a9e99
 
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
stratos goumas
 

Similar to Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα. (20)

Syros parousaiash
Syros parousaiashSyros parousaiash
Syros parousaiash
 
1_Εισαγωγή_στο_SPSS
1_Εισαγωγή_στο_SPSS1_Εισαγωγή_στο_SPSS
1_Εισαγωγή_στο_SPSS
 
Bασικές έννοιες αλγορίθμων
Bασικές έννοιες αλγορίθμωνBασικές έννοιες αλγορίθμων
Bασικές έννοιες αλγορίθμων
 
H prwth gnwrimia_me_thn_ennoia_ths_synarthshs
H prwth gnwrimia_me_thn_ennoia_ths_synarthshsH prwth gnwrimia_me_thn_ennoia_ths_synarthshs
H prwth gnwrimia_me_thn_ennoia_ths_synarthshs
 
Στατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4οΣτατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4ο
 
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
 
Algorithms
AlgorithmsAlgorithms
Algorithms
 
Στατιστική - Διαφάνειες - Μάθημα 3ο
Στατιστική - Διαφάνειες - Μάθημα 3οΣτατιστική - Διαφάνειες - Μάθημα 3ο
Στατιστική - Διαφάνειες - Μάθημα 3ο
 
ΛΟΓΙΣΤΙΚΑ ΦΥΛΛΑ
ΛΟΓΙΣΤΙΚΑ ΦΥΛΛΑΛΟΓΙΣΤΙΚΑ ΦΥΛΛΑ
ΛΟΓΙΣΤΙΚΑ ΦΥΛΛΑ
 
Mathimatika thetikou pros_b_meros
Mathimatika thetikou pros_b_merosMathimatika thetikou pros_b_meros
Mathimatika thetikou pros_b_meros
 
Εισαγωγή στις αρχές της επιστήμης των ΗΥ Κεφ 2 2 7_3
Εισαγωγή στις αρχές της επιστήμης των ΗΥ Κεφ 2 2 7_3Εισαγωγή στις αρχές της επιστήμης των ΗΥ Κεφ 2 2 7_3
Εισαγωγή στις αρχές της επιστήμης των ΗΥ Κεφ 2 2 7_3
 
Senario
SenarioSenario
Senario
 
Senario
SenarioSenario
Senario
 
Εισαγωγή στις αρχές της επιστήμης των ΗΥ κεφ 2 2 1
Εισαγωγή στις αρχές της επιστήμης των ΗΥ κεφ 2 2 1Εισαγωγή στις αρχές της επιστήμης των ΗΥ κεφ 2 2 1
Εισαγωγή στις αρχές της επιστήμης των ΗΥ κεφ 2 2 1
 
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docxΘεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
 
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docxΘεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
Θεωρία Μέτρου με μαθηματικά Γυμνασίου για Γεωμετρία Β΄Λυκείου.docx
 
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
 
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
 
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
 

More from stratos goumas

Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
stratos goumas
 
Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.
stratos goumas
 
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
stratos goumas
 
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
stratos goumas
 
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
stratos goumas
 
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
stratos goumas
 

More from stratos goumas (15)

Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
 
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdfBitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
 
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
 
Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.
 
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριώνΤεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
 
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξηΣχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
 
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
 
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
 
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
 
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
 
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
 
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
 
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
 
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
 
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
 

Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

  • 1. Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα. Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος. MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’ e-mail: s_4goum@yahoo.com, My Blog 29/1/2011 ΕΙΣΑΓΩΓΗ Τα μαθηματικά είναι επιστημονικός κλάδος όπου οι εφαρμογές τους αποτελούν αναπόσπαστο τμήμα σε πλήθος άλλων επιστημών και αντιμετώπισης ζητημάτων, όπως η έρευνα, η διοίκηση, η οικονομία, η αστρονομία, η φυσική κτλ. Στην εργασία αυτή θα ασχοληθούμε με ένα τμήμα των μαθηματικών όπου αφορά την ποσοτικοποίηση των οικονομικών μεγεθών. Το αντικείμενο αυτό ονομάζεται οικονομετρία και εφαρμόζεται σε πληθώρα οικονομικών ζητημάτων, επιχειρησιακής ερευνάς και διοίκησης. Η οικονομετρία προσπαθεί να δώσει υπόσταση και να αναπτύξει τις σχέσεις της οικονομικής θεωρίας. Η μαθηματική, στατιστική και οικονομική ανάλυση συνδυάζονται με σκοπό την εκτίμηση των οικονομικών σχέσεων. Όπως γνωρίζουμε, όλες οι επιστήμες διέπονται από θεωρίες, ωστόσο μια θεωρία, δεν μπορεί να σταθεί αν δεν υπάρξει η επαλήθευσή της και ο έλεγχος. Σκοποί της οικονομετρίας είναι οι εξής1 . 1) Εμπειρική επαλήθευση ή έλεγχος μιας θεωρίας. 2) Άσκηση οικονομικής πολίτικης 3) Πρόβλεψη οικονομικών μεγεθών. Τα στάδια της οικονομετρικής αναλύσεως συνοψίζονται κατά σειρά στα εξής: Στάδιο 1- Οικονομική Θεωρία. Στάδιο 2- Οικονομικό υπόδειγμα. Στάδιο 3- Οικονομετρικό υπόδειγμα. Στάδιο 4- Εκτίμηση του υποδείγματος (Δεδομένα και Οικονομετρικές Μέθοδοι). Στάδιο 5- Έλεγχος υποδείγματος. Στάδιο 6- Χρήση υποδείγματος (Προβλέψεις, Οικονομική Πολιτική, Έλεγχος Θεωρίας). 1 1 Βλ. ‘’Εισαγωγή στην Οικονομετρία’’ Γ.Κ. Χρήστου
  • 2. 2 ΠΕΡΙΛΗΨΗ Στην εργασία αυτή θα μελετήσουμε και θα παρουσιάσουμε την πολλαπλή γραμμική παλινδρόμηση, η οποία αποτελεί μια από της βασικές μεθόδους εκτίμησης στην οικονομετρία. Η πολλαπλή παλινδρόμηση αποτελεί μια σχέση/ εξάρτηση μεταξύ πολλών μεταβλητών. Δεν θα σταθούμε τόσο στην ανάπτυξη της θεωρίας και την θεμελίωση των μαθηματικών τεχνικών όσο στην παρουσίαση της μεθόδου υπολογισμού και εκτίμησης των σχέσεων. Αυτό που θα χρειαστούμε είναι το excel 2003 (ή 2007) και ένα βιβλίο οικονομετρίας στο οποίο θα μπορούμε να ανατρέξουμε για την ορθή τεκμηρίωση των αποτελεσμάτων μας. Έχουμε επιλέξει τρεις χρηματιστηριακούς δείκτες, FTSE-100 (Αγγλία), Dow- Jones (ΗΠΑ) και Xerta-DAX (Γερμανία) και υπολογίσαμε την μέση εβδομαδιαία απόδοση για το διάστημα 1/1/2009 έως 1/12/2010. Θα επιχειρήσουμε να εξετάσουμε την επίδραση στο χρηματιστήριο της Γερμανίας από τα άλλα δυο χρηματιστήρια. Με τη χρήση του excel θα εκτιμήσουμε ένα πολλαπλό γραμμικό υπόδειγμα της μορφής Yt= b0+b1*X1t+b2*X2t+ut. Όπου Υ Απόδοση Γερμανίας, Χ1 Απόδοση Αγγλίας και Χ2 Απόδοση ΗΠΑ. (Σημ: Υ εξαρτημένη μεταβλητή. Χ1,Χ2 ανεξάρτητες-ερμηνευτικές μεταβλητές) ΣΧΟΛΙΑ Οι λόγοι οι οποίοι επιλέξαμε τις μέσες εβδομαδιαίες αποδόσεις είναι οι εξής: 1) Επειδή τα χρηματιστήρια που επιλέξαμε δεν κλείνουν την ίδια ώρα, θα είχαμε σοβαρό και ουσιαστικό πρόβλημα για τον προσδιορισμό των τιμών και των αποδόσεων. Για να λάβουμε τις ημερήσιες τιμές θα πρέπει να χρηματιστήρια να κλείνουν την ίδια ή περίπου την ίδια ώρα. Στην περίπτωσή μας, οι αγορές που επιλέχθηκαν έχουν μεγάλη διαφορά στην ώρα κλεισίματος, οπότε δεν είναι ούτε εφικτό ούτε ευνόητο να χρησιμοποιήσουμε τις ημερήσιες τιμές κλεισίματος. 2) Στις ημερήσιες χρηματιστηριακές τιμές παρουσιάζεται έντονη διακύμανση, ως εκ τούτου τα γραμμικά μοντέλα δεν είναι κατάλληλα για την εκτίμηση των δεδομένων, διότι δεν έχουν την δυνατότητα να ‘’συλλάβουν’’ αυτή την έντονη μεταβλητότητα. Έχει αποδειχτεί από αναλυτές-ερευνητές ότι τα οικονομετρικά γραμμικά μοντέλα με χρήση ημερήσιων τιμών αποτυγχάνουν τόσο στην εκτίμηση των ερμηνευτικών μεταβλητών όσο και στις προβλέψεις,. Ωστόσο, ένα γραμμικό μοντέλο μπορεί να αποδειχτεί χρήσιμο όταν λαμβάνουμε λιγότερο συχνές παρατηρήσεις (π.χ.
  • 3. 3 εβδομαδιαίες, μηνιαίες), η εκτίμηση του οποίου θα μας εξηγήσει την γενικότερη πορεία της αγοράς. Αντιθέτως, οι ημερήσιες τιμές προσφέρονται για τεχνική ανάλυση (technical analysis), με την οποία έχουμε την δυνατότητα να προβλέψουμε την εξέλιξη ενός δείκτη/ μιας μετοχής για πολύ βραχυχρόνιο και βραχυχρόνιο ορίζοντα. Στις μεθόδους τεχνικής ανάλυσης συγκαταλέγονται τα εξής: 1) Κινητοί Μέσοι Όροι (Moving Average), Τάση (Trend), Ζώνες Bollinger (Bollinger Bands), Ταλαντωτές (Oscillators), Όγκος Συναλλαγών (Volume), Δείκτης Σύγκλισης-Απόκλισης (MACD), Σχηματισμοί (Patterns) κτλ. ΘΕΩΡΙΑ Αρχικά θα αναφερθούμε στην απλή γραμμική παλινδρόμηση η οποία αποτελεί σχέση μεταξύ δυο μεταβλητών. Σκοπός μας είναι να αναπτύξουμε το βασικό θεωρητικό υπόβαθρο και να παρουσιάσουμε μερικά παράδειγμα με τη χρήση του excel. Για περεταίρω ανάλυση σε θεωρητική βάση, ο αναγνώστης μπορεί να συμβουλευτεί κάποιο βιβλίο οικονομετρίας. 1) Απλή Γραμμική Παλινδρόμηση: Yt=a+b*Xt+ut. X Ανεξάρτητη μεταβλητή, Υ Εξαρτημένη μεταβλητή, u Κατάλοιπα (σφάλμα). Παράδειγμα: Έστω ότι θέλουμε να εξετάσουμε την επίδραση του Επιτοκίου (r) στην Προσφορά Χρήματος (Μ). Αφού λάβουμε τις τιμές σχηματίζουμε το υπόδειγμα Mt=a+b*rt+ut. Με κατάλληλες μεθόδους (π.χ. μέθοδο ελάχιστων τετραγώνων OLS) εκτιμούμε τους συντελεστές a,b. Όπως είναι φυσικό τα ζεύγη τιμών (Χ,Υ) δεν θα ταυτίζονται επακριβώς με την γραμμή της παλινδρόμησης (μερικές τιμές θα είναι πάνω στην γραμμή, ενώ μερικές άλλες θα είναι εκτός της γραμμής 2 ), με αποτέλεσμα να υπάρχει πάντοτε σφάλμα (u). 2) Πολλαπλή Γραμμική Παλινδρόμηση:Yt=b0+b1*X1t+b2*X2t+b3*X3t+.+ bn*Xnt+ut. Xi Ανεξάρτητες (ερμηνευτικές) μεταβλητές, Υ Εξαρτημένη μεταβλητή, u Κατάλοιπα (σφάλμα). 2 Βλέπε παρακάτω, Γράφημα 1
  • 4. 4 Παράδειγμα: Έστω ότι θέλουμε να εκτιμήσουμε την επίδραση στην τιμή (Ρ) ενός προϊόντος από τους Μισθούς (I) και το Κόστος Πρώτων Υλών (C). Αν υποθέσουμε ότι υπάρχει γραμμική σχέση μεταξύ αυτών των μεταβλητών, τo υπόδειγμα θα έχει την εξής μορφή: Ρt= b0+b1*Ιt+b2*Ct +ut. Βασικό συστατικό για να λάβουμε ορθές εκτιμήσεις είναι τα κατάλοιπα να ακολουθούν την κανονική κατανομή, με μέσο μηδέν και σταθερή διακύμανση u~N(0,σ2 ), να μην συσχετίζονται (δηλαδή το ut να μην εμφανίζει σχέση με το us άρα E(utus)=0 για t≠s) καθώς επίσης να μην υπάρχουν ακριβείς γραμμικές σχέσεις (συγγραμικότητα) μεταξύ των ερμηνευτικών μεταβλητών (Xi). Ωστόσο, επειδή στην πράξη οι υποθέσεις αυτές συμβαίνουν σπάνια, αν τα κατάλοιπα ακολουθούν μια κατανομή που να προσεγγίζει ικανοποιητικά την κανονική κατανομή, υποθέτουμε ότι η κατανομή είναι η κανονική συνεχίζοντας την διαδικασία και στο τέλος διορθώνουμε τους συντελεστές μας. Στην περίπτωση που τα κατάλοιπα ακολουθούν μια κατανομή η οποία δεν είναι η κανονική ούτε την προσεγγίζει, τότε καταφεύγουμε σε άλλες τεχνικές ανάλυσης. Όσο αφορά την γραμμική σχέση μεταξύ των ερμηνευτικών μεταβλητών προσπαθούμε να ελέγξουμε για την ύπαρξη έντονης συσχέτισης μεταξύ τους. Η ύπαρξη γραμμικών σχέσεων, θα οδηγήσει σε λανθασμένα αποτελέσματα, συνεπώς οφείλουμε να αναδιαρθρώσουμε το μοντέλο μας. ΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΑΠΛΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ME TO EXCEL 2003 3 . Στο παρακάτω γράφημα (Γράφημα 1) έχουμε απεικονίσει την απλή γραμμική παλινδρόμηση Yt=a+b*Xt+ut. Η κατασκευή του γραφήματος στο excel 2003 έγινε ως εξής Αρχικά εισάγουμε τα δεδομένα μας στο φύλλο excel. Από το Μενού Εισαγωγή Γράφημα Διασπορά (ΧΥ)4 . Στο παράθυρο που εμφανίζεται εισάγουμε τα δεδομένα μας στην ‘’Περιοχή Δεδομένων‘’. Πατώντας ‘’Επόμενο….’’ κατασκευάζουμε το διάγραμμα διασποράς των ζευγών (Χ,Υ). Εν συνεχεία θα προσθέσουμε στο γράφημα την γραμμή παλινδρόμησης. Επιλέγοντας τα σημεία (Χ,Υ) του γραφήματος και με δεξί κλικ εμφανίζεται ένα νέο παράθυρο. Επιλεγούμε το ‘’Προσθήκη Γραμμής Τάσης’’. Στην καρτέλα ‘’Τύπος’’ , 3 Βλ. Φύλλο ‘’rates’’ του excel. 4 Επιλεγούμε το πρώτο γράφημα που έχει μόνο τα σημεία
  • 5. επιλεγούμε ‘’Γραμμικός’’ ενώ στην καρτέλα ‘’Επιλογές’’ επιλεγούμε τα ‘’Προβολή εξίσωσης στο γράφημα’’ και ‘’Προβολή τιμής R-τετράγωνο’’ ΓΡΑΦΗΜΑ 1. y = 0,7041x + 0,0003 R 2 = 0,8169 -0,08 -0,06 -0,04 -0,02 0 0,02 0,04 0,06 -0,1 -0,05 0 0,05 0,1 X Y Σειρά1 Γραμμική (Σειρά1) Από το γράφημα παρατηρούμε ότι τα πραγματικά δεδομένα δεν ταυτίζονται επακριβώς με την γραμμή παλινδρόμησης, ωστόσο η προσέγγιση επιτυγχάνεται σε ικανοποιητικό βαθμό. Η γραμμή η οποία διέρχεται από τα ζεύγη τιμών (Χ,Υ) ονομάζεται γραμμή παλινδρόμησης (regression line). Το ερώτημα που ανακύπτει είναι αν αυτή η γραμμή είναι η βέλτιστη ή θα μπορούσαν να υπάρξουν και επιπλέον γραμμές οι οποίες θα ερμήνευαν ικανοποιητικά τα δεδομένα μας. Η ιδιότητα η οποία διέπει την απλή γραμμική παλινδρόμηση είναι ότι η τεχνική που συνηθίζεται να χρησιμοποιείται είναι η μέθοδος ελάχιστων τετραγώνων (OLS), η οποία αναπτύχτηκε από τους Gauss-Markov και ελαχιστοποιεί το άθροισμα των τετραγώνων των καταλοίπων (SSE). Ελάχιστο άθροισμα καταλοίπων συνεπάγεται καλύτερη ερμηνευτικότητα στο υπόδειγμα. Συμπεραίνουμε λοιπόν ότι η γραμμική αυτή σχέση, με την μέθοδο OLS, είναι η καλύτερη που θα μπορούσε να εξευρεθεί. Εναλλακτικές μέθοδοι οι οποίες χρησιμοποιήθηκαν μετέπειτα και βασιστήκαν στην OLS είναι η γενικευμένη μέθοδος ελάχιστων τετραγώνων (GLS), η μέθοδος μέγιστης πιθανοφάνειας (Maximum Likelihood), η ραχοειδής παλινδρόμησης (Ridge Regression), η σταθμική μέθοδος ελαχίστων τετραγώνων (Weighted Least Square) κ.α. 5
  • 6. Τελειώνοντας, να αναφέρουμε ότι εκτός των γραμμικών τεχνικών υπάρχουν βεβαίως και οι μη-γραμμικές τεχνικές, με τις οποίες δεν θα ασχοληθούμε στην παρούσα ενότητα, όπως η μη γραμμική μέθοδος ελαχίστων τετραγώνων, η μαθηματική βελτιστοποίηση, η μη-παραμετρική παλινδρόμηση, ο τετραγωνικός προγραμματισμός κ.α. ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ EXCEL (Για να κατεβάσετε το αρχείο excel πιεστέ εδώ) Στο αρχείο excel έχουμε τρία φύλλα εργασίας. (rates, regression,stats) Η διαδικασία της παλινδρόμησης στο excel 2003 έχει ως εξής (με παρόμοιο τρόπο γίνεται και στο excel 2007) --------ΣΤΑΔΙΟ Α (Φύλλο excel ‘’rates’’) 1) Εισαγωγή δεδομένων (Φύλλο ‘’rates’’). Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών. 2) Από το μενού ‘’Εργαλεία’’ ‘’Πρόσθετα’’ Επιλογή το ‘’Πακέτο Εργαλείων Ανάλυσης’’. Προσθέσαμε ένα νέο πακέτο εργαλείων. 3) Από το μενού ‘’Εργαλεία’’ ‘’Ανάλυση Δεδομένων’’ Επιλογή την ‘’Παλινδρόμηση’’. 4) Στο παράθυρο της παλινδρόμησης που εμφανίζεται εισάγουμε τα εξής: (Προσοχή! Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών) α) Περιοχή Εισόδου Υ Επιλεγούμε την περιοχή κελίων με τα δεδομένα του δείκτης της Γερμανίας (Α1:A99). β) Περιοχή Εισόδου Χ Επιλεγούμε τα δεδομένα των δεικτών της Αγγλίας και των ΗΠΑ (B1:C99). γ) Επιλεγούμε επίσης τα ‘’Ετικέτες’’ και ‘’Βαθμός Εμπιστοσύνης 95%’’. δ) Επιλεγούμε το ‘’Νέο Φύλλο Εργασίας’’ και το ‘’Υπόλοιπα’’. Με την επιλογή ‘’Υπόλοιπα’’ θα εκτιμήσουμε τα σφάλματα (u) της παλίνδρομης, όπου , τα οποία παρουσιάζονται στην περιοχή ‘’Έξοδος Υπολοίπων/ Φύλλο ∧ −= YYu excel regression’’. 6
  • 7. 7 Πατάμε το ΟΚ και σε ένα νέο φύλλο εργασίας (Φύλλο ‘’regression’’) υπολογίζονται τα στοιχεία της παλινδρόμησης τα οποία παρουσιάζονται στους παρακάτω πίνακες. (βλ. Πίνακες 1,2,3) --------ΣΤΑΔΙΟ Β (Φύλλο excel ‘’regression’’) Από τα δεδομένα των Υπολοίπων (Έξοδος Υπολοίπων) θα κατασκευάσουμε ένα τυπικό γράφημα της κατανομής που ακολουθούν. 1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το ‘’Ιστόγραμμα’’. (βλ. παρακάτω, Γράφημα 2) 2) Στην ‘’Περιοχή Εισόδου’’, εισάγω τα δεδομένα των υπολοίπων (Φύλλο excel ‘’regression’’/ C50:C147). Επιλέγω επίσης και το ‘’Ετικέτες’’. 3) Στην ‘’Περιοχή Εξόδου’’, επιλέγω μια κενή περιοχή κελιών (έστω 4x4). Επιλεγώ επίσης τα ‘’Αθροιστική Σχετική Συχνότητα’’ και το ‘’Έξοδος Γραφήματος’’. Πατάμε ΟΚ και κατασκευάζουμε το διάγραμμα κατανομής των υπολοίπων, το οποίο παρατηρούμε ότι προσεγγίζει την κανονική κατανομή (βλ. Γράφημα ‘’Ιστόγραμμα’’/ Φύλλο excel ‘’regression’’). Τέλος από το μενού ’’Εισαγωγή’’ ‘’Γράφημα (γραμμές)’’. Πιέζουμε το ‘’Επόμενο’’ και στην ‘’Περιοχή Δεδομένων’’ επιλέγω τα δεδομένα των υπολοίπων (Φύλλο ‘’regression’’/ C50:C147) και το ‘’Σειρά σε Στήλες’’. Πατώντας ‘’Επόμενο…’’ φτάνω μέχρι το τέλος και κατασκευάζω το γράφημα των υπολοίπων (βλ. ‘’Γράφημα Υπολοίπων’’/ Φύλλο excel ‘’regression’’). .
  • 8. 8 ----ΣΤΑΔΙΟ Γ (Φύλλο excel ‘’stats’’). Περιγραφικά στατιστικά των δεδομένων μας. 1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το ‘’Περιγραφικά Στατιστικά’’. 2) Στην ‘’Περιοχή Εισόδου’’ επιλέγω τα δεδομένα των υπολοίπων (‘’Φύλλο regression’’/ C50:C147), καθώς επίσης και το ‘’Νέο Φύλλο’’, ‘’Περιληπτικά Στατιστικά’’. 3) Πιέζοντας το ΟΚ, εμφανίζονται τα περιγραφικά στατιστικά του Φύλλου ‘’stats’’. Η ιδία διαδικασία ισχύει για την εύρεση των περιγραφικών στατιστικών των αποδόσεων των δεικτών (Φύλλο ‘’rates’’/ Α2:A99, B2:B99, C2:C99). Στο φύλλο excel ‘’stats’’ έχουμε υπολογίσει τα περιγραφικά στατιστικά (μέση τιμή, διακύμανση, κύρτωση κτλ) τόσο των δεικτών όσο και των σφαλμάτων. ΦΥΛΛΟ EXCEL ‘’regression’’ (Ανάλυση Παλινδρόμησης) Στον πρώτο πίνακα παρουσιάζονται τα γενικά στατιστικά της παλινδρόμησης, στον δεύτερο η ανάλυση διακύμανσης, ενώ στον τρίτο τα στατιστικά των συντελεστών. ΠΙΝΑΚΑΣ 1. (ΣΤΑΤΙΣΤΙΚΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ) Στατιστικά παλινδρόμησης Πολλαπλό R 0,903435424 R Τετράγωνο 0,816195565 Προσαρμοσμένο R Τετράγωνο 0,812325998 Τυπικό σφάλμα 0,012336364 Μέγεθος δείγματος 98
  • 9. ΠΙΝΑΚΑΣ 2. (ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ) βαθμοί ελευθερίας SS MS F Σημαντικότητα F Παλινδρόμηση 2 0,064200174 0,032100087 210,9268438 1,14001E-35 Υπόλοιπο 95 0,014457659 0,000152186 Σύνολο 97 0,078657833 ΠΙΝΑΚΑΣ 3. (ΣΥΝΤΕΛΕΣΤΕΣ) Συντελεστές Τυπικό σφάλμα t τιμή-P Κατώτερο 95% Υψηλότερο 95% Κατώτερο 95,0% Υψηλότερο 95,0% Τεταγμένη επί την αρχή (b0) 0,000767503 0,001251986 0,61302813 0,5413226 -0,001718 0,00325301 -0,001718 0,00325301 FTSE-100 (b1) 0,622396658 0,125692912 4,9517244 3,188E-06 0,3728647 0,87192863 0,372865 0,87192863 Dow Jones (b2) 0,492589505 0,125888417 3,91290571 0,0001713 0,2426694 0,74250961 0,242669 0,74250961 ΚΑΤΑΝΟΜΗ ΚΑΤΑΛΟΙΠΩΝ ΓΡΑΦΗΜΑ 2. 9
  • 10. ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ: t-stat, F-stat, Jarque-Bera. (Φύλλο excel ‘regression’) Από την οικονομετρία γνωρίζουμε μερικούς ελέγχους τους οποίους διεξάγουμε για να αποφανθούμε για την στατιστική σημαντικότητα τόσο των συντελεστών όσο και της παλινδρόμησης. Η παλινδρόμηση, όπως ήδη έχουμε αναφέρει, έχει την μορφή Yt=b0+b1*X1t+b2*X2t. Στον ‘’Πίνακα 3/ Στήλη Συντελεστές’’ (βλ. παραπάνω), έχουν εκτιμηθεί οι συντελεστές της παλινδρόμησης, οπότε καταλήγουμε στην μορφή Yt=0,00076+0,622*X1t+0,492*X2t. (Δεν έχουμε γράψει τα τελευταία δεκαδικά ψηφιά για λόγους κομψότητας….). Όλοι οι έλεγχοι έγιναν σε επίπεδο σημαντικότητας α=5%. Το μέγεθος του δείγματος είναι Τ=98 παρατηρήσεις, ενώ ο αριθμός των συντελεστών του υποδείγματός μας είναι k=2 (b1, b2). Οι έλεγχοι που έχουμε διενεργήσει είναι οι εξής: (Στο αρχείο excel παρουσιάζεται η διαδικασία αναλυτικά, με τις αντίστοιχες συναρτήσεις) 1) Έλεγχος σημαντικότητας των συντελεστών (t-statistic). H0: bi=0 H1: bi<>0 Aν > | τότε απορρίπτω την H0, άρα ο συντελεστής είναι στατιστικά σημαντικός. | 1,2/ | −− kTa t)(| ibstatistict − Για την τιμή t-statistic των συντελεστών θα ανατρέξουμε στον Πίνακα 3/ Στήλη t 2) Έλεγχος σημαντικότητας της παλινδρόμησης (F-statistic). H0: Παλινδρόμηση μη σημαντική H1: Παλινδρόμηση σημαντική Aν > τότε απορρίπτω την H0, άρα η παλινδρόμηση είναι στατιστικά σημαντική. )(regressionstatisticF − 1,, −− kTka F Για την τιμή F-statistic της παλινδρόμησης θα ανατρέξουμε στον Πίνακα 2/ Στήλη F. 10
  • 11. 3) Έλεγχος κανονικότητας διαταρακτικού όρου (X2 ). H0: u~N(0,σ2 ) H1: u<>N(0,σ2 ) Aν 5 statisticBeraJarque _− > τότε απορρίπτω την H0, άρα τα κατάλοιπα δεν ακολουθούν την κανονική κατανομή. 2 2,a X Οι συναρτήσεις του excel που έχουμε χρησιμοποιήσει για τις κρίσιμες τιμές των στατιστικών ελέγχων είναι οι κάτωθι. 1) TINV 1,2/ −− kTa t 2) FIVN 1,, −− kTka F 3) CHIINV 2 ,Ta X ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (βλ. παραπάνω Πίνακες 1,2,3 και Φύλλο excel ‘’regression’’) Το κυριότερο που μας ενδιαφέρει από τα στοιχεία της παλινδρόμησης Yt=b0+b1*X1t+b2*X2t. είναι η στατιστική σημαντικότητά της (F-statistic), η σημαντικότητα των συντελεστών (t-statistic) καθώς και ο συντελεστής προσδιορισμού R2 . Το R2 δείχνει το βαθμό προσαρμογής της γραμμής της παλινδρόμησης στα δεδομένα μας. Οι τιμές που λαμβάνει είναι στο διάστημα (0,1). Όσο πλησιάζουμε προς την μονάδα τόσο καλύτερη είναι η παλινδρόμηση. Στην περίπτωσή μας από το Φύλλο ‘’regression’’/ Έξοδος Συμπεράσματος το R2 =0.816, οπότε αντιλαμβανόμαστε ότι η ερμηνευτικότητα της παλινδρόμηση είναι ικανοποιητική6 . Το προσαρμοσμένο R2 είναι μια βελτιωμένη εκδοχή του απλού R2 . Παρατηρούμε επίσης ότι οι συντελεστές b1 και b2 είναι στατιστικά σημαντικοί, ενώ αντιθέτως ο σταθερός όρος b0 δεν είναι στατιστικά σημαντικός (βλ. Φύλλο excel ‘’regression’’/ Στατιστικοί Έλεγχοι). Βέβαια, εκείνο που μας ενδιαφέρει κυρίως 11 5 =BeraJarque − 24 )3( 6 (* 22 − + kS T ), όπου Τ Μέγεθος Δείγματος S Τιμή Ασυμμετρίας [κατάλοιπα (u)], k Τιμή Κύρτωσης [κατάλοιπα (u)]. 6 Οι εμπειρικές μελέτες έχουν δείξει ότι για την ικανοποιητική ερμηνεία των χρονολογικών σειρών το R2 της παλινδρόμησης θα πρέπει υπερβαίνει το 0.8, ενώ για διαστρωματικά δεδομένα το R2 θα πρέπει να είναι μεγαλύτερο το 0.6.
  • 12. 12 είναι η στατιστική σημαντικότητα των ερμηνευτικών μεταβλητών (b1 ,b2) και όχι τόσο του σταθερού όρου (b0). Να προσθέσουμε επίσης ότι οι συντελεστές b1, b2 δείχνουν την ποσοστιαία μεταβολή της εξαρτημένης μεταβλητής (Υ), όταν οι ανεξάρτητες (Χ1, Χ2) μεταβάλλονται κατά 1%. Άρα, όταν η απόδοση της Αγγλίας (Χ1) μεταβάλλεται κατά 1%, η μεταβολή του δείκτη της Γερμανίας είναι b1=0,6223%, ενώ όταν μεταβάλλεται ο δείκτης των ΗΠΑ (Χ2) κατά 1% τότε η επίδραση στην απόδοση της Γερμανίας είναι b2=0,4925% (βλ Πίνακα 3/ Στήλη Συντελεστές). Επιπλέον διαπιστώνουμε ότι η τιμή F-statistic της παλινδρόμησης (βλ. Φύλλο excel ‘’regression’’/ Στατιστικοί Έλεγχοι) είναι πολύ υψηλή, γεγονός που δείχνει το υπόδειγμα είναι στατιστικά σημαντικό. Τέλος, εστιάζοντας στην τιμή Jarque-Bera, εξακριβώνουμε ότι τα κατάλοιπα ακολουθούν την κανονική κατανομή. ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ. Όπως γνωρίζουμε από την γεωμετρία, κάθε συνάρτηση της μορφής Y= b0+b1*X1+b2*X2 παριστάνει ένα επίπεδο στο χώρο. Είναι λοιπόν κατανοητό ότι η σχέση που έχει εκτιμηθεί μεταξύ των δεικτών παριστάνει ένα επίπεδο. Στο παρακάτω γράφημα έχουμε σχεδιάσει την γραφική παράσταση με τη βοήθεια του MatLab. Δυστυχώς οι δυνατότητες του excel είναι πολύ περιορισμένες στα γραφήματα, ωστόσο παρέχει τη δυνατότητα απεικόνισης διμεταβλητής συνάρτησης με τη χρήση των γραφημάτων ‘’Επιφάνεια’’.
  • 13. ΣΥΝΟΨΗ ΣΥΝΑΡΤΗΣΕΩΝ EXCEL Οι συναρτήσεις που χρησιμοποιήσαμε για να εκτιμήσουμε την παλινδρόμηση Y= b0+b1*X1+b2*X2 και για να διενεργήσουμε τους στατιστικούς ελέγχους ήταν οι εξής: Μενού Εργαλεία Ανάλυση Δεδομένων Παλινδρόμηση Μενού Εργαλεία Ανάλυση Δεδομένων Ιστόγραμμα Μενού Εργαλεία Ανάλυση Δεδομένων Περιγραφικά Στατιστικά TINV (κρίσιμη τιμή t -κατανομής) 1,2/ −− kTa t FIVN (κρίσιμη τιμή F -κατανομής) 1,, −− kTka F CHIINV (κρίσιμη τιμή X2 -κατανομής)2 ,Ta X Γραφήματα Διασπορά (ΧΥ) και Προσθήκη Γραμμής Τάσης Γραφήματα Γραμμή 13