1. REGRESIA LINIARĂ MULTIPLĂ
TEMATICA C4-C5
1. Prezentarea modelului liniar multiplu
2. Estimarea parametrilor modelului liniar multiplu
3. Testarea parametrilor modelului liniar multiplu
4. Testarea modelului
5. Testarea influenţei marginale a unei variabile
6. Exemplu (I)
7. Estimarea indicatorilor de corelaţie
8. Testarea indicatorilor de corelaţie
9. Exemplu (II)
2. 5. Testarea influenţei marginale a unei variabile
independente asupra variabilei dependente
1. Formularea ipotezelor
H0: variabila independentă nou introdusă în model nu are o
influenţă semnificativă asupra variaţiei variabilei aleatoare
H1: variabila independentă nou introdusă în model are o
influenţă semnificativă asupra variaţiei variabilei aleatoare
2. Fixarea pragului de semnificaţie α=0,05
ˆ
ˆ
η 2 new − η 2 old n − k new
⋅
3. Alegerea statisticii test F =
2
ˆ
1 − η new
k new − 1
R 2 new − R 2 old n − k new
4. Calcularea statisticii test F = 1 − R 2 new ⋅ k − 1
new
5. Criterii de decizie:
Dacă Fcalc≤ Fα, k-1, n-k => se acceptă H0 cu o probabilitate de 1-α.
Dacă Fcalc> F α, k-1, n-k => se respinge H0 cu un risc asumat α.
3. EXEMPLU I (1)
Model Summary
Change Statistics
Model
1
2
R
.661a
.663b
R Square
.436
.439
Adjusted
R Square
.435
.437
Std. Error of
the Estimate
$12,833.540
$12,815.280
R Square
Change
.436
.003
F Change
365.381
2.346
df1
df2
472
471
1
1
Sig. F Change
.000
.126
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Months since Hire
Model Summary
Change Statistics
Model
1
2
R
.661a
.890b
R Square
.436
.792
Adjusted
R Square
.435
.792
Std. Error of
the Estimate
$12,833.540
$7,796.524
R Square
Change
.436
.356
F Change
365.381
807.889
df1
df2
472
471
1
1
Sig. F Change
.000
.000
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Beginning Salary
Model Summary
Change Statistics
Model
1
2
R
.910a
.907b
R Square
.828
.822
Adjusted
R Square
.818
.814
Std. Error of
the Estimate
5.2961
5.3542
R Square
Change
.828
-.006
F Change
83.271
2.544
df1
df2
4
1
69
69
Sig. F Change
.000
.115
a. Predictors: (Constant), Average female life expectancy, People living in cities (%), Daily calorie intake, People who read (%)
b. Predictors: (Constant), Average female life expectancy, Daily calorie intake, People who read (%)
4. EXEMPLU I (2)
Model Summary
Change Statistics
Model
1
R
,910a
R Square
,829
Adjusted
R Square
,807
Std. Error of
the Estimate
285,65322
R Square
Change
,829
F Change
38,718
df1
df2
2
a. Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)
ANOVAb
Model
1
Regression
Residual
Total
Sum of
Squares
6318646
1305564
7624211
df
2
16
18
Mean Square
3159323,188
81597,759
F
38,718
Sig.
,000a
a. Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)
a
b. Dependent Variable: Salariul (RON) Coefficients
Model
1
(Constant)
Vechime in munca (ani)
Nr. ani pregatire
Unstandardized
Coefficients
B
Std. Error
-545,101
224,894
84,315
25,550
85,298
20,394
a. Dependent Variable: Salariul (RON)
Standardized
Coefficients
Beta
,443
,562
t
-2,424
3,300
4,182
Sig.
,028
,005
,001
16
Sig. F Change
,000
5. TEMATICA
7. Estimarea indicatorilor de corelaţie
8. Testarea indicatorilor de corelaţie
9. Exemplu (II)
Pentru un model de regresie liniară multiplă, pot fi
determinati următorii coeficienţi:
- coeficienţi de corelaţie simplă între variabila
dependentă şi fiecare variabilă independentă (coeficienţi
bivariaţi);
- coeficienţi de corelaţie parţială;
- coeficientul de corelaţie multiplă şi coeficientul de
determinaţie multiplă.
6. 7. Estimarea indicatorilor de corelaţie (I)
Coeficienţi de corelaţie bivariată şi parţială
Pentru un model liniar de forma:
y i = β 0 + β 1 x1i + β 2 x 2 i + ε i
există trei coeficienţi de corelaţie bivariată:
ry1 =
n∑ x1i yi − ∑ x1i ∑ yi
i
i
i
[n∑ x12i − (∑ x1i ) 2 ][n∑ yi2 − (∑ yi ) 2 ]
i
i
ry 2 =
i
i
n ∑ x 2 i yi − ∑ x 2 i ∑ yi
i
i
i
2
[n∑ x2i − (∑ x2i ) 2 ][n∑ yi2 − (∑ yi ) 2 ]
i
i
r12 =
i
i
n∑ x1i x2i − ∑ x1i ∑ x2i
i
i
i
2
[n∑ x12i − (∑ x1i ) 2 ][n∑ x2i − (∑ x2i ) 2 ]
i
i
i
i
7. 7. Estimarea indicatorilor de corelaţie (II)
… şi trei coeficienţi de corelaţie parţială calculaţi cu ajutorul
coeficienţilor de corelaţie bivariată:
ry 2 − ry1r12
ry1 − ry 2 r12
ry 2.1 =
ry1.2 =
2
(1 − ry21 )(1 − r12 )
2
2
(1 − ry 2 )(1 − r12 )
r12 − ry1ry 2
r12. y =
(1 − ry21 )(1 − ry22 )
Corelaţia parţială măsoară dependenţa dintre variabile prin
excluderea succesivă a influenţei celorlalţi factori,
considerând influenţa lor constantă si menţinând numai
influenţa factorului măsurat.
În funcţie de numărul variabilelor a căror influenţă se elimină
din calcul, coeficienţii de corelaţie parţială pot fi de ordinul
întâi (pentru o variabilă eliminată), de ordinul doi (pentru două
variabile) etc.
8. 7. Estimarea indicatorilor de corelaţie (III)
Raportul de determinaţie multiplă şi raportul de corelaţie
multiplă
Parametri 2
η
2
∑ ( y − y)
=
∑ ( y − y)
i
xi
2
i
VE
VR
=
= 1−
VT
VT
η = η2
=>
i
Estimatori
ε i2
∑
ˆ
ˆ
VE
VR
i
ˆ
ˆ
η =
= 1−
= 1−
η = η2
=> ˆ
2
ˆ
ˆ
VT
VT
∑ ( yi − y )
2
i
Estimaţiile
R2 =
ei2
∑
ESS
RSS
i
2
= 1−
= 1−
=> R = R
TSS
TSS
( yi − y ) 2
∑
9. 7. Estimarea indicatorilor de corelaţie (IV)
Coeficientul de corelaţie multiplă
Coeficientul de corelaţie multiplă se calculează numai
pentru modelele multiple liniare şi se exprimă cu ajutorul
coeficienţilor de corelaţie simplă dintre variabilele perechi.
Astfel, în cazul corelaţiei dintre o variabilă rezultativă Y şi
X1 X2
două variabile independente
,
,la nivelul unui
eşantion, coeficientul de corelaţie multiplă, notat cu r, se
calculează după relaţia:
r=
ry21 + ry22 − 2ry1ry 2 r12
2
1 − r12
⇔ r = ry21 + (1 − ry21 )ry 2.1 ⇔ r = ry22 + (1 − ry22 )ry1.2
10. 8. Testarea indicatorilor de corelaţie
Raportul de determinaţie si raportul de corelatie se
testează cu testul F după algoritmul prezentat la modelul liniar
simplu, ţinând cont de faptul că k=p+1 reprezintă numărul
parametrilor din noul model.
Coeficienţii de corelaţie se testează cu ajutorul testului t .
după algoritmul prezentat la modelul liniar simplu, ţinând cont
de faptul că k=p+1 reprezintă numărul parametrilor din noul
model.
11. Exemplu 1 Model Summary
Model
1
R
,910a
R Square
,829
Adjusted
R Square
,807
Std. Error of
the Estimate
285,65322
a. Predictors: (Constant), Nr. ani pregatire, Vechime in
munca (ani)
ANOVAb
Model
1
Regression
Residual
Total
Sum of
Squares
6318646
1305564
7624211
df
2
16
18
Mean Square
3159323,188
81597,759
F
38,718
Sig.
,000a
a. Predictors: (Constant), Nr. ani pregatire, Vechime in munca (ani)
b. Dependent Variable: Salariul (RON)
Coefficientsa
Model
1
(Constant)
Vechime in munca (ani)
Nr. ani pregatire
Unstandardized
Coefficients
B
Std. Error
-545,101
224,894
84,315
25,550
85,298
20,394
a. Dependent Variable: Salariul (RON)
Standardized
Coefficients
Beta
,443
,562
t
-2,424
3,300
4,182
Sig.
,028
,005
,001
Correlations
Zero-order
Partial
,801
,844
,636
,723
Part
,341
,433
12. Exemplu II (1)
În studiul legăturii dintre valoarea vânzărilor unei firme (Y) şi
cheltuielile de publicitate (X1), cheltuielile ocazionate de diferite
promoţii (X2) şi vânzările anuale realizate de principalul
concurent (X3), s-au obţinut următoarele rezultate:
b
Model Summary
Model
1
R
R Square
a
,913
,833
Adjusted
R Square
,787
a. Predictors: (Constant), X3, X1, X2
b. Dependent Variable: Y
Std. Error of
the Estimate
17,60029
DurbinWatson
1,879
13. EXEMPLU II (2)
ANOVAb
Model
1
Regression
Residual
Total
Sum of
Squares
16997,537
3407,473
20405,009
df
3
11
14
Mean Square
5665,846
309,770
F
18,290
Sig.
,000a
t
2,369
4,596
2,525
-2,258
Sig.
,037
,001
,028
,045
a. Predictors: (Constant), X3, X1, X2
b. Dependent Variable: Y
Coefficientsa
Model
1
(Constant)
X1
X2
X3
Unstandardized
Coefficients
B
Std. Error
65,705
27,731
48,979
10,658
59,654
23,625
-1,838
,814
a. Dependent Variable: Y
Standardized
Coefficients
Beta
,581
,359
-,324
14. ANEXE
Funcţia de consum
- cererea sau consumul populaţiei pentru o anumită categorie
de mărfuri este o funcţie de venit:
Ci=a+βVi+εi.
unde parametrul β arată de câte ori creşte consumul unui
anumit produs (Ci) la o creştere cu o unitate a venitului. Acesta
este, de regulă, pozitiv.
Legea cererii
- cererea populaţiei pentru o anumită categorie de mărfuri
este o funcţie de preţul acestor produse:
Ci=a+βPi+εi.
unde parametrul β este de regulă negativ şi arată cu cât
scade cererea la o creştere a preţului cu o unitate