2. Ipoteza de necoliniaritate a variabilelor
independente
Ipoteza de necoliniaritate presupune că între
variabilele independente ale unui model de regresie
liniar multiplu nu există o legătură de tip liniar.
Probleme:
identificarea gradului de coliniaritate
stabilirea cauzelor încălcării ipotezei
stabilirea efectelor coliniarităţii
testarea ipotezei de coliniaritate şi
corectarea modelului în cazul existenţei
acesteia.
2
3. Ipoteza lipsei de coliniaritate a variabilelor
independente
Grade de coliniaritate
Coliniaritate perfectă dacă există p constante , nu toate nule,
λ1 X 1 + λ2 X 2 + ... + λ p X p = 0
respectiv coliniaritate neperfectă dacă are loc relaţia:
λ1 X 1 + λ2 X 2 + ... + λ p X p + u = 0
unde u este o variabilă aleatoare care respectă ipotezele
modelului clasic de regresie.
3
4. Cauzele încălcării necoliniarităţii:
Tipul de model utilizat;
Variabilele alese pentru a realiza modelarea etc.
Efectele coliniarităţii:
Varianţa estimatorilor parametrilor de regresie creşte,
deci estimatorii nu vor mai fi eficienţi.
Dacă există coliniaritate perfectă, varianţa
estimatorilor este infinită, iar parametrii nu pot f
estimaţi.
Dacă există coliniaritate imperfectă, atunci varianţele
estimatorilor parametrilor vor fi mari
4
5. Ipoteza lipsei de coliniaritate a
variabilelor independente
Identificarea coliniarităţii
Testarea coeficienţilor de regresie în cazul unui model cu un coeficient de
determinaţie ridicat (de obicei peste 0.8).
Testarea coeficienţilor de corelaţie bivariaţi pentru variabilele independente din
modelul de regresie
Dacă aceşti coeficienţi au valori ridicate (de regulă, peste 0.8), atunci există
posibilitatea coliniarităţii între variabilele independente.
Estimarea şi testarea parametrilor modelelor de regresie auxiliară dintre
variabilele independente .
Dacă coeficienţii de regresie sunt nesemnificativ diferiţi de zero, atunci ipoteza de
necoliniaritate este încălcată.
Ipoteza de necoliniaritate este încălcată dacă aceşti coeficienţi de regresie sunt
semnificativ diferiţi de zero.
Detectare a coliniarităţii pe baza a doi indicatori (aplicaţi în SPSS):
Tolerance (TOL)
VIF (Variance Inflation Factor).
5
6. Ipoteza lipsei de coliniaritate a variabilelor
independente
Indicatorul VIF se defineşte prin relaţia: VIF j =
1
( 1 − R2 )
j
R 2 este raportul de determinaţie din modelul de regresie auxiliar,
j
construit pe baza variabilelor independente, în care variabila j
este considerată variabila dependentă, iar celelalte variabile
factoriale sunt considerate variabile independente.
Lipsa coliniarităţii dă o valoare VIF = 1
Existenţa coliniarităţii determină o valoare mare a indicatorului, condiţia
limită fiind în cazul unei coliniarităţi perfecte
R 2 = 1 ⇒ VIF → ∞
j
În practică, se consideră că o valoare VIF>10 indică prezenţa coliniarităţii.
6
7. Ipoteza lipsei de coliniaritate a variabilelor
independente
Indicatorul Tolerance
Se determină ca inversul valorii indicatorului VIF, după:
1
TOL j =
= ( 1 − R2 )
j
VIF j
Dacă TOL = 1, nu există coliniaritate, iar
dacă TOL = 0 suntem în situaţia extremă, de coliniaritate perfectă.
7
8. Corectarea coliniarităţii
Eliminarea din model a variabilei care induce
coliniaritatea
Construirea unui model de regresie cu
variabile transformare folosind diverse funcţii
sau operatori (decalaj, diferenţă etc.)
8
9. Exemplu
a
Coefficients
Model
1
(Constant)
Gross domestic
product / capita
Population increase
(% per year))
People who read (%)
Daily calorie intake
Unstandardized
Coefficients
B
Std. Error
208.654
12.503
Standardized
Coefficients
Beta
t
16.689
Sig.
.000
Collinearity Statistics
Tolerance
VIF
-.001
.000
-.128
-2.002
.049
.349
2.864
-6.059
1.993
-.178
-3.040
.003
.422
2.372
-1.345
-.016
.100
.004
-.803
-.235
-13.420
-3.684
.000
.000
.402
.354
2.489
2.829
a. Dependent Variable: Infant mortality (deaths per 1000 live births)
9
10. Exemplu
a
Coefficients
Model
1
(Constant)
Gross domestic
product / capita
Population increase
(% per year))
People who read (%)
Daily calorie intake
Unstandardized
Coefficients
B
Std. Error
208.654
12.503
Standardized
Coefficients
Beta
t
16.689
Sig.
.000
Collinearity Statistics
Tolerance
VIF
-.001
.000
-.128
-2.002
.049
.349
2.864
-6.059
1.993
-.178
-3.040
.003
.422
2.372
-1.345
-.016
.100
.004
-.803
-.235
-13.420
-3.684
.000
.000
.402
.354
2.489
2.829
a. Dependent Variable: Infant mortality (deaths per 1000 live births)
9