Lisrel-İleri İstatistik

LISREL

Yrd. Doç. Dr. Serkan ARIKAN



YEM’de amaç teorik olarak kurulan modellerin
veri tarafından desteklenip
desteklenmediğinin ortaya konmasıdır.





Niye Kullanırız?
Birden çok gözlenen değişkeni kullanarak
aralarındaki ilişkiyi daha iyi anlayabiliriz.






PRELIS: PreLisrel, Lisrelin veri düzenleme
aracıdır.
SIMPLIS: SimpleLisrel, Syntaxlar yardımı ile
analizleri yapmamızı sağlayan kolay
kullanımlı bir yazılımdır.








OPEN Seçeneği
*.pr2 uzantılı dosyalar PRELIS dosyaları
*.ls8 uzantılı dosyalar LISREL dosyaları
*.spl uzantılı dosyalar SIMPLIS dosyaları








IMPORT DATA IN FREE FORMAT Seçeneği
SPSS dosyaları gibi daha önce hazırlanmış
verileri Lisrelde görmemizi sağlar.

SPSSEX klasöründen Data100.sav dosyasını
açalım.




PRELIS’te SPSS data dosyası açtığımızda
sistem otomatik olarak Data100.psf dosyası
oluşturup kaydeder.








Ölçüm Birimi
Kullandığımız ölçüm birimi yapabileceğimiz
matematiksel işlemleri dolayısı ile istatistiksel
analizleri etkilemektedir.
Nominal: Kız-Erkek
Ortalama almanın, standart sapma
hesaplamanın bir anlamı yoktur.






Ölçüm Birimi
Ordinal: Okula karşı tutum, Tamamen
katılıyorum, …., Tamamen katılmıyorum

Aralarında sıralama olan kategorik verilerde
“Mann-Whitney U Test” gibi sıralamaya göre
hesaplama yapan testler kullanılır.






Ölçüm Birimi
Continuous: Öğrencilere verilen
notlar, Öğrencilerin boy uzunlukları

Bu tip veride ortalama ve standart sapma
hesaplamak artık anlamlıdır.






Ölçüm Birimi
Datamızda yer alan değişkenlerin
nominal,
ordinal veya
continuous
olup olmadığı LISREL’e girilmelidir.




Ölçüm Birimi







Veri Adetinin Sınırlanması
Lisrel otomatik olarak bir değişkendeki veri
sayısı 15ten az ise o veriyi “Ordinal”, 15ten
fazla ise o veriyi “Continuous” olarak
analizlere katmaktadır.
Bunun sebebi ise veri çeşiti 15ten fazla ise
Pearson Korelasyonu -1 ile +1 arasında
değişirken 15ten az ise -0,5 ile +0,5 arasında
değişmesidir.







Kayıp Data (Missing Data)
Ġstatistiksel veri analizi sonuçları kayıp
datadan etkilenmektedir.

Bu sebeple, kayıp datanın ne yapılacağına
karar verilmelidir.







Öncelikle kayıp datanın sebebi incelenmelidir.
◦ Veri girişi sırasında mı hata yapılmıştır?
◦ Kayıp data “random” mıdır?
◦ Kayıp data sistematik midir?










Listwise deletion and Pairwise deletion
metodları kullanılırsa veriden çok sayıda
“case” silinebilir ve örneklem sayısı ciddi
olarak azalabilir.








Mean Substitution yöntemi eğer çok az sayıda
kayıp değer var ise kullanılmalıdır.

Regression Imputation eğer orta seviyede
kayıp değer var ise kullanılmalıdır.






The maximum likelihood (EM algorithm) eğer
çok sayıda eksik varsa kullanılabilinir.
(Ama missingler random olmalı sistematik
olmamalı)






En çok tavsiye edilen ise: “Full Information
Maximum Likelihood” (FIML) metodu
kullanılarak LISREL hesaplamalarının
yapılmasıdır.


Kayıp Data (Missing Data) –
IMPUTATION ÖRNEĞĠ










TUTORIAL FOLDER
import Data in free format
Chollev.dat
3 Variables
Chollev.psf







Kayıp Data (Missing Data) – ÖRNEK
-9’lar missing olarak tanımlanmalı
(Save Edilmeli)






Kayıp Data (Missing Data) – ÖRNEK
Data screening kısmını kullanarak kontrol
ediniz.




Outliers



“Outliers” ortalama (mean) ve standart
sapmayı çok fazla etkilerler

◦ Data giriş hatası mı?
◦ Başka grupa ait bir data mı?
◦ “Outliers” ile diğer dataların arasındaki
boşluk, örneklem toplayarak kapatılabilinir mi?





Box and Whisker Plot
(Lisrel de çiziyor ama datayı 5 parçaya
bölüyor)




Doğrusallık (Linearity)
Değişkenler arası ilişkilerin lineer olması
beklenmektedir, “curvilinear” ilişkiler
korelasyonun sıfır çıkmasına sebep
olabilecektir.



Bu bakımdan değişkenler arası “scatterplot”
çizdirilebilinir.



Graph & Bivariate & ScatterPlot







Normallik
Genel olarak pek çok analiz yöntemi verilerin
normal dağılmasını varsaymaktadır
(Assumption)
Normal dağılmayan data durumlarında
“asymptotic covariance matrix” ile “covariance
matrix” birlikte kullanılması önerilmektedir.








Ġki değişken arasındaki ilişki, korelasyon veya
kovaryans istatistiksel hesaplamalarda önemli
bir yer tutmaktadır.
Korelasyon veya kovaryans hesaplaması
yapılırken değişkenlerin ölçüm birimi
(continuous, ordinal) dikkate alınmalıdır.
Continuous ve ordinal bir arada kullanılacak
ise “asymptotic covariance matrix”
kullanılmalıdır.

Y
1

1

2

2

3

3

4

4

5

5

6

5

7

4

8

3

9

2

10


X

1

r=0 ama veriler arasında aslında bir ilişki var

Y
8

2

10



3

9



X

1

Örneklem Hatası
Aynı datada r=-1


Y

Y

X

8

6

8

-

7

5

7

5

8

4

8

-

5

2

5

2

4

3

4

3

5

2

5

2

3

3

3

3

5

4

5

-

3

1

3

1

2


X

2

2

2

r=.782 p=.007; r=.659 p=.108

Y

9

1

9

7

2

7

3

5

3

5

4

3

4

3

5



X

2



Y

1



X

27

5

2

r=.524 p=.370; r=-.994 p=.001
Veri giriş hatası mı?
Örneklem tüm veriyi kapsamıyor mu?





Ġlk kural olarak, ne kadar çok örneklem o
kadar iyi analiz sonuçları diyebiliriz.
Lisrel analiz yapıldıktan sonra sağlıklı
sonuçlar elde edilmesi için tavsiye edilen
“Critical N” (Hoelter, 1983) değerini
raporlamaktadır.




Lisrel hesaplamaları yaparken
◦ Ġmplied Model (Tasarlanan Model)
◦ Saturated Model (Tam Model)
◦ Independence Model (Hiçbir parametre
hesaplanmayan model)

Kullanarak karşılaştırmalar yapmaktadır.


Eğer örneklem sayısı az ise “Saturated Model”
hesabı yapamayacağı için analizleri
gerçekleştiremez.




Çalışmalarımızı planlamadan örneklem sayısı
ile ilgili bazı hesaplamalar yaparak en az
sayıda örneklem ihtiyacını dikkate almalıyız.










En az 100-150 kişi olmalı
400 kişinin bile bazı durumlarda yeterli
olamayabileceğini söyleyenler de var.

En az değişken başına 10-20 kişi
Normal dağılan bir veri ise değişken başına 5
kişi yeterli olabilir (Bentler & Chou, 1987)




SEM analizlerinde genel olarak
“varyans-kovaryans” matrisi kullanılır.




Analizde input olarak kullanılabilecek
seçenekler
◦ Ham datayı Lisrele tanıtabilir (psf dosyası olarak)
(Program bu datadan kendisi kovaryans matrisi
üreterek analizlere devam eder)

◦ Korelasyon matrixi oluşturup syntaxta kullanabilir
(Prelis ile)
◦ Kovaryans matrixi oluşturup syntaxta kullanabilir
(Prelis ile)






Korelasyon matrisi kullanılırsa SEM
programları bu matrisi standart sapmaları
kullanarak kovaryans matrisine çevirirler.
Çünkü, korelasyon matrisinden elde edilen
parametre kestirimleri hatalı olabilir.








Model
Model
Model
Model
Model

Specification
Identification
Estimation
Testing
Modification






Veriler toplanmadan önce teorik bazda
modelin oluşturulmasıdır. (literatür taraması,
önceki yapılan çalışmalar, araştırma problemi
ışığında)

“Acaba bu oluşturulan model varyanskovaryans matrisi tarafından destekleniyor
mu?” sorusuna cevap analizler kısmında
aranacaktır.








Hangi değişkenleri modele alacaksınız?
Hangi değişkenleri modele almayacaksınız?
Hangi değişkenler bağımlı değişken?
Hangi değişkenler bağımsız değişken?
Değişkenler arasında nasıl ilişkiler olduğunu
öngörüyorsunuz?








Örneğin, X ve Y yüksek korelasyona sahip.
X mi Y’yi etkiliyor?
Y mi X’i etkiliyor?
Z mi X ve Y’yi etkiliyor?




Eğer, ilişkiler doğru tahmin edilerek kurulmaz
ise, model “hatalı” olacak ve toplanan veri ile
model “uyum” (fit) göstermeyecektir.






SEM analizlerinde parametre kestirimleri
yapılmadan önce “identification” problemi
çözülmelidir.
Toplanan veriler (kovaryans matrisi) ve
tanımlanan model kullanılarak belirlenmek
istenen parametreler tek bir şekilde (unique)
kestirilebilinir mi?










Örneğin, teorik model X+Y=bir sayı olsun.
Veriler de X+Y=10 olduğuna işaret etsin.
Çözüm X=5 ve Y= 5 olabilir, X=1 ve Y=9
olabilir.
Buradaki sorun, tek bir çözüm bulunmasına
yetecek kadar “sınırlama” (constraint)
olmamasıdır
X=1 olarak sabitlenerek, bu sorun
çözülebilinir.



SEM’de de benzer durumlar gözlenebilinir.
Model iyi tanımlanmamış ise “unique”
parametre kestirimi yapılamayabilinir, ve bu
durum bize hata mesajı olarak iletilir.




Modeldeki kestirilecek her parametre

◦ “free” (serbest) parametre
(değeri bilinmeyen ve bu değer kestirilecek
parametredir)
◦ “fixed” (sabitlenmiş) parametre
(değeri sabit bir değere sabitlenmiş, 0 veya 1
parametredir)
◦ “constrained” (sınırlandırılmış) parametre
(değeri bilinmeyen ve başka bir veya birden çok
parametrenin değerine eşitlenen parametredir)

olarak tanımlanır.




Model de bu tanımlamalar yapıldıktan sonra 3
durumla karşılaşılabilinir
◦ Model “underidentified”
Kovaryans matrisinden elde edilen bilgi sayısı,
kestirilecek parametre sayısından az ise
Bir veya daha fazla parametre “unique” olarak
kestirilemez
Degrees of freedom negatif.
SORUN VAR- “Constraint” eklenebilinir, bazı
değişkenler “fixed” edilebilinir.



◦ Model “justidentified”
kestirilecek parametre sayısına eşit ise
Degrees of freedom 0.
SORUN VAR- “Constraint” eklenebilinir, bazı
değişkenler “fixed” edilebilinir.




◦ Model “overidentified”
kestirilecek parametre sayısından fazla
Degrees of freedom pozitif.
SORUN YOK






Bir veri grubunda n tane değişken var ise,
toplam n.(n+1)/2 tane bilgi (varyans ve
covaryans) vardır.
Özetle, bu sayı hesaplanacak parametre
sayısından fazla olmalıdır.






Modeldeki parametreleri kestirmek için
birden fazla metot bulunmaktadır.
Parametre kestirim işlemindeki amaç,
Kurgulanan Modelin oluşturduğu kovaryans
matrisi ile Toplanan verinin oluşturduğu
kovaryans matrisi arasında en az fark bulacak
“fonksiyonun” kullanılmasıdır.








Yaygın olarak kullanılan kestirim metotları:
ML (Maximum Likelihood)
GLS (Generalized Least Square)
ULS (Ordinary Least Square)
WLS (Weighted Least Square)







ML (Maximum Likelihood)
Eğer gözlenen değişkenler sürekli ve çoklu
normal dağılım gösteriyorlar ise ML
kullanmak uygundur.
Lisrel aksi belirtilmedikçe ML kullanır.









WLS (Weighted Least Square)
Ordinal datalar var ise WLS kullanılabilinir.
Daha fazla örneklem gerekir.
Normal dağılım koşulu yoktur.

Asymptotic covariance matrix ile covariance
matrix birlikte kullanılmalıdır.








Parametre kestirimleri yapıldıktan sonra, elde
edilen verilerin oluşturulan modele ne
seviyede uyum gösterdiği
değerlendirilecektir.

“Teorik model veri ile ne ölçüde
desteklenmektedir?”




Burada 2 önemli değerlendirme yapılır.



Genel olarak modelin dataya uyumu nasıldır?



Elde edilen parametrelerin modele uyumu
nasıldır?




Genel olarak modelin dataya uyumu
değerlendirilirken, pek çok “uyum iyiliği” “fit”
indeksine bakılır.




Parametrelerin uyumu incelenirken
◦ Tahmin edilen parametre değerleri sıfırdan anlamlı
olarak farklı mı?
◦ Parametrenin işareti beklenen yönde mi?
◦ (Başarıyı artırması beklenen bir değişken + değere
mi sahip?)
◦ Parametre değerleri mantıklı mı?
◦ (varyanslar pozitif, korelasyonlar 1’den küçük mü)








Eğer modelin test edilmesinde elde edilen
değerler istenilen seviyede değil ise, modelin
modifiye edilmesi düşünülebilinir.
Kuramsal alt yapısı olan yeni ilişkiler
tanımlanabilir veya bazı ilişkiler
kaldırılabilinir.
Ardından elde edilen yeni model test edilir.








Diğer bir yöntem ise “residual” matrix
incelemektir.
Gözlenen Kovaryans Matrisi ile Kurgulanan
Modelin Kovaryans Matrisi arasındaki
farklardan oluşan matristir.
Bu farkların küçük olmasını bekleriz






Farkların büyük olması model ile veri arasında
ciddi bir uyumsuzluk olduğunu gösterir.
Ancak, sadece bir değişken için bu değerler
büyük ise o değişken ile ilgili sorunlar
olduğunu gösterir. O değişken incelenmeli,
kurgulanan ilişkiler gözden geçirilmelidir.






“Standardized Residual” Matrix kullanılırsa,
değerleri yorumlamak daha kolay olur.
Genel olarak 1.96’dan büyük standardized
residual değerleri olan değişkenler arası
uyumsuzluk vardır diye algılanır.




http://www.ssicentral.com/lisrel/techdocs/R
esiduals.pdf




Teorik bir model ile ilgili bir hipotez kurarız.



Data toplarız.



Bu model ile datanın uyumunu test ederiz.



Elde ettiğimiz fit (uyum) değerlerine göre
teorik modeli ya kabul ederiz, ya reddederiz.








A) Ġlk olarak significant (anlamlı) olmayan bir
ki-kare değeri bekleriz. Ki-kare değerinin
anlamlı olmaması matrixler arası farkın az
olması, yani modelin dataya uyumlu olduğu
demektir.
Ayrıca, RMSEA değeri gibi daha tutarlı bir
parametrenin 0.05’ten az olması iyi bir
uyumu göstermektedir.
Pekçok uyum iyiliği indisi bulunmaktadır.









B) Model uyumlu ise modeldeki her “path”in
(yol) ayrı ayrı t değerlerine bakarak anlamlı
olan ilişkileri (yol) belirleriz.
C) Anlamlı olan parametre değerlerinin
“büyüklüklerine” ve “yönlerine” bakarak
yorumlarız.
Anlamlı olmayan ilişkileri de yorumlayabiliriz.
Örneğin, televizyon izlenen saat ile başarı
arasında negatif bir ilişki bulmak garip olmaz.







Pek çok model fit indisi vardır.
Diğer istatistiksel analizlerde olduğu gibi bu
değerlerin bir dağılımı ve bu sebeple bir
anlamlılık değeri yoktur.
Her indis için kabul gören en az veya en çok
değerler vardır.


Model Fit Kriteri

Aldığı Değerler

Ġstenen Değer

Ki-kare

0 ve üzeri

Anlamlılık testine bakılır

Goodness of fit (GFI)

0-1 arası

0.95 ve üzeri

Adjusted GFI

0-1 arası

0.95 ve üzeri

Root Mean Square of
Approximation
(RMSEA)
Normed Fit Index
(NFI)

0.05 ve altı

0-1 arası

0.95 ve üzeri









Ki-kare değerini raporlayabilirsiniz ama kikare değeri örneklemden aşırı etkilenir.
Örneklem çok ise uyumu reddeder.
Örneklem az ise uyumu kabul eder.

Bu sebeple sadece ki-kare raporlamayınız,
diğer indislerle birlikte raporlayınız veya hiç
raporlamayınız.


Lisrel-İleri İstatistik

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (11)

Lisrel-İleri İstatistik