Faktorska analiza sajt

FAKTORSKA ANALIZA
LOGIKA
OSNOVNI POJMOVI
PRIMENA

• Realne sposobnosti i karakteristike antropološkog
statusa čoveka su latentnog (prikrivenog) karaktera, ne
mogu se direktno meriti.
• U istraživanju manifestne reakcije ispitanika mogu da
ukažu na određene karakteristike ili sposobnosti
čoveka, ali se ne mogu nikada poistovetiti sa realnim
merama tih sposobnosti.
• Broj mogućih manifestnih reakcija je praktično
beskonačan, pošto te reakcije zavise kako od
antropoloških sposobnosti i karakteristika ispitanika,
tako i od specifičnosti situacija merenja ili ocenjivanja.
• Definisanje zakonitosti moguće je samo na osnovu
poznavanja latentnih varijabli koje su generatori
manifestacija koje opažamo.

Kada istraživač pristupa istraživanju on:
• određuje domen, polje u kome će istraživati (npr.
snaga, izdržljivost, efikasnost igre itd.);
• definiše populaciju od interesa za istraživanje (deca,
odrasli, sportisti, radnici i sl.), pa iz nje izdvaja uzorak
entiteta na kome će realizovati istraživanje;
• kada je definisao domen i uzorak entiteta, istraživač
definiše manifestna svojstva koja želi da istražuje i
određuje merne instrumente koje će koristiti za njihovu
procenu (testove, mere, skale procene i sl.), odnosno
definiše uzorak mernih instrumenata;
• zatim sprovodi merenje, procenu, u svakom svojstvu
za svaki entitet uvršten u istraživanje.

• Tako dobijeni podaci imaju unutar svake manifestne
varijable određeni varijabilitet, koji odražava
individualne razlike između rezultata entiteta.
• Isto tako, u tim podacima se mogu uočiti i
korelacije, odnosno kovarijanse parova varijabli.
One mogu biti veće ili manje u zavisnosti od veličine
zajedničkog varijabiliteta parova varijabli.
• Na tom nivou posmatranja, mogu se uočiti samo
relacije parova varijabli (kovarijabiliteti), ne mogu se
sagledati neki složeniji odnosi između varijabli.
• Upravo u tome se ogleda uloga i teorijska osnova
metoda faktorske analize.

• U osnovi teorije faktorske analitike je tvrdnja da postoje
latentne (interne) varijable koje su generatori
manifestacija koje registrujemo procesom merenja.
• To su varijable koje ne možemo direktno meriti, ali se
one reflektuju i izražavaju kroz merenja manifestnih
varijabli, npr. motoričkih zadataka, stavki na upitniku.
• Latentne varijable su često samo hipotetski konstrukti
koji se formiraju da bi se objasnila egzistencija
određenih pojava, fenomena u prirodi i društvu.
• Npr. koristeći pojam izdržljivost u kineziologiji,
objašnjavamo pojavu dugotrajnog obavljanja neke
motoričke aktivnosti čoveka. I u drugim naukama je
prisutna pojava takvih konstrukata kao što je npr. u fizici
gravitacija (padanje objekata) ili magnetizam
(privlačenje objekata).

• Faktorska analiza je generičko ime za mnoštvo
procedura razvijenih sa svrhom analize odnosa i
stukture jednog skupa varijabli na osnovu njihovih
interkorelacija.
• Cilj faktorske analize je da se veliki broj
međusobno povezanih manifestnih varijabli
kondenzuje i redukuje u manji broj međusobno
relativno nezavisnih latentnih varijabli koje
mogu objasniti međusobne relacije analiziranog
skupa manifestnih varijabli.
• Izdvojene latentne varijable se smatraju
generatorima (uzrocima ili izvorima) varijacija i
kovarijacija manifestnih varijabli.

• Jedan od glavnih razloga za primenu faktorske
analize u nauci je tzv. zakon štednje (engl. Law
of Parsimony), odnosno zahtev za jednostavnim
rešenjem.
• Zahtev za parsimonijskim rešenjem problema
predstavlja zahtev da se veći broj manifestnih
varijabli objasni pomoću manjeg broja latentnih
varijabli, odnosno faktora.
• Stoga je i cilj faktorske analize da međusobnu
povezanost većeg broja varijabli objasni nekim
manjim brojem fundamentalnih ili latentnih
varijabli, odnosno izvora kovarijacija tih varijabli.

Primena metode faktorske analize:
• definisanje strukture prostora istraživanja;
• utvrđivanje valjanosti mernih instrumenata, kao i
stepen te valjanosti u odnosu na druge merne
instrumente koji procenjuju iste latentne dimenzije;
• poređenje strukture zajedničkog prostora
istraživanja za različite grupe ispitanika;
• u cilju dobijanja jedne kriterijske varijable,
odnosno vršenje redukcije celog ili dela sistema
primenjenih manifestnih varijabli (prostora
istraživanja) na prvu glavnu komponentu;
• korišćenje definisanih latentnih dimenzija za neke
druge statističke analize.

• Nakon izvršenih merenja pomoću n mernih
instrumenata (mere, procene, testovi) na nekom
uzorku od N ispitanika, sve dobijene informacije
(rezultati merenja ili procena) mogu da se
predstave jednom matricom u kojoj su svi vektori
ispitanika, odnosno svi vektori varijabli.
• Takva matrica predstavlja skup svih informacija
dobijenih merenjima u manifestnom prostoru,
pošto su se pojave i reakcije ispitanika direktno
merile.
• Elementi u toj matrici se transformišu u standardne
z-vrednosti, pa inicijalna matrica Z predstavlja
matricu standardizovanih rezultata.

• Svaki rezultat je produkt veličine uticaja onih faktora
koji se manifestuju kroz merenje i rezultate svakog
ispitanika u svakom tom faktoru. Ti se faktori nazivaju
zajednički faktori (common factor).
• Kako se ne može uvek predvideti uticaj svih faktora na
manifestnu reakciju koja se meri, postoji i specifičan
uticaj nekog faktora na pojedinu varijablu, što
nazivamo specifičnim faktorom.
• Pošto svaka operacija merenja nužno povlači i
određenu grešku, na rezultate u matrici deluje još
jedan faktor, koji se naziva faktor greške.
• Specifični faktor i faktor greške, čine unikni faktor,
koji pokazuje sa kolikom greškom se može predvideti
rezultat u nekoj manifestnoj varijabli ako su poznati
faktori koji utiču na manifestaciju te varijable.

• Varijabilitet u manifestnim varijablama je uzrokovan
najviše uticajem zajedničkih faktora, koji deluju na
varijabilitet unutar varijabli ali i na kovarijabilitet
(interkorelacije varijabli) u sistemu što čini
zajedničku varijansu.
• Uticaj specifičnog faktora je jednoznačno usmeren
na varijabilitet unutar određene varijable, te njegov
snažni uticaj umanjuje povezanost te varijable sa
drugima u sistemu (specificitet)
• Faktor greške je proizvod procesa merenja i on
direktno umanjuje kovarijabilitet varijabli.
• Pored toga na relacije u sistemu mogu uticati i razni
spoljni faktori, koji utiču i na zajedničke i specifične
faktore.



k
f
ikfjifij uaFaz
1
1
Rezultat u jedinoj varijabli za nekog ispitanika (Zij)
može se predstaviti linearnom sumacijom spomenutih
činioca, odnosno:
Gde je aif – koeficijent uticaja činioca f na varijablu i,
Ffj – rezultat ispitanika j u činiocu (faktoru) F koji utiče
na varijablu i,
ui – unikvitet za varijablu i.

Ako se ova jednačina generalizuje na ceo prostor
varijabli, koji je sadržan u matrici Z, onda se ona može
predstaviti kao:
Z = AF + U
gde je A – matrica koja sadrži sve koeficijente a,
F - matrica koja sadrži sve f (faktore),
U – dijagonalna matrica koja sadrži unikvitete
za odgovarajuće varijable.
Ovakav oblik rezultata u manifestnom prostoru
analiziranih varijabli poznat je pod imenom Generalni
linearni model ili Raov linearni model.

• Manifestne varijable se transformišu u
standardizovani oblik, gde je aritmetičak sredina
AS=0 a standardna devijacija s=1 ili varijansa
s2=1.
• Shodno tome i svi faktori su standardizovani,
normirani na jedan, imaju veličinu, odnosno
dužinu 1 a centrirani su na 0 (nulu).
• Distribucije više varijabli u zajedničkom prostoru
ponašaju se kao multivarijatno normalno
distribuirane.

Pri rešavanju istraživačkih problema pomoću
ovakvog linearnog modela najčešće se koriste
dve strategije :
1)Konfirmativna – ako su faktori koji deluju na
fenomen unapred poznati, ili je hipotetski
pretpostavljen njihov brij i struktura;
2)Eksplorativna – ako sistem faktora koji definišu
fenomen nije unapred poznat, što znači da nije
poznat ni njihov broj, a time ni realni naučni
smisao tog fenomena.

Pri formiranju uzorka mernih instrumenata
istraživanja, na osnovu kojih će se dobiti
odgovarajuće manifestne varijable, potrebno je:
• da svaki hipotetski faktor bude procenjen
sa najmanje tri varijable,
• da ceo sistem varijabli bude uravnotežen u
odnosu na faktore, kako bi se poštovao princip
homeostaze (uravnoteženosti).
Na taj način se svim hipotetskim faktorima ostavlja
mogućnost da se realno pojave, te da se ni jedan
posebno ne favorizuje viškom odgovarajućih
varijabli.

Šematski prikaz sistema manifestnih varijabli
koji nije uravnotežen (nejednak broj manifestnih
varijabli po faktoru)

Prilikom izbora načina na koji ćemo analizirati prostor
manifestnih varijabli, treba sagledati specifičnosti i
željenu valjanost i pouzdanost krajnjih rezultata
istraživanja. Na osnovu toga se odlučujemo za neki
model definisanja latentnih dimenzija. Najpoznatija su
ova dva modela:
1. komponentni model - analizira kompletan
varijabilitet manifestnih varijabli koristeći
neredukovanu matricu interkorelacija, gde su u
glavnoj dijagonali jedinice, matematički je stabilan i
ima jednoznačna rešenja, i
2. faktorski modeli - analiziraju redukovanu matricu
interkorelacija, gde su u glavnoj dijagonali na neki
način procenjene, valjane varijanse.

Definisanje što realnijih latentnih varijabli, zavisi od:
• izbora metode izdvajanja inicijalnih faktora;
• primene kriterijuma za određivanje broja značajnih
inicijalnih faktora (obično glavnih komponenti) na
osnovu matrice interkorelacija manifestnih varijabli, i
• izbora modela, metoda i tehnika rotacije inicijalnih
faktora.
Veoma važan problem je određivanje broja značajnih
faktora koji treba da objasne analizirani prostor. Treba
da se odredi najmanji rang matrice interkorelacija
varijabli u konkretnom istraživanju, kako bi se dobila
što jednostavnija struktura faktora u analiziranom
prostoru.

• Prvo je potrebno da se testira matrica
interkorelacija, da li je pogodna za faktorizaciju.
• To se radi određivanjem mere reprezentativnosti
tog skupa manifestnih varijabli (MSA engl. Measure
of Sampling Adequacy) , odnosno pomoću Bartlett-
ovog testa sfericiteta multivarijatne distribucije
analiziranog skupa varijabli.
• Još važnija provera je putem dobijanja informacije
o veličini determinante matrice interkorelacija.
Ukoliko je determinanta jednaka nuli, to znači da je
ta matrica singularna i da nije pogodna za
faktorizaciju.

Veoma je važno za istraživače da prepoznaju kada
mogu očekivati da determinanta korelacione matrice
može biti jednaka nuli:
• kada matrica ima dva jednaka reda ili kolone), to je
slučaj kada dva ili više ispitanika imaju potpuno iste
rezultate u svim varijablama, ili kada dve varijable
imaju iste korelacije sa ostalim varijablama;
• kada u analiziranoj matrici vektori vrste (entiteta)
među sobom, odnosno vektori-kolone (varijabli)
među sobom, nisu linearno nezavisni;
• u matrici koja treba da se analizira ne sme se pojaviti
varijabla koja je linearna kombinacija druge dve ili
više analiziranih varijabli.

Primeri prethodne stavke :
• sumacija rezultata više merenja istog testa kao
jedna varijabla i istovremeno rezultati merenja u
svakom izvođenju tog istog testa kao pojedinačne
varijable;
• neki izračunati indeks iz dve ili više varijabli, kao
jedna varijabla, te posebno te iste varijable;
• Izmereno ukupno vreme u nekoj aktivnosti kao jedna
varijabla i parcijalna vremena u raznim delovima iste
aktivnosti, kao posebne varijable;
• ukupan rezultat u atletskom ili gimnastičkom
višeboju, kao jedna varijabla, te rezultati u svakoj
pojedinačnoj disciplini tog višeboja, kao posebne
varijable);

• kada su svi elementi na nekom redu matrice jednaki
nuli;
• u praksi to je slučaj ako se ne ukloni vektor ispitanika
sa svim rezultatima koji su jednaki nuli, ili vektor
varijable u kome su svi rezultati merenja pomoću
odgovarajućeg testa jednaki nuli (što je slučaj kada
je motorički test toliko težak za analizirani uzorak
ispitanika da ga niko od ispitanika nije u stanju da
reši niti u najmanjoj predviđenoj mernoj jedinici tog
testa);
• kod korelacione matrice to je slučaj kada je neka
varijabla totalno nezavisna od svih preostalih, pa su
svi odgovarajući koeficijenti korelacije jednaki nuli.

Tipovi ekstrakcije inicijalnih faktora:
• metoda glavnih komponenti (PCA)
• metoda glavnih osovina (principal axes);
• metoda maksimalne verodostojnosti
(maximum likelihood);
• image faktorska analiza;
• alfa faktorska analiza;
• kanonička faktorska analiza;
• Antiimaž, tj. Harris-Kaiserova faktorska
analiza ... i mnoge druge.

• Sva navedena rešenja se primenjuju samo tokom
izdvajanja inicijalnih faktora.
• U faktorskoj analizi glavnih komponenti, inicijalnih
faktora ima onoliko koliko ima varijabli u sistemu.
• Dužine vektora varijabli i faktora se iskazuju njihovim
normama, odnosno korenom iz sume kvadriranih
faktorskih koeficijenata.
• Varijansa vektora varijable u faktorskom prostoru
naziva se kumunalitet i predstavlja sumu kvadriranih
faktorskih koeficijenata izolovanih značajnih faktora za
tu varijablu.
• Varijanse glavnih komponenti jednake su njihovim
karakterističnim korenima (lambdama,svojstvenim
vrednostima i predstavljaju sumu kvadriranih
koeficijenata svih varijabli na tom faktoru.

Matrica izolovanih značajnih komponenti
Kumunalitet – suma
kvadrata koeficijenata na
značajnim komponentama
Karaktristični koreni –
suma kvadrata koeficijenata
svih varijabli na jednoj
komponenti.

• U stvarnosti, interpretabilnih faktora je znatno manje.
Istraživači nastoje da dobiju što manje jakih, dobro
definisanih faktora (sa velikom varijansom).
• Ako su interkorelacije niske, faktorska analiza će težiti da
proizvede puno sitnih faktora. To je najčešće posledica
lošeg merenja, visokih grešaka pri uzorkovanju, loše
definisanih konstrukata, loših mernih postupaka itd.
• Osnovni problem u određivanju značajnog broja faktora,
sastoji se u mogućnosti da se preteranim brojem faktora
neki izdvojeni faktor definiše kao stvaran, a da je on
samo rezultat hiperfaktorizacije i da predstavlja specifični
ili možda faktor greške. Isto tako, moguće je da neki
faktor koji realno postoji isključimo zbog toga što je
izdvojen premali broj faktora.

• Dilema oko određivanja broja značajnih faktora
može da se reši upotrebom više različitih nezavisnih
kriterija za određivanje broja značajnih faktora, kako
bi se odredila makar donja i gornja granica broja
značajnih faktora.
• Svi kriterijumi za određivanje broja značajnih faktora
polaze od analize karakterističnih korenova
(eigenvalue) neredukovane matrice interkorelacija
manifestnih varijabli, tj. matrice sa potpunom
varijansom svake manifestne varijable koja iznosi 1.
• Postoji više načina za određivanje broja značajnih
inicijalnih faktora na osnovu odgovarajuće matrice
interkorelacija varijabli.

Prilikom određivanja broja značajnih faktora,
koristi se više prilaza.
1. Empirijski, na osnovu iskustva i hipotetske
postavke istraživača,
2. Na osnovu neke matematičko-statističke
logike i odgovarajućih dokaza,
3. Razmatranjem grafički prikazane distribucije
karakterističnih korenova matrice
interkorelacija primenjenih varijabli,
4. Paralelnom analizom.

U prvom prilazu su npr. postupci koji podrazumevaju:
• primenu hipotetskog ili željenog broja faktora (ta
mogućnost je i ugrađena u odgovarajuće kompjuterske
programe za faktorsku analizu);
• unapred određen željeni procenat ukupne količine
zajedničke varijanse (obično 75, 80, 85 ili čak 90%),
da bi se do te vrednosti prihvatali inicijalni faktori, koji
doprinose i delom objašnjavaju unapred određenu
varijansu celokupnog analiziranog prostora;
• izdvajanje jednog po jednog faktora, transformaciju
u planiranu poziciju, sve dok se svaki faktor može
smisleno interpretirati. Kada se naredni faktor ne može
interpretirati, prestaje se sa ekstrakcijom i zadržava
konačan broj interpretabilnih faktora.

U drugom prilazu postoji veći broj kriterijuma za
ekstrakciju značajnih faktora, čije su osnove različite
matematičke i statističke logike.
• Guttman-Kaiser-ov (GK) kriterijum koji kaže da se
zadrže svi inicijalni faktori čiji su karakteristični koreni
veći od 1 (λ>1). Njegova logika se zasniva na entropiji
matrice interkorelacija analiziranih varijabli u
standardizovanom obliku, odnosno na količini
informacija koju daje ta matrica. Najveću relativnu
količinu informacija (pozitivnu informatičku vrednost)
će davati samo oni faktori čija je varijansa veća od
izvornih varijabli. Smatra se da ovaj kriterijum određuje
gornju granicu broja značajnih faktora.

• Valjana varijansa analiziranog skupa manifestnih
varijabli je suma valjanih varijansi varijabli u tom skupu
(kvadrirani koeficijenti multiple korelacije jedne
varijable sa svim ostalima). Ovaj kriterijum daje donju
granicu broja značajnih faktora i nije ugrađen u SPSS
već se može naći u odgovarajućim makro
procedurama.
• Grafički prilaz (Scree-test Cattell-a,1966) se bazira na
analizi krivulje koja se dobije ako se u ortogonalnom
koordinatnom sistemu, čija ordinata predstavlja
vrednosti karakterističnih korenova a apscisa njihov
broj, nanesu karakteristični korenovi matrice
interkorelacija analiziranih varijabli s leva na desno u
opadajućem nizu.

Po Scree kriterijumu broj značajnih korenova je jednak
broju korenova koji se nalaze s leve strane krivulje tih
korenova do tačke kada ta krivulja počinje da monotono
opada (tačka infleksije – k na slici).

Četvrti prilaz je danas prilično popularna
“paralelna analiza”.
• Kreira se matrica podataka istog reda (broj rdova i
kolona) od slučajnih brojeva (eventualno iste
asimetrije, AS, SD...).
• Na toj matrici se uradi inicijalna Faktorska analiza,
pa se dobijeni karakteristični koreni (lambde)
prikažu paralelno sa stvarnim.
• Zadržavaju se samo oni stvarni karakteristični
koreni koje su veći od tako kreiranih korenova.
• Macro paralel i rawpar.
• MonteCarlo PC procedura (program)

VARIJAB
LE
V1 V2 V3 . . . Vn
V1 1,00 r1,2 r1,3 . . . r1,n
V2 r2,1 1,00 r2,3 . . . r2,n
V3 r3,1 r3,2 1,00 . . . r3,n
. . . . . . . .
. . . . . . . .
. . . . . . . .
Vn rn,1 rn,2 rn,3 . . . 1,00
Broj koeficijenata korelacija je n(n-1)/2
U faktorskoj analizi polazna je matrica interkorelacija varijabli.
U komponentnoj metodi to je kvadratna matrica sa 1 u
glavnoj dijagonali (neredukovana matrica). Ispod i iznad
glavne dijagonale nalaze se isti koeficijenti korelacija parova
varijabli.

Jedna varijabla u prostoru dva faktora ima dve važne
vrednosti: ortogonalnu projekciju – koeficijent korelacije sa
faktorom i kosu projekciju – koeficijent opterećenja,
zasićenja.

Metoda glavnih komponenti se najčešće koristi u
dva osnovna slučaja:
1) kada se želi izvršiti redukcija
nekog sistema varijabli na jednu
dimenziju, prvu glavnu
komponentu (H1), koja sadrži
najveću količinu informacija koja
se može izdvojiti iz tog sistema
varijabli. Tada se dobija samo
matrica težinskih koeficijenata sa
prvom glavnom komponentom.
Najveći koeficijenti (h) ukazuju
na varijable koje su najvažnije za
definisanje komponente.

2) U svhu određivanja početnog koordinatnog sistema vektora
manifestnih varijabli, sa ograničenim brojem komponenti,
koji će zatim biti transformisan u pogodniji ortogonalni ili
kosi koordinatni sistem, koji zadovoljava princip parsimonije
(jednostavne strukture).

METODE ROTACIJE FAKTORA U SPSS-u
ORTOGONALNE ROTACIJE
• Varimax (Kaiser (1958) - metoda rotacije koja
minimizira broj varijabli koje imaju opterećenje na
svakom faktoru. Ova metoda pojednostavljuje
interpretaciju faktora.
• Quartimax - rotacija koja minimizira broj faktora
potrebnih za objašnjenje svake varijable.
• Eqimax - rotacija koja je kombinacija metode varimax
koja pojednostavljuje faktore i metode quartimax koja
pojednostavljuje varijable. Minimizira se broj varijabli
koje imaju visoka opterećenja na neki faktor i broj
faktora potrebnih za objašnjenje neke varijable.

KOSE ROTACIJE
• Direktni oblimin (Jennrich i Sampson, 1966) -
metoda kose (nonorthogonal) rotacije. Kada je delta
jednaka 0 (zadana vrednost), rešenja su najkosija.
Kako delta postaje negativnija, faktori postaju manje
kosi. Da biste nadjačali zadanu deltu od 0, unesite
broj koji je manji ili jednak 0,8.
• Promax (Hendrickson i White, 1964) - kosa rotacija
koja omogućava korelaciju faktora. Ova rotacija se
može izračunati brže od direktne oblimin rotacije, tako
da je korisna za velike skupove podataka.

Ortogonalna rotacija - znači da nema povezanosti među
faktorima, što nije realna situacija u kineziologiji.
Faktori su ortogonalni i
projektovani su van
snopova varijabli
Faktori su ortogonalni i
rotirani tako da se približe
najgušćim snopovima varijabli

Kosa rotacija - znači da postoji povezanost između faktora,
što je slučaj u kineziologiji. Inicijalni faktori se rotiraju tako da
zahvate što gušće snopove vektora varijabli.

• Početna korelaciona natrica se transformiše u matricu
komponenti (Component Matrix), koja sadrži faktorske
koeficijente skupa varijabli koji se analizira. Prva
komponenta nosi najveći procenat varijanse a svaka
sledeća manji procenat jer se izdvajaju iz preostale
varijanse. Ona ne služi za interpretaciju strukture
analiziranog skupa varijabli već je polazna za delju
transformaciju i izračunavanja.
• Kad su faktori ortogonalni, onda za tumačenje postoji
jedna matrica, matrica strukture izolovanih faktora.
• Kad su faktori korelirani, postoje tri matrice:
• Matrica sklopa, paralelnih projekcije, koje su
ekvivalentni regresionim koeficijentima (A matrica).
• Matrica strukture, ortogonalne projekcije, čiji su
elementi korelacije varijable i faktora (F matrica), i
• Matrica faktorskih interkorelacija (M matrica)

Kada su faktori korelirani mogu se odrediti i faktori višeg reda,
faktorizacijom faktorskih skorova, odnosno rezultata
ispitanika na faktorima. To je moguće raditi i do dobijanja
jednog, generalnog faktora (g).

• U našoj praksi najčešća kombinacija je primena metode
glavnih komponenti za određivanje inicijalnih faktora, zatim
određivanje broja značajnih faktora primenom G-K kriterijuma
i kosa rotacija (promax, direktni oblimin) faktora za dobijanje
jednostavnog i intepretabilnog rešenja.
• Međutim, zato što je najčešće, ne znači da je i najbolje i
jedino dobro. Potrebno je tražiti pravo rešenje primenom
većeg broja metoda i tehnika.
• Postoji sugestija da se za ekstrakciju koristi faktorska analiza
u užem smislu:
• Maksimalna verodostojnost (maximum licelihood) kada su
podaci uredni (dobar uzorak i normalna distribuiranost)
• Glavne komponente (principal components) kada to nije
slučaj
Neke praktične sugestije – koja metoda

Neke praktične sugestije – koja metoda
• Metoda maksimalne verodostojnosti je tehnika ocene
parametara, u ovom slučaju faktorskih opterećenja, a
sa ciljem što bolje reprodukcije početne korelacione
matrice.
• Metoda glavnih komponenti je tehnika dekompozicije
varijanse, u tom smislu da svaka komponenta
objašnjava najveći deo preostale varijanse i da je
ortogonalna na prethodne.
• Ona je primerenija za redukciju podataka ali nije
pouzdana kada su mali kumunaliteti varijabli i mali broj
varijabli po faktoru. Obično obuhvata veći % varijanse i
daje veća opterećenja, što može rezultovati unakrsnim
opterećenjima (pojava većih opterećenja na dva ili
više faktora) i slabijom strukturom .

Neke praktične sugestije – broj faktora
• Pokazano je da G-K kriterijum vrlo često daje
veći broj faktora, u najmanje 30% slučajeva, ali je
lak za primenu i može poslužiti kao početni
kriterijum.
• Sugestija je da se sa njim koristi Cattellov grafički
kriterijum (scree test). Traži se „koleno“ (tačka
infleksije) u krivoj i zadržavaju se korenovi koji su
iznad tog kolena.
• Ako postoji očekivani, teorijski broj faktora,
preporučuje se da se proba sa njim, pa sa scree
testom, pa sa jednim faktorom više i jednim
faktorom manje.

Neke praktične sugestije – rotacija faktora
• Ekstrakcija inicijalnih faktora nije konačno rešenje.
Potrebno je uraditi rotaciju faktora kako bi se dobilo
jednostavno rešenje i mogla interpretirati struktura
prostora koji se analizira.
• Kada se žele odrediti nezavisni faktori, koji
zadržavaju ortogonalnost (nisu u korelaciji),
najčešće se primenjuje Varimax rotacija glavnih
komponenti. Ređe se koristi u analizi motoričkog
prostora.
• Kada se očekuju faktori za koje znamo da mogu
biti u korelaciji, koristi se neka od kosih rotacija,
najčešće Promax ili Direct oblimin.

Neke praktične sugestije – rotacija faktora
• Postoji mišljenje da ortogonalne rotacije bolje služe
sređivanju našeg znanja, a kose opisivanju
stvarnosti.
• Zato što kad želimo da znamo, želimo da imamo
jasno razdvojene konstrukte, a korelirani konstrukti
nisu jasno razdvojeni.
• Ortogonalne rotacije su prirodne za slučaj kada
želimo da obavimo redukciju podataka na manji
skup nekoreliranih faktora, npr. da izbegnemo
multikolinearnost u regresiji i sličnim tehnikama.
• Kose rotacije su, s druge strane, realnije za našu
praksu i dozvoljavaju dalju analizu relacija samih
faktora.

Neke praktične sugestije – interpretacija faktora
• Nijedan faktor ne sme imati manje od tri visoka
opterećenja;
• Nijedno visoko opterećenje na faktoru ne sme biti
manje od 0,30;
• Faktor koji ima najmanje 5 visokih opterećenja (preko
0,50) je dobar faktor;
• Ako varijable imaju unakrsna opterećenja (ista varijabla
ima opterećenje veće od 0,30 na više faktora), to nije
dobro faktorsko rešenje.
• Ako je komunalitet manji od 0,40, može se sumnjati da
ta varijabla ne pripada skupu, ili da je rešenje
podfaktorisano. Komunalitet je zapravo korelacija
varijable sa svim zadržanim faktorima (analogno R2 i R
iz višestruke regresije).

Za orijentaciju, postoji sledeća sugestija za
faktorska opterećenja u apsolutnoj vrednosti:
> 0,70 su odlična
> 0,60 < 0,70 su vrlo dobra
> 0,55 < od 0,60 su dobra
> 0,45 < 0,55 dovoljna
> 0,30 < 45 jedva dovoljna
< 0,30 nedovoljna
Ove granične vrednosti su arbitrarne i ne mogu
se uzeti zdravo za gotovo.

• Ne postoji saglasnost oko toga čemu treba dati
prvenstvo, matrici sklopa ili matrici strukture.
• Klasična sugestija autora FA je da se:
• za interpretaciju faktora koristi matrica sklopa i matrica
korelacija faktora,
• a za interpretaciju varijabli koristi matrica strukture i
matrica korelacija faktora.
• Ako se faktorska opterećenja kvadriraju i pomnože sa
100 dobije se približna slika o tome koliko % ta varijabla
doprinosi datom faktoru.
• Ako se korelacije u matrici strukture kvadriraju i pomnože
sa 100 dobije se približna slika o tome koliko % taj faktor
učestvuje u varijansi neke varijable.
• Ipak, matrica sklopa ima prostiju strukturu, pa je lakša za
interpretaciju i najčešće se koristi.

Kada su podaci pogodni za Faktorsku analizu
• Uzorak slučajeva ne sme biti previše mali;
• Odnos broja ispitanika prema broju varijabli ne bi
trebao biti manji od 5:1, a nikako manji od 3:1, jer se ne
zna unapred kvalitet podataka;
• Greške merenja ne smeju biti previše velike;
• Podaci moraju biti dobro strukturisani, da ih objašnjava
nekoliko jakih faktora;
• Čak i kad je odnos 20:1 i kad su podaci dobro
strukturisani, moguća su pogrešna razvrstavanja
varijabli na faktore;
• Visok MSA (adekvatnost uzorka varijabli);
• Značajan Bartlett-ov test sferičnosti;
• Varijable treba da imaju visoke komunalitete.

Kakva mora biti priroda podataka
• Kao i sve multivarijatne analize, FA zahteva
multivarijatno raspodeljene varijable. To znači da su
sve varijable kvantitativne, kontinualne i linearno
povezane.
• Šta raditi sa kategorijalnim podacima, pre svega sa
ordinalnim i dihotomnim?
• Decenijama je trajala debata o tome da li binarne
varijable (obično ajteme) analizirati preko r
koeficijenta, ili nekog prilagođenog
• Uglavnom, običan r je dovoljno dobar.
• Sa rtet (tetrahonični koeficijent korelacije) je stvar
drukčija, jer on ima korekciju asimetričnosti distribucija.
• U praksi, kategorijalni i ordinalni podaci se ne mogu
izbeći, a iskustvo govori da se mogu analizirati
standardnim multivarijatnim analizama.

LITERATURA:
• Dizdar, D. (2006). Kvantitativne metode. Zagreb:
Kineziološki fakultet Sveučilišta u Zagrebu.
• Fulgosi, A. (1984). Faktorska analiza. Zagreb:
Školska knjiga.
• Fajgelj, S. (2005). Podsetnik za multivarijatnu
analizu individualnih razlika. U S. Fajgelj,
Psihometrija, str. 631-674.
• Bala, G. (2010). Metodologija kineziometrijskih
istraživanja. Novi Sad: Fakultet sporta i fizičkog
vaspitanja.
• http://www.statsoft.com/textbook/stathome.html

Faktorska analiza sajt

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Faktorska analiza sajt