SlideShare a Scribd company logo
1 of 55
FAKTORSKA ANALIZA
LOGIKA
OSNOVNI POJMOVI
PRIMENA
• Realne sposobnosti i karakteristike antropološkog
statusa čoveka su latentnog (prikrivenog) karaktera, ne
mogu se direktno meriti.
• U istraživanju manifestne reakcije ispitanika mogu da
ukažu na određene karakteristike ili sposobnosti
čoveka, ali se ne mogu nikada poistovetiti sa realnim
merama tih sposobnosti.
• Broj mogućih manifestnih reakcija je praktično
beskonačan, pošto te reakcije zavise kako od
antropoloških sposobnosti i karakteristika ispitanika,
tako i od specifičnosti situacija merenja ili ocenjivanja.
• Definisanje zakonitosti moguće je samo na osnovu
poznavanja latentnih varijabli koje su generatori
manifestacija koje opažamo.
Kada istraživač pristupa istraživanju on:
• određuje domen, polje u kome će istraživati (npr.
snaga, izdržljivost, efikasnost igre itd.);
• definiše populaciju od interesa za istraživanje (deca,
odrasli, sportisti, radnici i sl.), pa iz nje izdvaja uzorak
entiteta na kome će realizovati istraživanje;
• kada je definisao domen i uzorak entiteta, istraživač
definiše manifestna svojstva koja želi da istražuje i
određuje merne instrumente koje će koristiti za njihovu
procenu (testove, mere, skale procene i sl.), odnosno
definiše uzorak mernih instrumenata;
• zatim sprovodi merenje, procenu, u svakom svojstvu
za svaki entitet uvršten u istraživanje.
• Tako dobijeni podaci imaju unutar svake manifestne
varijable određeni varijabilitet, koji odražava
individualne razlike između rezultata entiteta.
• Isto tako, u tim podacima se mogu uočiti i
korelacije, odnosno kovarijanse parova varijabli.
One mogu biti veće ili manje u zavisnosti od veličine
zajedničkog varijabiliteta parova varijabli.
• Na tom nivou posmatranja, mogu se uočiti samo
relacije parova varijabli (kovarijabiliteti), ne mogu se
sagledati neki složeniji odnosi između varijabli.
• Upravo u tome se ogleda uloga i teorijska osnova
metoda faktorske analize.
• U osnovi teorije faktorske analitike je tvrdnja da postoje
latentne (interne) varijable koje su generatori
manifestacija koje registrujemo procesom merenja.
• To su varijable koje ne možemo direktno meriti, ali se
one reflektuju i izražavaju kroz merenja manifestnih
varijabli, npr. motoričkih zadataka, stavki na upitniku.
• Latentne varijable su često samo hipotetski konstrukti
koji se formiraju da bi se objasnila egzistencija
određenih pojava, fenomena u prirodi i društvu.
• Npr. koristeći pojam izdržljivost u kineziologiji,
objašnjavamo pojavu dugotrajnog obavljanja neke
motoričke aktivnosti čoveka. I u drugim naukama je
prisutna pojava takvih konstrukata kao što je npr. u fizici
gravitacija (padanje objekata) ili magnetizam
(privlačenje objekata).
• Faktorska analiza je generičko ime za mnoštvo
procedura razvijenih sa svrhom analize odnosa i
stukture jednog skupa varijabli na osnovu njihovih
interkorelacija.
• Cilj faktorske analize je da se veliki broj
međusobno povezanih manifestnih varijabli
kondenzuje i redukuje u manji broj međusobno
relativno nezavisnih latentnih varijabli koje
mogu objasniti međusobne relacije analiziranog
skupa manifestnih varijabli.
• Izdvojene latentne varijable se smatraju
generatorima (uzrocima ili izvorima) varijacija i
kovarijacija manifestnih varijabli.
• Jedan od glavnih razloga za primenu faktorske
analize u nauci je tzv. zakon štednje (engl. Law
of Parsimony), odnosno zahtev za jednostavnim
rešenjem.
• Zahtev za parsimonijskim rešenjem problema
predstavlja zahtev da se veći broj manifestnih
varijabli objasni pomoću manjeg broja latentnih
varijabli, odnosno faktora.
• Stoga je i cilj faktorske analize da međusobnu
povezanost većeg broja varijabli objasni nekim
manjim brojem fundamentalnih ili latentnih
varijabli, odnosno izvora kovarijacija tih varijabli.
Primena metode faktorske analize:
• definisanje strukture prostora istraživanja;
• utvrđivanje valjanosti mernih instrumenata, kao i
stepen te valjanosti u odnosu na druge merne
instrumente koji procenjuju iste latentne dimenzije;
• poređenje strukture zajedničkog prostora
istraživanja za različite grupe ispitanika;
• u cilju dobijanja jedne kriterijske varijable,
odnosno vršenje redukcije celog ili dela sistema
primenjenih manifestnih varijabli (prostora
istraživanja) na prvu glavnu komponentu;
• korišćenje definisanih latentnih dimenzija za neke
druge statističke analize.
• Nakon izvršenih merenja pomoću n mernih
instrumenata (mere, procene, testovi) na nekom
uzorku od N ispitanika, sve dobijene informacije
(rezultati merenja ili procena) mogu da se
predstave jednom matricom u kojoj su svi vektori
ispitanika, odnosno svi vektori varijabli.
• Takva matrica predstavlja skup svih informacija
dobijenih merenjima u manifestnom prostoru,
pošto su se pojave i reakcije ispitanika direktno
merile.
• Elementi u toj matrici se transformišu u standardne
z-vrednosti, pa inicijalna matrica Z predstavlja
matricu standardizovanih rezultata.
• Svaki rezultat je produkt veličine uticaja onih faktora
koji se manifestuju kroz merenje i rezultate svakog
ispitanika u svakom tom faktoru. Ti se faktori nazivaju
zajednički faktori (common factor).
• Kako se ne može uvek predvideti uticaj svih faktora na
manifestnu reakciju koja se meri, postoji i specifičan
uticaj nekog faktora na pojedinu varijablu, što
nazivamo specifičnim faktorom.
• Pošto svaka operacija merenja nužno povlači i
određenu grešku, na rezultate u matrici deluje još
jedan faktor, koji se naziva faktor greške.
• Specifični faktor i faktor greške, čine unikni faktor,
koji pokazuje sa kolikom greškom se može predvideti
rezultat u nekoj manifestnoj varijabli ako su poznati
faktori koji utiču na manifestaciju te varijable.
• Varijabilitet u manifestnim varijablama je uzrokovan
najviše uticajem zajedničkih faktora, koji deluju na
varijabilitet unutar varijabli ali i na kovarijabilitet
(interkorelacije varijabli) u sistemu što čini
zajedničku varijansu.
• Uticaj specifičnog faktora je jednoznačno usmeren
na varijabilitet unutar određene varijable, te njegov
snažni uticaj umanjuje povezanost te varijable sa
drugima u sistemu (specificitet)
• Faktor greške je proizvod procesa merenja i on
direktno umanjuje kovarijabilitet varijabli.
• Pored toga na relacije u sistemu mogu uticati i razni
spoljni faktori, koji utiču i na zajedničke i specifične
faktore.


k
f
ikfjifij uaFaz
1
1
Rezultat u jedinoj varijabli za nekog ispitanika (Zij)
može se predstaviti linearnom sumacijom spomenutih
činioca, odnosno:
Gde je aif – koeficijent uticaja činioca f na varijablu i,
Ffj – rezultat ispitanika j u činiocu (faktoru) F koji utiče
na varijablu i,
ui – unikvitet za varijablu i.
Ako se ova jednačina generalizuje na ceo prostor
varijabli, koji je sadržan u matrici Z, onda se ona može
predstaviti kao:
Z = AF + U
gde je A – matrica koja sadrži sve koeficijente a,
F - matrica koja sadrži sve f (faktore),
U – dijagonalna matrica koja sadrži unikvitete
za odgovarajuće varijable.
Ovakav oblik rezultata u manifestnom prostoru
analiziranih varijabli poznat je pod imenom Generalni
linearni model ili Raov linearni model.
• Manifestne varijable se transformišu u
standardizovani oblik, gde je aritmetičak sredina
AS=0 a standardna devijacija s=1 ili varijansa
s2=1.
• Shodno tome i svi faktori su standardizovani,
normirani na jedan, imaju veličinu, odnosno
dužinu 1 a centrirani su na 0 (nulu).
• Distribucije više varijabli u zajedničkom prostoru
ponašaju se kao multivarijatno normalno
distribuirane.
Pri rešavanju istraživačkih problema pomoću
ovakvog linearnog modela najčešće se koriste
dve strategije :
1)Konfirmativna – ako su faktori koji deluju na
fenomen unapred poznati, ili je hipotetski
pretpostavljen njihov brij i struktura;
2)Eksplorativna – ako sistem faktora koji definišu
fenomen nije unapred poznat, što znači da nije
poznat ni njihov broj, a time ni realni naučni
smisao tog fenomena.
Pri formiranju uzorka mernih instrumenata
istraživanja, na osnovu kojih će se dobiti
odgovarajuće manifestne varijable, potrebno je:
• da svaki hipotetski faktor bude procenjen
sa najmanje tri varijable,
• da ceo sistem varijabli bude uravnotežen u
odnosu na faktore, kako bi se poštovao princip
homeostaze (uravnoteženosti).
Na taj način se svim hipotetskim faktorima ostavlja
mogućnost da se realno pojave, te da se ni jedan
posebno ne favorizuje viškom odgovarajućih
varijabli.
Šematski prikaz sistema manifestnih varijabli
koji nije uravnotežen (nejednak broj manifestnih
varijabli po faktoru)
Prilikom izbora načina na koji ćemo analizirati prostor
manifestnih varijabli, treba sagledati specifičnosti i
željenu valjanost i pouzdanost krajnjih rezultata
istraživanja. Na osnovu toga se odlučujemo za neki
model definisanja latentnih dimenzija. Najpoznatija su
ova dva modela:
1. komponentni model - analizira kompletan
varijabilitet manifestnih varijabli koristeći
neredukovanu matricu interkorelacija, gde su u
glavnoj dijagonali jedinice, matematički je stabilan i
ima jednoznačna rešenja, i
2. faktorski modeli - analiziraju redukovanu matricu
interkorelacija, gde su u glavnoj dijagonali na neki
način procenjene, valjane varijanse.
Definisanje što realnijih latentnih varijabli, zavisi od:
• izbora metode izdvajanja inicijalnih faktora;
• primene kriterijuma za određivanje broja značajnih
inicijalnih faktora (obično glavnih komponenti) na
osnovu matrice interkorelacija manifestnih varijabli, i
• izbora modela, metoda i tehnika rotacije inicijalnih
faktora.
Veoma važan problem je određivanje broja značajnih
faktora koji treba da objasne analizirani prostor. Treba
da se odredi najmanji rang matrice interkorelacija
varijabli u konkretnom istraživanju, kako bi se dobila
što jednostavnija struktura faktora u analiziranom
prostoru.
• Prvo je potrebno da se testira matrica
interkorelacija, da li je pogodna za faktorizaciju.
• To se radi određivanjem mere reprezentativnosti
tog skupa manifestnih varijabli (MSA engl. Measure
of Sampling Adequacy) , odnosno pomoću Bartlett-
ovog testa sfericiteta multivarijatne distribucije
analiziranog skupa varijabli.
• Još važnija provera je putem dobijanja informacije
o veličini determinante matrice interkorelacija.
Ukoliko je determinanta jednaka nuli, to znači da je
ta matrica singularna i da nije pogodna za
faktorizaciju.
Veoma je važno za istraživače da prepoznaju kada
mogu očekivati da determinanta korelacione matrice
može biti jednaka nuli:
• kada matrica ima dva jednaka reda ili kolone), to je
slučaj kada dva ili više ispitanika imaju potpuno iste
rezultate u svim varijablama, ili kada dve varijable
imaju iste korelacije sa ostalim varijablama;
• kada u analiziranoj matrici vektori vrste (entiteta)
među sobom, odnosno vektori-kolone (varijabli)
među sobom, nisu linearno nezavisni;
• u matrici koja treba da se analizira ne sme se pojaviti
varijabla koja je linearna kombinacija druge dve ili
više analiziranih varijabli.
Primeri prethodne stavke :
• sumacija rezultata više merenja istog testa kao
jedna varijabla i istovremeno rezultati merenja u
svakom izvođenju tog istog testa kao pojedinačne
varijable;
• neki izračunati indeks iz dve ili više varijabli, kao
jedna varijabla, te posebno te iste varijable;
• Izmereno ukupno vreme u nekoj aktivnosti kao jedna
varijabla i parcijalna vremena u raznim delovima iste
aktivnosti, kao posebne varijable;
• ukupan rezultat u atletskom ili gimnastičkom
višeboju, kao jedna varijabla, te rezultati u svakoj
pojedinačnoj disciplini tog višeboja, kao posebne
varijable);
• kada su svi elementi na nekom redu matrice jednaki
nuli;
• u praksi to je slučaj ako se ne ukloni vektor ispitanika
sa svim rezultatima koji su jednaki nuli, ili vektor
varijable u kome su svi rezultati merenja pomoću
odgovarajućeg testa jednaki nuli (što je slučaj kada
je motorički test toliko težak za analizirani uzorak
ispitanika da ga niko od ispitanika nije u stanju da
reši niti u najmanjoj predviđenoj mernoj jedinici tog
testa);
• kod korelacione matrice to je slučaj kada je neka
varijabla totalno nezavisna od svih preostalih, pa su
svi odgovarajući koeficijenti korelacije jednaki nuli.
Tipovi ekstrakcije inicijalnih faktora:
• metoda glavnih komponenti (PCA)
• metoda glavnih osovina (principal axes);
• metoda maksimalne verodostojnosti
(maximum likelihood);
• image faktorska analiza;
• alfa faktorska analiza;
• kanonička faktorska analiza;
• Antiimaž, tj. Harris-Kaiserova faktorska
analiza ... i mnoge druge.
• Sva navedena rešenja se primenjuju samo tokom
izdvajanja inicijalnih faktora.
• U faktorskoj analizi glavnih komponenti, inicijalnih
faktora ima onoliko koliko ima varijabli u sistemu.
• Dužine vektora varijabli i faktora se iskazuju njihovim
normama, odnosno korenom iz sume kvadriranih
faktorskih koeficijenata.
• Varijansa vektora varijable u faktorskom prostoru
naziva se kumunalitet i predstavlja sumu kvadriranih
faktorskih koeficijenata izolovanih značajnih faktora za
tu varijablu.
• Varijanse glavnih komponenti jednake su njihovim
karakterističnim korenima (lambdama,svojstvenim
vrednostima i predstavljaju sumu kvadriranih
koeficijenata svih varijabli na tom faktoru.
Matrica izolovanih značajnih komponenti
Kumunalitet – suma
kvadrata koeficijenata na
značajnim komponentama
Karaktristični koreni –
suma kvadrata koeficijenata
svih varijabli na jednoj
komponenti.
• U stvarnosti, interpretabilnih faktora je znatno manje.
Istraživači nastoje da dobiju što manje jakih, dobro
definisanih faktora (sa velikom varijansom).
• Ako su interkorelacije niske, faktorska analiza će težiti da
proizvede puno sitnih faktora. To je najčešće posledica
lošeg merenja, visokih grešaka pri uzorkovanju, loše
definisanih konstrukata, loših mernih postupaka itd.
• Osnovni problem u određivanju značajnog broja faktora,
sastoji se u mogućnosti da se preteranim brojem faktora
neki izdvojeni faktor definiše kao stvaran, a da je on
samo rezultat hiperfaktorizacije i da predstavlja specifični
ili možda faktor greške. Isto tako, moguće je da neki
faktor koji realno postoji isključimo zbog toga što je
izdvojen premali broj faktora.
• Dilema oko određivanja broja značajnih faktora
može da se reši upotrebom više različitih nezavisnih
kriterija za određivanje broja značajnih faktora, kako
bi se odredila makar donja i gornja granica broja
značajnih faktora.
• Svi kriterijumi za određivanje broja značajnih faktora
polaze od analize karakterističnih korenova
(eigenvalue) neredukovane matrice interkorelacija
manifestnih varijabli, tj. matrice sa potpunom
varijansom svake manifestne varijable koja iznosi 1.
• Postoji više načina za određivanje broja značajnih
inicijalnih faktora na osnovu odgovarajuće matrice
interkorelacija varijabli.
Prilikom određivanja broja značajnih faktora,
koristi se više prilaza.
1. Empirijski, na osnovu iskustva i hipotetske
postavke istraživača,
2. Na osnovu neke matematičko-statističke
logike i odgovarajućih dokaza,
3. Razmatranjem grafički prikazane distribucije
karakterističnih korenova matrice
interkorelacija primenjenih varijabli,
4. Paralelnom analizom.
U prvom prilazu su npr. postupci koji podrazumevaju:
• primenu hipotetskog ili željenog broja faktora (ta
mogućnost je i ugrađena u odgovarajuće kompjuterske
programe za faktorsku analizu);
• unapred određen željeni procenat ukupne količine
zajedničke varijanse (obično 75, 80, 85 ili čak 90%),
da bi se do te vrednosti prihvatali inicijalni faktori, koji
doprinose i delom objašnjavaju unapred određenu
varijansu celokupnog analiziranog prostora;
• izdvajanje jednog po jednog faktora, transformaciju
u planiranu poziciju, sve dok se svaki faktor može
smisleno interpretirati. Kada se naredni faktor ne može
interpretirati, prestaje se sa ekstrakcijom i zadržava
konačan broj interpretabilnih faktora.
U drugom prilazu postoji veći broj kriterijuma za
ekstrakciju značajnih faktora, čije su osnove različite
matematičke i statističke logike.
• Guttman-Kaiser-ov (GK) kriterijum koji kaže da se
zadrže svi inicijalni faktori čiji su karakteristični koreni
veći od 1 (λ>1). Njegova logika se zasniva na entropiji
matrice interkorelacija analiziranih varijabli u
standardizovanom obliku, odnosno na količini
informacija koju daje ta matrica. Najveću relativnu
količinu informacija (pozitivnu informatičku vrednost)
će davati samo oni faktori čija je varijansa veća od
izvornih varijabli. Smatra se da ovaj kriterijum određuje
gornju granicu broja značajnih faktora.
• Valjana varijansa analiziranog skupa manifestnih
varijabli je suma valjanih varijansi varijabli u tom skupu
(kvadrirani koeficijenti multiple korelacije jedne
varijable sa svim ostalima). Ovaj kriterijum daje donju
granicu broja značajnih faktora i nije ugrađen u SPSS
već se može naći u odgovarajućim makro
procedurama.
• Grafički prilaz (Scree-test Cattell-a,1966) se bazira na
analizi krivulje koja se dobije ako se u ortogonalnom
koordinatnom sistemu, čija ordinata predstavlja
vrednosti karakterističnih korenova a apscisa njihov
broj, nanesu karakteristični korenovi matrice
interkorelacija analiziranih varijabli s leva na desno u
opadajućem nizu.
Po Scree kriterijumu broj značajnih korenova je jednak
broju korenova koji se nalaze s leve strane krivulje tih
korenova do tačke kada ta krivulja počinje da monotono
opada (tačka infleksije – k na slici).
Četvrti prilaz je danas prilično popularna
“paralelna analiza”.
• Kreira se matrica podataka istog reda (broj rdova i
kolona) od slučajnih brojeva (eventualno iste
asimetrije, AS, SD...).
• Na toj matrici se uradi inicijalna Faktorska analiza,
pa se dobijeni karakteristični koreni (lambde)
prikažu paralelno sa stvarnim.
• Zadržavaju se samo oni stvarni karakteristični
koreni koje su veći od tako kreiranih korenova.
• Macro paralel i rawpar.
• MonteCarlo PC procedura (program)
VARIJAB
LE
V1 V2 V3 . . . Vn
V1 1,00 r1,2 r1,3 . . . r1,n
V2 r2,1 1,00 r2,3 . . . r2,n
V3 r3,1 r3,2 1,00 . . . r3,n
. . . . . . . .
. . . . . . . .
. . . . . . . .
Vn rn,1 rn,2 rn,3 . . . 1,00
Broj koeficijenata korelacija je n(n-1)/2
U faktorskoj analizi polazna je matrica interkorelacija varijabli.
U komponentnoj metodi to je kvadratna matrica sa 1 u
glavnoj dijagonali (neredukovana matrica). Ispod i iznad
glavne dijagonale nalaze se isti koeficijenti korelacija parova
varijabli.
Jedna varijabla u prostoru dva faktora ima dve važne
vrednosti: ortogonalnu projekciju – koeficijent korelacije sa
faktorom i kosu projekciju – koeficijent opterećenja,
zasićenja.
Metoda glavnih komponenti se najčešće koristi u
dva osnovna slučaja:
1) kada se želi izvršiti redukcija
nekog sistema varijabli na jednu
dimenziju, prvu glavnu
komponentu (H1), koja sadrži
najveću količinu informacija koja
se može izdvojiti iz tog sistema
varijabli. Tada se dobija samo
matrica težinskih koeficijenata sa
prvom glavnom komponentom.
Najveći koeficijenti (h) ukazuju
na varijable koje su najvažnije za
definisanje komponente.
2) U svhu određivanja početnog koordinatnog sistema vektora
manifestnih varijabli, sa ograničenim brojem komponenti,
koji će zatim biti transformisan u pogodniji ortogonalni ili
kosi koordinatni sistem, koji zadovoljava princip parsimonije
(jednostavne strukture).
METODE ROTACIJE FAKTORA U SPSS-u
ORTOGONALNE ROTACIJE
• Varimax (Kaiser (1958) - metoda rotacije koja
minimizira broj varijabli koje imaju opterećenje na
svakom faktoru. Ova metoda pojednostavljuje
interpretaciju faktora.
• Quartimax - rotacija koja minimizira broj faktora
potrebnih za objašnjenje svake varijable.
• Eqimax - rotacija koja je kombinacija metode varimax
koja pojednostavljuje faktore i metode quartimax koja
pojednostavljuje varijable. Minimizira se broj varijabli
koje imaju visoka opterećenja na neki faktor i broj
faktora potrebnih za objašnjenje neke varijable.
KOSE ROTACIJE
• Direktni oblimin (Jennrich i Sampson, 1966) -
metoda kose (nonorthogonal) rotacije. Kada je delta
jednaka 0 (zadana vrednost), rešenja su najkosija.
Kako delta postaje negativnija, faktori postaju manje
kosi. Da biste nadjačali zadanu deltu od 0, unesite
broj koji je manji ili jednak 0,8.
• Promax (Hendrickson i White, 1964) - kosa rotacija
koja omogućava korelaciju faktora. Ova rotacija se
može izračunati brže od direktne oblimin rotacije, tako
da je korisna za velike skupove podataka.
Ortogonalna rotacija - znači da nema povezanosti među
faktorima, što nije realna situacija u kineziologiji.
Faktori su ortogonalni i
projektovani su van
snopova varijabli
Faktori su ortogonalni i
rotirani tako da se približe
najgušćim snopovima varijabli
Kosa rotacija - znači da postoji povezanost između faktora,
što je slučaj u kineziologiji. Inicijalni faktori se rotiraju tako da
zahvate što gušće snopove vektora varijabli.
• Početna korelaciona natrica se transformiše u matricu
komponenti (Component Matrix), koja sadrži faktorske
koeficijente skupa varijabli koji se analizira. Prva
komponenta nosi najveći procenat varijanse a svaka
sledeća manji procenat jer se izdvajaju iz preostale
varijanse. Ona ne služi za interpretaciju strukture
analiziranog skupa varijabli već je polazna za delju
transformaciju i izračunavanja.
• Kad su faktori ortogonalni, onda za tumačenje postoji
jedna matrica, matrica strukture izolovanih faktora.
• Kad su faktori korelirani, postoje tri matrice:
• Matrica sklopa, paralelnih projekcije, koje su
ekvivalentni regresionim koeficijentima (A matrica).
• Matrica strukture, ortogonalne projekcije, čiji su
elementi korelacije varijable i faktora (F matrica), i
• Matrica faktorskih interkorelacija (M matrica)
Kada su faktori korelirani mogu se odrediti i faktori višeg reda,
faktorizacijom faktorskih skorova, odnosno rezultata
ispitanika na faktorima. To je moguće raditi i do dobijanja
jednog, generalnog faktora (g).
• U našoj praksi najčešća kombinacija je primena metode
glavnih komponenti za određivanje inicijalnih faktora, zatim
određivanje broja značajnih faktora primenom G-K kriterijuma
i kosa rotacija (promax, direktni oblimin) faktora za dobijanje
jednostavnog i intepretabilnog rešenja.
• Međutim, zato što je najčešće, ne znači da je i najbolje i
jedino dobro. Potrebno je tražiti pravo rešenje primenom
većeg broja metoda i tehnika.
• Postoji sugestija da se za ekstrakciju koristi faktorska analiza
u užem smislu:
• Maksimalna verodostojnost (maximum licelihood) kada su
podaci uredni (dobar uzorak i normalna distribuiranost)
• Glavne komponente (principal components) kada to nije
slučaj
Neke praktične sugestije – koja metoda
Neke praktične sugestije – koja metoda
• Metoda maksimalne verodostojnosti je tehnika ocene
parametara, u ovom slučaju faktorskih opterećenja, a
sa ciljem što bolje reprodukcije početne korelacione
matrice.
• Metoda glavnih komponenti je tehnika dekompozicije
varijanse, u tom smislu da svaka komponenta
objašnjava najveći deo preostale varijanse i da je
ortogonalna na prethodne.
• Ona je primerenija za redukciju podataka ali nije
pouzdana kada su mali kumunaliteti varijabli i mali broj
varijabli po faktoru. Obično obuhvata veći % varijanse i
daje veća opterećenja, što može rezultovati unakrsnim
opterećenjima (pojava većih opterećenja na dva ili
više faktora) i slabijom strukturom .
Neke praktične sugestije – broj faktora
• Pokazano je da G-K kriterijum vrlo često daje
veći broj faktora, u najmanje 30% slučajeva, ali je
lak za primenu i može poslužiti kao početni
kriterijum.
• Sugestija je da se sa njim koristi Cattellov grafički
kriterijum (scree test). Traži se „koleno“ (tačka
infleksije) u krivoj i zadržavaju se korenovi koji su
iznad tog kolena.
• Ako postoji očekivani, teorijski broj faktora,
preporučuje se da se proba sa njim, pa sa scree
testom, pa sa jednim faktorom više i jednim
faktorom manje.
Neke praktične sugestije – rotacija faktora
• Ekstrakcija inicijalnih faktora nije konačno rešenje.
Potrebno je uraditi rotaciju faktora kako bi se dobilo
jednostavno rešenje i mogla interpretirati struktura
prostora koji se analizira.
• Kada se žele odrediti nezavisni faktori, koji
zadržavaju ortogonalnost (nisu u korelaciji),
najčešće se primenjuje Varimax rotacija glavnih
komponenti. Ređe se koristi u analizi motoričkog
prostora.
• Kada se očekuju faktori za koje znamo da mogu
biti u korelaciji, koristi se neka od kosih rotacija,
najčešće Promax ili Direct oblimin.
Neke praktične sugestije – rotacija faktora
• Postoji mišljenje da ortogonalne rotacije bolje služe
sređivanju našeg znanja, a kose opisivanju
stvarnosti.
• Zato što kad želimo da znamo, želimo da imamo
jasno razdvojene konstrukte, a korelirani konstrukti
nisu jasno razdvojeni.
• Ortogonalne rotacije su prirodne za slučaj kada
želimo da obavimo redukciju podataka na manji
skup nekoreliranih faktora, npr. da izbegnemo
multikolinearnost u regresiji i sličnim tehnikama.
• Kose rotacije su, s druge strane, realnije za našu
praksu i dozvoljavaju dalju analizu relacija samih
faktora.
Neke praktične sugestije – interpretacija faktora
• Nijedan faktor ne sme imati manje od tri visoka
opterećenja;
• Nijedno visoko opterećenje na faktoru ne sme biti
manje od 0,30;
• Faktor koji ima najmanje 5 visokih opterećenja (preko
0,50) je dobar faktor;
• Ako varijable imaju unakrsna opterećenja (ista varijabla
ima opterećenje veće od 0,30 na više faktora), to nije
dobro faktorsko rešenje.
• Ako je komunalitet manji od 0,40, može se sumnjati da
ta varijabla ne pripada skupu, ili da je rešenje
podfaktorisano. Komunalitet je zapravo korelacija
varijable sa svim zadržanim faktorima (analogno R2 i R
iz višestruke regresije).
Neke praktične sugestije – interpretacija faktora
Za orijentaciju, postoji sledeća sugestija za
faktorska opterećenja u apsolutnoj vrednosti:
> 0,70 su odlična
> 0,60 < 0,70 su vrlo dobra
> 0,55 < od 0,60 su dobra
> 0,45 < 0,55 dovoljna
> 0,30 < 45 jedva dovoljna
< 0,30 nedovoljna
Ove granične vrednosti su arbitrarne i ne mogu
se uzeti zdravo za gotovo.
Neke praktične sugestije – interpretacija faktora
• Ne postoji saglasnost oko toga čemu treba dati
prvenstvo, matrici sklopa ili matrici strukture.
• Klasična sugestija autora FA je da se:
• za interpretaciju faktora koristi matrica sklopa i matrica
korelacija faktora,
• a za interpretaciju varijabli koristi matrica strukture i
matrica korelacija faktora.
• Ako se faktorska opterećenja kvadriraju i pomnože sa
100 dobije se približna slika o tome koliko % ta varijabla
doprinosi datom faktoru.
• Ako se korelacije u matrici strukture kvadriraju i pomnože
sa 100 dobije se približna slika o tome koliko % taj faktor
učestvuje u varijansi neke varijable.
• Ipak, matrica sklopa ima prostiju strukturu, pa je lakša za
interpretaciju i najčešće se koristi.
Kada su podaci pogodni za Faktorsku analizu
• Uzorak slučajeva ne sme biti previše mali;
• Odnos broja ispitanika prema broju varijabli ne bi
trebao biti manji od 5:1, a nikako manji od 3:1, jer se ne
zna unapred kvalitet podataka;
• Greške merenja ne smeju biti previše velike;
• Podaci moraju biti dobro strukturisani, da ih objašnjava
nekoliko jakih faktora;
• Čak i kad je odnos 20:1 i kad su podaci dobro
strukturisani, moguća su pogrešna razvrstavanja
varijabli na faktore;
• Visok MSA (adekvatnost uzorka varijabli);
• Značajan Bartlett-ov test sferičnosti;
• Varijable treba da imaju visoke komunalitete.
Kakva mora biti priroda podataka
• Kao i sve multivarijatne analize, FA zahteva
multivarijatno raspodeljene varijable. To znači da su
sve varijable kvantitativne, kontinualne i linearno
povezane.
• Šta raditi sa kategorijalnim podacima, pre svega sa
ordinalnim i dihotomnim?
• Decenijama je trajala debata o tome da li binarne
varijable (obično ajteme) analizirati preko r
koeficijenta, ili nekog prilagođenog
• Uglavnom, običan r je dovoljno dobar.
• Sa rtet (tetrahonični koeficijent korelacije) je stvar
drukčija, jer on ima korekciju asimetričnosti distribucija.
• U praksi, kategorijalni i ordinalni podaci se ne mogu
izbeći, a iskustvo govori da se mogu analizirati
standardnim multivarijatnim analizama.
LITERATURA:
• Dizdar, D. (2006). Kvantitativne metode. Zagreb:
Kineziološki fakultet Sveučilišta u Zagrebu.
• Fulgosi, A. (1984). Faktorska analiza. Zagreb:
Školska knjiga.
• Fajgelj, S. (2005). Podsetnik za multivarijatnu
analizu individualnih razlika. U S. Fajgelj,
Psihometrija, str. 631-674.
• Bala, G. (2010). Metodologija kineziometrijskih
istraživanja. Novi Sad: Fakultet sporta i fizičkog
vaspitanja.
• http://www.statsoft.com/textbook/stathome.html

More Related Content

What's hot

Презентація 1-4.pptx
Презентація 1-4.pptxПрезентація 1-4.pptx
Презентація 1-4.pptxssuser0931cd
 
3, 4 i 4,5. cas t2 vozac
3, 4 i 4,5. cas t2 vozac3, 4 i 4,5. cas t2 vozac
3, 4 i 4,5. cas t2 vozacigoriv
 
Predmet i struktura licnosti
Predmet i struktura licnostiPredmet i struktura licnosti
Predmet i struktura licnostiProfpsiholog
 
Тема 1. Нормативно правова база
Тема 1. Нормативно правова базаТема 1. Нормативно правова база
Тема 1. Нормативно правова базаNata_iv
 
Безпека життєдіяльності в ГПД Губерненко Н.М.
Безпека життєдіяльності в ГПД Губерненко Н.М.Безпека життєдіяльності в ГПД Губерненко Н.М.
Безпека життєдіяльності в ГПД Губерненко Н.М.sergey_strizhak
 
Znacaj psihologije u turizmu
Znacaj psihologije u turizmuZnacaj psihologije u turizmu
Znacaj psihologije u turizmuProfpsiholog
 
фізика 7 клас. взаємодія тіл. сила міра взаємодії.
фізика 7 клас. взаємодія тіл. сила   міра взаємодії.фізика 7 клас. взаємодія тіл. сила   міра взаємодії.
фізика 7 клас. взаємодія тіл. сила міра взаємодії.Chalenko
 
Osoba u socijalnom okruzenju
Osoba u socijalnom okruzenjuOsoba u socijalnom okruzenju
Osoba u socijalnom okruzenjuProfpsiholog
 
Емоції (мультимедійна презентація)
Емоції (мультимедійна презентація)Емоції (мультимедійна презентація)
Емоції (мультимедійна презентація)Gnotan
 
Пожежна безпека
Пожежна безпекаПожежна безпека
Пожежна безпекаCupCakeDoo
 
Зброя Сухопутних вiйск Збройних Сил України
Зброя Сухопутних  вiйск Збройних Сил УкраїниЗброя Сухопутних  вiйск Збройних Сил України
Зброя Сухопутних вiйск Збройних Сил УкраїниVarlakov Vitalii
 
Презентація до уроку: Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...
Презентація до уроку:  Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...Презентація до уроку:  Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...
Презентація до уроку: Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...Яна Іванова
 
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"sveta7940
 

What's hot (20)

Презентація 1-4.pptx
Презентація 1-4.pptxПрезентація 1-4.pptx
Презентація 1-4.pptx
 
3, 4 i 4,5. cas t2 vozac
3, 4 i 4,5. cas t2 vozac3, 4 i 4,5. cas t2 vozac
3, 4 i 4,5. cas t2 vozac
 
Predmet i struktura licnosti
Predmet i struktura licnostiPredmet i struktura licnosti
Predmet i struktura licnosti
 
O emocijama
O emocijamaO emocijama
O emocijama
 
Тема 1. Нормативно правова база
Тема 1. Нормативно правова базаТема 1. Нормативно правова база
Тема 1. Нормативно правова база
 
Безпека життєдіяльності в ГПД Губерненко Н.М.
Безпека життєдіяльності в ГПД Губерненко Н.М.Безпека життєдіяльності в ГПД Губерненко Н.М.
Безпека життєдіяльності в ГПД Губерненко Н.М.
 
Znacaj psihologije u turizmu
Znacaj psihologije u turizmuZnacaj psihologije u turizmu
Znacaj psihologije u turizmu
 
Mehanizmi odbrane
Mehanizmi odbraneMehanizmi odbrane
Mehanizmi odbrane
 
Стежками дружби
Стежками дружбиСтежками дружби
Стежками дружби
 
фізика 7 клас. взаємодія тіл. сила міра взаємодії.
фізика 7 клас. взаємодія тіл. сила   міра взаємодії.фізика 7 клас. взаємодія тіл. сила   міра взаємодії.
фізика 7 клас. взаємодія тіл. сила міра взаємодії.
 
Osoba u socijalnom okruzenju
Osoba u socijalnom okruzenjuOsoba u socijalnom okruzenju
Osoba u socijalnom okruzenju
 
Емоції (мультимедійна презентація)
Емоції (мультимедійна презентація)Емоції (мультимедійна презентація)
Емоції (мультимедійна презентація)
 
Opažanje osoba
Opažanje osobaOpažanje osoba
Opažanje osoba
 
Пожежна безпека
Пожежна безпекаПожежна безпека
Пожежна безпека
 
Зброя Сухопутних вiйск Збройних Сил України
Зброя Сухопутних  вiйск Збройних Сил УкраїниЗброя Сухопутних  вiйск Збройних Сил України
Зброя Сухопутних вiйск Збройних Сил України
 
Priprema - Radionica - Rešavanje konflikata
Priprema - Radionica -  Rešavanje konflikataPriprema - Radionica -  Rešavanje konflikata
Priprema - Radionica - Rešavanje konflikata
 
Klaster analiza
Klaster analizaKlaster analiza
Klaster analiza
 
Kvadratna nejednacina
Kvadratna nejednacinaKvadratna nejednacina
Kvadratna nejednacina
 
Презентація до уроку: Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...
Презентація до уроку:  Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...Презентація до уроку:  Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...
Презентація до уроку: Тертя. Сили тертя спокою, ковзання, кочення. Коефіцієн...
 
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"
Урок:"Тертя. Сили тертя. Коефіцієнт тертя ковзання. Тертя в природі й техніці"
 

Faktorska analiza sajt

  • 2. • Realne sposobnosti i karakteristike antropološkog statusa čoveka su latentnog (prikrivenog) karaktera, ne mogu se direktno meriti. • U istraživanju manifestne reakcije ispitanika mogu da ukažu na određene karakteristike ili sposobnosti čoveka, ali se ne mogu nikada poistovetiti sa realnim merama tih sposobnosti. • Broj mogućih manifestnih reakcija je praktično beskonačan, pošto te reakcije zavise kako od antropoloških sposobnosti i karakteristika ispitanika, tako i od specifičnosti situacija merenja ili ocenjivanja. • Definisanje zakonitosti moguće je samo na osnovu poznavanja latentnih varijabli koje su generatori manifestacija koje opažamo.
  • 3. Kada istraživač pristupa istraživanju on: • određuje domen, polje u kome će istraživati (npr. snaga, izdržljivost, efikasnost igre itd.); • definiše populaciju od interesa za istraživanje (deca, odrasli, sportisti, radnici i sl.), pa iz nje izdvaja uzorak entiteta na kome će realizovati istraživanje; • kada je definisao domen i uzorak entiteta, istraživač definiše manifestna svojstva koja želi da istražuje i određuje merne instrumente koje će koristiti za njihovu procenu (testove, mere, skale procene i sl.), odnosno definiše uzorak mernih instrumenata; • zatim sprovodi merenje, procenu, u svakom svojstvu za svaki entitet uvršten u istraživanje.
  • 4. • Tako dobijeni podaci imaju unutar svake manifestne varijable određeni varijabilitet, koji odražava individualne razlike između rezultata entiteta. • Isto tako, u tim podacima se mogu uočiti i korelacije, odnosno kovarijanse parova varijabli. One mogu biti veće ili manje u zavisnosti od veličine zajedničkog varijabiliteta parova varijabli. • Na tom nivou posmatranja, mogu se uočiti samo relacije parova varijabli (kovarijabiliteti), ne mogu se sagledati neki složeniji odnosi između varijabli. • Upravo u tome se ogleda uloga i teorijska osnova metoda faktorske analize.
  • 5. • U osnovi teorije faktorske analitike je tvrdnja da postoje latentne (interne) varijable koje su generatori manifestacija koje registrujemo procesom merenja. • To su varijable koje ne možemo direktno meriti, ali se one reflektuju i izražavaju kroz merenja manifestnih varijabli, npr. motoričkih zadataka, stavki na upitniku. • Latentne varijable su često samo hipotetski konstrukti koji se formiraju da bi se objasnila egzistencija određenih pojava, fenomena u prirodi i društvu. • Npr. koristeći pojam izdržljivost u kineziologiji, objašnjavamo pojavu dugotrajnog obavljanja neke motoričke aktivnosti čoveka. I u drugim naukama je prisutna pojava takvih konstrukata kao što je npr. u fizici gravitacija (padanje objekata) ili magnetizam (privlačenje objekata).
  • 6. • Faktorska analiza je generičko ime za mnoštvo procedura razvijenih sa svrhom analize odnosa i stukture jednog skupa varijabli na osnovu njihovih interkorelacija. • Cilj faktorske analize je da se veliki broj međusobno povezanih manifestnih varijabli kondenzuje i redukuje u manji broj međusobno relativno nezavisnih latentnih varijabli koje mogu objasniti međusobne relacije analiziranog skupa manifestnih varijabli. • Izdvojene latentne varijable se smatraju generatorima (uzrocima ili izvorima) varijacija i kovarijacija manifestnih varijabli.
  • 7. • Jedan od glavnih razloga za primenu faktorske analize u nauci je tzv. zakon štednje (engl. Law of Parsimony), odnosno zahtev za jednostavnim rešenjem. • Zahtev za parsimonijskim rešenjem problema predstavlja zahtev da se veći broj manifestnih varijabli objasni pomoću manjeg broja latentnih varijabli, odnosno faktora. • Stoga je i cilj faktorske analize da međusobnu povezanost većeg broja varijabli objasni nekim manjim brojem fundamentalnih ili latentnih varijabli, odnosno izvora kovarijacija tih varijabli.
  • 8. Primena metode faktorske analize: • definisanje strukture prostora istraživanja; • utvrđivanje valjanosti mernih instrumenata, kao i stepen te valjanosti u odnosu na druge merne instrumente koji procenjuju iste latentne dimenzije; • poređenje strukture zajedničkog prostora istraživanja za različite grupe ispitanika; • u cilju dobijanja jedne kriterijske varijable, odnosno vršenje redukcije celog ili dela sistema primenjenih manifestnih varijabli (prostora istraživanja) na prvu glavnu komponentu; • korišćenje definisanih latentnih dimenzija za neke druge statističke analize.
  • 9. • Nakon izvršenih merenja pomoću n mernih instrumenata (mere, procene, testovi) na nekom uzorku od N ispitanika, sve dobijene informacije (rezultati merenja ili procena) mogu da se predstave jednom matricom u kojoj su svi vektori ispitanika, odnosno svi vektori varijabli. • Takva matrica predstavlja skup svih informacija dobijenih merenjima u manifestnom prostoru, pošto su se pojave i reakcije ispitanika direktno merile. • Elementi u toj matrici se transformišu u standardne z-vrednosti, pa inicijalna matrica Z predstavlja matricu standardizovanih rezultata.
  • 10. • Svaki rezultat je produkt veličine uticaja onih faktora koji se manifestuju kroz merenje i rezultate svakog ispitanika u svakom tom faktoru. Ti se faktori nazivaju zajednički faktori (common factor). • Kako se ne može uvek predvideti uticaj svih faktora na manifestnu reakciju koja se meri, postoji i specifičan uticaj nekog faktora na pojedinu varijablu, što nazivamo specifičnim faktorom. • Pošto svaka operacija merenja nužno povlači i određenu grešku, na rezultate u matrici deluje još jedan faktor, koji se naziva faktor greške. • Specifični faktor i faktor greške, čine unikni faktor, koji pokazuje sa kolikom greškom se može predvideti rezultat u nekoj manifestnoj varijabli ako su poznati faktori koji utiču na manifestaciju te varijable.
  • 11. • Varijabilitet u manifestnim varijablama je uzrokovan najviše uticajem zajedničkih faktora, koji deluju na varijabilitet unutar varijabli ali i na kovarijabilitet (interkorelacije varijabli) u sistemu što čini zajedničku varijansu. • Uticaj specifičnog faktora je jednoznačno usmeren na varijabilitet unutar određene varijable, te njegov snažni uticaj umanjuje povezanost te varijable sa drugima u sistemu (specificitet) • Faktor greške je proizvod procesa merenja i on direktno umanjuje kovarijabilitet varijabli. • Pored toga na relacije u sistemu mogu uticati i razni spoljni faktori, koji utiču i na zajedničke i specifične faktore.
  • 12.   k f ikfjifij uaFaz 1 1 Rezultat u jedinoj varijabli za nekog ispitanika (Zij) može se predstaviti linearnom sumacijom spomenutih činioca, odnosno: Gde je aif – koeficijent uticaja činioca f na varijablu i, Ffj – rezultat ispitanika j u činiocu (faktoru) F koji utiče na varijablu i, ui – unikvitet za varijablu i.
  • 13. Ako se ova jednačina generalizuje na ceo prostor varijabli, koji je sadržan u matrici Z, onda se ona može predstaviti kao: Z = AF + U gde je A – matrica koja sadrži sve koeficijente a, F - matrica koja sadrži sve f (faktore), U – dijagonalna matrica koja sadrži unikvitete za odgovarajuće varijable. Ovakav oblik rezultata u manifestnom prostoru analiziranih varijabli poznat je pod imenom Generalni linearni model ili Raov linearni model.
  • 14. • Manifestne varijable se transformišu u standardizovani oblik, gde je aritmetičak sredina AS=0 a standardna devijacija s=1 ili varijansa s2=1. • Shodno tome i svi faktori su standardizovani, normirani na jedan, imaju veličinu, odnosno dužinu 1 a centrirani su na 0 (nulu). • Distribucije više varijabli u zajedničkom prostoru ponašaju se kao multivarijatno normalno distribuirane.
  • 15. Pri rešavanju istraživačkih problema pomoću ovakvog linearnog modela najčešće se koriste dve strategije : 1)Konfirmativna – ako su faktori koji deluju na fenomen unapred poznati, ili je hipotetski pretpostavljen njihov brij i struktura; 2)Eksplorativna – ako sistem faktora koji definišu fenomen nije unapred poznat, što znači da nije poznat ni njihov broj, a time ni realni naučni smisao tog fenomena.
  • 16. Pri formiranju uzorka mernih instrumenata istraživanja, na osnovu kojih će se dobiti odgovarajuće manifestne varijable, potrebno je: • da svaki hipotetski faktor bude procenjen sa najmanje tri varijable, • da ceo sistem varijabli bude uravnotežen u odnosu na faktore, kako bi se poštovao princip homeostaze (uravnoteženosti). Na taj način se svim hipotetskim faktorima ostavlja mogućnost da se realno pojave, te da se ni jedan posebno ne favorizuje viškom odgovarajućih varijabli.
  • 17. Šematski prikaz sistema manifestnih varijabli koji nije uravnotežen (nejednak broj manifestnih varijabli po faktoru)
  • 18. Prilikom izbora načina na koji ćemo analizirati prostor manifestnih varijabli, treba sagledati specifičnosti i željenu valjanost i pouzdanost krajnjih rezultata istraživanja. Na osnovu toga se odlučujemo za neki model definisanja latentnih dimenzija. Najpoznatija su ova dva modela: 1. komponentni model - analizira kompletan varijabilitet manifestnih varijabli koristeći neredukovanu matricu interkorelacija, gde su u glavnoj dijagonali jedinice, matematički je stabilan i ima jednoznačna rešenja, i 2. faktorski modeli - analiziraju redukovanu matricu interkorelacija, gde su u glavnoj dijagonali na neki način procenjene, valjane varijanse.
  • 19. Definisanje što realnijih latentnih varijabli, zavisi od: • izbora metode izdvajanja inicijalnih faktora; • primene kriterijuma za određivanje broja značajnih inicijalnih faktora (obično glavnih komponenti) na osnovu matrice interkorelacija manifestnih varijabli, i • izbora modela, metoda i tehnika rotacije inicijalnih faktora. Veoma važan problem je određivanje broja značajnih faktora koji treba da objasne analizirani prostor. Treba da se odredi najmanji rang matrice interkorelacija varijabli u konkretnom istraživanju, kako bi se dobila što jednostavnija struktura faktora u analiziranom prostoru.
  • 20. • Prvo je potrebno da se testira matrica interkorelacija, da li je pogodna za faktorizaciju. • To se radi određivanjem mere reprezentativnosti tog skupa manifestnih varijabli (MSA engl. Measure of Sampling Adequacy) , odnosno pomoću Bartlett- ovog testa sfericiteta multivarijatne distribucije analiziranog skupa varijabli. • Još važnija provera je putem dobijanja informacije o veličini determinante matrice interkorelacija. Ukoliko je determinanta jednaka nuli, to znači da je ta matrica singularna i da nije pogodna za faktorizaciju.
  • 21. Veoma je važno za istraživače da prepoznaju kada mogu očekivati da determinanta korelacione matrice može biti jednaka nuli: • kada matrica ima dva jednaka reda ili kolone), to je slučaj kada dva ili više ispitanika imaju potpuno iste rezultate u svim varijablama, ili kada dve varijable imaju iste korelacije sa ostalim varijablama; • kada u analiziranoj matrici vektori vrste (entiteta) među sobom, odnosno vektori-kolone (varijabli) među sobom, nisu linearno nezavisni; • u matrici koja treba da se analizira ne sme se pojaviti varijabla koja je linearna kombinacija druge dve ili više analiziranih varijabli.
  • 22. Primeri prethodne stavke : • sumacija rezultata više merenja istog testa kao jedna varijabla i istovremeno rezultati merenja u svakom izvođenju tog istog testa kao pojedinačne varijable; • neki izračunati indeks iz dve ili više varijabli, kao jedna varijabla, te posebno te iste varijable; • Izmereno ukupno vreme u nekoj aktivnosti kao jedna varijabla i parcijalna vremena u raznim delovima iste aktivnosti, kao posebne varijable; • ukupan rezultat u atletskom ili gimnastičkom višeboju, kao jedna varijabla, te rezultati u svakoj pojedinačnoj disciplini tog višeboja, kao posebne varijable);
  • 23. • kada su svi elementi na nekom redu matrice jednaki nuli; • u praksi to je slučaj ako se ne ukloni vektor ispitanika sa svim rezultatima koji su jednaki nuli, ili vektor varijable u kome su svi rezultati merenja pomoću odgovarajućeg testa jednaki nuli (što je slučaj kada je motorički test toliko težak za analizirani uzorak ispitanika da ga niko od ispitanika nije u stanju da reši niti u najmanjoj predviđenoj mernoj jedinici tog testa); • kod korelacione matrice to je slučaj kada je neka varijabla totalno nezavisna od svih preostalih, pa su svi odgovarajući koeficijenti korelacije jednaki nuli.
  • 24. Tipovi ekstrakcije inicijalnih faktora: • metoda glavnih komponenti (PCA) • metoda glavnih osovina (principal axes); • metoda maksimalne verodostojnosti (maximum likelihood); • image faktorska analiza; • alfa faktorska analiza; • kanonička faktorska analiza; • Antiimaž, tj. Harris-Kaiserova faktorska analiza ... i mnoge druge.
  • 25. • Sva navedena rešenja se primenjuju samo tokom izdvajanja inicijalnih faktora. • U faktorskoj analizi glavnih komponenti, inicijalnih faktora ima onoliko koliko ima varijabli u sistemu. • Dužine vektora varijabli i faktora se iskazuju njihovim normama, odnosno korenom iz sume kvadriranih faktorskih koeficijenata. • Varijansa vektora varijable u faktorskom prostoru naziva se kumunalitet i predstavlja sumu kvadriranih faktorskih koeficijenata izolovanih značajnih faktora za tu varijablu. • Varijanse glavnih komponenti jednake su njihovim karakterističnim korenima (lambdama,svojstvenim vrednostima i predstavljaju sumu kvadriranih koeficijenata svih varijabli na tom faktoru.
  • 26. Matrica izolovanih značajnih komponenti Kumunalitet – suma kvadrata koeficijenata na značajnim komponentama Karaktristični koreni – suma kvadrata koeficijenata svih varijabli na jednoj komponenti.
  • 27. • U stvarnosti, interpretabilnih faktora je znatno manje. Istraživači nastoje da dobiju što manje jakih, dobro definisanih faktora (sa velikom varijansom). • Ako su interkorelacije niske, faktorska analiza će težiti da proizvede puno sitnih faktora. To je najčešće posledica lošeg merenja, visokih grešaka pri uzorkovanju, loše definisanih konstrukata, loših mernih postupaka itd. • Osnovni problem u određivanju značajnog broja faktora, sastoji se u mogućnosti da se preteranim brojem faktora neki izdvojeni faktor definiše kao stvaran, a da je on samo rezultat hiperfaktorizacije i da predstavlja specifični ili možda faktor greške. Isto tako, moguće je da neki faktor koji realno postoji isključimo zbog toga što je izdvojen premali broj faktora.
  • 28. • Dilema oko određivanja broja značajnih faktora može da se reši upotrebom više različitih nezavisnih kriterija za određivanje broja značajnih faktora, kako bi se odredila makar donja i gornja granica broja značajnih faktora. • Svi kriterijumi za određivanje broja značajnih faktora polaze od analize karakterističnih korenova (eigenvalue) neredukovane matrice interkorelacija manifestnih varijabli, tj. matrice sa potpunom varijansom svake manifestne varijable koja iznosi 1. • Postoji više načina za određivanje broja značajnih inicijalnih faktora na osnovu odgovarajuće matrice interkorelacija varijabli.
  • 29. Prilikom određivanja broja značajnih faktora, koristi se više prilaza. 1. Empirijski, na osnovu iskustva i hipotetske postavke istraživača, 2. Na osnovu neke matematičko-statističke logike i odgovarajućih dokaza, 3. Razmatranjem grafički prikazane distribucije karakterističnih korenova matrice interkorelacija primenjenih varijabli, 4. Paralelnom analizom.
  • 30. U prvom prilazu su npr. postupci koji podrazumevaju: • primenu hipotetskog ili željenog broja faktora (ta mogućnost je i ugrađena u odgovarajuće kompjuterske programe za faktorsku analizu); • unapred određen željeni procenat ukupne količine zajedničke varijanse (obično 75, 80, 85 ili čak 90%), da bi se do te vrednosti prihvatali inicijalni faktori, koji doprinose i delom objašnjavaju unapred određenu varijansu celokupnog analiziranog prostora; • izdvajanje jednog po jednog faktora, transformaciju u planiranu poziciju, sve dok se svaki faktor može smisleno interpretirati. Kada se naredni faktor ne može interpretirati, prestaje se sa ekstrakcijom i zadržava konačan broj interpretabilnih faktora.
  • 31. U drugom prilazu postoji veći broj kriterijuma za ekstrakciju značajnih faktora, čije su osnove različite matematičke i statističke logike. • Guttman-Kaiser-ov (GK) kriterijum koji kaže da se zadrže svi inicijalni faktori čiji su karakteristični koreni veći od 1 (λ>1). Njegova logika se zasniva na entropiji matrice interkorelacija analiziranih varijabli u standardizovanom obliku, odnosno na količini informacija koju daje ta matrica. Najveću relativnu količinu informacija (pozitivnu informatičku vrednost) će davati samo oni faktori čija je varijansa veća od izvornih varijabli. Smatra se da ovaj kriterijum određuje gornju granicu broja značajnih faktora.
  • 32. • Valjana varijansa analiziranog skupa manifestnih varijabli je suma valjanih varijansi varijabli u tom skupu (kvadrirani koeficijenti multiple korelacije jedne varijable sa svim ostalima). Ovaj kriterijum daje donju granicu broja značajnih faktora i nije ugrađen u SPSS već se može naći u odgovarajućim makro procedurama. • Grafički prilaz (Scree-test Cattell-a,1966) se bazira na analizi krivulje koja se dobije ako se u ortogonalnom koordinatnom sistemu, čija ordinata predstavlja vrednosti karakterističnih korenova a apscisa njihov broj, nanesu karakteristični korenovi matrice interkorelacija analiziranih varijabli s leva na desno u opadajućem nizu.
  • 33. Po Scree kriterijumu broj značajnih korenova je jednak broju korenova koji se nalaze s leve strane krivulje tih korenova do tačke kada ta krivulja počinje da monotono opada (tačka infleksije – k na slici).
  • 34. Četvrti prilaz je danas prilično popularna “paralelna analiza”. • Kreira se matrica podataka istog reda (broj rdova i kolona) od slučajnih brojeva (eventualno iste asimetrije, AS, SD...). • Na toj matrici se uradi inicijalna Faktorska analiza, pa se dobijeni karakteristični koreni (lambde) prikažu paralelno sa stvarnim. • Zadržavaju se samo oni stvarni karakteristični koreni koje su veći od tako kreiranih korenova. • Macro paralel i rawpar. • MonteCarlo PC procedura (program)
  • 35. VARIJAB LE V1 V2 V3 . . . Vn V1 1,00 r1,2 r1,3 . . . r1,n V2 r2,1 1,00 r2,3 . . . r2,n V3 r3,1 r3,2 1,00 . . . r3,n . . . . . . . . . . . . . . . . . . . . . . . . Vn rn,1 rn,2 rn,3 . . . 1,00 Broj koeficijenata korelacija je n(n-1)/2 U faktorskoj analizi polazna je matrica interkorelacija varijabli. U komponentnoj metodi to je kvadratna matrica sa 1 u glavnoj dijagonali (neredukovana matrica). Ispod i iznad glavne dijagonale nalaze se isti koeficijenti korelacija parova varijabli.
  • 36. Jedna varijabla u prostoru dva faktora ima dve važne vrednosti: ortogonalnu projekciju – koeficijent korelacije sa faktorom i kosu projekciju – koeficijent opterećenja, zasićenja.
  • 37. Metoda glavnih komponenti se najčešće koristi u dva osnovna slučaja: 1) kada se želi izvršiti redukcija nekog sistema varijabli na jednu dimenziju, prvu glavnu komponentu (H1), koja sadrži najveću količinu informacija koja se može izdvojiti iz tog sistema varijabli. Tada se dobija samo matrica težinskih koeficijenata sa prvom glavnom komponentom. Najveći koeficijenti (h) ukazuju na varijable koje su najvažnije za definisanje komponente.
  • 38. 2) U svhu određivanja početnog koordinatnog sistema vektora manifestnih varijabli, sa ograničenim brojem komponenti, koji će zatim biti transformisan u pogodniji ortogonalni ili kosi koordinatni sistem, koji zadovoljava princip parsimonije (jednostavne strukture).
  • 39. METODE ROTACIJE FAKTORA U SPSS-u ORTOGONALNE ROTACIJE • Varimax (Kaiser (1958) - metoda rotacije koja minimizira broj varijabli koje imaju opterećenje na svakom faktoru. Ova metoda pojednostavljuje interpretaciju faktora. • Quartimax - rotacija koja minimizira broj faktora potrebnih za objašnjenje svake varijable. • Eqimax - rotacija koja je kombinacija metode varimax koja pojednostavljuje faktore i metode quartimax koja pojednostavljuje varijable. Minimizira se broj varijabli koje imaju visoka opterećenja na neki faktor i broj faktora potrebnih za objašnjenje neke varijable.
  • 40. KOSE ROTACIJE • Direktni oblimin (Jennrich i Sampson, 1966) - metoda kose (nonorthogonal) rotacije. Kada je delta jednaka 0 (zadana vrednost), rešenja su najkosija. Kako delta postaje negativnija, faktori postaju manje kosi. Da biste nadjačali zadanu deltu od 0, unesite broj koji je manji ili jednak 0,8. • Promax (Hendrickson i White, 1964) - kosa rotacija koja omogućava korelaciju faktora. Ova rotacija se može izračunati brže od direktne oblimin rotacije, tako da je korisna za velike skupove podataka.
  • 41. Ortogonalna rotacija - znači da nema povezanosti među faktorima, što nije realna situacija u kineziologiji. Faktori su ortogonalni i projektovani su van snopova varijabli Faktori su ortogonalni i rotirani tako da se približe najgušćim snopovima varijabli
  • 42. Kosa rotacija - znači da postoji povezanost između faktora, što je slučaj u kineziologiji. Inicijalni faktori se rotiraju tako da zahvate što gušće snopove vektora varijabli.
  • 43. • Početna korelaciona natrica se transformiše u matricu komponenti (Component Matrix), koja sadrži faktorske koeficijente skupa varijabli koji se analizira. Prva komponenta nosi najveći procenat varijanse a svaka sledeća manji procenat jer se izdvajaju iz preostale varijanse. Ona ne služi za interpretaciju strukture analiziranog skupa varijabli već je polazna za delju transformaciju i izračunavanja. • Kad su faktori ortogonalni, onda za tumačenje postoji jedna matrica, matrica strukture izolovanih faktora. • Kad su faktori korelirani, postoje tri matrice: • Matrica sklopa, paralelnih projekcije, koje su ekvivalentni regresionim koeficijentima (A matrica). • Matrica strukture, ortogonalne projekcije, čiji su elementi korelacije varijable i faktora (F matrica), i • Matrica faktorskih interkorelacija (M matrica)
  • 44. Kada su faktori korelirani mogu se odrediti i faktori višeg reda, faktorizacijom faktorskih skorova, odnosno rezultata ispitanika na faktorima. To je moguće raditi i do dobijanja jednog, generalnog faktora (g).
  • 45. • U našoj praksi najčešća kombinacija je primena metode glavnih komponenti za određivanje inicijalnih faktora, zatim određivanje broja značajnih faktora primenom G-K kriterijuma i kosa rotacija (promax, direktni oblimin) faktora za dobijanje jednostavnog i intepretabilnog rešenja. • Međutim, zato što je najčešće, ne znači da je i najbolje i jedino dobro. Potrebno je tražiti pravo rešenje primenom većeg broja metoda i tehnika. • Postoji sugestija da se za ekstrakciju koristi faktorska analiza u užem smislu: • Maksimalna verodostojnost (maximum licelihood) kada su podaci uredni (dobar uzorak i normalna distribuiranost) • Glavne komponente (principal components) kada to nije slučaj Neke praktične sugestije – koja metoda
  • 46. Neke praktične sugestije – koja metoda • Metoda maksimalne verodostojnosti je tehnika ocene parametara, u ovom slučaju faktorskih opterećenja, a sa ciljem što bolje reprodukcije početne korelacione matrice. • Metoda glavnih komponenti je tehnika dekompozicije varijanse, u tom smislu da svaka komponenta objašnjava najveći deo preostale varijanse i da je ortogonalna na prethodne. • Ona je primerenija za redukciju podataka ali nije pouzdana kada su mali kumunaliteti varijabli i mali broj varijabli po faktoru. Obično obuhvata veći % varijanse i daje veća opterećenja, što može rezultovati unakrsnim opterećenjima (pojava većih opterećenja na dva ili više faktora) i slabijom strukturom .
  • 47. Neke praktične sugestije – broj faktora • Pokazano je da G-K kriterijum vrlo često daje veći broj faktora, u najmanje 30% slučajeva, ali je lak za primenu i može poslužiti kao početni kriterijum. • Sugestija je da se sa njim koristi Cattellov grafički kriterijum (scree test). Traži se „koleno“ (tačka infleksije) u krivoj i zadržavaju se korenovi koji su iznad tog kolena. • Ako postoji očekivani, teorijski broj faktora, preporučuje se da se proba sa njim, pa sa scree testom, pa sa jednim faktorom više i jednim faktorom manje.
  • 48. Neke praktične sugestije – rotacija faktora • Ekstrakcija inicijalnih faktora nije konačno rešenje. Potrebno je uraditi rotaciju faktora kako bi se dobilo jednostavno rešenje i mogla interpretirati struktura prostora koji se analizira. • Kada se žele odrediti nezavisni faktori, koji zadržavaju ortogonalnost (nisu u korelaciji), najčešće se primenjuje Varimax rotacija glavnih komponenti. Ređe se koristi u analizi motoričkog prostora. • Kada se očekuju faktori za koje znamo da mogu biti u korelaciji, koristi se neka od kosih rotacija, najčešće Promax ili Direct oblimin.
  • 49. Neke praktične sugestije – rotacija faktora • Postoji mišljenje da ortogonalne rotacije bolje služe sređivanju našeg znanja, a kose opisivanju stvarnosti. • Zato što kad želimo da znamo, želimo da imamo jasno razdvojene konstrukte, a korelirani konstrukti nisu jasno razdvojeni. • Ortogonalne rotacije su prirodne za slučaj kada želimo da obavimo redukciju podataka na manji skup nekoreliranih faktora, npr. da izbegnemo multikolinearnost u regresiji i sličnim tehnikama. • Kose rotacije su, s druge strane, realnije za našu praksu i dozvoljavaju dalju analizu relacija samih faktora.
  • 50. Neke praktične sugestije – interpretacija faktora • Nijedan faktor ne sme imati manje od tri visoka opterećenja; • Nijedno visoko opterećenje na faktoru ne sme biti manje od 0,30; • Faktor koji ima najmanje 5 visokih opterećenja (preko 0,50) je dobar faktor; • Ako varijable imaju unakrsna opterećenja (ista varijabla ima opterećenje veće od 0,30 na više faktora), to nije dobro faktorsko rešenje. • Ako je komunalitet manji od 0,40, može se sumnjati da ta varijabla ne pripada skupu, ili da je rešenje podfaktorisano. Komunalitet je zapravo korelacija varijable sa svim zadržanim faktorima (analogno R2 i R iz višestruke regresije).
  • 51. Neke praktične sugestije – interpretacija faktora Za orijentaciju, postoji sledeća sugestija za faktorska opterećenja u apsolutnoj vrednosti: > 0,70 su odlična > 0,60 < 0,70 su vrlo dobra > 0,55 < od 0,60 su dobra > 0,45 < 0,55 dovoljna > 0,30 < 45 jedva dovoljna < 0,30 nedovoljna Ove granične vrednosti su arbitrarne i ne mogu se uzeti zdravo za gotovo.
  • 52. Neke praktične sugestije – interpretacija faktora • Ne postoji saglasnost oko toga čemu treba dati prvenstvo, matrici sklopa ili matrici strukture. • Klasična sugestija autora FA je da se: • za interpretaciju faktora koristi matrica sklopa i matrica korelacija faktora, • a za interpretaciju varijabli koristi matrica strukture i matrica korelacija faktora. • Ako se faktorska opterećenja kvadriraju i pomnože sa 100 dobije se približna slika o tome koliko % ta varijabla doprinosi datom faktoru. • Ako se korelacije u matrici strukture kvadriraju i pomnože sa 100 dobije se približna slika o tome koliko % taj faktor učestvuje u varijansi neke varijable. • Ipak, matrica sklopa ima prostiju strukturu, pa je lakša za interpretaciju i najčešće se koristi.
  • 53. Kada su podaci pogodni za Faktorsku analizu • Uzorak slučajeva ne sme biti previše mali; • Odnos broja ispitanika prema broju varijabli ne bi trebao biti manji od 5:1, a nikako manji od 3:1, jer se ne zna unapred kvalitet podataka; • Greške merenja ne smeju biti previše velike; • Podaci moraju biti dobro strukturisani, da ih objašnjava nekoliko jakih faktora; • Čak i kad je odnos 20:1 i kad su podaci dobro strukturisani, moguća su pogrešna razvrstavanja varijabli na faktore; • Visok MSA (adekvatnost uzorka varijabli); • Značajan Bartlett-ov test sferičnosti; • Varijable treba da imaju visoke komunalitete.
  • 54. Kakva mora biti priroda podataka • Kao i sve multivarijatne analize, FA zahteva multivarijatno raspodeljene varijable. To znači da su sve varijable kvantitativne, kontinualne i linearno povezane. • Šta raditi sa kategorijalnim podacima, pre svega sa ordinalnim i dihotomnim? • Decenijama je trajala debata o tome da li binarne varijable (obično ajteme) analizirati preko r koeficijenta, ili nekog prilagođenog • Uglavnom, običan r je dovoljno dobar. • Sa rtet (tetrahonični koeficijent korelacije) je stvar drukčija, jer on ima korekciju asimetričnosti distribucija. • U praksi, kategorijalni i ordinalni podaci se ne mogu izbeći, a iskustvo govori da se mogu analizirati standardnim multivarijatnim analizama.
  • 55. LITERATURA: • Dizdar, D. (2006). Kvantitativne metode. Zagreb: Kineziološki fakultet Sveučilišta u Zagrebu. • Fulgosi, A. (1984). Faktorska analiza. Zagreb: Školska knjiga. • Fajgelj, S. (2005). Podsetnik za multivarijatnu analizu individualnih razlika. U S. Fajgelj, Psihometrija, str. 631-674. • Bala, G. (2010). Metodologija kineziometrijskih istraživanja. Novi Sad: Fakultet sporta i fizičkog vaspitanja. • http://www.statsoft.com/textbook/stathome.html