1. Hyrje
Në këtë punim janë treguar disa nga komandat dhe output-tet e softit statistikor SPSS, duke iu
përgjigjur disa kërkesave të cilat do të paraqiten më poshtë në bazë të renditjes së tyre dhe duke
iu referuar variablave të ndryshëm që gjithashtu do të tregohen në kërkesat përkatëse.
Pyetja 1:
Për një variabël sasior të zgjedhur prej jush ndërtoni intervalin e besimit 95% për vlerën
mesatare të variablit dhe interpretoni atë.Supozoni një vlerë për mesataren e këtij variabli dhe
testoni nëse vlerat e tij janë më të vogla se kjo vlerë.
Çështje teorike:
Një interval besimi shpreh zonën rreth mesatares së sample-it që ne mendojmë se mesatarja e
popullsisë ka gjasa të mos pranohet.
Sa më te sigurt ne duam të jemi aq, më të lartë e vendosim koeficientin e besimit: Këta janë
koeficientët e besimit më të përdorshëm.
Vlerat = Ẋ ±1-α/2z(σ/√n)
90% Vlera: Ẋ ±1.645(σ/√n)
95% Vlera: Ẋ ±1.960(σ/√n)
99% Vlera: Ẋ ±2.576(σ/√n)
Zgjidhja:
Komandat e përdoruara për këtë test janë: Analyze-Compare Means-One sample t-test.
Variabli i përdorur për këtë testim është population weight(pweight).
Outputi nga SPSS:
2. Kërkesa kërkonte që ne të vendosnim një mesatare për këtë popullim të supozuar dhe mesatarja e
supozuar që u vendos ishte: Mesatarja=350.
Ndërkohë që nga SPSS bazuar në tabelën e parë konkludojmë në këto shifra:
Numri i përgjithshëm(N)=25335; Mesatarja=509,1936; Devijimi standart=467,41558;
Tek tabela e dytë na jepet informacion mbi këto vlera:
Përfundimi:
Me vlerën e testuar=350 intervalet e besimit me 95% siguri dhe me shkallë lirie (df)=25334 kanë
rezultuar:
Vlera minimale=153,4377; dhe Vlera maksimale=164,9495
Kjo do të thotë që vlera mesatare varion nga vlera minimale 153,4377 te vlera maksimale
164,9495.
Pyetja 2:
Kontrolloni hipotezën që përpjesa e individëve në zonat urbane është 0.5, me shkallë besimi
95%.
Zgjidhje:
Për përpjesën dimë këto informacione:
Hipotezat janë:
H0: p = 0.5 H0: p >= 0.5 H0: p<=0.5
Ha: p =/ 0.5 Ha: p < 0.5 Ha: p>0.5
Duhet provuar që përjesa e individëve në zonat urbane është 0.5, pra është testimi i parë i
hipotezave që duhet zgjedhur. Për këtë komandat në SPSS janë: Analyze-Compare Means-One
sample t-test.
Variabli i përdorur për këtë testim është urban.
Dhe output-i i softit është:
3. Përfundimi:
Nga tabela shohim që sinjifikanca(p)<0.05. Kjo do të thotë që hipoteza bazë hidhet poshtë dhe
përpjesa e popullimi nuk është e barabartë me 0.5.
Pyetja 3:
Kontrolloni hipotezën mbi diferencën viteve mesatare të shkollimit të të dy popullimeve, psh
vitet e shkollimit sipas zones urbane për popullsinë 15 vjec e lart, ose sipas gjinisë etj,
α=0.05.(Kujdes! Për vitet e shkollimit llogaritni një tregues te përafërt duke u nisur nga diploma
më lartë përkatëse e secilit). Kontrolloni hipotezën mbi normalitetin dhe barazinë e variancave
për variablin e zgjedhur nga ju. Nëse e gjykoni të përshtatshme mund të përdorni edhe metodat
joparametrike.
Çështje teorike:
Testi statistikor për një sample të pavarur llogaritet nga formula:
Ku:
4. Ku
x1 = Mesatarja e sample-it te parë
x2 = Mesatarja e sample-it te dytë
n1 = Madhesia e sample-it të parë
n2 = Madhesia e sample-it të dytë
s1 = Devijimi standart t sample-it të parë
s2 = Devijimi standart i sample-it të dytë
Zgjidhje:
Variablat e zgjedhur për të bërë testimin janë "Urban" (urban) dhe "Highest grade completed-
level" (m2b_q04).
Komandat e përdoruar janë: Analyze-Compare Means- Independent-samples t test.
H0: Ska asnjë lidhje midis zonës ku jeton dhe nivelit të edukimit.
Ha :Ka lidhje midis zonës ku jeton dhe nivelit të edukimit.
Outputi për këto variabla është:
5. Përfundim:
Informacioni i kolonës së dytë tek rreshti i parë i shënjuar me simbolin (Sig) quhet edhe
sinjifikanca. Nëse sig<0.05 hipoteza bazë që pohon që variancat janë të barabarta do të hidhet
poshtë. Në rastin tonë 0.038<0.05 pra na hidhet poshtë hipoteza bazë që do të thotë që variancat
e dy popullimeve Age dhe Urban nuk janë të barabarta.
Rezultati i sinjifikances i shënjuar në tabelë si Sig(2-tailed) tregon probabilitetin e bërjes së
gabimeve nëse ne themi që ka diferenca mes popullimeve.
Tek variablat "AGE" dhe "Highest diploma attained" ka 2 rreshta për secilën. Rreshtit të parë i
referohemi nëse në bazë të testit të hipotezave variancat tona konkludojnë të barabarta, dhe e
kundërta për rreshtin e dytë; ai do të përdoret kur variancat nuk janë të barabarta.
Pyetja 4:
Ndërtoni intervalin e besimit për diferencën e mesatareve të dy popullimeve,α=0.05.
Zgjidhje:
H0:µ1-µ2=0 Diferencat e mesatareve janë të barabarta
Ha:µ1-µ2=/0 Diferencat e mesatareve nuk janë të barabarta
Variablat e zgjedhur për këtë testim janë "Mother Educational Level"(m1a_q13) dhe "Father
Educational Level"(m1a_q19)
Komandat e përdorura për këtë testim janë: Analyze-Compare Means- Independent-samples t
test.
Output-i për këto dy popullime rezulton:
6. Përfundim:
Duke u përqëndruar vetëm tek dy kolonat e fundit kemi Vlerën minimale= -0.886 dhe Vlerën
maksimale= -0.823, pra intervali i besimit me α= 0.05 për diferencën e mesatareve të dy
popullimeve është ] -0.886; -0.0823[.
Pyetja 5:
Llogarisni koeficientin e korrelacionit midis konsumit real dhe shkollimit. Ndërtoni intervalin e
besimit për koeficientin e korrelacionit të popullimit për popullsinë 15 vjec e lart.
Zgjidhje:
Variabla e zgjedhur për këtë testim janë "Highest diploma attained" dhe "total consumption of
hh".
Komandat e përdoruara janë: Correlate- Bivariate- Pearson.
Output-i që rezulton nga SPSS është:
Përfundim:
Vlera në rreshtin e parë të kolonës së dytë është korrelacioni ose lidhja që rezulton mes këtyre dy
variablave që rezulton me një vlerë të barabartë me 0.174 që e interpretuar do të thotë që lidhje
mes këtyre variablave është e dobët por pozitive.
Sinjifikanca e vendosur në rreshtin e dytë të kolonës së dytë por është të parë(pjesa e dytë)
rezulton p= 0.05. Nga kjo konludojmë që ky koeficient korrelacioni nuk është i rëndësishëm
statistikisht.
7. Ndërsa për intervalin e besimit të variablit "Age" na jep informacion tabela e mëposhtme:
Intervali i besimit është ]38.457;39.763[, që do të thotë se me 95% siguri mosha mesatare
gjendet këtu, në këtë interval.
Pyetja 6:
Kryeni një Analizë Variance(ANOVA) me një faktor duke përdorur α=0.05. Çfarë supozimesh
duhen bërë? Nëse nuk do të përdornit Analizën e Variancës cilën metodë parametrike do të
sugjeronit. Vlerësoni diferencat midis dy mesatareve duke përdorur procedurën Tukey me
α=0.05 . Interpretoni përfundimet. Ndërtoni intervalet e besimit për diferencat e cdo dy
mesatareve me α=0.05.
Çështje teorike:
Supozimet që duhen bërë për të kryer një analizë ANOVA janë:
Madhësite e sample-it janë më të vogla se ato të popullsisë.
Variablat duhet të jenë të pavarur dhe të shpërndarë në mënyrë identike
Variablat e varur kanë varianca të barabarta
Variablat duhet të jenë të shpërndarë normalisht
Testi Kruskal-Wallis është i bazuar në teste joparametrike që mund të përdoren për të përcaktuar
nëse ka diferenca statistikisht të rëndësishme ndërmjet 2 ose më shumë grupeve të një variabli të
pavarur në shkallë nominale ose të zakonshme. Kjo ështe konsideruar si një alternativë
joparametrike e Anovës dhe një zgjerim i testit Mann-Whitney, i cili lejon krahasimin e më shumë
se dy grupeve të pavarur.
8. Zgjidhje:
Variabli i zgjedhur për të bërë këtë analizë është "Age-Years" dhe "Marital Status".
Komandat e përdorura për të kryer këtë analizë janë: Analyze-Compare Means- One-way
Anova.
Hipotezat e ngritura në lidhje me këtë testim janë:
H0:Mesataret e këtyre grupeve janë të barabarta
Ha: Mesataret e këtyre grupeve nuk janë të barabarta
Output-i i rezultuar është:
Përfundim:
Shkallët e lirisë për këtë variabël gjenden në kolonën e tretë të tabelës dhe janë 4 dhe 21794.
Ndërkohë që kriteri i Fisherit ka rezultuar F(4,21794)=8337.999.
9. Vlera e p ose sinjifikanca ka rezultuar p=0.000 pra p<0.05. Kjo do të thotë që hipoteza baze bie
poshtë dhe konkludojmë që mesataret e moshës së këtyre 5 grupeve nuk janë të barabarta.
Për të vlerësuar diferencat midis cdo dy mesatareve duke përdoruar procedureën Tukey me
α=0.05, zgjedhim komandat: Analyze -Compare Means - One-Way ANOVA-Post Hoc
Multiple Comparisons-Tukey.
Output-i rezulton:
Përfundimi: Pas përfundimit të analizës së variancave(ANOVA) konkludoi se hipoteza baze
binte poshte dhe mesataret e 5 grupeve nuk ishin te barabarta. Me anë të procedurës Tukey ne
përcaktojmë se cilat mesatare janë të njëjta dhe cilat ndryshojnë. Në bazë të tabelës së dytë të
quajtur Tukey HSD. Për 5 grupet e marra në analizë ne nuk kemi asnjë ngjashmëri të mesatareve
të ndonjërit prej grupeve. Pra të gjitha mesataret kanë ndryshime të rëndësishme mes tyre.
10. Pyetja 7:
Duke përcaktuar nga skedari dy variabla X dhe Y kryeni një analizë të regresionit të thjeshtë
linear. Interpretoni përfundimet α=0.05.
Çështje teorike:
Analiza regresive është një procedurë statistikore që mund të përdoret për të shprehur lidhjen
mes dy variablave me anën e një ekuacioni matematik. Në përputhje me terminologjinë e
regresionit, variabli që parashikohet me anën e ekuacionit matematik quhet variabël i varur.
Variabli ose variablat që përdoren për të parashikuar vlerën e variablit të varur quhen variabla të
pavarur.
Zgjidhje:
Lidhja mes dy variablave mund të paraqitet duke përdorur një scatter diagram.
Për ta bërë këtë gjë përpara se të kryej një analizë të thjeshtë regresive mes dy variablave të
zgjedhur që janë "Number of Hours" (m2a_Q09) dhe "Age" (M1B_AGE), do paraqis një scatter
diagram. Komandat e përdorura për ndërtimin e tij janë: Graphs-LegacyDialogues-Scatter/dot
Përfundim:
Lidhja mes dy varablave mund të themi që është e papërcaktuar dhe nuk mund të flasim
saktësisht për këtë gjë. Lidhja mes variablave përcaktohet nga ekuacioni:
Y = aX + b
11. ku: a-ordinata në origjinë
b-koeficienti këndor
y-vlera e vlerësuar e variablit të varur
Le të shohim analizën e thjeshtë regresive për këto dy variabla:
Shenojmë hipotezat: H0: β1=0 (Mosha nuk mund të parashikojë numrin e orëve)
Ha: β1=/0(Mosha parashikon numrin e orëve)
Komandat që përdoren nga SPSS janë: Analyze-Regression-Linear…
Outputi është:
Tek tabela e mëposhtme ne mund të arrijmë të marrim informacion edhe për ekuacionin e
regresionit që karakterizon këto variabla:
Përfundimi:
Në këtë tabelë fokusohemi te rreshti i fundit i cili shënon Sig dhe është sinjifikanca ose vlera e p.
Kjo vlerë ka rezultuar e barabartë me 0,522 që do të thotë: p=0.522> α=0.05. Kjo na tregon që
hipoteza bazë nuk mund të hidhet poshtë pra variabli "Age" nuk na ndihmon të parashikojmë
12. vlerat e variablit të varur. Tek tabela e dytë e quajtur tabela e koeficientëve ne marrim
ekuacionin : Y=307 X - 1532 . Ky është edhe ekuacioni i regresionit.
Pyetja 8:
Përcaktoni intervalin e besimit për parametrat e regresionit β0 dhe β1. Shpjegoni. Ndërtoni
intervalin e besimit dhe parashikimit për një vlerë të caktuar x, α=0.05. Interpretoni.
Zgjidhje:
Duke marrë në analizë variablat e një kërkese më sipër pra "Number of Hours" (m2a_Q09) dhe
"Age" (M1B_AGE), nga SPSS marrim tabelën nëpërmjet komandave po të thëna një kërkese më
sipër:
Outputi:
Përfundimi: Rreshti i parë i tabelës përcakton se cili është koeficienti konstant dhe cili i varur.
Në bazë të tabelës ne marrim intervalin e besimit për β0 që varion ]-25308.905; 22244.905[ .
Konkretisht shohim tek rreshti i dytë kolona e fundit dhe rezulton se intervali i besimit të
koeficienti me 95% besim në bazë të SPSS është: ]-3874.481; 4488.481[. Pra mund të themi që
me α=0.05 numri mesatar i orëve gjendet në këtë interval.
Intervali i besimit për parashikimin e një vlere të caktuar x:
Për këtë testim u morën në shqyrtim këta variabla "employed" dhe "AGE".
Komandat e përdoruara për këtë tesim janë : Analyze-Regression-Linear -Kliko “Save…”,
Zgjidh “Unstandardized” predicted values, zgjidh “Unstandardized” dhe “Studentized”
residuals, zgjidh “Mean”
Outputi i SPSS rezulton:
13. Përfundimi:
Në fund të të gjithë variablave në dritaren Data View krijohen variabla të rinj me emërtimet e
tyre përkatëse: (PRE_2) na tregon moshën e parashikuar të vlerës së variablit "employed" e cila
është e para në renditje e kshu me rradhë. Mosha që i përket kësaj vlere është 23.22 vjec. Kurse
(LMC_2) dhe (UMCI_2) na tregojnë intervalin e besimit që mesatarja në rastin tonë në 95%
siguri mosha është mes vlerave 23.0811 dhe 23.33598. Kurse (LICI_2) dhe (UICI_2) na tregon
intervalin e besimit ku mund të gjenden moshat individuale për cdo të punësuar.
Pyetja 9:
Bëni paraqitjen grafike të mbetjeve(termi i gabimit). Cilat janë supozimet për mbetjet në një
regresion? A janë mbetjet të rastësishme? A janë mbetjet të shpeërndara normalisht?
Çështje teorike:
Në analizën e regresionit në cdo vrojtim ekziston edhe një mbetje; ajo është diferenca midis
vlerës së vrojtuar të variablit të varur dhe vlerës së tij të llogaritur me anën e ekuacionit të
regresionit. Kjo mbetje për vrojtimin e i-te (yi-yi') është një vlerësim i gabimit që rezulton nga
përdorimi i ekuacionit të regresionit për parashikimin e vlerave të variablit të varuar. Analiza e
regresionit fillon me supozimin mbi formën e modelit të regresionit. Modeli i regresionit linear
ka formën e mëposhtme:
Y=β0+β1x+ε
Sic shihet Y është funksioni linear i x. Supozimet lidhur me termin e gabimit janë:
E(ε)=0
Varianca ε shënohet me (Ϭ2), është e njëjtë për të gjitha vlerat e x
Vlerat e ε janë të pavarura
14. Termi i gabimit ε është një madhësi e rastit e shpërndarë normalisht.
Zgjidhje
Variablat e marra në shqyrtim jane "emloyed" dhe "age15".
Komandat që na ndihmojnë në ndërtimin e grafikut të termave te mbetjeve janë:
Graphs - Legacy Dialogs - Scatter/Dot… (Simple) me
mbetjet (RES_1) si bosht Y dhe variabli" Age15" si bosht x
Outputi:
Përfundim:
Ky është grafiku i parë që rezulton i mbetjeve të standartizuara. Në grafikun tonë shohim që
forma e grafikut ndryshon në bazë të drejtezave, por që asnjëra nuk shtrihet në një interval të
caktuar si psh -2 dhe 2 apo -3 dhe 3. Kjo tregon që mbetjet nuk janë të shperndara normalisht.
Ky ishte grafiku për variablin e varur "employed".
15. Pyetja 10:
Kryeni një analize regresioni të shumëfishtë linear. (Ju mund të përfshini në ekuacion si variablël
të pavarur edhe ndonjë variabël cilësor). Interpretoni parametrat e regresionit. A ka ndonjë lidhje
regresive midis variablit të varur dhe të paktën njërit prej variablave të pavarur? Shpjegoni.
Çështje teorike:
Modeli probabilitar për analizën e regresionit të shumëfishte është një zgjerim i drejtpërdrejtë i
modeli të regresionit të thjeshtë me një variabël. Ekuacioni i regresionit të thjeshtë mund të
paraqitet.
E(y)=β0+ β1x1 + β2x2
Zgjidhje:
Komandat që mundësojnë analizën e regresionit të shumëfishtë janë: Analyze -Regression-
Linear
Variablat e marrë në shqyrtim për të kryer këtë analizë janë: Duke marrë parasysh që përfshihen
shumë variabla në këtë lloj analize SPSS në dritaren e outputit nxjerr një tabele qe përmbledh
gjithë variablat e përfshirë:
Tabela 1:
Sic mund të shihet pra dhe nga tabela variabli i varur
është "School expenses monthly" dhe gjithë variablat e
kolonës së dytë janë variablat e pavarur. Variabli cilësor
që kam menduar për të përfshirë në këtë analizë regresive
të shumëfishtë është "Urban".
16. Gjithashtu informacionet e tjera që marrim nga SPSS paraqiten nga outputi i mëposhtëm:
Tabela 2:
Përfundim: Kjo është vetem tabela e parë e outputit e cila paraqet në formë matricore fortësine e
lidhjes mes dy variabla. Psh lidhja e variabli të varur "School expenses monthly" dhe "Preschool
Gifts to educational institutions,monthly" rezulton me një vlerë -0.032 që do të thotë që lidhja
mes këtyre variablave është e dobët dhe negative(që do të thotë që vlerat ndryshojnë në kahe të
kundërta). E njëjta logjikë edhe në lidhje me koeficientët e tjerë. Kombinimi në tabelë i nje
variabli të njëjtë jep vleren e korrelacioni 1. Vlera më e larte e lidhjes që paraqitet këtu është e
barabartë me 0.586 dhe ekziston mes variablit te varur dhe "School excursions, monthly". Ky
variabël interpretohet në mënyrën që na tregon se kemi një lidhje relativishte të fortë dhe
pozitive mes variablave të përmenduar më sipër.
Tabela 3:
17. Përfundim: Kjo është dhe tabela ANOVA për regresionin e shumëfishtë linear. Vlera e sig na
tregon nëse modeli është i rëndesishem ose jo. Bazuar në të sig=0.00 modeli ynë është i
rëndësishëm.
Pyetja 11:
Interpretoni vlerat e koeficientit të përcaktueshmërisë dhe të koeficientit të korrigjuar të
përcaktueshmërisë. Kontrolloni rëndësinë e parametrave individualë të regresionit α=0.05
Zgjidhje:
Variablat e zgjedhur për përgjigjen e kësaj pyetje janë po ato që zgjodha në pyetjen e mësipërme.
Outputi:
Përfundimi: Vlera R square dhe Adjusted R square na trgojnë se sa përqind e modelit
shpjegohet nga vlerësimi i variances. R2=0.533 dhe R2 e korrigjuar =0.532. Pra këto vlera kanë
shumë pak ndryshim, që do të thotë që modeli shpjegon 53% te vlerave.
18. Përfundimi: Kjo tabelë njësoj si tek regresioni i thjeshtë linear na tregon lidhjen që kanë
variablat mes tyre, ekuacionin e regresionit të shumëfishtë që paraqitet nga kolona e parë, dhe
intervalet e besimit ku këta koeficientë variojnë. I referohemi rreshtit të dytë të kolonës ku
tregohen variablat. Na jepet një vlerë p=0.000< α=0.05. Kjo na tregon që hipoteza bazë hidhet
poshtë pra variabli i parë pas Constant na ndihmon të parashikojmë vlerat e variablit tonë të
varur. I njëjti arsyetim edhe për varaiblat e tjerë te pavaruar në lidhje me variablin e varuar. Kjo
tabelë gjithashtu na jep edhe ekuacionin e regresionit që në rastin tonë është:
Y=2822.628-0.565x1+0.65x2+0.897x3+1.260x4+1.834x5+2.911x6 + 1.046x7 - 0.17x8-1572.568x9
Pyetja 12:
Kontrolloni nëse variablat e pavarur janë kolinarë. Cfarë do te sugjeronit? Analizoni vlerat e
mbetjeve. Çfarë sugjeron paraqitja grafike e tyre?
Zgjidhje:
Variablat e marrë në analizë janë ata te pyetjes më sipër, pra variablat e pavarur.
Komandat janë: Analyze - Regression- Linear -Click the "Statistics" button
Outputi:
19. Ndërsa ky është grafiku për mbetjet:
Përfundimi: Meqë asnjë nga variablat nuk ka një (VIF) më të madhe se 10 kjo do të thotë që
nuk shfaqen probleme kolinariteti; me fjalë të tjera nuk ka asnjë variabël në këtë modelin tonë që
të mat të njejten lidhje si variablat e tjerë.
Grafiku tregon një lidhje rastësore pa një drejtim konstant.
Pyetja 13:
Kryeni një analizë të regresionit logjik që lidh X1 dhe X2 me Y. Tregoni rëndësinë e Çdo variabli
të pavarur. Interpretoni vlerat e raportit të gjasave për secilën variabël shpjegues.
Çështje teorike:
Regresioni logjistik përcakton ndikimin e shumë variablave të pavarura të dhëna pë të
parashikuar dy ose më shumë variabla të varura. Regresioni logjistik llogarit probabilitetin e
suksesit mbi atë të humbjes, dhe rezultatet e analizës jepen në formë raporti.
Supozimet në e regresionit logjistik janë:
Nuk tregon një lidhje lineare mes variablit të varur dhe atij të pavarur.
Variabli i varur nuk duhet të jetë interval, as i shpërndarë normailisht, as me lidhje
lineare, dhe me varianca jo të barabarta për secilin grup.
Grupet duhet të jenë përjashturese dh përmbledhëse.
Gjithashtu për një analizë sa më të besueshme rekomandohet një minimum rastesh prej
50 të tilla.
Zgjidhje:
Variablat e zgjedhur pë të kryer këtë analizë janë "extreme poverty", "Type of preschool"
(m2a_Q03) dhe "Amount per month" (m2a_Q05)
Komandat që na lejojnë të bëjmë një analizë regresioni logjistik janë: Analyze - Regression -
Binary Logistic.
Outputi:
Tabela 1:
20. Tabela 2:
Përfundimi: Tek tabela e parë e Block 0 e quajtur "Classification Table" ne marrim informacion
se sa përqind janë jo ekstremisht të varfër. Në shembullin tonë kemi 438/443=0.989, që do të
thotë që jo ekstremisht të varfër janë 98.9% e familjeve dhe përqindja që ngelet i përket rastit
janë ekstremisht të varfër.
Poshtë tabelës të quajtur "Model Summary" ne shohim që statistika -2 Log Likelihood është
52.351. Kjo statistikë mat se sa pak modeli parashikon vendimin. Sa më e vogël kjo statistikë aq
më i mirë modeli. Cox Ç Snell R2 mund të interpretohet si R2 në regresionin e shumëfishtëpor
që nuk mund të arrijë një vlerë maksimale të barabartë me një. Nagelkerke R2 mund të arrijë një
vlerë maksimale te barabartë me një.
Tabela e quajtur "Variables in the Equation" në rreshtin e fundit tregon një eksponent të shënuar
[Exp(B)] = 0.011. Kjo tregon që meqë 438 familje ishin jo ekstremisht të varfëra dhe 5 ishin të
tilla vlera e eksponentit rezulton nga 5/438.
Tabela 3:
21. Përfundim: Kjo tabelë na jep ekuacionin e regresionit logjistik. Në rastin tonë rezulton:
Y=-14.919+10.190X2
Të gjithë variablat e përfshirë në analizë rezultojnë statistikisht të rëndësishëm, sepse
sinjifikancat e tyre janë të gjitha mbi α=0.05.
Tabela 4:
Përfundim: Tabela "Classification Table" na tregon ne që të klasifikojmë korrektësisht 0/5=0%
të subjekteve ku ngjarja e parashikuar(ekstremisht të varfër) është vëzhguar. Kjo njihet edhe si
ndjeshmëria e parashikimit. E njëjtalogjikë edhe pë grupin tjetër. Ne këtë rast "Percentage
Correct" e grupit të parë rezulton 100%.
Pyetja 14:
Kryeni një Analizë Diskriminante, nëse keni përdorur të njëjtët variabla si tek 13 dhe 14
krahasoni rezultatet.
Zgjidhje:
Variablat e marrë në studim për këtë analizë janë "region", "Total consumption of hh" dhe "real
food consumption per capita".
22. Komandat e përdoruara janë: Analyze-Classify-Discriminant
Outputi:
Tabela 1:
Përfundim: Një vlerë eigen tregon pjesën e variancës që shpjegohet. Nje vlerë e madhe e kësaj
vlere është e lidhur me një funksion te fortë. Korrelacioni kanonik eshte 0.082 dhe tregohet nga
rreshti i fundit i tabelës. Mund të themi që është jashtëzakonisht shumë i ulët.
Tabela 2:
Përfundim: Një Wilks’ Lambda tregon pjesën e totalit të variancave të pashpjeguara. Nje
lambda e barabartë me 1.00 ndodh kur mesataret e grupeve janë të barabarta, dhe kur është e
ulët ndodh kur asnjë nga grupet nuk u përafrohen variancat. Këtu Lambda është 0.993 me nje
Sig. = 0,000, që do të thotë që mesataret e grupeve duket sikur ndryshojnë shumë pak.
Tabela 3:
Përfundim: Kjo tabelë jep jë përmbledhje të përqindjeve të variablave të klasifikuar
korrektësisht ose jo. Vetë tabela na infromon që 51.2% e grupeve janë klasifikuar korrektësisht.
23. Pyetja 15:
Kryeni një analizë me faktorë duke përdorur metodën VARIMAX, interpretoni rezultatet dhe
krahasojini me rezultatet kur nuk përdoret kjo metodë.
Çështje teorike:
Analiza e Faktorëve ka për qëllim të identifikojë variablat ose faktorët e fshehur që shpjegojnë
korrelacionin në një set observimesh. Kjo analizë është zakonisht e përdorur në të dhëna të
reduktuara për të identifikuar një numër të vogël faktorësh që shpjegojnë një numër shumë të
madh variablash.
Supozimet: Te dhënat duhet të kenë një shpërndarje normale të dyanshme për cdo cift variablash
dhe vëzhgimet duhet të jenë të pavarura.
Zgjidhje:
Variablat e përdorur për këtë analizë janë paraqitur me anë të tabelës të parë që rezulton nga
SPPS:
Komandat e përdoruara për marrjen e outputit në lidhje me analizën e faktorëve janë: Analyze-
Dimension Reduction-Factors.
Outputi:
Tabela 1:
Përfundimi: Kjo tabelë tregon se cilët faktorë janë përzgjedhur. Nese shohim në tre kolonat e
fundit “Rotation Sums of Squared Loadings”, tregon vetëm ata faktorë të metodës extraction. Në
këtë rast vetëm dy faktorë nuk kanë një eigenvalues më të madhe se një.
24. Kolona që tregon “% of variance” na tregon sa nga gjithë variablat bashkë mund të llogariten
nga secila prej shkallëve të faktorëve. Faktori 1 llogaritet për 33.483% e variabilitetit në 6
variblat e zgjedhur gjithësej.
Tabela 2:
Përfundimi: Tabela "Rotated Component Matrix" na tregon se sa peshon secili nga variablat.
Nëse shkojmë në Çdo rresht faktorët që peshojnë më shumë në Çdo variabël. Konkretisht të
gjitha vlerat që i afrohen 1 e plotësojnë kushtin më sipër. Bazuar në tabelë mund të themi që
variabli i dytë peshon në faktorin 1 me një vlerë 0.935. Duke vazhduar me të njëjtën logjikë
mund të themi që faktori 1 ka një vlerë afër 1, i dyti gjithashtu një dhe i treti po një.
Tabela 3:
Metoda e zgjedhur është Quartimax me output:
Përfundimi: Ky është grafiku që i
paraqet të tre komponentët në hapësirë
tredimensionale. Brënda grafikut janë
të gjithë variablat e përfshirë.