SlideShare a Scribd company logo
1 of 25
Hyrje
Në këtë punim janë treguar disa nga komandat dhe output-tet e softit statistikor SPSS, duke iu
përgjigjur disa kërkesave të cilat do të paraqiten më poshtë në bazë të renditjes së tyre dhe duke
iu referuar variablave të ndryshëm që gjithashtu do të tregohen në kërkesat përkatëse.
Pyetja 1:
Për një variabël sasior të zgjedhur prej jush ndërtoni intervalin e besimit 95% për vlerën
mesatare të variablit dhe interpretoni atë.Supozoni një vlerë për mesataren e këtij variabli dhe
testoni nëse vlerat e tij janë më të vogla se kjo vlerë.
Çështje teorike:
Një interval besimi shpreh zonën rreth mesatares së sample-it që ne mendojmë se mesatarja e
popullsisë ka gjasa të mos pranohet.
Sa më te sigurt ne duam të jemi aq, më të lartë e vendosim koeficientin e besimit: Këta janë
koeficientët e besimit më të përdorshëm.
Vlerat = Ẋ ±1-α/2z(σ/√n)
90% Vlera: Ẋ ±1.645(σ/√n)
95% Vlera: Ẋ ±1.960(σ/√n)
99% Vlera: Ẋ ±2.576(σ/√n)
Zgjidhja:
Komandat e përdoruara për këtë test janë: Analyze-Compare Means-One sample t-test.
Variabli i përdorur për këtë testim është population weight(pweight).
Outputi nga SPSS:
Kërkesa kërkonte që ne të vendosnim një mesatare për këtë popullim të supozuar dhe mesatarja e
supozuar që u vendos ishte: Mesatarja=350.
Ndërkohë që nga SPSS bazuar në tabelën e parë konkludojmë në këto shifra:
Numri i përgjithshëm(N)=25335; Mesatarja=509,1936; Devijimi standart=467,41558;
Tek tabela e dytë na jepet informacion mbi këto vlera:
Përfundimi:
Me vlerën e testuar=350 intervalet e besimit me 95% siguri dhe me shkallë lirie (df)=25334 kanë
rezultuar:
Vlera minimale=153,4377; dhe Vlera maksimale=164,9495
Kjo do të thotë që vlera mesatare varion nga vlera minimale 153,4377 te vlera maksimale
164,9495.
Pyetja 2:
Kontrolloni hipotezën që përpjesa e individëve në zonat urbane është 0.5, me shkallë besimi
95%.
Zgjidhje:
Për përpjesën dimë këto informacione:
Hipotezat janë:
H0: p = 0.5 H0: p >= 0.5 H0: p<=0.5
Ha: p =/ 0.5 Ha: p < 0.5 Ha: p>0.5
Duhet provuar që përjesa e individëve në zonat urbane është 0.5, pra është testimi i parë i
hipotezave që duhet zgjedhur. Për këtë komandat në SPSS janë: Analyze-Compare Means-One
sample t-test.
Variabli i përdorur për këtë testim është urban.
Dhe output-i i softit është:
Përfundimi:
Nga tabela shohim që sinjifikanca(p)<0.05. Kjo do të thotë që hipoteza bazë hidhet poshtë dhe
përpjesa e popullimi nuk është e barabartë me 0.5.
Pyetja 3:
Kontrolloni hipotezën mbi diferencën viteve mesatare të shkollimit të të dy popullimeve, psh
vitet e shkollimit sipas zones urbane për popullsinë 15 vjec e lart, ose sipas gjinisë etj,
α=0.05.(Kujdes! Për vitet e shkollimit llogaritni një tregues te përafërt duke u nisur nga diploma
më lartë përkatëse e secilit). Kontrolloni hipotezën mbi normalitetin dhe barazinë e variancave
për variablin e zgjedhur nga ju. Nëse e gjykoni të përshtatshme mund të përdorni edhe metodat
joparametrike.
Çështje teorike:
Testi statistikor për një sample të pavarur llogaritet nga formula:
Ku:
Ku
x1 = Mesatarja e sample-it te parë
x2 = Mesatarja e sample-it te dytë
n1 = Madhesia e sample-it të parë
n2 = Madhesia e sample-it të dytë
s1 = Devijimi standart t sample-it të parë
s2 = Devijimi standart i sample-it të dytë
Zgjidhje:
Variablat e zgjedhur për të bërë testimin janë "Urban" (urban) dhe "Highest grade completed-
level" (m2b_q04).
Komandat e përdoruar janë: Analyze-Compare Means- Independent-samples t test.
H0: Ska asnjë lidhje midis zonës ku jeton dhe nivelit të edukimit.
Ha :Ka lidhje midis zonës ku jeton dhe nivelit të edukimit.
Outputi për këto variabla është:
Përfundim:
Informacioni i kolonës së dytë tek rreshti i parë i shënjuar me simbolin (Sig) quhet edhe
sinjifikanca. Nëse sig<0.05 hipoteza bazë që pohon që variancat janë të barabarta do të hidhet
poshtë. Në rastin tonë 0.038<0.05 pra na hidhet poshtë hipoteza bazë që do të thotë që variancat
e dy popullimeve Age dhe Urban nuk janë të barabarta.
Rezultati i sinjifikances i shënjuar në tabelë si Sig(2-tailed) tregon probabilitetin e bërjes së
gabimeve nëse ne themi që ka diferenca mes popullimeve.
Tek variablat "AGE" dhe "Highest diploma attained" ka 2 rreshta për secilën. Rreshtit të parë i
referohemi nëse në bazë të testit të hipotezave variancat tona konkludojnë të barabarta, dhe e
kundërta për rreshtin e dytë; ai do të përdoret kur variancat nuk janë të barabarta.
Pyetja 4:
Ndërtoni intervalin e besimit për diferencën e mesatareve të dy popullimeve,α=0.05.
Zgjidhje:
H0:µ1-µ2=0 Diferencat e mesatareve janë të barabarta
Ha:µ1-µ2=/0 Diferencat e mesatareve nuk janë të barabarta
Variablat e zgjedhur për këtë testim janë "Mother Educational Level"(m1a_q13) dhe "Father
Educational Level"(m1a_q19)
Komandat e përdorura për këtë testim janë: Analyze-Compare Means- Independent-samples t
test.
Output-i për këto dy popullime rezulton:
Përfundim:
Duke u përqëndruar vetëm tek dy kolonat e fundit kemi Vlerën minimale= -0.886 dhe Vlerën
maksimale= -0.823, pra intervali i besimit me α= 0.05 për diferencën e mesatareve të dy
popullimeve është ] -0.886; -0.0823[.
Pyetja 5:
Llogarisni koeficientin e korrelacionit midis konsumit real dhe shkollimit. Ndërtoni intervalin e
besimit për koeficientin e korrelacionit të popullimit për popullsinë 15 vjec e lart.
Zgjidhje:
Variabla e zgjedhur për këtë testim janë "Highest diploma attained" dhe "total consumption of
hh".
Komandat e përdoruara janë: Correlate- Bivariate- Pearson.
Output-i që rezulton nga SPSS është:
Përfundim:
Vlera në rreshtin e parë të kolonës së dytë është korrelacioni ose lidhja që rezulton mes këtyre dy
variablave që rezulton me një vlerë të barabartë me 0.174 që e interpretuar do të thotë që lidhje
mes këtyre variablave është e dobët por pozitive.
Sinjifikanca e vendosur në rreshtin e dytë të kolonës së dytë por është të parë(pjesa e dytë)
rezulton p= 0.05. Nga kjo konludojmë që ky koeficient korrelacioni nuk është i rëndësishëm
statistikisht.
Ndërsa për intervalin e besimit të variablit "Age" na jep informacion tabela e mëposhtme:
Intervali i besimit është ]38.457;39.763[, që do të thotë se me 95% siguri mosha mesatare
gjendet këtu, në këtë interval.
Pyetja 6:
Kryeni një Analizë Variance(ANOVA) me një faktor duke përdorur α=0.05. Çfarë supozimesh
duhen bërë? Nëse nuk do të përdornit Analizën e Variancës cilën metodë parametrike do të
sugjeronit. Vlerësoni diferencat midis dy mesatareve duke përdorur procedurën Tukey me
α=0.05 . Interpretoni përfundimet. Ndërtoni intervalet e besimit për diferencat e cdo dy
mesatareve me α=0.05.
Çështje teorike:
Supozimet që duhen bërë për të kryer një analizë ANOVA janë:
 Madhësite e sample-it janë më të vogla se ato të popullsisë.
 Variablat duhet të jenë të pavarur dhe të shpërndarë në mënyrë identike
 Variablat e varur kanë varianca të barabarta
 Variablat duhet të jenë të shpërndarë normalisht
Testi Kruskal-Wallis është i bazuar në teste joparametrike që mund të përdoren për të përcaktuar
nëse ka diferenca statistikisht të rëndësishme ndërmjet 2 ose më shumë grupeve të një variabli të
pavarur në shkallë nominale ose të zakonshme. Kjo ështe konsideruar si një alternativë
joparametrike e Anovës dhe një zgjerim i testit Mann-Whitney, i cili lejon krahasimin e më shumë
se dy grupeve të pavarur.
Zgjidhje:
Variabli i zgjedhur për të bërë këtë analizë është "Age-Years" dhe "Marital Status".
Komandat e përdorura për të kryer këtë analizë janë: Analyze-Compare Means- One-way
Anova.
Hipotezat e ngritura në lidhje me këtë testim janë:
H0:Mesataret e këtyre grupeve janë të barabarta
Ha: Mesataret e këtyre grupeve nuk janë të barabarta
Output-i i rezultuar është:
Përfundim:
Shkallët e lirisë për këtë variabël gjenden në kolonën e tretë të tabelës dhe janë 4 dhe 21794.
Ndërkohë që kriteri i Fisherit ka rezultuar F(4,21794)=8337.999.
Vlera e p ose sinjifikanca ka rezultuar p=0.000 pra p<0.05. Kjo do të thotë që hipoteza baze bie
poshtë dhe konkludojmë që mesataret e moshës së këtyre 5 grupeve nuk janë të barabarta.
Për të vlerësuar diferencat midis cdo dy mesatareve duke përdoruar procedureën Tukey me
α=0.05, zgjedhim komandat: Analyze -Compare Means - One-Way ANOVA-Post Hoc
Multiple Comparisons-Tukey.
Output-i rezulton:
Përfundimi: Pas përfundimit të analizës së variancave(ANOVA) konkludoi se hipoteza baze
binte poshte dhe mesataret e 5 grupeve nuk ishin te barabarta. Me anë të procedurës Tukey ne
përcaktojmë se cilat mesatare janë të njëjta dhe cilat ndryshojnë. Në bazë të tabelës së dytë të
quajtur Tukey HSD. Për 5 grupet e marra në analizë ne nuk kemi asnjë ngjashmëri të mesatareve
të ndonjërit prej grupeve. Pra të gjitha mesataret kanë ndryshime të rëndësishme mes tyre.
Pyetja 7:
Duke përcaktuar nga skedari dy variabla X dhe Y kryeni një analizë të regresionit të thjeshtë
linear. Interpretoni përfundimet α=0.05.
Çështje teorike:
Analiza regresive është një procedurë statistikore që mund të përdoret për të shprehur lidhjen
mes dy variablave me anën e një ekuacioni matematik. Në përputhje me terminologjinë e
regresionit, variabli që parashikohet me anën e ekuacionit matematik quhet variabël i varur.
Variabli ose variablat që përdoren për të parashikuar vlerën e variablit të varur quhen variabla të
pavarur.
Zgjidhje:
Lidhja mes dy variablave mund të paraqitet duke përdorur një scatter diagram.
Për ta bërë këtë gjë përpara se të kryej një analizë të thjeshtë regresive mes dy variablave të
zgjedhur që janë "Number of Hours" (m2a_Q09) dhe "Age" (M1B_AGE), do paraqis një scatter
diagram. Komandat e përdorura për ndërtimin e tij janë: Graphs-LegacyDialogues-Scatter/dot
Përfundim:
Lidhja mes dy varablave mund të themi që është e papërcaktuar dhe nuk mund të flasim
saktësisht për këtë gjë. Lidhja mes variablave përcaktohet nga ekuacioni:
Y = aX + b
ku: a-ordinata në origjinë
b-koeficienti këndor
y-vlera e vlerësuar e variablit të varur
Le të shohim analizën e thjeshtë regresive për këto dy variabla:
Shenojmë hipotezat: H0: β1=0 (Mosha nuk mund të parashikojë numrin e orëve)
Ha: β1=/0(Mosha parashikon numrin e orëve)
Komandat që përdoren nga SPSS janë: Analyze-Regression-Linear…
Outputi është:
Tek tabela e mëposhtme ne mund të arrijmë të marrim informacion edhe për ekuacionin e
regresionit që karakterizon këto variabla:
Përfundimi:
Në këtë tabelë fokusohemi te rreshti i fundit i cili shënon Sig dhe është sinjifikanca ose vlera e p.
Kjo vlerë ka rezultuar e barabartë me 0,522 që do të thotë: p=0.522> α=0.05. Kjo na tregon që
hipoteza bazë nuk mund të hidhet poshtë pra variabli "Age" nuk na ndihmon të parashikojmë
vlerat e variablit të varur. Tek tabela e dytë e quajtur tabela e koeficientëve ne marrim
ekuacionin : Y=307 X - 1532 . Ky është edhe ekuacioni i regresionit.
Pyetja 8:
Përcaktoni intervalin e besimit për parametrat e regresionit β0 dhe β1. Shpjegoni. Ndërtoni
intervalin e besimit dhe parashikimit për një vlerë të caktuar x, α=0.05. Interpretoni.
Zgjidhje:
Duke marrë në analizë variablat e një kërkese më sipër pra "Number of Hours" (m2a_Q09) dhe
"Age" (M1B_AGE), nga SPSS marrim tabelën nëpërmjet komandave po të thëna një kërkese më
sipër:
Outputi:
Përfundimi: Rreshti i parë i tabelës përcakton se cili është koeficienti konstant dhe cili i varur.
Në bazë të tabelës ne marrim intervalin e besimit për β0 që varion ]-25308.905; 22244.905[ .
Konkretisht shohim tek rreshti i dytë kolona e fundit dhe rezulton se intervali i besimit të
koeficienti me 95% besim në bazë të SPSS është: ]-3874.481; 4488.481[. Pra mund të themi që
me α=0.05 numri mesatar i orëve gjendet në këtë interval.
Intervali i besimit për parashikimin e një vlere të caktuar x:
Për këtë testim u morën në shqyrtim këta variabla "employed" dhe "AGE".
Komandat e përdoruara për këtë tesim janë : Analyze-Regression-Linear -Kliko “Save…”,
Zgjidh “Unstandardized” predicted values, zgjidh “Unstandardized” dhe “Studentized”
residuals, zgjidh “Mean”
Outputi i SPSS rezulton:
Përfundimi:
Në fund të të gjithë variablave në dritaren Data View krijohen variabla të rinj me emërtimet e
tyre përkatëse: (PRE_2) na tregon moshën e parashikuar të vlerës së variablit "employed" e cila
është e para në renditje e kshu me rradhë. Mosha që i përket kësaj vlere është 23.22 vjec. Kurse
(LMC_2) dhe (UMCI_2) na tregojnë intervalin e besimit që mesatarja në rastin tonë në 95%
siguri mosha është mes vlerave 23.0811 dhe 23.33598. Kurse (LICI_2) dhe (UICI_2) na tregon
intervalin e besimit ku mund të gjenden moshat individuale për cdo të punësuar.
Pyetja 9:
Bëni paraqitjen grafike të mbetjeve(termi i gabimit). Cilat janë supozimet për mbetjet në një
regresion? A janë mbetjet të rastësishme? A janë mbetjet të shpeërndara normalisht?
Çështje teorike:
Në analizën e regresionit në cdo vrojtim ekziston edhe një mbetje; ajo është diferenca midis
vlerës së vrojtuar të variablit të varur dhe vlerës së tij të llogaritur me anën e ekuacionit të
regresionit. Kjo mbetje për vrojtimin e i-te (yi-yi') është një vlerësim i gabimit që rezulton nga
përdorimi i ekuacionit të regresionit për parashikimin e vlerave të variablit të varuar. Analiza e
regresionit fillon me supozimin mbi formën e modelit të regresionit. Modeli i regresionit linear
ka formën e mëposhtme:
Y=β0+β1x+ε
Sic shihet Y është funksioni linear i x. Supozimet lidhur me termin e gabimit janë:
E(ε)=0
Varianca ε shënohet me (Ϭ2), është e njëjtë për të gjitha vlerat e x
Vlerat e ε janë të pavarura
Termi i gabimit ε është një madhësi e rastit e shpërndarë normalisht.
Zgjidhje
Variablat e marra në shqyrtim jane "emloyed" dhe "age15".
Komandat që na ndihmojnë në ndërtimin e grafikut të termave te mbetjeve janë:
Graphs - Legacy Dialogs - Scatter/Dot… (Simple) me
mbetjet (RES_1) si bosht Y dhe variabli" Age15" si bosht x
Outputi:
Përfundim:
Ky është grafiku i parë që rezulton i mbetjeve të standartizuara. Në grafikun tonë shohim që
forma e grafikut ndryshon në bazë të drejtezave, por që asnjëra nuk shtrihet në një interval të
caktuar si psh -2 dhe 2 apo -3 dhe 3. Kjo tregon që mbetjet nuk janë të shperndara normalisht.
Ky ishte grafiku për variablin e varur "employed".
Pyetja 10:
Kryeni një analize regresioni të shumëfishtë linear. (Ju mund të përfshini në ekuacion si variablël
të pavarur edhe ndonjë variabël cilësor). Interpretoni parametrat e regresionit. A ka ndonjë lidhje
regresive midis variablit të varur dhe të paktën njërit prej variablave të pavarur? Shpjegoni.
Çështje teorike:
Modeli probabilitar për analizën e regresionit të shumëfishte është një zgjerim i drejtpërdrejtë i
modeli të regresionit të thjeshtë me një variabël. Ekuacioni i regresionit të thjeshtë mund të
paraqitet.
E(y)=β0+ β1x1 + β2x2
Zgjidhje:
Komandat që mundësojnë analizën e regresionit të shumëfishtë janë: Analyze -Regression-
Linear
Variablat e marrë në shqyrtim për të kryer këtë analizë janë: Duke marrë parasysh që përfshihen
shumë variabla në këtë lloj analize SPSS në dritaren e outputit nxjerr një tabele qe përmbledh
gjithë variablat e përfshirë:
Tabela 1:
Sic mund të shihet pra dhe nga tabela variabli i varur
është "School expenses monthly" dhe gjithë variablat e
kolonës së dytë janë variablat e pavarur. Variabli cilësor
që kam menduar për të përfshirë në këtë analizë regresive
të shumëfishtë është "Urban".
Gjithashtu informacionet e tjera që marrim nga SPSS paraqiten nga outputi i mëposhtëm:
Tabela 2:
Përfundim: Kjo është vetem tabela e parë e outputit e cila paraqet në formë matricore fortësine e
lidhjes mes dy variabla. Psh lidhja e variabli të varur "School expenses monthly" dhe "Preschool
Gifts to educational institutions,monthly" rezulton me një vlerë -0.032 që do të thotë që lidhja
mes këtyre variablave është e dobët dhe negative(që do të thotë që vlerat ndryshojnë në kahe të
kundërta). E njëjta logjikë edhe në lidhje me koeficientët e tjerë. Kombinimi në tabelë i nje
variabli të njëjtë jep vleren e korrelacioni 1. Vlera më e larte e lidhjes që paraqitet këtu është e
barabartë me 0.586 dhe ekziston mes variablit te varur dhe "School excursions, monthly". Ky
variabël interpretohet në mënyrën që na tregon se kemi një lidhje relativishte të fortë dhe
pozitive mes variablave të përmenduar më sipër.
Tabela 3:
Përfundim: Kjo është dhe tabela ANOVA për regresionin e shumëfishtë linear. Vlera e sig na
tregon nëse modeli është i rëndesishem ose jo. Bazuar në të sig=0.00 modeli ynë është i
rëndësishëm.
Pyetja 11:
Interpretoni vlerat e koeficientit të përcaktueshmërisë dhe të koeficientit të korrigjuar të
përcaktueshmërisë. Kontrolloni rëndësinë e parametrave individualë të regresionit α=0.05
Zgjidhje:
Variablat e zgjedhur për përgjigjen e kësaj pyetje janë po ato që zgjodha në pyetjen e mësipërme.
Outputi:
Përfundimi: Vlera R square dhe Adjusted R square na trgojnë se sa përqind e modelit
shpjegohet nga vlerësimi i variances. R2=0.533 dhe R2 e korrigjuar =0.532. Pra këto vlera kanë
shumë pak ndryshim, që do të thotë që modeli shpjegon 53% te vlerave.
Përfundimi: Kjo tabelë njësoj si tek regresioni i thjeshtë linear na tregon lidhjen që kanë
variablat mes tyre, ekuacionin e regresionit të shumëfishtë që paraqitet nga kolona e parë, dhe
intervalet e besimit ku këta koeficientë variojnë. I referohemi rreshtit të dytë të kolonës ku
tregohen variablat. Na jepet një vlerë p=0.000< α=0.05. Kjo na tregon që hipoteza bazë hidhet
poshtë pra variabli i parë pas Constant na ndihmon të parashikojmë vlerat e variablit tonë të
varur. I njëjti arsyetim edhe për varaiblat e tjerë te pavaruar në lidhje me variablin e varuar. Kjo
tabelë gjithashtu na jep edhe ekuacionin e regresionit që në rastin tonë është:
Y=2822.628-0.565x1+0.65x2+0.897x3+1.260x4+1.834x5+2.911x6 + 1.046x7 - 0.17x8-1572.568x9
Pyetja 12:
Kontrolloni nëse variablat e pavarur janë kolinarë. Cfarë do te sugjeronit? Analizoni vlerat e
mbetjeve. Çfarë sugjeron paraqitja grafike e tyre?
Zgjidhje:
Variablat e marrë në analizë janë ata te pyetjes më sipër, pra variablat e pavarur.
Komandat janë: Analyze - Regression- Linear -Click the "Statistics" button
Outputi:
Ndërsa ky është grafiku për mbetjet:
Përfundimi: Meqë asnjë nga variablat nuk ka një (VIF) më të madhe se 10 kjo do të thotë që
nuk shfaqen probleme kolinariteti; me fjalë të tjera nuk ka asnjë variabël në këtë modelin tonë që
të mat të njejten lidhje si variablat e tjerë.
Grafiku tregon një lidhje rastësore pa një drejtim konstant.
Pyetja 13:
Kryeni një analizë të regresionit logjik që lidh X1 dhe X2 me Y. Tregoni rëndësinë e Çdo variabli
të pavarur. Interpretoni vlerat e raportit të gjasave për secilën variabël shpjegues.
Çështje teorike:
Regresioni logjistik përcakton ndikimin e shumë variablave të pavarura të dhëna pë të
parashikuar dy ose më shumë variabla të varura. Regresioni logjistik llogarit probabilitetin e
suksesit mbi atë të humbjes, dhe rezultatet e analizës jepen në formë raporti.
Supozimet në e regresionit logjistik janë:
Nuk tregon një lidhje lineare mes variablit të varur dhe atij të pavarur.
Variabli i varur nuk duhet të jetë interval, as i shpërndarë normailisht, as me lidhje
lineare, dhe me varianca jo të barabarta për secilin grup.
Grupet duhet të jenë përjashturese dh përmbledhëse.
Gjithashtu për një analizë sa më të besueshme rekomandohet një minimum rastesh prej
50 të tilla.
Zgjidhje:
Variablat e zgjedhur pë të kryer këtë analizë janë "extreme poverty", "Type of preschool"
(m2a_Q03) dhe "Amount per month" (m2a_Q05)
Komandat që na lejojnë të bëjmë një analizë regresioni logjistik janë: Analyze - Regression -
Binary Logistic.
Outputi:
Tabela 1:
Tabela 2:
Përfundimi: Tek tabela e parë e Block 0 e quajtur "Classification Table" ne marrim informacion
se sa përqind janë jo ekstremisht të varfër. Në shembullin tonë kemi 438/443=0.989, që do të
thotë që jo ekstremisht të varfër janë 98.9% e familjeve dhe përqindja që ngelet i përket rastit
janë ekstremisht të varfër.
Poshtë tabelës të quajtur "Model Summary" ne shohim që statistika -2 Log Likelihood është
52.351. Kjo statistikë mat se sa pak modeli parashikon vendimin. Sa më e vogël kjo statistikë aq
më i mirë modeli. Cox Ç Snell R2 mund të interpretohet si R2 në regresionin e shumëfishtëpor
që nuk mund të arrijë një vlerë maksimale të barabartë me një. Nagelkerke R2 mund të arrijë një
vlerë maksimale te barabartë me një.
Tabela e quajtur "Variables in the Equation" në rreshtin e fundit tregon një eksponent të shënuar
[Exp(B)] = 0.011. Kjo tregon që meqë 438 familje ishin jo ekstremisht të varfëra dhe 5 ishin të
tilla vlera e eksponentit rezulton nga 5/438.
Tabela 3:
Përfundim: Kjo tabelë na jep ekuacionin e regresionit logjistik. Në rastin tonë rezulton:
Y=-14.919+10.190X2
Të gjithë variablat e përfshirë në analizë rezultojnë statistikisht të rëndësishëm, sepse
sinjifikancat e tyre janë të gjitha mbi α=0.05.
Tabela 4:
Përfundim: Tabela "Classification Table" na tregon ne që të klasifikojmë korrektësisht 0/5=0%
të subjekteve ku ngjarja e parashikuar(ekstremisht të varfër) është vëzhguar. Kjo njihet edhe si
ndjeshmëria e parashikimit. E njëjtalogjikë edhe pë grupin tjetër. Ne këtë rast "Percentage
Correct" e grupit të parë rezulton 100%.
Pyetja 14:
Kryeni një Analizë Diskriminante, nëse keni përdorur të njëjtët variabla si tek 13 dhe 14
krahasoni rezultatet.
Zgjidhje:
Variablat e marrë në studim për këtë analizë janë "region", "Total consumption of hh" dhe "real
food consumption per capita".
Komandat e përdoruara janë: Analyze-Classify-Discriminant
Outputi:
Tabela 1:
Përfundim: Një vlerë eigen tregon pjesën e variancës që shpjegohet. Nje vlerë e madhe e kësaj
vlere është e lidhur me një funksion te fortë. Korrelacioni kanonik eshte 0.082 dhe tregohet nga
rreshti i fundit i tabelës. Mund të themi që është jashtëzakonisht shumë i ulët.
Tabela 2:
Përfundim: Një Wilks’ Lambda tregon pjesën e totalit të variancave të pashpjeguara. Nje
lambda e barabartë me 1.00 ndodh kur mesataret e grupeve janë të barabarta, dhe kur është e
ulët ndodh kur asnjë nga grupet nuk u përafrohen variancat. Këtu Lambda është 0.993 me nje
Sig. = 0,000, që do të thotë që mesataret e grupeve duket sikur ndryshojnë shumë pak.
Tabela 3:
Përfundim: Kjo tabelë jep jë përmbledhje të përqindjeve të variablave të klasifikuar
korrektësisht ose jo. Vetë tabela na infromon që 51.2% e grupeve janë klasifikuar korrektësisht.
Pyetja 15:
Kryeni një analizë me faktorë duke përdorur metodën VARIMAX, interpretoni rezultatet dhe
krahasojini me rezultatet kur nuk përdoret kjo metodë.
Çështje teorike:
Analiza e Faktorëve ka për qëllim të identifikojë variablat ose faktorët e fshehur që shpjegojnë
korrelacionin në një set observimesh. Kjo analizë është zakonisht e përdorur në të dhëna të
reduktuara për të identifikuar një numër të vogël faktorësh që shpjegojnë një numër shumë të
madh variablash.
Supozimet: Te dhënat duhet të kenë një shpërndarje normale të dyanshme për cdo cift variablash
dhe vëzhgimet duhet të jenë të pavarura.
Zgjidhje:
Variablat e përdorur për këtë analizë janë paraqitur me anë të tabelës të parë që rezulton nga
SPPS:
Komandat e përdoruara për marrjen e outputit në lidhje me analizën e faktorëve janë: Analyze-
Dimension Reduction-Factors.
Outputi:
Tabela 1:
Përfundimi: Kjo tabelë tregon se cilët faktorë janë përzgjedhur. Nese shohim në tre kolonat e
fundit “Rotation Sums of Squared Loadings”, tregon vetëm ata faktorë të metodës extraction. Në
këtë rast vetëm dy faktorë nuk kanë një eigenvalues më të madhe se një.
Kolona që tregon “% of variance” na tregon sa nga gjithë variablat bashkë mund të llogariten
nga secila prej shkallëve të faktorëve. Faktori 1 llogaritet për 33.483% e variabilitetit në 6
variblat e zgjedhur gjithësej.
Tabela 2:
Përfundimi: Tabela "Rotated Component Matrix" na tregon se sa peshon secili nga variablat.
Nëse shkojmë në Çdo rresht faktorët që peshojnë më shumë në Çdo variabël. Konkretisht të
gjitha vlerat që i afrohen 1 e plotësojnë kushtin më sipër. Bazuar në tabelë mund të themi që
variabli i dytë peshon në faktorin 1 me një vlerë 0.935. Duke vazhduar me të njëjtën logjikë
mund të themi që faktori 1 ka një vlerë afër 1, i dyti gjithashtu një dhe i treti po një.
Tabela 3:
Metoda e zgjedhur është Quartimax me output:
Përfundimi: Ky është grafiku që i
paraqet të tre komponentët në hapësirë
tredimensionale. Brënda grafikut janë
të gjithë variablat e përfshirë.
Përfundim: Interpretimi i njëjtë si më sipër.

More Related Content

What's hot

Analiza e regresionit dhe korrelacionit
Analiza e regresionit dhe korrelacionitAnaliza e regresionit dhe korrelacionit
Analiza e regresionit dhe korrelacionitMenaxherat
 
Metodat e analizës dinamike
Metodat e analizës dinamikeMetodat e analizës dinamike
Metodat e analizës dinamikeMenaxherat
 
Ligjerata 8 indekset
Ligjerata 8   indeksetLigjerata 8   indekset
Ligjerata 8 indeksetcoupletea
 
Statistike, ushtrime 2
Statistike, ushtrime 2Statistike, ushtrime 2
Statistike, ushtrime 2coupletea
 
Treguesit e lokalizimit dhe te variacionit
Treguesit e lokalizimit dhe te variacionitTreguesit e lokalizimit dhe te variacionit
Treguesit e lokalizimit dhe te variacionitMenaxherat
 
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)fatonbajrami1
 
Ushtrime nga lenda e statistikes
Ushtrime nga lenda e statistikesUshtrime nga lenda e statistikes
Ushtrime nga lenda e statistikeskulla 2010
 
Ligjerata 9 treguesit e variacionit
Ligjerata 9   treguesit e variacionitLigjerata 9   treguesit e variacionit
Ligjerata 9 treguesit e variacionitcoupletea
 
Bazat e Statistikes
Bazat e StatistikesBazat e Statistikes
Bazat e Statistikesguestc49863
 
Ligjerata 2 konceptet themelore ne statistike dhe llojet e te dhenave
Ligjerata 2   konceptet themelore ne statistike dhe llojet e te dhenaveLigjerata 2   konceptet themelore ne statistike dhe llojet e te dhenave
Ligjerata 2 konceptet themelore ne statistike dhe llojet e te dhenavecoupletea
 
Nocioni i statistikes
Nocioni i statistikesNocioni i statistikes
Nocioni i statistikesMenaxherat
 
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)fatonbajrami1
 
Numrat indeksor
Numrat indeksorNumrat indeksor
Numrat indeksorMenaxherat
 
Statistike dhe probabilitet
Statistike dhe probabilitetStatistike dhe probabilitet
Statistike dhe probabilitetMelissa Cani
 
Statistike nocionet kryesore dhe mostra ligjerata 2 - ardiana gashi
Statistike   nocionet kryesore dhe mostra ligjerata 2 - ardiana gashiStatistike   nocionet kryesore dhe mostra ligjerata 2 - ardiana gashi
Statistike nocionet kryesore dhe mostra ligjerata 2 - ardiana gashiMenaxherat
 
Ushtrime statistika all
Ushtrime statistika allUshtrime statistika all
Ushtrime statistika allcoupletea
 

What's hot (20)

Analiza e regresionit dhe korrelacionit
Analiza e regresionit dhe korrelacionitAnaliza e regresionit dhe korrelacionit
Analiza e regresionit dhe korrelacionit
 
Metodat e analizës dinamike
Metodat e analizës dinamikeMetodat e analizës dinamike
Metodat e analizës dinamike
 
Ligjerata 8 indekset
Ligjerata 8   indeksetLigjerata 8   indekset
Ligjerata 8 indekset
 
Statistika
StatistikaStatistika
Statistika
 
Statistike, ushtrime 2
Statistike, ushtrime 2Statistike, ushtrime 2
Statistike, ushtrime 2
 
Treguesit e lokalizimit dhe te variacionit
Treguesit e lokalizimit dhe te variacionitTreguesit e lokalizimit dhe te variacionit
Treguesit e lokalizimit dhe te variacionit
 
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)
STATISTIKA - Dr. Rahmije Mustafa (Provime nga afatet e kaluara)
 
Ushtrime nga lenda e statistikes
Ushtrime nga lenda e statistikesUshtrime nga lenda e statistikes
Ushtrime nga lenda e statistikes
 
Ligjerata 9 treguesit e variacionit
Ligjerata 9   treguesit e variacionitLigjerata 9   treguesit e variacionit
Ligjerata 9 treguesit e variacionit
 
Bazat e Statistikes
Bazat e StatistikesBazat e Statistikes
Bazat e Statistikes
 
Statistik.ppt
Statistik.pptStatistik.ppt
Statistik.ppt
 
Ligjerata 2 konceptet themelore ne statistike dhe llojet e te dhenave
Ligjerata 2   konceptet themelore ne statistike dhe llojet e te dhenaveLigjerata 2   konceptet themelore ne statistike dhe llojet e te dhenave
Ligjerata 2 konceptet themelore ne statistike dhe llojet e te dhenave
 
Nocioni i statistikes
Nocioni i statistikesNocioni i statistikes
Nocioni i statistikes
 
Elasticiteti i ofertës dhe këkresës
Elasticiteti i ofertës dhe këkresësElasticiteti i ofertës dhe këkresës
Elasticiteti i ofertës dhe këkresës
 
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)
STATISTIKA - Dr. Rahmije Mustafa (Ushtrime)
 
Numrat indeksor
Numrat indeksorNumrat indeksor
Numrat indeksor
 
Statistike dhe probabilitet
Statistike dhe probabilitetStatistike dhe probabilitet
Statistike dhe probabilitet
 
Statistike nocionet kryesore dhe mostra ligjerata 2 - ardiana gashi
Statistike   nocionet kryesore dhe mostra ligjerata 2 - ardiana gashiStatistike   nocionet kryesore dhe mostra ligjerata 2 - ardiana gashi
Statistike nocionet kryesore dhe mostra ligjerata 2 - ardiana gashi
 
Ushtrime statistika all
Ushtrime statistika allUshtrime statistika all
Ushtrime statistika all
 
Varianca
VariancaVarianca
Varianca
 

Viewers also liked

Analiza dhe përpunimi i të dhënave (1) (1)
Analiza dhe përpunimi i të dhënave (1) (1)Analiza dhe përpunimi i të dhënave (1) (1)
Analiza dhe përpunimi i të dhënave (1) (1)Arbenng
 
Market share analysis
Market share analysisMarket share analysis
Market share analysisStiv Mello
 
Markat dhe Menaxhimi i Markave
Markat dhe Menaxhimi i MarkaveMarkat dhe Menaxhimi i Markave
Markat dhe Menaxhimi i MarkaveKujtim Hameli
 
Hotel Sheraton (Detyre Kursi)
Hotel Sheraton (Detyre Kursi)Hotel Sheraton (Detyre Kursi)
Hotel Sheraton (Detyre Kursi)KetiGjipali
 
Instrumentet e metodes se anketimit
Instrumentet e metodes se anketimitInstrumentet e metodes se anketimit
Instrumentet e metodes se anketimitstudent
 
Testimi i hipotezave,mostra e madhe
Testimi i hipotezave,mostra e madheTestimi i hipotezave,mostra e madhe
Testimi i hipotezave,mostra e madheMenaxherat
 
BCG Matrix of Nestle
BCG Matrix of NestleBCG Matrix of Nestle
BCG Matrix of NestleMutahir Bilal
 
Analiza statistikore e të dhënave - Ardiana Gashi
Analiza statistikore e të dhënave - Ardiana GashiAnaliza statistikore e të dhënave - Ardiana Gashi
Analiza statistikore e të dhënave - Ardiana GashiMenaxherat
 
BCG matrix with example
BCG matrix with exampleBCG matrix with example
BCG matrix with exampleMayur Narole
 

Viewers also liked (11)

Analiza dhe përpunimi i të dhënave (1) (1)
Analiza dhe përpunimi i të dhënave (1) (1)Analiza dhe përpunimi i të dhënave (1) (1)
Analiza dhe përpunimi i të dhënave (1) (1)
 
Market share analysis
Market share analysisMarket share analysis
Market share analysis
 
Markat dhe Menaxhimi i Markave
Markat dhe Menaxhimi i MarkaveMarkat dhe Menaxhimi i Markave
Markat dhe Menaxhimi i Markave
 
Hotel Sheraton (Detyre Kursi)
Hotel Sheraton (Detyre Kursi)Hotel Sheraton (Detyre Kursi)
Hotel Sheraton (Detyre Kursi)
 
Instrumentet e metodes se anketimit
Instrumentet e metodes se anketimitInstrumentet e metodes se anketimit
Instrumentet e metodes se anketimit
 
Chi square test
Chi square testChi square test
Chi square test
 
Testimi i hipotezave,mostra e madhe
Testimi i hipotezave,mostra e madheTestimi i hipotezave,mostra e madhe
Testimi i hipotezave,mostra e madhe
 
BCG Matrix of Nestle
BCG Matrix of NestleBCG Matrix of Nestle
BCG Matrix of Nestle
 
Analiza statistikore e të dhënave - Ardiana Gashi
Analiza statistikore e të dhënave - Ardiana GashiAnaliza statistikore e të dhënave - Ardiana Gashi
Analiza statistikore e të dhënave - Ardiana Gashi
 
BCG matrix with example
BCG matrix with exampleBCG matrix with example
BCG matrix with example
 
Introduction to spss
Introduction to spssIntroduction to spss
Introduction to spss
 

More from Ester Daci

Building a data warehouse
Building a data warehouseBuilding a data warehouse
Building a data warehouseEster Daci
 
Projekt-Ekonometrie.
Projekt-Ekonometrie.Projekt-Ekonometrie.
Projekt-Ekonometrie.Ester Daci
 
KodheliDaciKratellariLekaj
KodheliDaciKratellariLekajKodheliDaciKratellariLekaj
KodheliDaciKratellariLekajEster Daci
 

More from Ester Daci (6)

Building a data warehouse
Building a data warehouseBuilding a data warehouse
Building a data warehouse
 
mis
mismis
mis
 
Projekt-Ekonometrie.
Projekt-Ekonometrie.Projekt-Ekonometrie.
Projekt-Ekonometrie.
 
projkti-ssh
projkti-sshprojkti-ssh
projkti-ssh
 
C++-Projekt
C++-ProjektC++-Projekt
C++-Projekt
 
KodheliDaciKratellariLekaj
KodheliDaciKratellariLekajKodheliDaciKratellariLekaj
KodheliDaciKratellariLekaj
 

projekti-spss

  • 1. Hyrje Në këtë punim janë treguar disa nga komandat dhe output-tet e softit statistikor SPSS, duke iu përgjigjur disa kërkesave të cilat do të paraqiten më poshtë në bazë të renditjes së tyre dhe duke iu referuar variablave të ndryshëm që gjithashtu do të tregohen në kërkesat përkatëse. Pyetja 1: Për një variabël sasior të zgjedhur prej jush ndërtoni intervalin e besimit 95% për vlerën mesatare të variablit dhe interpretoni atë.Supozoni një vlerë për mesataren e këtij variabli dhe testoni nëse vlerat e tij janë më të vogla se kjo vlerë. Çështje teorike: Një interval besimi shpreh zonën rreth mesatares së sample-it që ne mendojmë se mesatarja e popullsisë ka gjasa të mos pranohet. Sa më te sigurt ne duam të jemi aq, më të lartë e vendosim koeficientin e besimit: Këta janë koeficientët e besimit më të përdorshëm. Vlerat = Ẋ ±1-α/2z(σ/√n) 90% Vlera: Ẋ ±1.645(σ/√n) 95% Vlera: Ẋ ±1.960(σ/√n) 99% Vlera: Ẋ ±2.576(σ/√n) Zgjidhja: Komandat e përdoruara për këtë test janë: Analyze-Compare Means-One sample t-test. Variabli i përdorur për këtë testim është population weight(pweight). Outputi nga SPSS:
  • 2. Kërkesa kërkonte që ne të vendosnim një mesatare për këtë popullim të supozuar dhe mesatarja e supozuar që u vendos ishte: Mesatarja=350. Ndërkohë që nga SPSS bazuar në tabelën e parë konkludojmë në këto shifra: Numri i përgjithshëm(N)=25335; Mesatarja=509,1936; Devijimi standart=467,41558; Tek tabela e dytë na jepet informacion mbi këto vlera: Përfundimi: Me vlerën e testuar=350 intervalet e besimit me 95% siguri dhe me shkallë lirie (df)=25334 kanë rezultuar: Vlera minimale=153,4377; dhe Vlera maksimale=164,9495 Kjo do të thotë që vlera mesatare varion nga vlera minimale 153,4377 te vlera maksimale 164,9495. Pyetja 2: Kontrolloni hipotezën që përpjesa e individëve në zonat urbane është 0.5, me shkallë besimi 95%. Zgjidhje: Për përpjesën dimë këto informacione: Hipotezat janë: H0: p = 0.5 H0: p >= 0.5 H0: p<=0.5 Ha: p =/ 0.5 Ha: p < 0.5 Ha: p>0.5 Duhet provuar që përjesa e individëve në zonat urbane është 0.5, pra është testimi i parë i hipotezave që duhet zgjedhur. Për këtë komandat në SPSS janë: Analyze-Compare Means-One sample t-test. Variabli i përdorur për këtë testim është urban. Dhe output-i i softit është:
  • 3. Përfundimi: Nga tabela shohim që sinjifikanca(p)<0.05. Kjo do të thotë që hipoteza bazë hidhet poshtë dhe përpjesa e popullimi nuk është e barabartë me 0.5. Pyetja 3: Kontrolloni hipotezën mbi diferencën viteve mesatare të shkollimit të të dy popullimeve, psh vitet e shkollimit sipas zones urbane për popullsinë 15 vjec e lart, ose sipas gjinisë etj, α=0.05.(Kujdes! Për vitet e shkollimit llogaritni një tregues te përafërt duke u nisur nga diploma më lartë përkatëse e secilit). Kontrolloni hipotezën mbi normalitetin dhe barazinë e variancave për variablin e zgjedhur nga ju. Nëse e gjykoni të përshtatshme mund të përdorni edhe metodat joparametrike. Çështje teorike: Testi statistikor për një sample të pavarur llogaritet nga formula: Ku:
  • 4. Ku x1 = Mesatarja e sample-it te parë x2 = Mesatarja e sample-it te dytë n1 = Madhesia e sample-it të parë n2 = Madhesia e sample-it të dytë s1 = Devijimi standart t sample-it të parë s2 = Devijimi standart i sample-it të dytë Zgjidhje: Variablat e zgjedhur për të bërë testimin janë "Urban" (urban) dhe "Highest grade completed- level" (m2b_q04). Komandat e përdoruar janë: Analyze-Compare Means- Independent-samples t test. H0: Ska asnjë lidhje midis zonës ku jeton dhe nivelit të edukimit. Ha :Ka lidhje midis zonës ku jeton dhe nivelit të edukimit. Outputi për këto variabla është:
  • 5. Përfundim: Informacioni i kolonës së dytë tek rreshti i parë i shënjuar me simbolin (Sig) quhet edhe sinjifikanca. Nëse sig<0.05 hipoteza bazë që pohon që variancat janë të barabarta do të hidhet poshtë. Në rastin tonë 0.038<0.05 pra na hidhet poshtë hipoteza bazë që do të thotë që variancat e dy popullimeve Age dhe Urban nuk janë të barabarta. Rezultati i sinjifikances i shënjuar në tabelë si Sig(2-tailed) tregon probabilitetin e bërjes së gabimeve nëse ne themi që ka diferenca mes popullimeve. Tek variablat "AGE" dhe "Highest diploma attained" ka 2 rreshta për secilën. Rreshtit të parë i referohemi nëse në bazë të testit të hipotezave variancat tona konkludojnë të barabarta, dhe e kundërta për rreshtin e dytë; ai do të përdoret kur variancat nuk janë të barabarta. Pyetja 4: Ndërtoni intervalin e besimit për diferencën e mesatareve të dy popullimeve,α=0.05. Zgjidhje: H0:µ1-µ2=0 Diferencat e mesatareve janë të barabarta Ha:µ1-µ2=/0 Diferencat e mesatareve nuk janë të barabarta Variablat e zgjedhur për këtë testim janë "Mother Educational Level"(m1a_q13) dhe "Father Educational Level"(m1a_q19) Komandat e përdorura për këtë testim janë: Analyze-Compare Means- Independent-samples t test. Output-i për këto dy popullime rezulton:
  • 6. Përfundim: Duke u përqëndruar vetëm tek dy kolonat e fundit kemi Vlerën minimale= -0.886 dhe Vlerën maksimale= -0.823, pra intervali i besimit me α= 0.05 për diferencën e mesatareve të dy popullimeve është ] -0.886; -0.0823[. Pyetja 5: Llogarisni koeficientin e korrelacionit midis konsumit real dhe shkollimit. Ndërtoni intervalin e besimit për koeficientin e korrelacionit të popullimit për popullsinë 15 vjec e lart. Zgjidhje: Variabla e zgjedhur për këtë testim janë "Highest diploma attained" dhe "total consumption of hh". Komandat e përdoruara janë: Correlate- Bivariate- Pearson. Output-i që rezulton nga SPSS është: Përfundim: Vlera në rreshtin e parë të kolonës së dytë është korrelacioni ose lidhja që rezulton mes këtyre dy variablave që rezulton me një vlerë të barabartë me 0.174 që e interpretuar do të thotë që lidhje mes këtyre variablave është e dobët por pozitive. Sinjifikanca e vendosur në rreshtin e dytë të kolonës së dytë por është të parë(pjesa e dytë) rezulton p= 0.05. Nga kjo konludojmë që ky koeficient korrelacioni nuk është i rëndësishëm statistikisht.
  • 7. Ndërsa për intervalin e besimit të variablit "Age" na jep informacion tabela e mëposhtme: Intervali i besimit është ]38.457;39.763[, që do të thotë se me 95% siguri mosha mesatare gjendet këtu, në këtë interval. Pyetja 6: Kryeni një Analizë Variance(ANOVA) me një faktor duke përdorur α=0.05. Çfarë supozimesh duhen bërë? Nëse nuk do të përdornit Analizën e Variancës cilën metodë parametrike do të sugjeronit. Vlerësoni diferencat midis dy mesatareve duke përdorur procedurën Tukey me α=0.05 . Interpretoni përfundimet. Ndërtoni intervalet e besimit për diferencat e cdo dy mesatareve me α=0.05. Çështje teorike: Supozimet që duhen bërë për të kryer një analizë ANOVA janë:  Madhësite e sample-it janë më të vogla se ato të popullsisë.  Variablat duhet të jenë të pavarur dhe të shpërndarë në mënyrë identike  Variablat e varur kanë varianca të barabarta  Variablat duhet të jenë të shpërndarë normalisht Testi Kruskal-Wallis është i bazuar në teste joparametrike që mund të përdoren për të përcaktuar nëse ka diferenca statistikisht të rëndësishme ndërmjet 2 ose më shumë grupeve të një variabli të pavarur në shkallë nominale ose të zakonshme. Kjo ështe konsideruar si një alternativë joparametrike e Anovës dhe një zgjerim i testit Mann-Whitney, i cili lejon krahasimin e më shumë se dy grupeve të pavarur.
  • 8. Zgjidhje: Variabli i zgjedhur për të bërë këtë analizë është "Age-Years" dhe "Marital Status". Komandat e përdorura për të kryer këtë analizë janë: Analyze-Compare Means- One-way Anova. Hipotezat e ngritura në lidhje me këtë testim janë: H0:Mesataret e këtyre grupeve janë të barabarta Ha: Mesataret e këtyre grupeve nuk janë të barabarta Output-i i rezultuar është: Përfundim: Shkallët e lirisë për këtë variabël gjenden në kolonën e tretë të tabelës dhe janë 4 dhe 21794. Ndërkohë që kriteri i Fisherit ka rezultuar F(4,21794)=8337.999.
  • 9. Vlera e p ose sinjifikanca ka rezultuar p=0.000 pra p<0.05. Kjo do të thotë që hipoteza baze bie poshtë dhe konkludojmë që mesataret e moshës së këtyre 5 grupeve nuk janë të barabarta. Për të vlerësuar diferencat midis cdo dy mesatareve duke përdoruar procedureën Tukey me α=0.05, zgjedhim komandat: Analyze -Compare Means - One-Way ANOVA-Post Hoc Multiple Comparisons-Tukey. Output-i rezulton: Përfundimi: Pas përfundimit të analizës së variancave(ANOVA) konkludoi se hipoteza baze binte poshte dhe mesataret e 5 grupeve nuk ishin te barabarta. Me anë të procedurës Tukey ne përcaktojmë se cilat mesatare janë të njëjta dhe cilat ndryshojnë. Në bazë të tabelës së dytë të quajtur Tukey HSD. Për 5 grupet e marra në analizë ne nuk kemi asnjë ngjashmëri të mesatareve të ndonjërit prej grupeve. Pra të gjitha mesataret kanë ndryshime të rëndësishme mes tyre.
  • 10. Pyetja 7: Duke përcaktuar nga skedari dy variabla X dhe Y kryeni një analizë të regresionit të thjeshtë linear. Interpretoni përfundimet α=0.05. Çështje teorike: Analiza regresive është një procedurë statistikore që mund të përdoret për të shprehur lidhjen mes dy variablave me anën e një ekuacioni matematik. Në përputhje me terminologjinë e regresionit, variabli që parashikohet me anën e ekuacionit matematik quhet variabël i varur. Variabli ose variablat që përdoren për të parashikuar vlerën e variablit të varur quhen variabla të pavarur. Zgjidhje: Lidhja mes dy variablave mund të paraqitet duke përdorur një scatter diagram. Për ta bërë këtë gjë përpara se të kryej një analizë të thjeshtë regresive mes dy variablave të zgjedhur që janë "Number of Hours" (m2a_Q09) dhe "Age" (M1B_AGE), do paraqis një scatter diagram. Komandat e përdorura për ndërtimin e tij janë: Graphs-LegacyDialogues-Scatter/dot Përfundim: Lidhja mes dy varablave mund të themi që është e papërcaktuar dhe nuk mund të flasim saktësisht për këtë gjë. Lidhja mes variablave përcaktohet nga ekuacioni: Y = aX + b
  • 11. ku: a-ordinata në origjinë b-koeficienti këndor y-vlera e vlerësuar e variablit të varur Le të shohim analizën e thjeshtë regresive për këto dy variabla: Shenojmë hipotezat: H0: β1=0 (Mosha nuk mund të parashikojë numrin e orëve) Ha: β1=/0(Mosha parashikon numrin e orëve) Komandat që përdoren nga SPSS janë: Analyze-Regression-Linear… Outputi është: Tek tabela e mëposhtme ne mund të arrijmë të marrim informacion edhe për ekuacionin e regresionit që karakterizon këto variabla: Përfundimi: Në këtë tabelë fokusohemi te rreshti i fundit i cili shënon Sig dhe është sinjifikanca ose vlera e p. Kjo vlerë ka rezultuar e barabartë me 0,522 që do të thotë: p=0.522> α=0.05. Kjo na tregon që hipoteza bazë nuk mund të hidhet poshtë pra variabli "Age" nuk na ndihmon të parashikojmë
  • 12. vlerat e variablit të varur. Tek tabela e dytë e quajtur tabela e koeficientëve ne marrim ekuacionin : Y=307 X - 1532 . Ky është edhe ekuacioni i regresionit. Pyetja 8: Përcaktoni intervalin e besimit për parametrat e regresionit β0 dhe β1. Shpjegoni. Ndërtoni intervalin e besimit dhe parashikimit për një vlerë të caktuar x, α=0.05. Interpretoni. Zgjidhje: Duke marrë në analizë variablat e një kërkese më sipër pra "Number of Hours" (m2a_Q09) dhe "Age" (M1B_AGE), nga SPSS marrim tabelën nëpërmjet komandave po të thëna një kërkese më sipër: Outputi: Përfundimi: Rreshti i parë i tabelës përcakton se cili është koeficienti konstant dhe cili i varur. Në bazë të tabelës ne marrim intervalin e besimit për β0 që varion ]-25308.905; 22244.905[ . Konkretisht shohim tek rreshti i dytë kolona e fundit dhe rezulton se intervali i besimit të koeficienti me 95% besim në bazë të SPSS është: ]-3874.481; 4488.481[. Pra mund të themi që me α=0.05 numri mesatar i orëve gjendet në këtë interval. Intervali i besimit për parashikimin e një vlere të caktuar x: Për këtë testim u morën në shqyrtim këta variabla "employed" dhe "AGE". Komandat e përdoruara për këtë tesim janë : Analyze-Regression-Linear -Kliko “Save…”, Zgjidh “Unstandardized” predicted values, zgjidh “Unstandardized” dhe “Studentized” residuals, zgjidh “Mean” Outputi i SPSS rezulton:
  • 13. Përfundimi: Në fund të të gjithë variablave në dritaren Data View krijohen variabla të rinj me emërtimet e tyre përkatëse: (PRE_2) na tregon moshën e parashikuar të vlerës së variablit "employed" e cila është e para në renditje e kshu me rradhë. Mosha që i përket kësaj vlere është 23.22 vjec. Kurse (LMC_2) dhe (UMCI_2) na tregojnë intervalin e besimit që mesatarja në rastin tonë në 95% siguri mosha është mes vlerave 23.0811 dhe 23.33598. Kurse (LICI_2) dhe (UICI_2) na tregon intervalin e besimit ku mund të gjenden moshat individuale për cdo të punësuar. Pyetja 9: Bëni paraqitjen grafike të mbetjeve(termi i gabimit). Cilat janë supozimet për mbetjet në një regresion? A janë mbetjet të rastësishme? A janë mbetjet të shpeërndara normalisht? Çështje teorike: Në analizën e regresionit në cdo vrojtim ekziston edhe një mbetje; ajo është diferenca midis vlerës së vrojtuar të variablit të varur dhe vlerës së tij të llogaritur me anën e ekuacionit të regresionit. Kjo mbetje për vrojtimin e i-te (yi-yi') është një vlerësim i gabimit që rezulton nga përdorimi i ekuacionit të regresionit për parashikimin e vlerave të variablit të varuar. Analiza e regresionit fillon me supozimin mbi formën e modelit të regresionit. Modeli i regresionit linear ka formën e mëposhtme: Y=β0+β1x+ε Sic shihet Y është funksioni linear i x. Supozimet lidhur me termin e gabimit janë: E(ε)=0 Varianca ε shënohet me (Ϭ2), është e njëjtë për të gjitha vlerat e x Vlerat e ε janë të pavarura
  • 14. Termi i gabimit ε është një madhësi e rastit e shpërndarë normalisht. Zgjidhje Variablat e marra në shqyrtim jane "emloyed" dhe "age15". Komandat që na ndihmojnë në ndërtimin e grafikut të termave te mbetjeve janë: Graphs - Legacy Dialogs - Scatter/Dot… (Simple) me mbetjet (RES_1) si bosht Y dhe variabli" Age15" si bosht x Outputi: Përfundim: Ky është grafiku i parë që rezulton i mbetjeve të standartizuara. Në grafikun tonë shohim që forma e grafikut ndryshon në bazë të drejtezave, por që asnjëra nuk shtrihet në një interval të caktuar si psh -2 dhe 2 apo -3 dhe 3. Kjo tregon që mbetjet nuk janë të shperndara normalisht. Ky ishte grafiku për variablin e varur "employed".
  • 15. Pyetja 10: Kryeni një analize regresioni të shumëfishtë linear. (Ju mund të përfshini në ekuacion si variablël të pavarur edhe ndonjë variabël cilësor). Interpretoni parametrat e regresionit. A ka ndonjë lidhje regresive midis variablit të varur dhe të paktën njërit prej variablave të pavarur? Shpjegoni. Çështje teorike: Modeli probabilitar për analizën e regresionit të shumëfishte është një zgjerim i drejtpërdrejtë i modeli të regresionit të thjeshtë me një variabël. Ekuacioni i regresionit të thjeshtë mund të paraqitet. E(y)=β0+ β1x1 + β2x2 Zgjidhje: Komandat që mundësojnë analizën e regresionit të shumëfishtë janë: Analyze -Regression- Linear Variablat e marrë në shqyrtim për të kryer këtë analizë janë: Duke marrë parasysh që përfshihen shumë variabla në këtë lloj analize SPSS në dritaren e outputit nxjerr një tabele qe përmbledh gjithë variablat e përfshirë: Tabela 1: Sic mund të shihet pra dhe nga tabela variabli i varur është "School expenses monthly" dhe gjithë variablat e kolonës së dytë janë variablat e pavarur. Variabli cilësor që kam menduar për të përfshirë në këtë analizë regresive të shumëfishtë është "Urban".
  • 16. Gjithashtu informacionet e tjera që marrim nga SPSS paraqiten nga outputi i mëposhtëm: Tabela 2: Përfundim: Kjo është vetem tabela e parë e outputit e cila paraqet në formë matricore fortësine e lidhjes mes dy variabla. Psh lidhja e variabli të varur "School expenses monthly" dhe "Preschool Gifts to educational institutions,monthly" rezulton me një vlerë -0.032 që do të thotë që lidhja mes këtyre variablave është e dobët dhe negative(që do të thotë që vlerat ndryshojnë në kahe të kundërta). E njëjta logjikë edhe në lidhje me koeficientët e tjerë. Kombinimi në tabelë i nje variabli të njëjtë jep vleren e korrelacioni 1. Vlera më e larte e lidhjes që paraqitet këtu është e barabartë me 0.586 dhe ekziston mes variablit te varur dhe "School excursions, monthly". Ky variabël interpretohet në mënyrën që na tregon se kemi një lidhje relativishte të fortë dhe pozitive mes variablave të përmenduar më sipër. Tabela 3:
  • 17. Përfundim: Kjo është dhe tabela ANOVA për regresionin e shumëfishtë linear. Vlera e sig na tregon nëse modeli është i rëndesishem ose jo. Bazuar në të sig=0.00 modeli ynë është i rëndësishëm. Pyetja 11: Interpretoni vlerat e koeficientit të përcaktueshmërisë dhe të koeficientit të korrigjuar të përcaktueshmërisë. Kontrolloni rëndësinë e parametrave individualë të regresionit α=0.05 Zgjidhje: Variablat e zgjedhur për përgjigjen e kësaj pyetje janë po ato që zgjodha në pyetjen e mësipërme. Outputi: Përfundimi: Vlera R square dhe Adjusted R square na trgojnë se sa përqind e modelit shpjegohet nga vlerësimi i variances. R2=0.533 dhe R2 e korrigjuar =0.532. Pra këto vlera kanë shumë pak ndryshim, që do të thotë që modeli shpjegon 53% te vlerave.
  • 18. Përfundimi: Kjo tabelë njësoj si tek regresioni i thjeshtë linear na tregon lidhjen që kanë variablat mes tyre, ekuacionin e regresionit të shumëfishtë që paraqitet nga kolona e parë, dhe intervalet e besimit ku këta koeficientë variojnë. I referohemi rreshtit të dytë të kolonës ku tregohen variablat. Na jepet një vlerë p=0.000< α=0.05. Kjo na tregon që hipoteza bazë hidhet poshtë pra variabli i parë pas Constant na ndihmon të parashikojmë vlerat e variablit tonë të varur. I njëjti arsyetim edhe për varaiblat e tjerë te pavaruar në lidhje me variablin e varuar. Kjo tabelë gjithashtu na jep edhe ekuacionin e regresionit që në rastin tonë është: Y=2822.628-0.565x1+0.65x2+0.897x3+1.260x4+1.834x5+2.911x6 + 1.046x7 - 0.17x8-1572.568x9 Pyetja 12: Kontrolloni nëse variablat e pavarur janë kolinarë. Cfarë do te sugjeronit? Analizoni vlerat e mbetjeve. Çfarë sugjeron paraqitja grafike e tyre? Zgjidhje: Variablat e marrë në analizë janë ata te pyetjes më sipër, pra variablat e pavarur. Komandat janë: Analyze - Regression- Linear -Click the "Statistics" button Outputi:
  • 19. Ndërsa ky është grafiku për mbetjet: Përfundimi: Meqë asnjë nga variablat nuk ka një (VIF) më të madhe se 10 kjo do të thotë që nuk shfaqen probleme kolinariteti; me fjalë të tjera nuk ka asnjë variabël në këtë modelin tonë që të mat të njejten lidhje si variablat e tjerë. Grafiku tregon një lidhje rastësore pa një drejtim konstant. Pyetja 13: Kryeni një analizë të regresionit logjik që lidh X1 dhe X2 me Y. Tregoni rëndësinë e Çdo variabli të pavarur. Interpretoni vlerat e raportit të gjasave për secilën variabël shpjegues. Çështje teorike: Regresioni logjistik përcakton ndikimin e shumë variablave të pavarura të dhëna pë të parashikuar dy ose më shumë variabla të varura. Regresioni logjistik llogarit probabilitetin e suksesit mbi atë të humbjes, dhe rezultatet e analizës jepen në formë raporti. Supozimet në e regresionit logjistik janë: Nuk tregon një lidhje lineare mes variablit të varur dhe atij të pavarur. Variabli i varur nuk duhet të jetë interval, as i shpërndarë normailisht, as me lidhje lineare, dhe me varianca jo të barabarta për secilin grup. Grupet duhet të jenë përjashturese dh përmbledhëse. Gjithashtu për një analizë sa më të besueshme rekomandohet një minimum rastesh prej 50 të tilla. Zgjidhje: Variablat e zgjedhur pë të kryer këtë analizë janë "extreme poverty", "Type of preschool" (m2a_Q03) dhe "Amount per month" (m2a_Q05) Komandat që na lejojnë të bëjmë një analizë regresioni logjistik janë: Analyze - Regression - Binary Logistic. Outputi: Tabela 1:
  • 20. Tabela 2: Përfundimi: Tek tabela e parë e Block 0 e quajtur "Classification Table" ne marrim informacion se sa përqind janë jo ekstremisht të varfër. Në shembullin tonë kemi 438/443=0.989, që do të thotë që jo ekstremisht të varfër janë 98.9% e familjeve dhe përqindja që ngelet i përket rastit janë ekstremisht të varfër. Poshtë tabelës të quajtur "Model Summary" ne shohim që statistika -2 Log Likelihood është 52.351. Kjo statistikë mat se sa pak modeli parashikon vendimin. Sa më e vogël kjo statistikë aq më i mirë modeli. Cox Ç Snell R2 mund të interpretohet si R2 në regresionin e shumëfishtëpor që nuk mund të arrijë një vlerë maksimale të barabartë me një. Nagelkerke R2 mund të arrijë një vlerë maksimale te barabartë me një. Tabela e quajtur "Variables in the Equation" në rreshtin e fundit tregon një eksponent të shënuar [Exp(B)] = 0.011. Kjo tregon që meqë 438 familje ishin jo ekstremisht të varfëra dhe 5 ishin të tilla vlera e eksponentit rezulton nga 5/438. Tabela 3:
  • 21. Përfundim: Kjo tabelë na jep ekuacionin e regresionit logjistik. Në rastin tonë rezulton: Y=-14.919+10.190X2 Të gjithë variablat e përfshirë në analizë rezultojnë statistikisht të rëndësishëm, sepse sinjifikancat e tyre janë të gjitha mbi α=0.05. Tabela 4: Përfundim: Tabela "Classification Table" na tregon ne që të klasifikojmë korrektësisht 0/5=0% të subjekteve ku ngjarja e parashikuar(ekstremisht të varfër) është vëzhguar. Kjo njihet edhe si ndjeshmëria e parashikimit. E njëjtalogjikë edhe pë grupin tjetër. Ne këtë rast "Percentage Correct" e grupit të parë rezulton 100%. Pyetja 14: Kryeni një Analizë Diskriminante, nëse keni përdorur të njëjtët variabla si tek 13 dhe 14 krahasoni rezultatet. Zgjidhje: Variablat e marrë në studim për këtë analizë janë "region", "Total consumption of hh" dhe "real food consumption per capita".
  • 22. Komandat e përdoruara janë: Analyze-Classify-Discriminant Outputi: Tabela 1: Përfundim: Një vlerë eigen tregon pjesën e variancës që shpjegohet. Nje vlerë e madhe e kësaj vlere është e lidhur me një funksion te fortë. Korrelacioni kanonik eshte 0.082 dhe tregohet nga rreshti i fundit i tabelës. Mund të themi që është jashtëzakonisht shumë i ulët. Tabela 2: Përfundim: Një Wilks’ Lambda tregon pjesën e totalit të variancave të pashpjeguara. Nje lambda e barabartë me 1.00 ndodh kur mesataret e grupeve janë të barabarta, dhe kur është e ulët ndodh kur asnjë nga grupet nuk u përafrohen variancat. Këtu Lambda është 0.993 me nje Sig. = 0,000, që do të thotë që mesataret e grupeve duket sikur ndryshojnë shumë pak. Tabela 3: Përfundim: Kjo tabelë jep jë përmbledhje të përqindjeve të variablave të klasifikuar korrektësisht ose jo. Vetë tabela na infromon që 51.2% e grupeve janë klasifikuar korrektësisht.
  • 23. Pyetja 15: Kryeni një analizë me faktorë duke përdorur metodën VARIMAX, interpretoni rezultatet dhe krahasojini me rezultatet kur nuk përdoret kjo metodë. Çështje teorike: Analiza e Faktorëve ka për qëllim të identifikojë variablat ose faktorët e fshehur që shpjegojnë korrelacionin në një set observimesh. Kjo analizë është zakonisht e përdorur në të dhëna të reduktuara për të identifikuar një numër të vogël faktorësh që shpjegojnë një numër shumë të madh variablash. Supozimet: Te dhënat duhet të kenë një shpërndarje normale të dyanshme për cdo cift variablash dhe vëzhgimet duhet të jenë të pavarura. Zgjidhje: Variablat e përdorur për këtë analizë janë paraqitur me anë të tabelës të parë që rezulton nga SPPS: Komandat e përdoruara për marrjen e outputit në lidhje me analizën e faktorëve janë: Analyze- Dimension Reduction-Factors. Outputi: Tabela 1: Përfundimi: Kjo tabelë tregon se cilët faktorë janë përzgjedhur. Nese shohim në tre kolonat e fundit “Rotation Sums of Squared Loadings”, tregon vetëm ata faktorë të metodës extraction. Në këtë rast vetëm dy faktorë nuk kanë një eigenvalues më të madhe se një.
  • 24. Kolona që tregon “% of variance” na tregon sa nga gjithë variablat bashkë mund të llogariten nga secila prej shkallëve të faktorëve. Faktori 1 llogaritet për 33.483% e variabilitetit në 6 variblat e zgjedhur gjithësej. Tabela 2: Përfundimi: Tabela "Rotated Component Matrix" na tregon se sa peshon secili nga variablat. Nëse shkojmë në Çdo rresht faktorët që peshojnë më shumë në Çdo variabël. Konkretisht të gjitha vlerat që i afrohen 1 e plotësojnë kushtin më sipër. Bazuar në tabelë mund të themi që variabli i dytë peshon në faktorin 1 me një vlerë 0.935. Duke vazhduar me të njëjtën logjikë mund të themi që faktori 1 ka një vlerë afër 1, i dyti gjithashtu një dhe i treti po një. Tabela 3: Metoda e zgjedhur është Quartimax me output: Përfundimi: Ky është grafiku që i paraqet të tre komponentët në hapësirë tredimensionale. Brënda grafikut janë të gjithë variablat e përfshirë.
  • 25. Përfundim: Interpretimi i njëjtë si më sipër.