Your SlideShare is downloading. ×
Bosiljčić igor   seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Bosiljčić igor seminarski rad - statistička analiza prosečne visine aketiranih studenata ekonomskog fakulteta

2,225
views

Published on


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,225
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
43
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Ekonomski fakultet, Univerzitet Beograd Seminarski rad: Statistička analiza prosečne visine aketiranih studenata Ekonomskog fakulteta Student:Beograd, 2001. Bosiljčić Igor -1-
  • 2. 1. Uvod1.1. Osnovne karakteristike seminarskog rada Cilj ovog seminarskog rada je da objasni pojam, karakteristike, funkciju(primenu) parametara skupa. Rad obrađuje sve parametre sa 2 aspekta: 1. teorijski 2. prakticni. Teorijska dimenzija ima zadatak da objasni pojam - teorijske postavke,karakteristike, primenu svakog parametra. Praktični deo ima za cilj da deaspraktizuje predhodnu dimenzijuobrađivanjem 2 pojave. Podaci su dobijeni sprovođenjem ankete. Odeljak br.2 ovog rada u početnom delu obrađuje sam pojamstatističkih parametara, a kasnije ih nabraja, detaljnije objašnjava i ilustrujeanketnim podacima. Takođe, uz ovaj rad priložena je i disketa sa svim podacima uMajkrosoft Ekselu (Microsoft Excel) kao jedan vid dodatne ilustracije. Svipopunjeni anketni listovi kao i nepopunjeni anketni listić nalaze se u odeljkubr.4.1.2. Postupak sprovođenja ankete i njene osnovne karakteristike U anketi je učestvovalo 100 studenata prve godine Ekonomskogfakulteta(4,5. i 6. grupa) sredinom maja 2001. Na anketnom listiću se nalazi 10pitanja, koja su formirana na osnovu nekoliko principa: 1. Neformalnost – nezvaničnost. Cilj ankete je bio da se dobiju ˝realni˝ podaci o određenoj pojavi kako bi se kasnije iskoristili, a ne da se sprovodi ˝ozbiljno˝ socio-statističko istraživanje. 2. Kratkoća, jasnost, dopadljivost, aktuelnost. Iskustvo je u mnogome delovalo na to da anketni listić bude kratak po sadržini, kako se ne bi odbili studenti. Primećeno je čak da zbog dopadljivosti i aktuelnosti anketni listić je delovao kao ˝intrigirajući faktor˝, pa su se studenti gotovo radovali anketi i nisu je prihvatali kao teret administracije, što je rezultiralo da broj neadekvatno odgovorenih pitanja, tj.neadekvatno popunjenih anketnih listića bude između 1-3% ukupnog skupa.NAPOMENA: Veliki deo tereta sprovođenja ankete je pao na ramena Ivane Erić, kojojželim da se ovom prilikom zahvalim. -2-
  • 3. 2. Parametri skupa Svako naučno istraživanje počinje sagledavanjem načinamanifestovanja određene pojave. Tom prilikom naučnik pravi zapisnik gdezapisuje sve važne karakteristike. Nakon perioda posmatranja sledi faza obradepodataka. Obrada podataka se može izvesti na više načina, ali je ubedljivonajvažniji, najsigurniji i najinfomativniji statistički metod obrade podataka. Na osnovu zapisnika formiraju se statističke serije strukture odnosnovremenske serije u vidu tabela i određenih grafika. Tabele i grafici služe kaopolazna tačka. Njihovim analiziranjem želimo da iz mora podataka izvučemopravilnosti i zakonitosti njihovog ponašanja. Masa podataka uvek pričinjavateškoće prilikom analize. Zato mi težimo da seriju podataka zamenimo sajednim ili većim brojem parametara, koje bi pružile što više informacija o skupu ireprezentovale sam skup. Postavlja se pitanje: Da li smemo uvek da primenimo takav pristup?Nisu sve pojave takve da se mogu predstaviti sa jednim ili sa dva parametra. Unekim slučajevima potrebno je i po nekoliko parametara, međutim, u globaluvaži sledeća konstatacija: Gotovo uvek su vrednosti obeležija uglavnomraspoređene tako da se njihove frekvencije koncentrišu negde oko sredine,između minimalne i maksimalne vrednosti. Sa udaljavanjem od sredinefrekvencije opadaju. Šta je parametar? Parametar je deskriptivna mera koja se odnosi naceo skup. Parametre delimo u 3 velike grupe. Ovaj seminarski rad obuhvata: MERE CENTRALNE TENDENCIJE (2.1.) ARITMETIČKA SREDINA (2.1.1.) GEOMETRIJSKA SREDINA (2.1.2.) HARMONIJSKA SREDINA (2.1.3.) MODUS (2.1.4.) MEDIJANA (KVARTILI) (2.1.5.) MERE DISPERZIJE (2.2.) APSOLUTNE MERE DISPERZIJE (2.2.1.) INTERVAL VARIJACIJE (2.2.1.1.) INTERKVARTILNA RAZLIKA (2.2.1.2.) SREDNJE APSOLUTNO ODSTUPANJE (2.2.1.3.) VARIJANSA SKUPA (2.2.1.4.) STANDARDNA DEVIJACIJA SKUPA (2.2.1.5.) RELATIVNE MERE DISPERZIJE (2.2.2.) KOEFICIJENT VARIJACIJE (2.2.2.1.) KOEF. INTERKVARTILNE VARIJACIJE (2.2.2.2.) STANDARDIZOVANO ODSTUPANJE (2.2.2.3.) -3-
  • 4. MERE OBLIKA RASPOREDA (2.3.) MERE ASIMETRIJE (2.3.1.) RELATIVNA MERA ASIMETRIJE (2.3.1.1.) PEARSON-OV KOEF. ASIMETRIJE (2.3.1.2.) BOWLEY-EV KOEF. ASIMETRIJE (2.3.1.3.) MERE SPLJOŠTENOSTI (2.3.2.) RELATIVNO UČEŠĆE (2.4.)2.1. Mere centralne tendencije Rasporedi frekvencija su izvori informacija o karakteristikama skupova.Rasporedi otkrivaju pre svega tendenciju grupisanja. Srednja vrednost treba da bude pokazatelj centralne tendencije. Onapredstavlja meru centralne tendencije i pokazuje lokaciju skupa. To je jedan odnajznačajnijih pokazatelja numeričkih podataka. Srednja vrednost se koristisvuda u statistici. Ona se koristi za sažimanje strukture skupa i za praćenjenjegove dinamike, tako i kao osnova za druge karakteristike. U zavisnosti od načina odrađivanja centralne vrednosti obeležija skupa,srednje vrednosti se dele na: 1. Izračunate, koje se izračunavaju na osnovu svih vrednostiobelezija. Razlikujemo: 1. Aritmetička sredina 2. Geometrijska sredina 3. Harmonijska sredina 4. Kvadratna sredina 5. Kubna sredina. 2. Pozicione, koje se određuju položajem u seriji: 1. Modus 2. Medijana Koja će se srednja vrednost upotrebiti zavisi od: a) posmatrane pojaveb) načina grupisanja u rasporedu frekvencija, c) svojstva samih srednjihvrednosti. Zajednička svojstva srednjih vrednosti: 1. Utvđuje se objektivnim matematičkim postupkom 2. Njena vrednost se mora nalaziti ižmeđu maksimalne i minimalne vrednosti (Xmin < sr.vr. < Xmax) 3. Ukoliko su te vrednosti obelezija međusobno jednake i srednja vrednost mora biti jednaka toj vrednosti obeležija. -4-
  • 5. 2.1.1. Aritmetička sredina (prosek) Aritmetička sredina se dobija kad se zbir svih vrednosti obeležija podelinjihovim brojem. x + x + ... + x N 1 N µ= 1 2 = ∑ xi N N i =1 Gorenavedena formula služi za izračunavanje aritmetičke sredine kadase svaki podatak javlja samo jedanput, sa frekvenciom 1. U statističkimistraživanjima uglavnom se radi sa grupisanim podacima u vidu radporedafrekvencija. Tako da dobijamo formulu tzv.ponederisane aritmetičke sredine. f x + f 2 x2 + ... + f k xk 1 k µ= 1 1 = ∑ f i xi N N i =1 Međutim, vrlo često se dešava da se pojava daje u grupnimintervalima. Izračunavanje aritmeričke sredine grupnih intervala polazi odpretpostavke da su vrednosti obeležija unutar intervala ravnomernoraspoređeni, što u praksi najčešće nije slučaj, pa dobijeni rezultati sistemackiodstupaju od aritmetičke sredine. Obim ostupanja zavisi od: 1. Širine grupnih intervala 2. Rasporeda unutar njih.Da bismo izračunali aritmetičku sredinu grupnih intervala moramo doći dosredina grupnih intervala i množiti ih sa njihovim frekvencijama. L – granicaintervala. L + LDONJA xi = GORNJA 2 f1 x1 + f 2 x2 + ... + f k xk 1 k µ= = ∑ f i xi N N i =1 Aritmetička sredina je srednja vrednost koja se najčešće koristi kaomera centralne tendencije – sintetički pokazatelj lokacije skupa ili uzorka. Onase može podvrći daljim algebarskim operacijama (aritmetička sredinaaritmetičkih sredina), što drugi ne mogu. Na njenu vrednost utiču sve vrednostiobeležija. Ona izravnava apsolutne varijacije vrednosti obeležija. Ako u skupuima vrednosti koje odskaču, apsolutna sredina može dati iskrivljenu sliku. Zaserije čije vrednosti znatno odstupaju od aritmetičke sredine kažemo da imajuveliku raspršenost ili disperziju.OSOBINE ARITMETIČKE VREDNOSTI: 1. Aritmetička vrednost je veća od minimuma i manja od maksimuma vrednosti nekog obeležija: xMIN < µ < xMAX 2. Aritmetička sredina se izjednačuje sa vrednostima obeležija, kada su one međusobno jednake: x1 = x2 = ... = x i = ... = xk = const. = µ 3. Zbir odstupanja aritmetičke sredine od pojedinih vrednosti obeležija jednak je nuli: N k ∑ xi = 0 i =1 ∑fx i =1 i i =0 -5-
  • 6. 4. Zbir kvadrata odstupanja aritmetičke sredine od pojedinih vrednosti obeležija manji je od zbira kvadrata odstupanja bilo koje vrednosti obeležija x0 (pa i drugih srednjih vrednosti, ako nisu jednake aritmetičkoj sredini) od ostalih vrednosti obeležija: k k ∑ i =1 f i ( xi − µ ) 2 < ∑ f i ( xi − x0 ) 2 i =1 5. Ako su dva obeležija vezana linearnom funkcion, tada su i njihove aritmetičke sredine vezane tom istom linearnom funkciom: y = b0 + b1 x µ y = b0 + b1 µ x Aritmetička sredina najbolje reprezentuje one rasporede kod kojihnajveću frekvenciju imaju one vrednosti koje su najbliže aritmetičkoj sredini.Ona se ne može računati za rasporede sa otvorenim grupnim intervalom, akonisu poznate sredine tih intervala. Aritmetička sredina je često decimalan broj ikao takav može biti nelogičan (prosečan broj dece =2.4). Važna osobina je i daaritmetička sredina u najvećem broju slučajeva pogodnija od svih drugihsrednjih vrednosti uzoraka za ocenu aritmetičke sredine skupa.Tabela 2.1.1.a Prosečna težina studenata (kg). Interval fi xi f i ⋅ xi 40.1 - 51.1 11 45,6 501,6 52.2 - 62.2 27 56,7 1530,9 k 62.3 - 73.3 16 67,8 1084,8 ∑fx i i 6997,2 73.4 - 84.4 14 78,9 1104,6 µ= i =1 = = 72,887500 kg 84.5 - 95.5 12 90,0 1080 k 96 95.6 - 106.6 12 101,1 1213,2 ∑f i =1 i 106.7 - 117.7 1 112,2 112,2 117.8 - 128.8 3 123,3 369,9 k k ∑f i =1 i = 96 ∑fxi =1 i i = 6997,2Tabela 2.1.1.b Prosečna visina studenata (cm). Interval f i xi f i ⋅ xi 145.1 - 152 1 148,5 148,5 152.1 - 159 4 155,5 622 159.1 - 166 10 162,5 1625 166.1 - 173 27 169,5 4576,5 k 173.1 - 180 19 176,5 3353,5 180.1 - 187 13 183,5 2385,5 ∑fx i =1 i i 16972 µ= = = 176,791667cm 187.1 - 194 13 190,5 2476,5 k 96 194.1 - 201 8 197,5 1580 ∑f i =1 i 201.1 - 208 1 204,5 204,5 k k ∑f i =1 i = 96 ∑fx i =1 i i = 16972 -6-
  • 7. 2.1.2. Geometrijska sredina Geometrijska sredina izravnjava relativne (proporcijalne) promeneizmeđu vrednosti podataka. G = N x1 ⋅ x2 ⋅ ... ⋅ x N k ∑ fi G = i=1 x1f1 ⋅ x2f 2 ⋅ ... ⋅ xkf kKao problem se ovde može javiti račun. Sve dok savremeni kalkulatori nisupostali dostupni široj populaciji bilo je veoma teško izračunati recimo258 , 33 8542644,58414 . Tako da se gorenavedene formule mogu transformisati: G = N x1 ⋅ x2 ⋅ ... ⋅ x N log10 1 log10 G = log10 ( x1 ⋅ x2 ⋅ ... ⋅ x N ) N 1 log10 G = log10 ( x1 ⋅ x2 ⋅ ... ⋅ x N ) N 1 log10 G = (log10 x1 + log10 x2 + ... + log10 x N ) N 1 N log10 G = ∑ log10 xi N i =1 1 k log10 G = ∑ f i log10 xi N i =1Zadnja formula se odnosi na grupisane, a pretposlednja na negrupisanepodatke. Iz poslednje dve transformacije možemo izraziti G: N 1 ∑ log10 xi G = 10 N i =1 k 1 ∑ f1 log10 xi G = 10 N i =1Ovaj vid izračunavanja G je računski jednostavniji. Važno je napomenuti da jegeometrijska sredina obično manja od aritmetičke.OSOBINE GEOMETRIJSKE SREDINE: 1. Vrednost geometrijske sredine je uvek između minimalne i maksimalne vrednosti u seriji. 2. Geometrijska sredina se izjednačuje sa vrednostima obeležija, kada su one međusobno jednake: x1 = x2 = ... = x i = ... = x k = const. = G 3. Ona izražava proporcijalne promene podataka. Proizvod odnosa geometrijske sredine prema manjim vrednostima obeležija jednak je proizvodu odnosa većih vrednosti obeležija prema geometrijskoj sredini. Ovo svojstvo se koristi u izražavanju dinamike gde su važnije razlike u odnosima nego u apsolutnim veličinama. -7-
  • 8. G = N x1 ⋅ x2 ⋅ ... ⋅ x N ⇔ G N = x1 ⋅ x2 ⋅ ... ⋅ x N ⇔ G ⋅2⋅3 ⋅ G ⋅2⋅3 = x1 ⋅ x2 ⋅ ... ⋅ xi ⋅ xi +1 ⋅ ...x N ⇔ 1 ...4 1 ...4 4 G 4 G 14424N −4 i 4 i 43 N G ⋅ ... ⋅ G x ⋅ ...x N = i +1 , xi ≤ G ≤ xi +1 x1 ⋅ x2 ⋅ ... ⋅ xi G ⋅ ... ⋅ G U ekonomskim istraživanjima dinamike naročito je rasprostranjenaupotreba geometrijske sredine za izračunavanje stope rasta na osnovu lančanihindeksa.Tabela 2.1.2.a Geometrijska sredina težina studenata (kg). interval fi xi xi f i 40.1 - 51.1 11 45,6 1,772610E+18 52.2 - 62.2 27 56,7 2,221993E+47 62.3 - 73.3 16 67,8 1,993770E+29 k 73.4 - 84.4 14 78,9 3,623081E+26 k ∑ fi 84.5 - 95.5 12 90 2,824295E+23 G = i =1 ∏x fi i = 70,261572kg 95.6 - 106.6 12 101,1 1,140286E+24 i =1 106.7 - 117.7 1 112,2 112,2 117.8 - 128.8 3 123,3 1,874516E+06 k k ∑f i =1 i = 96 ∏x i =1 fi i = 1,927148E+177Tabela 2.1.2.b Geometrijska sredina visina studenata (cm). interval f i xi xi f i 145.1 - 152 1 148,5 1,485000E+02 152.1 - 159 4 155,5 5,846845E+08 159.1 - 166 10 162,5 1,283907E+22 166.1 - 173 27 169,5 1,540217E+60 k k 173.1 - 180 19 176,5 4,876963E+42 ∑ fi G = i =1 ∏x fi i = 176,400775cm 180.1 - 187 13 183,5 2,674662E+29 i =1 187.1 - 194 13 190,5 4,351457E+29 194.1 - 201 8 197,5 2,314924E+18 201.1 - 208 1 204,5 2,045000E+02 k k ∑ i =1 fi = 96 ∏x i =1 fi i = 4,613674E+215 -8-
  • 9. 2.1.3. Harmonijska sredina Harmonijska sredina je recipročna vrednost aritmetičke sredinerecipročnih vrednosti obeležija. xi ≠ 0 N N H= = N 1 1 1 1 + x1 x2 + ... + xN ∑x i =1 i N N H= = k f1 f 2 f f + x1 x2 + ... + k xk ∑ xi i =1 iHarmonijsku sredinu ima smisla tražiti samo za ona obeležija čije su svevrednosti različite od nule. Osetljiva je na male veličine. Ima osobine srednjevrednosti. Primenjuje se uglavnom za računanje indeksnih brojeva – srednjegindeksa i u slučajevima kada su obeležija statističkih jedinica izražena u oblikutzv.recipročnih pokazatelja.Tabela 2.1.3.a Harmonijska sredina težine studenata (kg). fi interval fi xi xi 40.1 - 51.1 11 45,6 0,241228070 52.2 - 62.2 27 56,7 0,476190476 k 62.3 - 73.3 16 67,8 0,235988201 ∑f i =1 i 73.4 - 84.4 14 78,9 0,177439797 H= k = 67,790970 kg 84.5 - 95.5 12 90 0,133333333 f 95.6 - 106.6 12 101,1 0,118694362 ∑ xi i =1 i 106.7 - 117.7 1 112,2 0,008912656 117.8 - 128.8 3 123,3 0,024330900 k k fi ∑f i = 96 ∑x i =1 = 1,416117796 i =1 iTabela 2.1.3.b Harmonijska sredina visine strudenata (cm). fi interval f i xi xi 145.1 - 152 1 148,5 0,006734007 152.1 - 159 4 155,5 0,025723473 k 159.1 - 166 10 162,5 0,061538462 ∑f i 166.1 - 173 27 169,5 0,159292035 H= i =1 = 52,360140cm k 173.1 - 180 19 176,5 0,107648725 f 180.1 - 187 13 183,5 0,070844687 ∑ xi i =1 i 187.1 - 194 13 190,5 0,068241470 194.1 - 201 8 197,5 0,040506329 201.1 - 208 1 204,5 0,004889976 k k fi ∑f i = 96 ∑x i =1 = 0,545419163 i =1 i -9-
  • 10. 2.1.4. Modus Modus je vrednost obeležija koja u posmatranoj seriji ima najvećufrekvenciju – najčešće se javlja i zato je najtipičnija vrednost u seriji. Za serijenegrupisanih podataka utvrđuje se tako što se nađe onaj ko se najviše putaponavlja – najveću frekvenciju. Razlikujemo više tipova modusa: 1. Unimodalni, jedna vrednost sa najvećom frekvencijom 2. Bimodalni, dve vrednosti sa najvećim frekvencijama 3. Multimodalni, više vrednosti sa najvećim frekvencijama Sporedni modus je pojava kad nekoj vrednosti obeležija odgovarafrekvencija veća od frekvencije obeležija neposredno ispred I iza nje. Takvihmodusa može biti više. Može se desiti da modusa nema, tj ako svi elementiimaju istu frekvenciju. Za serije negrupisanih podataka se koristi formula: f 2 − f1 Mo = L1 + ⋅i 2 f 2 − f1 − f 3 L1 je donja granica modalnog intervala, i je dužina grupnog intervala, f 1 , f 2 , f 3 su frekvencije respektivno predmodalnog, modalnog I postmodalnogintervala. Na veličinu modusa ne utiču promene frekvencija, pa ni ekstremnevrednosti. Modus možemo odrediti I kad frekvencije krajnjih obeležija nisupoznate, ali znamo da je frekvencija mala. Modus se može koristiti I kao meracentralne tenndencije atributnih serija. Na veličinu modusa utiče načingrupisanja podataka. Promenom grupnih intervala ili granica menja se I modus.Modus se može naći na početku ili na kraju rasporeda kad ekstremne vrednostiimaju najveću frekvenciju kod recimo tzv.″L″ I ″J ″ rasporeda. U takvimslučajevima modus gubi svojstvo pokazatelja centralne tendencije.Tabela 2.1.4.a Modus rasporeda težina studenata (kg). fi Uviđamo da interval 52,2 – 62,2 ima najveću frekvenciju, pa Interval je to modalni interval. 40.1 - 51.1 11 52.2 - 62.2 27 f 1 = 11; f 2 = 27; f 3 = 16; 62.3 - 73.3 16 i = 11,1; L1 = 52,2; 73.4 - 84.4 14 84.5 - 95.5 12 f 2 − f1 • 95.6 - 106.6 12 Mo = L1 + ⋅ i = 58, 7 kg 106.7 - 117.7 1 2 f 2 − f1 − f 3 117.8 - 128.8 3Tabela 2.1.4.b Modus rasporeda visina studenata (cm). fi Uviđamo da interval 166,1 – 173 ima najveću frekvenciju, pa interval je to modalni interval. 145.1 - 152 1 152.1 - 159 4 f 1 = 10; f 2 = 27; f 3 = 19; 159.1 - 166 10 i = 11,1; L1 = 166.1; 166.1 - 173 27 173.1 - 180 19 f 2 − f1 180.1 - 187 13 Mo = L1 + ⋅ i = 172,839285 cm 187.1 - 194 13 2 f 2 − f1 − f 3 194.1 - 201 8 201.1 - 208 1 - 10 -
  • 11. 2.1.5. Medijana Meddijana je ona vrednost obeležija koja se nalazi u sredini serijeuređene po veličini obeležija, odnosno to je vrednost obeležija koja deli sumusvih frekvencija na dva jednaka dela. Razlikujemo 2 slučaja kada je broj članova N: a) neparan, b) paran. Ako je N neparan broj, tada središnji član deli ovaj niz na dva jdnakadela. Ako je N paran broj, tada u njemu postoje dva srednja člana. Da bi torazrašili tražimo aritmetičku sredinu tih vrednosti. Za serije grupisanih podataka medjuanu dobijamo interpolaciom izmeđudonje i gornje granice intervala grupe u kojoj se medijana nalazi. N − ∑ f1 Me = L1 + 2 ⋅i f Me L1 – je donja granica medijalnog intervala, N – je broj članova serije, ∑ f1 - zbirfrekvencija predmedijalnih intervala, f Me – frekvencija medijalnog intervala, i –dužina intervala medijalnog intervala. Ovaj metod se zasniva na ravnomernom rasporedu članova serije unutarsvake intervalne grupe što nije uvek slučaj. Medijana se da i grafički odrediti. To je apcisa tačke preseka kumulanteispod i kumulante iznad. Medijana zauzima središnji položaj u seriji, što znači da na nju ne utičukrajnje vrednosti obeležija, pa za njeno određivanje i nije potrebno raspolagatitim obeležijima. Ona zavisi od broja i redosleda vrednosti obeležija. Čak uslučajevima kad je teško pribaviti egzaktne podatke za sve članove serije, aliako se oni lako rangiraju moguće je naći središnji član i izmeriti njegovunumeričku vrednost. Medijana nije dobar pokazatelj tamo gde su ekzaktne vrednostikarakteristične za posmatranu pojavu. Medijana se ne može odrediti ni kadaotvoreni interval sadrži više od pola jedinica.KVARTILI Ako se serija podataka rangiranih po veličini podeli na 4 jednaka dela,verdnosti obeležija koje ih dele nazivamo kvartilima. Prvi kvartil – Q1, drugikvartil je ustvari medijana – Me, treći kvartil – Q3. Prvi kvartil je vrednost obeležija od koje 25% elemenata skupa uređenihpo veličini ima manju ili jednaku vrednost. Treći kvartil je vrednost obeležija od koje 75% elemenata skupa uređenihpo veličini ima manju ili jednaku vrednost. N + ∑ f1 Q1 = L1 + 4 ⋅i f Q1 3N + ∑ f1 Q3 = L1 + 4 ⋅i f Q3 - 11 -
  • 12. L1 – donja granica kvartilnog intervala, N – ukupan broj jednica posmatranja,∑ f1 - suma frekvencija predkvartilnog intervala, f Q – frekvencija kvartilnogintervala, i – dužina intervala.Tabela 2.1.5.a Medijana rasporeda težine studenata (kg) interval f i kum ispod Uočavamo da je Q1 interval: 52,2 – 62,2; Me interval: 62,3 – 73,3; Q3 interval: 84,5 – 95,5. Dobijamo: 40.1 - 51.1 11 11 52.2 - 62.2 27 38 62.3 - 73.3 16 54 Q1 = 52,681481kg 73.4 - 84.4 14 68 Me = 62,925 kg 84.5 - 95.5 12 80 • 95.6 - 106.6 12 92 Q3 = 84,8 3 kg 106.7 - 117.7 1 93 117.8 - 128.8 3 96Tabela 2.1.5.b Medijana rasporeda težine studenata (cm) interval f i kum ispod Uočavamo da je Q1 interval: 166,1 – 173; Me interval: 145.1 - 152 1 1 173,1 – 180; Q3 interval: 180,1 - 187. Dobijamo: 152.1 - 159 4 5 • 159.1 - 166 10 15 Q1 = 166,4 3 cm 166.1 - 173 27 42 173.1 - 180 19 61 Me = 173,415789 cm 180.1 - 187 13 74 Q3 = 180,948154 cm 187.1 - 194 13 87 194.1 - 201 8 95 201.1 - 208 1 96 - 12 -
  • 13. 2.2. Mere disperzije Srednja vrednost nije uvek dovoljna da reperezentuje određeni raspored.Problem se javlja jer različiti rasporedi mogu imati istu srednju vrednost – štoznači da oslanjajući se samo na srednju vrednost mi nismo u stanju daodredimo raspored određene pojave. Disperzija je mera koja nam govori kakve su razlike između elemenataodređenog rasporeda.2.2.1. Apsolutne mere disperzije Apsolutne mere disperzije iskazuju varibalitet u apsolutnim iznosima onihmernih jedinica u kojima su dati modaliteti posmatranog obeležija. Ove meremogu biti: 1. Pozicione 2. Izračunate Apsolutne mere disperzije su: 1. Interval varijacije i 2. Interkvartilna razlika iq 3. srednje apsolutno odstupanje d 2 4. varijansa skupa σ 5. standardna devijacija skupa σ .2.2.1.1. Interval varijacije - razmak Od pozicionih razmak – interval varijacije se najčešće koristi. Onpredstavlja razliku između najviše i najniže vrednosti obeležija u seriji. i = X MAX − X MIN Ove mera ima smisla samo za konačne razmake i ne daje punoinformacija o disperziji serije. Ova razlika kod većih serija je veća nego kodmanjih gotovo uvek. Interval varijacije težine studenata je 84kg, a visine je 53cm.2.2.1.2. Interkvartilna razlika Da bi se eleminisao uticaj ekstremnih vrednosti na iznos intervalavarijacije računa se interkvartilna razlika. iq = Q3 − Q1Ova mera isključuje po 25% podataka sa minimalnim i maksimalnimvrednostima obeležija. XMIN Q1 Q3 XMAX iq i - 13 -
  • 14. Ako je i velik, a iq mali, to znači da na krajevima postoje ekstremnevrednosti, ali da ostali članovi ne pokazuju veliki varijabilitet. Ako su i i i iq velikito je slika o varijabilitetu nejasna. Interkvartilna razlika težina strudenata je 32,151852kg, a visina14,512821cm.2.2.1.3. Srednje apsolutno odstupanje Precizniju informaciju o varijabilitetu daje srednje apsolutno odstupanje. 1 N d = ∑ xi − µ N i =1 1 k ∑ f i xi − µ N i =1 d =Tabela 2.2.1.2.a Srednje apsolutno odstupanje individualnih težina od prosečne težine (kg) xi − µ f i xi − µ µ = 72,887500 kg interval f i xi 40.1 - 51.1 11 45.6 27.2875 300.1625 52.2 - 62.2 27 56.7 16.1875 437.0625 k 62.3 - 73.3 16 67.8 5.0875 81.4000 ∑f i xi − µ 73.4 - 84.4 14 78.9 6.0125 84.1750 d = i =1 = 17,054688 kg k 84.5 - 95.5 12 90 17.1125 205.3500 95.6 - 106.6 12 101.1 28.2125 338.5500 ∑f i =1 i 106.7 - 117.7 1 112.2 39.3125 39.3125 117.8 - 128.8 3 123.3 50.4125 151.2375 k k ∑ i =1 fi 96 ∑f i =1 i xi − µ 1637.2500Tabela 2.2.1.2.b Srednje apsolutno odstupanje individualnih visina od prosečne visine (cm) xi − µ f i xi − µ µ = 176,791667cm interval f i xi 145.1 - 152 1 148.5 28.291667 28.291667 152.1 - 159 4 155.5 21.291667 85.166667 159.1 - 166 10 162.5 14.291667 142.916667 k 166.1 - 173 27 169.5 7.291667 196.875000 ∑f i xi − µ 173.1 - 180 19 176.5 0.291667 5.541667 d = i =1 = 9,558160cm k 180.1 - 187 13 183.5 6.708333 87.208333 187.1 - 194 13 190.5 13.708333 178.208333 ∑f i =1 i 194.1 - 201 8 197.5 20.708333 165.666667 201.1 - 208 1 204.5 27.708333 27.708333 k k ∑ i =1 fi 96 ∑f i =1 i xi − µ 917.583333 - 14 -
  • 15. 2.2.1.4. Varijansa skupa Jedan od veoma često korišćenih parametara je varijansa skupa σ 2 .Varijansa je prosečno kvadratno odstupanje elemenata skupa od srednjevrednosti skupa. 1 N σ 2 = ∑ ( xi − µ ) 2 N i =1 1 k σ2 = ∑ f (x i i − µ )2 N i =1Prilikom računanja često se koristi I rezultat sledeće transformacije: 1 k σ 2 = ∑ f i ( xi − µ ) 2 ⇔ N i =1 1 k σ2 = ∑( f x 2 i i −2 ⋅ f i xi µ + f i µ 2 ) ⇔ N i =1 1 k 1 k 1 k σ2 = ∑fx 2 i i −2 µ ⋅ ∑ f i xi + µ 2 ⋅ N ∑ f i ⇔ N i =1 N4=1 3 1 i24 4i=1 123 4 µ 1 1 k σ2 = ∑fx 2 i i −2 µ 2 + µ 2 ⇔ N i =1 1 k σ2 = ∑fx 2 i i −µ 2 N i =12.2.1.5. Standardna devijacija Ovo je najčešće korišćena apsolutna mera disperyije. Dobija se kaopoyitivni koren varijanse. Ona je veća ya serije čije su vrednosti obeležija veća Iobrnuto. 1 N σ= ∑ ( xi − µ ) 2 N i =1 1 k ∑ f i ( xi − µ ) 2 N i =1 σ=Tabela 2.2.1.4-5a Varijansa I standardna devijacija rasporeda težina studenata (kg) interval f i xi xi2 f i ⋅ xi2 k 40.1 - 51.1 11 45.6 2079.360 22872.96 ∑ f i ( xi − µ ) 2 52.2 - 62.2 27 56.7 3214.890 86802.03 σ 2 = i =1 k = 400,218594 kg 62.3 - 73.3 16 67.8 4596.840 73549.44 73.4 - 84.4 14 78.9 6225.210 87152.94 ∑ fi i =1 84.5 - 95.5 12 90.0 8100.000 97200.00 k 95.6 - 106.6 12 101.1 10221.210 122654.52 ∑ f (x i i − µ )2 106.7 - 117.7 1 112.2 12588.840 12588.84 σ= i =1 = 20,005464 kg k 117.8 - 128.8 3 123.3 15202.890 45608.67 k k 2 ∑f i =1 i ∑i =1 fi 96 ∑i =1 fi ⋅ x i 548429.40 - 15 -
  • 16. Tabela 2.2.1.4-5b Varijansa I standardna decijacija rasporeda visina studenata (cm) xi2 f i ⋅ xi2 k interval f i xi f (x − µ )2 ∑ i i 145.1 - 152 1 148.5 22052.25 22052.25 2 i =1 σ = k = 138,748264cm 152.1 - 159 4 155.5 24180.25 96721.00 159.1 - 166 10 162.5 26406.25 264062.50 ∑f i =1 i 166.1 - 173 27 169.5 28730.25 775716.75 k 173.1 - 180 19 176.5 31152.25 591892.75 ∑ f (x i i − µ )2 180.1 - 187 13 183.5 33672.25 437739.25 i =1 187.1 - 194 13 190.5 36290.25 471773.25 σ= k = 11,779145cm 194.1 - 201 8 197.5 39006.25 312050.00 ∑f i =1 i 201.1 - 208 1 204.5 41820.25 41820.25 k k ∑ fi 96 ∑f i ⋅ xi2 3013828 i =1 i =12.2.2. Relativne mere disperzije Za upoređenje raspršenosti dveju ili više serija sa različitim aritmetičkimsredinama ne mogu se koristiti apsolutne mere, jer one variraju sa veličinomorginalne pojave. Relativne mere su upravo to – relativne, odnosnobezdimenzione. Kao takve one omogućavaju da se upoređuju I kvalitativnonajrazličitiji rasporedi. Poznajemo sledeće relativne mere disperzije: 1. koeficijen varijacije 2. keoficijen interkvartilne varijacije 3. standardizovano (normalizovano) odstupanje.2.2.2.1. Koeficijent varijacije Dobija se kao količnik standardne devijacije I srednje vrednosti skupa.Sto je koeficijent veći odstupanje je veće. U serijama gde su svi članovimeđusobno jednaki koeficient varijacije je 0. Njegova prednost je u tome što semože koristiti za poređenje raspršenosti serija čije jedinice nisu jednake. σ V= µ Koeficient varijacije rasporeda težina studenata je 0,274470, a visina je0,066627.2.2.2.2. Interkvartilni koeficijent varijacije Ovaj koeficijent se koristi za upoređenje disperzije više skupova iliuzoraka. Ako je on veći disperzija je veća I obrnuto. On je posebno pogodan zatakve rasporede gde elementi koji se nalaze ispod prvog kvartila I iznad trećegimaju malo uticaja, pa se ovim koeficientom oni I zaobilaze. Ovaj koeficijentmože imati vrednost od 0 do 1, tj.do 100%. Varijacija se može ocenjivati nesamo sa gledišta rasporeda frekvencija kao celine, nego I sa gledištaindividualnih vrednosti. Q − Q1 VQ = 3 Q3 + Q1 - 16 -
  • 17. Koeficient interkvertilne varijacije za raspored težina studenata je0,233806, a za raspored visina je 0,041778.2.2.2.3 Standardizovano (normalizovano) odstupanje Kd se odstupanje od aritmetičke sredine od bilo koj vrednosti izražava ujedinicama standardne devijacije dobijamo normalizovano ili standardizovanoodstupanje. Ovo predstavlja opštu meru odstupanja individualnih podataka odaritmetičke sredine. X −µ Z= σ2.3. Mere oblika rasporeda Pored srednjih vrednosti I disperzija o rasporedu man govore I mereoblika raspored. Pri tom razlikujemo: 1. mere asimetrije 2. mere spljoštenosti Pre nego što pređemo na navedene mere moraju se pomenuti centralnimomenti rasporeda. Centralni momenti rasporeda mere prosečno odstupanjeelemenata skupa od srednje vrednosti skupa diguti na odgovarajući stepen.Razlikujemo: nulti, prvi, drugi (varijansa), treći I četvrti momenat. 1 k M 0 = ∑ f i ( xi − µ ) 0 = 1 N i =1 1 k M1 = ∑ f (x i i − µ )1 = 0 N i =1 1 k M2 = σ 2 = ∑ f (x i i − µ)2 N i =1 1 k M3 = ∑ f (x i i − µ )3 N i =1 1 k M4 = ∑ f i ( xi − µ ) 4 N i =1 Treći momenat – M3 - koristimo za merenje spljoštenosti, a četvrti – M4 -za merenje asimetrije.2.3.1. Mere asimetrije Raspored je asimetričan kad elementi skupa pokazuju tendencijugrupisanja oko vrednosti obeležija iznad ili ispod srednje vrednosti. Razlikujemoviše mera asimetričnosti: 1. Relativnu meru asimetrije 2. Pearson – ov koeficijen asimetrije 3. Bowley – ev keoficijent asimetrije - 17 -
  • 18. 2.3.1.1. Relativna mera asimetrije Relativna mera asimetrije je: M3 α3 = σ3 Kod simetričnih rasporeda ovaj koeficijen je jednak 0, a kod asimetričnihje različit od nule. Kod pozitivne asimetrije (asimetirja udesno) koeficijent je većiod nule, a kod negativne asimetrije (asimetrija ulevo) manji od nule. Štokoeficijent više raylikuje od 0 to je raspored više asimetričan. Raspored jeumereno asimetričan ako je koeficijenu u intervalu (0,±0.5), sve preko toga sesmatra izrazito asimetričnim. Kod simetričnog rasporeda vrednosti aritmetičke sredine, medijane imodusa su međusobno jednake µ = Me = Mo . Kod pozitivne asimetrija stanje je µ f Me f Mo , a kod negativne µ p Me p Mo .Tabela 2.3.1.1.a Relativna mera asimetrije rasporeda težina studenata interval f i xi xi − µ ( xi − µ ) 3 f i ⋅ ( xi − µ ) 3 ( xi − µ ) 4 f i ⋅ ( xi − µ ) 4 40.1 - 51.1 11 45.6 -27.2875 -20318.4814 -223503.2956 554440.5617 6098846.1792 52.2 - 62.2 27 56.7 -16.1875 -4241.6940 -114525.7404 68662.4231 1853885.4239 62.3 - 73.3 16 67.8 -5.0875 -131.6780 -2106.8482 669.9118 10718.5903 73.4 - 84.4 14 78.9 6.0125 217.3528 3042.9394 1306.8337 18295.6731 84.5 - 95.5 12 90 17.1125 5011.1843 60134.2127 85753.8929 1029046.7150 95.6 - 106.6 12 101.1 28.2125 22455.6027 269467.2326 633528.6917 7602344.3010 106.7 - 117.7 1 112.2 39.3125 60756.3937 60756.3937 2388485.7312 2388485.7312 117.8 - 128.8 3 123.3 50.4125 128119.3436 384358.0308 6458816.4105 19376449.2317 k k k ∑i =1 fi 96 ∑ fi ⋅ (xi − µ)3 i =1 437622.9251 ∑ f ⋅ ( x − µ) i =1 i i 4 38378071.8457Tabela 2.3.1.1.b Relativna mera asimetrije rasporeda visina studenata interval f i xi xi − µ ( xi − µ ) 3 f i ⋅ ( xi − µ ) 3 ( xi − µ ) 4 f i ⋅ ( xi − µ ) 4 145.1 - 152 1 148.5 -28.2916 -22645.1706 -22645.1706 640669.6195 640669.6195 152.1 - 159 4 155.5 -21.2916 -9652.2591 -38609.0367 205512.6851 822050.7407 159.1 - 166 10 162.5 -14.2916 -2919.0977 -29190.9772 41718.7717 417187.7170 166.1 - 173 27 169.5 -7.2916 -387.6862 -10467.5292 2826.8790 76325.7344 173.1 - 180 19 176.5 -0.2916 -0.0248 -0.4714 0.0072 0.1374 180.1 - 187 13 183.5 6.7083 301.8866 3924.5264 2025.1562 26327.0312 187.1 - 194 13 190.5 13.7083 2576.0481 33488.6253 35313.3261 459073.2393 194.1 - 201 8 197.5 20.7083 8880.4595 71043.6765 183899.5167 1471196.1342 201.1 - 208 1 204.5 27.7083 21273.1210 21273.1210 589442.7283 589442.7283 k k 96 ∑f i ⋅ (xi − µ)3 28816.7638 ∑ f ⋅ ( x − µ) i i 4 4502273.0824 i =1 i =1 Na osnovu proračuna vidimo da je koeficijent asimetričnosti rasporedatežina studenata 0,569355, a visina 0,183668. - 18 -
  • 19. 2.3.1.2. Pearson-ov koeficijent asimetrije Pearson-ov koeficijent predstavlja odnos raylike aritmetičke sredine imodusa po standardnoj devijaciji. µ − Mo S K1 = σZbog nedostataka modusa, a imajući u vidu da asimetrija nije velika dobijamo: 3( µ − Me ) SK 2 = σ Ako je ovaj Pearson-ov koeficijent jednak nuli to znači da je rasporedsimetričan, dok njegovo približavanje ka +3 odnosno –3 znači pozitivnu ilinegativnu asimetriju rasporeda. Pearsonov koeficijent asimetrije rasporeda težina studenata jeS K1 = 2,293748 i S K 2 = 1,493967 . Raspored visina ima sledeće koeficijente:S K1 = 12,716684 i S K 2 = 0,859793 .2.3.1.3. Bowley-ev koeficient asimetrije Ova mera polazi od činjenice da je kod simetričnih rasporeda frekvencijarazlika između trećeg kvartila i medijane jednaka razlici medijane i prvogkvartila, tj Q3 − Me = Me − Q1 . Q + Q3 − 2Me Sa = 1 Q3 − Q1 Vednosti ovog koeficijenta se kreću u intervalu ±1. Raspored jesimetričan ako je ovaj koeficijent jednak nuli. Bowley-ev koeficijent rasporeda težina strudenata je 0,362804, arasporeda visina 0,037753.2.3.2. Mere spljoštenosti Odnos M4 i σ 4 je koeficijent spljoštenosti. Ako koeficijent uzima vrednost3 to je normalna spljoštenost. Ako raspored uzima vrednosti veće od 3 to je ioblik rasporeda ispupčeniji. Situacija je obrnuta kada ke koeficijen manji od tri,tada dolazi do izražaja spljoštenost rasporeda. Koeficijent spljoštenosti rasporeda težina studenata je 2,495844, arasporeda visina studenata 2,436158. - 19 -
  • 20. 2.4. Relativno učešće Relativno učešće ili prorcija je veoma bitan parametar skupa. On pratielemente sa odgovarajućim karakteristikama. Da bismo sračunali proporciju πmoramo ceo skup podeliti na uspeh i neuspeh. Proporcija je ustvari relativnafrekvencija uspeha u skupu. uspeh uspeh π= = ukupno uspeh + neuspeh 0 ≤π ≤1 Pertpostavka 1.: uspeh = težina u intervalu (µ ± 5%). Dobijamo da jeproporcija: uspeh = 9 uspeh + neuspeh = 96 pa je relativno učešće π = 9,375% Pretpostavka 2.: uspeh = visina u intervalu (µ ± 5%). Dobijamo da jeproporcija: uspeh = 54 uspeh + neuspeh = 96 pa je relativno učešće π = 56,25% - 20 -
  • 21. 3. Literatura1. Dr Mileva Žižić, Dr Miodrag lovrić, Dr Dubravka Pavličić; METODISTATISTIČKE ANALIZE, Beograd 2000. - 21 -