Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
štatistika
1. *Vysvetlite štatistické pojmy:
• charakteristiky polohy
• charakteristiky variability
Riešenie:
Charakteristiky polohy
a) Aritmetický priemer:
b) Geometrický priemer:
c) Harmonický priemer:
d) Modus mod(x) je najčastejšie sa vyskytujúca hodnota štatistického súboru.
e) Medián med(x) je:
• stredná hodnota štatistického súboru, v ktorom sú štatistické jednotky usporiadané
podľa veľkosti a ktorých je nepárny počet
• aritmetický priemer dvoch stredných štatistických jednotiek, ak štatistický súbor má
párny počet štatistických jednotiek
Charakteristiky variability
a) Variačné rozpätie
R = xmax - xmin
b) Rozptyl (disperzia)
c) Smerodajná odchýlka
*Auto išlo prvú polovicu cesty priemernou rýchlosťou v1 = 20 km/hod a druhú polovicu cesty
priemernou rýchlosťou v2 = 80 km/hod. Akou priemernou rýchlosťou auto išlo?
2. Riešenie:
Auto každú polovicu cesty išlo rôznou rýchlosťou, preto ich prešlo za rôzne časy.
Priemernú rýchlosť auta vypočítame ako harmonický priemer rýchlostí v1 a v2.
Priemerná rýchlosť auta bola 32 km/hod.
Meraním v laboratóriu boli zistené nasledujúce dĺžky valčeka (v milimetroch):
{302;310;312;310;313;318;305;309;310;309}
Vypočítajte aritmetický, geometrický priemer, modus a medián.
Riešenie:
Množinu čísiel usporiadame podľa veľkosti:
{302;305;309;309;310;310;310;312;313;318}
* Dvaja poľovníci, poľovník A a poľovník B súťažili v streľbe na terč. Ktorý strieľal
presnejšie a súťaž vyhral?
Získali nasledujúce zásahy:
A = {9;8;8;8;7}
B = {10;10;8;7;5}
Riešenie:
Poľovník A
3. Poľovník B
Rozptyl poľovníka A je s2(A) = 0,4 , poľovníka B je s2(B) = 3,6. Platí s2(A) < s2(B).
Lepšie strieľal a súťaž vyhral poľovník A.
*U 20 pracovníkoch sa zisťoval mesačný zárobok v eurách. Vypočítajte aritmetický priemer
mesačných zárobkov všetkých pracovníkov. Využite nasledujúcu tabuľku.
Riešenie:
4. Priemerný mesačný zárobok pracovníka je 951.5 €.
*Za mesiac november vymeškali študenti nasledujúce počty vyučovacích hodín:
• Dievčatá: 2;0;6;10;2;2;4;2;5;2;
• Chlapci: 4;4;0;2;10;2;6;2;3;10;
Porovnajte variabilitu obidvoch štatistických súborov.
Riešenie:
7. Pre výpočet koeficientu korelácie použijeme funkciu CORREL, zadanú známou
cestou:
Hodnota koeficientu korelácie r=0,965046
Nahraďme hodnoty x hodnotami 1/x. Pôvodná tabuľka dát prejde do tvaru:
Náklady v
19,8 27,5 21,1 31 15 33,2 14,1
tis.
Úroda q/ha 15,03 19,62 18,31 24,15 14,3 23,04 13,06
Náklad
0,05050 0,03636 0,04739 0,03226 0,06667 0,03012 0,07092
y v tis.
Úroda
15,03 19,62 18,31 24,15 14,3 23,04 13,06
q/ha
Rovnica hyperboly má tvar:
y = -249,74/x + 30,14
R2 = 0,8773, R=0,936653893
Príklad 2
8. Predmetom štatistického šetrenia boli výsledky psychologického výskumu
o vzniku konfliktov v malých skupinách v závislosti od dĺžky obdobia. Určite
koeficient závislosti medzi počtom konfliktov a počtom dní, ktoré expertná
skupina strávila v uzavretom priestore.
Výsledky uvádza nasledujúca tabuľka.
Dni 1 2 3 4 5 6 7 8 9 10 11 12
konfli 6 5 5 4 3 2 3 2 2 1 0 1
kty
Aproximujte tento vzťah hyperbolou a určite mieru hyperbolickej závislosti.
Určite teoretický počet konfliktov v skupine, ktorá trávi spoločne 13, 15, 20 dní.
Riešenie:
7
y = -0,4895x + 6,0152
6
R2 = 0,9097
5
4
3
2
1
0
0 2 4 6 8 10 12 14
-0,9537
Correl 9
Dni 0,33 0,12 0,09
1 0,5 0,25 0,2 0,167 0,143 0,111 0,1 0,083
3 5 1
konfli
6 5 5 4 3 2 3 2 2 1 0 1
kty
9. y = -2,3131Ln(x) + 6,6861 y = -0,4895x + 6,0152
8
R2 = 0,8927 R2 = 0,9097
7
6 y = 0,0235x2 - 0,7947x + 6,7273
R 2 = 0,9292
5
4
3
2
1
0
0 2 4 6 8 10 12 14
y = 2,3131Ln(1/x) + 6,6861
8 y = 5,7597/x + 1,3439
R2 = 0,8927
R2 = 0,6715
7
6
5
4
3
2
1
0
0 0,2 0,4 0,6 0,8 1 1,2
* Príklad
Nasledujúca tabuľka uvádza vývoj počtu obyvateľstva v rokoch 1850-1950.
Odhadnite tento trend jednotlivými krivkami trendu a porovnajte mieru ich
regresie. Na základe týchto kriviek potom odhadnite vývoj v rokoch 1960, 1970,
1975, 1980, 2000 a porovnajte so skutočnou hodnotou v roku 1960, keď počet
obyvateľov v sledovanej krajine dosiahol 179,03 mil.
Rok 185 186 187 188 189 190 191 192 193 194 1950
10. 0 0 0 0 0 0 0 0 0 0
Obyv/mi 23,2 31,4 39,8 50,2 62,9 76 92 105, 122, 131, 151,
l/ 7 8 7 1
vývoj obyvateľstva
160
140
120
100
80
y = 1,2998x - 2389
60 2
R = 0,9906
40
2
y = 0,004x - 13,803x + 11954
20 2
R = 0,9978
0
1840 1860 1880 1900 1920 1940 1960
lin.trend- parab.trend-
rok priamka parabola
chyba chyba
1960 158,608 266,52 -20,422 87,49
1970 171,606 285,69
1975 178,105 295,575
1980 184,604 305,66
2000 210,6 348
Pri porovnaní odchýlok medzi skutočne dosiahnutou a teoretickou hodnotu
počtu obyvateľstva v roku 1960 vykazuje aproximácia priamkou, ktorá má aj
najvyšší koeficient regresie R=0,995289
Pri prognózovaní musíme brať do úvahy aj vzdialenosť medzi vstupnými
a prognózovanými dátami. Z pohľadu dlhodobého trendu je niekedy
výhodnejšie zvoliť krivku s nižšou mierou regresie, ale s vyrovnanejšími
vlastnosťami na danom úseku hodnôt x.
* Príklad
11. Nasledujúca tabuľka uvádza vývoj počtu obyvateľstva v rokoch 1850-1950.
Odhadnite tento trend jednotlivými krivkami trendu a porovnajte mieru ich
regresie. Na základe týchto kriviek potom odhadnite vývoj v rokoch 1960, 1970,
1975, 1980, 2000 a porovnajte so skutočnou hodnotou v roku 1960, keď počet
obyvateľov v sledovanej krajine dosiahol 179,03 mil.
Rok 185 186 187 188 189 190 191 192 193 194 1950
0 0 0 0 0 0 0 0 0 0
Obyv/mi 23,2 31,4 39,8 50,2 62,9 76 92 105, 122, 131, 151,
l/ 7 8 7 1
lin.trend- parab.trend-
rok priamka parabola
chyba chyba
1960 158,608 266,52 -20,422 87,49
1970 171,606 285,69
1975 178,105 295,575
1980 184,604 305,66
2000 210,6 348
vývoj obyvateľstva
160
140
120
100
80
y = 1,2998x - 2389
60 2
R = 0,9906
40
2
y = 0,004x - 13,803x + 11954
20 2
R = 0,9978
0
1840 1860 1880 1900 1920 1940 1960
* Príklad 1
12. Na základe dlhodobého pozorovania bolo zistené, že príprava na skúšku
z matematiky predstavuje u študentov manažérskych študijných programov
priemerne 28,5 hodiny.
V ankete u 40 študentov KU boli zistené nasledujúce údaje:
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
hod 12,5 25,3 45 12 23 36 52 48 38 26 22 18 10 12 25 42 43 36 38 62
štud 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
hod 9,5 11 12 14,5 17,5 23,5 38 45 42 36 85 42 35 36 63 48 25 24 43 36
Overte, či ide rovnaký čas venovaný príprave na skúšku z matematiky, alebo
vykazuje výrazné rozdiely. Pracujme na hladine signifikantosti 0,05.
Riešenie:
Základné číselné charakteristiky súboru V.:
arit.
priemer: 32,8 AVERAGEA
rozptyl D 271 VARP odh.D 278
st.odch. 16,5 STDEVP 16,7
Je časová náročnosť u študentov KU štatisticky významné, alebo je spôsobené
iba náhodným výberom? Ide o systémovú či náhodnú odchýlku?
x = 32,8 m=32,8 µ = 23,5
H0 : ide iba o náhodnú odchýlku spôsobenú výberom prvkov do súboru V. Pre
súbor Z je doba prípravy zhodná s dlhodobo zistenou hodnotou 28,5 h.
m=µ
H1: ide o systémovú chybu, teda zvýšený počet hodín potrebných v príprave
na skúšku je štatisticky významný, má charakter systémovej odchýlky.
Dvojstranná hypotéza: m ≠ µ
Jednostranná hypotéza: m > µ ( x > µ)
x -µ
Testovacia charakteristika: t = . n
s
Kritická hodnota t t α , pre obojstrannú alternatívnu hypotézu, v programe
krit= ,( n −1)
2
α
Excel použijeme funkciu TINV , n − 1
2
Kritická hodnota tkrit= t α ,( n −1) , pre jednostrannú alternatívnu hypotézu, v programe
Excel použijeme funkciu TINV( α, n − 1)
32,8 − 23,5
t= . 40 = 3,5647 , t α ,( n −1) = 2,3313 potom H1.
16,5 2
t α ,( n −1) = 2,0227 potom H1.
13. Poznámka.
Za predpokladu, že sledovaný znak sa riadi normálnym rozdelením a poznáme
hodnotu σ pre súbor Z, alebo počet prvkov n>30 a hodnotu σ vieme odhadnúť,
~ n 2
pre výpočet testovacej charakteristiky použijeme vzťah σ 2 = D = .s ,
n −1
x −µ x −µ
t= . n −1 = ~ . n −1 .
σ s
x −µ 32,8 − 23,5
Pre našu úlohu platí: t = . n −1 = . 40 − 1 = 3,4815
σ 16,6822
* Príklad 2
U študentov študijného odboru manažment v Poprade a v Košiciach, sme
sledovali dĺžku ich prípravy na skúšku z matematiky. Overte, či študenti
venovali rovnakú pozornosť príprave, alebo nie.
Poprad
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
hod 12,5 25,3 45 12 23 36 52 48 38 26 22 18 10 12 25 42 43 36 38 62
Košice
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
hod 9,5 11 12 14,5 17,5 23,5 38 45 42 36 85 42 35 36 63 48 25 24 25 46
Číselné charakteristiky súborov:
V1: n1=20, x 1 = 31,291 , D1=210,5, s1=14,51003
V2: n2=18, x 2 = 34,3 , D2=359,3, s2=18,956
* Príklad 3
U vybraných 20 študentov študijného odboru manažment v Poprade sme
sledovali dĺžku ich prípravy na skúšku z matematiky I a matematiky II. Na
skúšku z matematiky II sa pripravovali po kurze rýchleho čítania. Overte, či
kurz rýchleho čítania prispel ku skráteniu času prípravy na skúšku.
Matematika I
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
hod 12,5 25,3 45 12 23 36 52 48 38 26 22 18 10 12 25 42 43 36 38 62
14. Matematika II
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
hod 9,5 11 12 14,5 17,5 23,5 38 45 42 16 45 22 25 16 63 48 25 24 26 48
Dvouvýběrový párový t-test na střední hodnotu
Soubor 1 Soubor 2
Stř. hodnota 31,29 28,55
Rozptyl 221,635 234,4711
Pozorování 20 20
Pears. korelace 0,4532
Hyp. rozdíl stř. hodnot 0
Rozdíl 19
t stat 0,7758
P(T<=t) (1) 0,22371
t krit (1) 1,72913
P(T<=t) (2) 0,44742
t krit (2) 2,09302
štud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
pred 12,5 25,3 45 12 23 36 52 48 38 26 22 18 10 12 25 42 43 36 38 62
po 9,5 11 12 8 17,5 23,5 38 45 22 16 12 22 15 16 63 48 25 24 26 48
3 14,3 33 4 5,5 12,5 14 3 16 10 10 -4 -5 -4 -38 -6 18 12 12 14
Dvouvýběrový párový t-test na střední hodnotu
Soubor 1 Soubor 2
Stř. hodnota 31,29 25,075
Rozptyl 221,634632 235,5072368
Pozorování 20 20
Pears. korelace 0,56984608
Hyp. rozdíl stř.
hodnot 0
Rozdíl 19
t stat 1,98146426
P(T<=t) (1) 0,03109868
t krit (1) 1,72913279
P(T<=t) (2) 0,06219737
t krit (2) 2,09302405