ТОЙМ СТАТИСТИК
1
АГУУЛГА
Төвийн хандлага ба байршлын
үзүүлэлтүүд
Хэлбэлзэл
Тархалт, тархалтын хэлбэрүүд
2
ТОЙМ СТАТИСТИК
 Өгөгдөл цуглуулах
 Асуумж гм
 Анхдагч, хоёрдогч эх үүсвэр
 Өгөгдлийг илтгэх
 Хүснэгт, график гм
 Статистик : Түүврийн мэдээллийг илтгэх тоон
утга
 Түүврийн дундаж гм
3
ӨГӨГДӨЛ ЦУГЛУУЛАХ
Өгөгдөл цуглуулах
АсуумжТуршилт
Утсаар Ажиглалт
5
Статистикүүд
Төвийн үзүүлэлт Байршлын үзүүлэлт Хэлбэлзэл
Арифметик дундаж
Голч утга/медиан
Моод
Квартил
Децил
Перцентил
Завсар
Стандарт хазайлт
Дисперс
Вариацын коэф
 Тоон өгөгдлүүдийг ганц тоогоор төлөөлүүлж
илэрхийлэх боломжтой юу?
6
Төвийн үзүүлэлт
(Central Tendency)
Арифметик дундаж Голч утга/медиан Моод Бусад дундаж
ДУНДАЖ ХЭМЖИГДЭХҮҮН
Тодорхойлолт:
Үзэгдэл юмсын судлагдаж буй шинж
тэмдэгийн нэгдсэн нэг үзүүлэлт бөгөөд
үзэгдэл юмсын бүрдүүлж буй
нэгжүүдийг төлөөлж чадахуйц
хэмжигдэхүүн юм.
7
ХЭРЭГЛЭЭ
 Дундажийг үзэгдлүүдийн:
 одоогийн түвшин
 харилцан хамаарал
 прогноз
 нормативийг г.м тооцоолоход ашигладаг.
8
ЗЭРГИЙН ДУНДАЖИЙН ЕРӨНХИЙ ТОМЪЁО
 K –аас хамаарч зэргийн дундажийн хэлбэрүүдийг
гарган авч болно.
9
k
k
n
X
X
_
АРИФМЕТИК ДУНДАЖ
 Зэргийн дундажууд дотроос хамгийн түгээмэл
хэрэглэгддэг.
 K=1
 энгийн арифметик дундаж
 Түүвэр олонлог нэгэн төрөл байх
10
_ X
X
n
ЖИШЭЭ
11
151412
жин
i xi
1 12.6
2 12.9
3 13.4
4 12.2
5 13.6
6 13.5
7 12.6
8 13.1
12.99
max
min
0.13
8
104
8
1.13..9.126.12
8
8
i
i
x
x
АРИФМЕТИК ДУНДАЖ
 Алслагдсан утга (extreme values) нөлөөлдөг.
12
N1 1 2 3 4 5
0.3
5
54321
5
5
1
1
i
i
x
x
N1 1 2 3 4 10
0.6
5
104321
5
5
1
2
i
i
x
x
МООД
 Шинж тэмдгүүдийн хамгийн олон давтагддаг утгыг
МООД гэнэ.
 Mo гэж тэмдэглэдэг.
 Бүх төрлийн өгөгдөл дээр тооцдог. Тасралттай тоон,
чанарын өгөгдөл дээр хэрэглэдэг.
 Алслагдсан утгууд тооцогдохгүй
13
ЖИШЭЭ
Хөх
Ногоон
Ногоон
Улаан
Улаан
Улаан
Улаан
Шар
Шар
Шар CC
BY-
NC-
SA
Nor
dyk
e
2010
Mоод
=Улаан
20
29
34
41
41
42
43
45
45
Олон
моодтой
1.1
2.3
4.1
5.3
4.3
6.7
8.2
Моодгүй
МЕДИАН
 Төв дунд нь орших утгыг МЕДИАН (50%,50%-аар
хуваадаг) гэнэ.
 Me гэж тэмдэглэдэг.
 Хэт өндөр эсвэл бага утгуудын оролцоо
нөлөөлдөггүй.
15
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Ме
50% 50%
КВАРТИЛ
Хамгийн
бага утга Q1 Meдиан Q3
Хамгийн
их утга
25%
50%
75%
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Q1 Ме Q2
ДЕЦИЛЬ ПЕРЦЕНТИЛЬ
 Дециль
 9 цэгээр хуваадаг. Харгалзан d1 (10%), d2
(20%),…d9 (90%) тэмдэглэдэг.
 Перцентиль
 Мэдээллийг 99 цэгээр хуваадаг. Харгалзан p1
(1%), p2 (2%),…p99 (99%) тэмдэглэдэг.
17
ХЭЛБЭЛЗЛИЙН ҮЗҮҮЛЭЛТҮҮД
18
ХЭРЭГЛЭЭ
 Судлагдаж хүчин зүйлийн хэлбэлзлийн
тодорхойлсноор:
 Олонлогийн нэгэн төрлийн байдал
 Норматив
 Хүчин зүйл хоорондын хамаарал гэх мэт.
19
АНГИЛАЛ
20
Хэлбэлзлийн үзүүлэлтүүд
Абсолют үзүүлэлт Харьцангуй үзүүлэлт
Завсар/Range
Стандарт хазайлт
Дисперс
Вариацын коэф
АБСОЛЮТ ҮЗҮҮЛЭЛТҮҮД
 Тод: Судлагдаж буй олонлогийн утга
холбогдлуудын дундажаасаа хазайх
хазайлтыг хэлбэлзэл гэнэ.
 x1,x2,..xn n хэмжээст олонлог өгөгдсөн
дундаж гэвэл хэлбэлзэл нь :
21
_
X
ДАЛАЙЦ
 Далайц нь тоон мэдээллийн хамгийн их утга ба
хамгийн бага утгын зөрүүг харуулдаг.
R=Xmax-Xmin
 R=Xmax-Xmin=8.2-1.1=7.1
22
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Хамгийн
бага утга
Хамгийн
их утга
ДАЛАЙЦЫН СУЛ ТАЛ
R=Xmax-Xmin
 R1=Xmax-Xmin=8.2-1.1=7.1
 R2=Xmax-Xmin=8.2-1.1=7.1
23
N1 1.1 2.3 4.1 4.3 5.3 6.7 8.2
N2 1.1 1.2 1.3 1.4 1.5 1.6 8.2
ТҮҮВРИЙН ДИСПЕРС
 Тооцох томъёо:
24
2
2
1
s
X X
n
( )
Түүврийн дисперсээр эх олонлогийн
хэлбэлзлийг үнэлдэг
ЖИШЭЭ
N X
1 1.1 -3.47 12.04
2 2.3 -2.27 5.15
3 4.1 -0.47 0.22
4 5.3 0.73 0.53
5 4.3 -0.27 0.07
6 6.7 2.13 4.54
7 8.2 3.63 13.18
Нийлбэр 4.57 0.01 35.73
25
XX
2
XX
95.573.35
1
2
2
n
XX
s
ТҮҮВРИЙН СТАНДАРТ ХАЗАЙЛТ
 Тооцох томъёо:
26
1
2
n
XX
s
N X
1 1.1 -3.47 12.04
2 2.3 -2.27 5.15
3 4.1 -0.47 0.22
4 5.3 0.73 0.53
5 4.3 -0.27 0.07
6 6.7 2.13 4.54
7 8.2 3.63 13.18
Нийлбэр 4.57 0.01 35.73
44.295.5
1
2
n
XX
s
ЖИШЭЭ
27
81.293.7s
866.075.0s
ЗАВСРЫН КВАРТИЛ
Хамгийн
бага утга Q1 Meдиан Q3
Хамгийн
их утга
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Q1 Ме Q2
1.1 2.3 4.3 6.7 8.2
4.42.3-6.7Q1-Q3квартилЗавсрын
ХАРЬЦАНГУЙ ДИСПЕРС
 Судлагдаж буй хүчин зүйл нь альтернатив шинжтэй
байх нь олон тохиолддог.
 p - шинж тэмдэгийн нийт олонлогт эзлэх хувийн жин
 q - эсрэг шинж тэмдэгийн хувийн жин
29
pqs
2
ЖИШЭЭ
 Эрүүл мэндийн байгууллагын ажиллагсдын В
гепатитийн судалгаа хийгджээ. Халдвартай хүмүүс
нь 30 % -ийг эзэлж байг(p=0.3). Халдвар илрээгүй нь
70% байна(q=0.7).
 δ2=pq=0.3*0.7=0.21
30
ВАРИАЦЫН КОЭФФИЦИЕНТ
 33 % бага гарч байвал түүвэр олонлогийг төлөөлөх
чадвар сайтай гэж үздэг.
31
%100*
x
s
Vs
ДАВТАЖИЙН ТАРХАЛТ
 Бүлэглэсэн тоон өгөгдөл
 Тархалтын тухай мэдээлэл өгдөг.
 Зарим тохиолдолд тоон өгөгдлийг бүлэглэж анализ
хийх болдог.
• Жишээлбэл: Даралт, нас
 Давтамжийн тархалтыг ихэнхдээ гистограмаар
дүрсэлдэг.
320
5
10
15
20
25
5-10 10-1515-2020-2525-3030-3535-4040-45
Давтамж
Нас
33
Дундаж=Медиан
Хоёр моодтойДундаж=Медиан=Моод
50%
Хонх хэлбэрийн муруй Бимодал тархалт
34
Моод
Медиан
Дундаж
50%
Моод Дундаж
50%
Медиан
Баруун тал руугаа
Хазайлттай тархалт
Зүүн тал руугаа
Хазайлттай тархалт
35
ХЭВИЙН ТАРХАЛТ ЯАГААД ЧУХАЛ ВЭ?
 Олон үзэгдлүүд хэвийнтэй ойролцоогоор тархсан
байдаг. Жишээ нь давсны, өндөр
 Статистикийн олон аргууд хэвийн тархалтаар
тархсан олонлогт зориулагдсан байдаг.
 Т тестүүд
 ANOVA
 Регрессийн шинжилгээ гэх мэт
36
ХЭВИЙН ТАРХАЛТЫГ ШИНЖЛЭХ
37
Графикийн аргууд Тоон аргууд
Дескриптив Навч-ба-үндэс,
box plot,
гистограмм
Skewness, Kurtosis
Онол P-P plot
Q-Q plot
Kolmogorov-
Smirnov test,
1. Эрэмбэлсэн тоон өгөгдөл 2. Эрэмбэлсэн тоон өгөгдөл
-1 1 2 2 3 3 3 4 4 4 4 5 5 5 6 6 7 9 1 1 1 1 1 1 3 3 4 6 7 7 9 9 9 9 9 9
Min = -1, Q1 = 3, Meдиан = 4, Q3 = 5,
Max = 9
Min = 1, Q1 = 1, Meдиан = 5, Q3 = 9,
Max = 9
)( 2/1,12/1,1
n
s
zx
n
s
zx nn
ИТГЭХ ИНТЕРВАЛ
(CONFINDENCE INTERVAL)
39
эх олонлогийн
дундаж утга
түүвэр олонлогийн
дундаж утга
Санамж : n<200
)( 2/12/1
n
s
zx
n
s
zx
ИТГЭХ ИНТЕРВАЛ
(CONFINDENCE INTERVAL)
40
эх олонлогийн
дундаж утга
түүвэр олонлогийн
дундаж утга
Санамж : n>200
ЖИШЭЭ
41
АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА
42

тойм статистик лекц 2