More Related Content Similar to Lecture_4_Numerical_Descriptive_Measures.pdf Similar to Lecture_4_Numerical_Descriptive_Measures.pdf (20) Lecture_4_Numerical_Descriptive_Measures.pdf2. АГУУЛГА
1. Тоон өгөгдлийг тодорхойлогч төвийн хандлагын
хэмжигдэхүүн
2. Тоон өгөгдлийг тодорхойлогч хэлбэлзлийн
хэмжигдэхүүн
3. Тоон өгөгдлийн тархалтын хэв маягийг
тодоорхойлох
4. Тоон өгөгдлийг шинжлэх
5. Хоёр хувьсагчийн харилцан хамаарлыг
тодорхойлогч хэмжигдэхүүн
3. 1. ТӨВИЙН ХАНДЛАГЫН ҮЗҮҮЛЭЛТҮҮД
1. Дундаж (Mean)
2. Медиан (Median)
3. Моод (Mode)
4. Percentile, Decile, Quartile
5. • Жишээ: Эдийн засаг, НББ, Менежмент, Статистик,
Санхүүгийн ангийн оюутнуудын тоо дараах байдлаар
өгөгджээ: 46 54 42 46 32.
• Энэ тохиолдолд Х1 = 46, Х2 = 54, Х3 = 42, Х4 = 46,
Х5 = 32 бөгөөд
𝑋 =
𝑋1+𝑋2+𝑋3+𝑋4+𝑋5
5
=
46+54+42+46+32
5
= 44
6. Жигнэгдсэн дундаж: Дундаж утгыг тооцох томъёог авч үзвэл ажиглалтын
нэгж бүрт 1/n гэсэн ижил жин харгалзаж байна.
𝑋 =
𝑋𝑖
𝑛
=
1
𝑛
𝑋𝑖 =
1
𝑛
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
=
1
𝑛
(𝑋1) +
1
𝑛
(𝑋2) + ⋯ +
1
𝑛
(𝑋𝑛)
Эндээс жигнэгдсэн дунджийн томъёог гарган авч бичвэл дараах
хэлбэртэй болно.
𝑋 =
𝑓𝑖𝑋𝑖
𝑓𝑖
7. Жишээ: Таван төрлийн түүхий эд материалын борлуулалтын мэдээ өгөгджээ.
Түүхий эдийн
төрөл
Нэгжийн үнэ,
мян.төг
Борлуулсан тоо хэмжээ, кг
1 3.0 1200
2 3.4 500
3 2.8 2750
4 2.9 1000
5 3.25 800
𝑋 =
𝑋1+𝑋2+𝑋3+𝑋4+𝑋5
5
=
3+3.4+2.8+2.9+3.25
5
=
15.35
5
= 3.07
𝑋 =
𝑓𝑖𝑋𝑖
𝑓𝑖
=
1200 ∙ 3.0 + 500 ∙ 3.4 + 2750 ∙ 2.8 + 1000 ∙ 2.9 + 800 ∙ 3.25
1200 + 500 + 2750 + 1000 + 800
=
18500
6250
= 2.96
9. • Хэрвээ ажиглалтын тоо сондгой бол медиан нь
эрэмблэгдсэн дэс дугаарын голын утгад
харгалзна. Жишээ нь, ажиглалтын тоо 11 бол
эрэмбэлэгдсэн цувааны 6 дугаар эрэмбэ дээр
байгаа утга нь медиан болно.
𝑖𝑀𝑒𝑑𝑖𝑎𝑛 =
𝑛 + 1
2
10. • Хэрэв ажиглалтын тоо тэгш бол медиан нь
эрэмблэгдсэн дэс дугаарын голын 2 утгад
харгалзах утгын дунджаар тодорхойлогдно.
11. Жишээ нь: Өглөө босоод ажилдаа ажилдаа
явахаар гарах хүртэл зарцуулсан хугацаа,
минутаар, 10 хоног
13. Тархалт тасралтгүй:
• Эхлээд медиан орших интервалыг
тодорхойлно. Медиан нь нийт давтамжийн
хагасыг өөртөө агуулах хамгийн эхний өсөн
нэмэгдэх давтамжид харгалзах интервалд
оршино.
15. Ажилчдын цалингийн мэдээ өгөгджээ:
Цалин, төгрөгөөр Ажилчдын тоо L
200000 хүртэл 5 5
200001-400000 15 20
400001-600000 30 50
600001-800000 22 72
800001-1000000 16 88
1000001-1200000 4 92
1200001-ээс дээш 8 100
18. Тоон мэдээ нь тасралттай тархалтын цуваа
хэлбэрээр өгөгдсөн бол хамгийн олон давтамж
харгалзаж байгаа утга нь моод болно.
19. Харин интервал хэлбэрээр өгөгдсөн бол:
• Эхлээд моод орших интервалыг тодорхойлно.
Тэнцүү интервалтай мэдээний хувьд хамгийн
их давтамжид харгалзах интервалд, тэнцүү
биш интервалтай мэдээний хувьд хамгийн их
тархалтын нягтад харгалзах интервалд мод
оршдог.
• Давтамжийг интервалын уртад харьцуулсан
харьцааг тархалтын нягт гэнэ.
20.
)
(
)
( 1
mod
1
mod
1
mod
mod
f
f
f
f
f
f
d
X
Mode
e
e
e
e
21. Жишээ нь: Өглөө босоод ажилдаа явахаар
гарах хүртэл зарцуулсан хугацаа, минутаар
(10 өдрийн мэдээ)
22. Ажилчдын цалингийн мэдээ өгөгджээ:
Цалин, төгрөгөөр Ажилчдын тоо L
200000 хүртэл 5 5
200001-400000 15 20
400001-600000 30 50
600001-800000 22 72
800001-1000000 16 88
1000001-1200000 4 92
1200001-ээс дээш 8 100
23.
13
.
530435
)
22
30
(
)
15
30
(
15
30
199999
400001
)
(
)
( 1
mod
1
mod
1
mod
mod
f
f
f
f
f
f
d
X
Mode
e
e
e
e
24. Төвийн хандлагын үзүүлэлтээс гадна төвийн
хандлыг илэрхийлэхгүй ч тоон мэдээллийг
тодорхойлогч дараах үзүүлэлтүүд байдаг.
• Percentile, Decile, Quartile
(100, 10, 4 тэнцүү хэсэгт хуваах)
25. Percentile:
Percentile утга орших эрэмбэ буюу дугаарыг дараах байдлаар тодорхойлдог.
Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ.
Алхам 2. Дараах индексийг тооцно. 𝑖 =
𝑝∙𝑛
100
Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу
ажиглалтын нэгжийн тоо.
Алхам 3.
a) Хэрэв i нь бухэл тоо биш бол i-ын дараагийн бүхэл тоон эрэмбэд
харгалзах утгыг р дугаар Percentile-аар авна.
b) Хэрэв i нь бухэл тоо бол i болон i +1 эрэмбэд харгалзах утгын
дунджийг р дугаар Percentile-аар авна.
26. Жишээ 1:
85 болон 50 дахь Percentile-г олохдоо дараах байдлаар тодорхойлно.
i нь бухэл тоо биш учраас 10.2-ын дараагийн бүхэл тоо болох 11
гэсэн эрэмбэд харгалзах утга 3730 нь 85-р Percentile юм.
i нь бухэл тоо учраас 6 болон 6+1=7 эрэмбэд харгалзах утгын дундаж буюу
(3490+3520)/2=3505 нь 50-р Percentile юм.
27. Percentile утга орших эрэмбэ буюу дугаарыг мөн дараах байдлаар тодорхойлж
болно.
Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ.
Алхам 2. Дараах индексийг тооцно. 𝑖 =
𝑝
100
(𝑛 + 1)
Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу ажиглалтын
нэгжийн тоо.
Алхам 3.
a) Хэрэв i нь бүхэл тоогоор илэрхийлэгдэж байвал тухайн дэс дугаарт
харгалзаж буй утгыг сонгоно.
b) Хэрэв i нь 2 дэс дугаарын голын утгаар тодорхойлогдож байвал тухайн 2
дэс дугаарт харгалзаж буй утгуудын дунджаар тодорхойлогдно.
c) Хэрэв i нь 2 дэс дугаарын голын утгаар бус байдлаар (0.5 биш 0.25 ч юм
уу 0.75 гэх мэт) тодорхойлогдож байвал тухайн утгад хамгийн ойр байгаа
дэс дугаарт харгалзах утгыг сонгоно.
28. Quartile:
• 𝑄1= 25th рercentile
• 𝑄2= 50th рercentile (median)
• 𝑄3= 75th рercentile
Өмнөх жишээний хувьд 1, 2, 3-р квартиль буюу 25, 50, 75-р
рercentile-ийг тооцож үзье.
31. Decile:
1-р дециль нь 10-р рercentile,
2-р дециль нь 20-р рercentile гэх мэт
9-р дециль нь 90-р рercentile байна.
32. Геометрийн дундаж
Өгөөжийн дундаж төвшинг тооцох геометр
дундажийн арга:
n
n
n
n
G X
X
X
X
X
X
X
...
)
...
( 2
1
/
1
2
1
𝑅𝐺 = 1 + 𝑅1 ∙ 1 + 𝑅2 ∙ … ∙ (1 + 𝑅𝑛) 1/𝑛
− 1
34. 2. ТООН МЭДЭЭГ ТОДОРХОЙЛОГЧ ХЭЛБЭЛЗЛИЙН ХЭМЖИГДЭХҮҮН
1. Далайц (Range)
2. Квартилийн далайц (Interquartile Range)
3. Вариац (Variance)
4. Стандарт хэлбэлзэл (Standard deviation)
5. Хэлбэлзлийн коэффициент буюу вариацын
коэффициент (Coefficient of Variation)
35. Далайц
Жишээ: Өглөө босоод ажилдаа явахаар гарах хүртэл
зарцуулсан хугацаа, минутаар (10 өдрийн мэдээ)
Далайц нь 52-29=23 минут байна.
min
max X
X
R
45. Вариацын математик чанарууд:
1. Тогтмол тооны вариац тэгтэй тэнцүү.
𝜎2
=
(𝐶−𝐶)2
𝑁
= 0, C=constant
2. 𝜎2
=
((𝑋𝑖−𝐶)−(𝑋−𝐶))2
𝑁
=
((𝑋𝑖−𝐶−𝑋+𝐶)2
𝑁
=
(𝑋𝑖−𝑋)2
𝑁
3. 𝜎2 =
(
𝑋𝑖
𝐶
−
𝑋
𝐶
)2
𝑁
=
1
𝐶2(𝑋𝑖−𝑋)2
𝑁
=
1
𝐶2 ∙
(𝑋𝑖−𝑋)2
𝑁
47. 3. ТООН МЭДЭЭНИЙ ТАРХАЛТЫН ХЭВ МАЯГИЙГ ТОДООРХОЙЛОХ
Тархалтын хэв маяг (Shape):
• тэгш хамтэй
• тэгш бус хэмтэй
48. Z хэмжигдэхүүн (Z score):
Алслагдсан утга (Outlier):
𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅
𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5(𝐼𝑄𝑅)
49. Х Z
39 -0,09
29 -1,57
43 0,50
52 1,83
39 -0,09
44 0,65
40 0,06
31 -1,27
44 0,65
35 -0,68
Дундаж 39,6
S 6,77
50. 𝑖𝑄1
=
25∙10
100
=2.5 буюу 3-р эрэмбэд харгалзах утга 𝑄1 =35
𝑖𝑄3
=
75∙10
100
=7.5 буюу 8-р эрэмбэд харгалзах утга 𝑄3 =44
IQR=44-35=9
𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅 = 35 − 1.5 ∗ 9 = 21.5
𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5 𝐼𝑄𝑅 = 44 + 1.5 ∗ 9 = 57.5
51. Чебышевын дүрэм: Тархалтын хэв маягаас
үл хамааран тухайн судалж буй санамсаргүй
хувьсагчийн авах утгуудын ядаж
нь дунджаасаа к стандарт хэлбэлзлийн зайд
тархсан байна.
• Жишээ нь, к=2 үед тухайн санамсаргүй
хувьсагчийн авах утгуудын ядаж
нь дунджаасаа ± 2σ завсарт оршин байна.
60. 5. ХОЁР ХУВЬСАГЧИЙН ХАРИЛЦАН ХАМААРЛЫГ
ТОДОРХОЙЛОГЧ ХЭМЖИГДЭХҮҮН
Ковариац буюу хамтын хэлбэлзэл нь Х ба Ү
гэсэн хоёр хувьсагчийн хоорондын шугаман
хамаарлыг илэрхийлэгч үзүүлэлт юм.
Түүврийн хувьд: