SlideShare a Scribd company logo
1 of 66
Download to read offline
ДИСКРЕПТИВ СТАТИСТИК:
ТООН ӨГӨГДЛИЙГ ТОДОРХОЙЛОГЧ
ХЭМЖИГДЭХҮҮН
Д.Хишигт (Ph.D.)
Эдийн засгийн тэнхим
МУИС-ийн ШУС
АГУУЛГА
1. Тоон өгөгдлийг тодорхойлогч төвийн хандлагын
хэмжигдэхүүн
2. Тоон өгөгдлийг тодорхойлогч хэлбэлзлийн
хэмжигдэхүүн
3. Тоон өгөгдлийн тархалтын хэв маягийг
тодоорхойлох
4. Тоон өгөгдлийг шинжлэх
5. Хоёр хувьсагчийн харилцан хамаарлыг
тодорхойлогч хэмжигдэхүүн
1. ТӨВИЙН ХАНДЛАГЫН ҮЗҮҮЛЭЛТҮҮД
1. Дундаж (Mean)
2. Медиан (Median)
3. Моод (Mode)
4. Percentile, Decile, Quartile
Арифметик дундаж (Arithmetic Mean):
• Түүвэр
• Эх олонлог
𝑋 =
𝑋1+𝑋2+…+𝑋𝑛
𝑛
= 𝑖=1
𝑛
𝑋𝑖
𝑛
𝜇 =
𝑋1+𝑋2+…+𝑋𝑁
𝑁
= 𝑖=1
𝑁
𝑋𝑖
𝑁
• Жишээ: Эдийн засаг, НББ, Менежмент, Статистик,
Санхүүгийн ангийн оюутнуудын тоо дараах байдлаар
өгөгджээ: 46 54 42 46 32.
• Энэ тохиолдолд Х1 = 46, Х2 = 54, Х3 = 42, Х4 = 46,
Х5 = 32 бөгөөд
𝑋 =
𝑋1+𝑋2+𝑋3+𝑋4+𝑋5
5
=
46+54+42+46+32
5
= 44
Жигнэгдсэн дундаж: Дундаж утгыг тооцох томъёог авч үзвэл ажиглалтын
нэгж бүрт 1/n гэсэн ижил жин харгалзаж байна.
𝑋 =
𝑋𝑖
𝑛
=
1
𝑛
𝑋𝑖 =
1
𝑛
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
=
1
𝑛
(𝑋1) +
1
𝑛
(𝑋2) + ⋯ +
1
𝑛
(𝑋𝑛)
Эндээс жигнэгдсэн дунджийн томъёог гарган авч бичвэл дараах
хэлбэртэй болно.
𝑋 =
𝑓𝑖𝑋𝑖
𝑓𝑖
Жишээ: Таван төрлийн түүхий эд материалын борлуулалтын мэдээ өгөгджээ.
Түүхий эдийн
төрөл
Нэгжийн үнэ,
мян.төг
Борлуулсан тоо хэмжээ, кг
1 3.0 1200
2 3.4 500
3 2.8 2750
4 2.9 1000
5 3.25 800
𝑋 =
𝑋1+𝑋2+𝑋3+𝑋4+𝑋5
5
=
3+3.4+2.8+2.9+3.25
5
=
15.35
5
= 3.07
𝑋 =
𝑓𝑖𝑋𝑖
𝑓𝑖
=
1200 ∙ 3.0 + 500 ∙ 3.4 + 2750 ∙ 2.8 + 1000 ∙ 2.9 + 800 ∙ 3.25
1200 + 500 + 2750 + 1000 + 800
=
18500
6250
= 2.96
Медиан/голч (Median):
Тасралттай хувьсагч:
• Тоон мэдээг багаас нь ихрүү нь дэс дараалалд
оруулан байрлуулах бөгөөд эхнээс нь
эрэмбэлнэ (rank).
• Хэрвээ ажиглалтын тоо сондгой бол медиан нь
эрэмблэгдсэн дэс дугаарын голын утгад
харгалзна. Жишээ нь, ажиглалтын тоо 11 бол
эрэмбэлэгдсэн цувааны 6 дугаар эрэмбэ дээр
байгаа утга нь медиан болно.
𝑖𝑀𝑒𝑑𝑖𝑎𝑛 =
𝑛 + 1
2
• Хэрэв ажиглалтын тоо тэгш бол медиан нь
эрэмблэгдсэн дэс дугаарын голын 2 утгад
харгалзах утгын дунджаар тодорхойлогдно.
Жишээ нь: Өглөө босоод ажилдаа ажилдаа
явахаар гарах хүртэл зарцуулсан хугацаа,
минутаар, 10 хоног
7 төрлийн өдрийн хоолны калорийн хэмжээ
Тархалт тасралтгүй:
• Эхлээд медиан орших интервалыг
тодорхойлно. Медиан нь нийт давтамжийн
хагасыг өөртөө агуулах хамгийн эхний өсөн
нэмэгдэх давтамжид харгалзах интервалд
оршино.
 
median
i
median
f
L
f
d
X
Median
1
2






Ажилчдын цалингийн мэдээ өгөгджээ:
Цалин, төгрөгөөр Ажилчдын тоо L
200000 хүртэл 5 5
200001-400000 15 20
400001-600000 30 50
600001-800000 22 72
800001-1000000 16 88
1000001-1200000 4 92
1200001-ээс дээш 8 100
 
600000
30
20
2
100
199999
400001
2
1












median
i
median
f
L
f
d
X
Median
Моод (Mode):
Моод гэдэг нь тоон мэдээний/өгөгдлийн хувьд
шинж тэмдгийн хамгийн олон давтагдаж
байгаа утга юм.
Тоон мэдээ нь тасралттай тархалтын цуваа
хэлбэрээр өгөгдсөн бол хамгийн олон давтамж
харгалзаж байгаа утга нь моод болно.
Харин интервал хэлбэрээр өгөгдсөн бол:
• Эхлээд моод орших интервалыг тодорхойлно.
Тэнцүү интервалтай мэдээний хувьд хамгийн
их давтамжид харгалзах интервалд, тэнцүү
биш интервалтай мэдээний хувьд хамгийн их
тархалтын нягтад харгалзах интервалд мод
оршдог.
• Давтамжийг интервалын уртад харьцуулсан
харьцааг тархалтын нягт гэнэ.
 
   )
(
)
( 1
mod
1
mod
1
mod
mod










f
f
f
f
f
f
d
X
Mode
e
e
e
e
Жишээ нь: Өглөө босоод ажилдаа явахаар
гарах хүртэл зарцуулсан хугацаа, минутаар
(10 өдрийн мэдээ)
Ажилчдын цалингийн мэдээ өгөгджээ:
Цалин, төгрөгөөр Ажилчдын тоо L
200000 хүртэл 5 5
200001-400000 15 20
400001-600000 30 50
600001-800000 22 72
800001-1000000 16 88
1000001-1200000 4 92
1200001-ээс дээш 8 100
 
   
13
.
530435
)
22
30
(
)
15
30
(
15
30
199999
400001
)
(
)
( 1
mod
1
mod
1
mod
mod



















f
f
f
f
f
f
d
X
Mode
e
e
e
e
Төвийн хандлагын үзүүлэлтээс гадна төвийн
хандлыг илэрхийлэхгүй ч тоон мэдээллийг
тодорхойлогч дараах үзүүлэлтүүд байдаг.
• Percentile, Decile, Quartile
(100, 10, 4 тэнцүү хэсэгт хуваах)
Percentile:
Percentile утга орших эрэмбэ буюу дугаарыг дараах байдлаар тодорхойлдог.
Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ.
Алхам 2. Дараах индексийг тооцно. 𝑖 =
𝑝∙𝑛
100
Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу
ажиглалтын нэгжийн тоо.
Алхам 3.
a) Хэрэв i нь бухэл тоо биш бол i-ын дараагийн бүхэл тоон эрэмбэд
харгалзах утгыг р дугаар Percentile-аар авна.
b) Хэрэв i нь бухэл тоо бол i болон i +1 эрэмбэд харгалзах утгын
дунджийг р дугаар Percentile-аар авна.
Жишээ 1:
85 болон 50 дахь Percentile-г олохдоо дараах байдлаар тодорхойлно.
i нь бухэл тоо биш учраас 10.2-ын дараагийн бүхэл тоо болох 11
гэсэн эрэмбэд харгалзах утга 3730 нь 85-р Percentile юм.
i нь бухэл тоо учраас 6 болон 6+1=7 эрэмбэд харгалзах утгын дундаж буюу
(3490+3520)/2=3505 нь 50-р Percentile юм.
Percentile утга орших эрэмбэ буюу дугаарыг мөн дараах байдлаар тодорхойлж
болно.
Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ.
Алхам 2. Дараах индексийг тооцно. 𝑖 =
𝑝
100
(𝑛 + 1)
Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу ажиглалтын
нэгжийн тоо.
Алхам 3.
a) Хэрэв i нь бүхэл тоогоор илэрхийлэгдэж байвал тухайн дэс дугаарт
харгалзаж буй утгыг сонгоно.
b) Хэрэв i нь 2 дэс дугаарын голын утгаар тодорхойлогдож байвал тухайн 2
дэс дугаарт харгалзаж буй утгуудын дунджаар тодорхойлогдно.
c) Хэрэв i нь 2 дэс дугаарын голын утгаар бус байдлаар (0.5 биш 0.25 ч юм
уу 0.75 гэх мэт) тодорхойлогдож байвал тухайн утгад хамгийн ойр байгаа
дэс дугаарт харгалзах утгыг сонгоно.
Quartile:
• 𝑄1= 25th рercentile
• 𝑄2= 50th рercentile (median)
• 𝑄3= 75th рercentile
Өмнөх жишээний хувьд 1, 2, 3-р квартиль буюу 25, 50, 75-р
рercentile-ийг тооцож үзье.
Decile:
1-р дециль нь 10-р рercentile,
2-р дециль нь 20-р рercentile гэх мэт
9-р дециль нь 90-р рercentile байна.
Геометрийн дундаж
Өгөөжийн дундаж төвшинг тооцох геометр
дундажийн арга:
n
n
n
n
G X
X
X
X
X
X
X 






 ...
)
...
( 2
1
/
1
2
1
𝑅𝐺 = 1 + 𝑅1 ∙ 1 + 𝑅2 ∙ … ∙ (1 + 𝑅𝑛) 1/𝑛
− 1
Жишээ:
2. ТООН МЭДЭЭГ ТОДОРХОЙЛОГЧ ХЭЛБЭЛЗЛИЙН ХЭМЖИГДЭХҮҮН
1. Далайц (Range)
2. Квартилийн далайц (Interquartile Range)
3. Вариац (Variance)
4. Стандарт хэлбэлзэл (Standard deviation)
5. Хэлбэлзлийн коэффициент буюу вариацын
коэффициент (Coefficient of Variation)
Далайц
Жишээ: Өглөө босоод ажилдаа явахаар гарах хүртэл
зарцуулсан хугацаа, минутаар (10 өдрийн мэдээ)
Далайц нь 52-29=23 минут байна.
min
max X
X
R 

Квартилын далайц (Interquartile Range-IQR):
Өмнөх жишээн дээр Квартилын далайц=44-35=9 минут
квартилын далайц = 𝑄3 − 𝑄1
• Вариац
• Стандарт хэлбэлзэл
Түүврийн вариац
1
)
(
...
)
(
)
( 2
2
2
2
1
2








n
X
X
X
X
X
X
S n
1
)
(
1
2
2





n
X
X
S
n
i
i






1
)
( 2
2
i
i
i
f
f
X
X
S
Түүврийн вариацаас квадрат язгуур авч
түүврийн стандарт хэлбэлзлийг тодорхойлдог.
1
)
(
1
2
2






n
X
X
S
S
n
i
i
Эх олонлогийн вариац
Вариацын математик чанарууд:
1. Тогтмол тооны вариац тэгтэй тэнцүү.
𝜎2
=
(𝐶−𝐶)2
𝑁
= 0, C=constant
2. 𝜎2
=
((𝑋𝑖−𝐶)−(𝑋−𝐶))2
𝑁
=
((𝑋𝑖−𝐶−𝑋+𝐶)2
𝑁
=
(𝑋𝑖−𝑋)2
𝑁
3. 𝜎2 =
(
𝑋𝑖
𝐶
−
𝑋
𝐶
)2
𝑁
=
1
𝐶2(𝑋𝑖−𝑋)2
𝑁
=
1
𝐶2 ∙
(𝑋𝑖−𝑋)2
𝑁
Вариацын (хэлбэлзлийн) коэффициент:
%
100








X
S
CV
3. ТООН МЭДЭЭНИЙ ТАРХАЛТЫН ХЭВ МАЯГИЙГ ТОДООРХОЙЛОХ
Тархалтын хэв маяг (Shape):
• тэгш хамтэй
• тэгш бус хэмтэй
Z хэмжигдэхүүн (Z score):
Алслагдсан утга (Outlier):
𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅
𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5(𝐼𝑄𝑅)
Х Z
39 -0,09
29 -1,57
43 0,50
52 1,83
39 -0,09
44 0,65
40 0,06
31 -1,27
44 0,65
35 -0,68
Дундаж 39,6
S 6,77
𝑖𝑄1
=
25∙10
100
=2.5 буюу 3-р эрэмбэд харгалзах утга 𝑄1 =35
𝑖𝑄3
=
75∙10
100
=7.5 буюу 8-р эрэмбэд харгалзах утга 𝑄3 =44
IQR=44-35=9
𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅 = 35 − 1.5 ∗ 9 = 21.5
𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5 𝐼𝑄𝑅 = 44 + 1.5 ∗ 9 = 57.5
Чебышевын дүрэм: Тархалтын хэв маягаас
үл хамааран тухайн судалж буй санамсаргүй
хувьсагчийн авах утгуудын ядаж
нь дунджаасаа к стандарт хэлбэлзлийн зайд
тархсан байна.
• Жишээ нь, к=2 үед тухайн санамсаргүй
хувьсагчийн авах утгуудын ядаж
нь дунджаасаа ± 2σ завсарт оршин байна.
4. ТООН МЭДЭЭГ ШИНЖЛЭХ
m
ax
3
1
m
in X
Q
Median
Q
X
Өмнөх жишээний хувьд
29 35 39,5 44 52
max
3
1
min X
Q
Median
Q
X
box plot
5. ХОЁР ХУВЬСАГЧИЙН ХАРИЛЦАН ХАМААРЛЫГ
ТОДОРХОЙЛОГЧ ХЭМЖИГДЭХҮҮН
Ковариац буюу хамтын хэлбэлзэл нь Х ба Ү
гэсэн хоёр хувьсагчийн хоорондын шугаман
хамаарлыг илэрхийлэгч үзүүлэлт юм.
Түүврийн хувьд:
Эх олонлогийн хувьд
Корреляцийн коэффициент
Lecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdf

More Related Content

Similar to Lecture_4_Numerical_Descriptive_Measures.pdf

Dad_6
Dad_6Dad_6
Dad_6oz
 
Dad6
Dad6Dad6
Dad6oz
 
Descriptive statistic
Descriptive statisticDescriptive statistic
Descriptive statisticaltaamecs
 
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэх
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэхШинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэх
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэхМони Гоша
 
Борлуулалтыг хэрхэн таамаглах вэ?
Борлуулалтыг хэрхэн таамаглах вэ?Борлуулалтыг хэрхэн таамаглах вэ?
Борлуулалтыг хэрхэн таамаглах вэ?Bilegtsaikhan Batjargal
 
machine learningsahfahsfahsfashfsahfsahfsahjf
machine learningsahfahsfahsfashfsahfsahfsahjfmachine learningsahfahsfahsfashfsahfsahfsahjf
machine learningsahfahsfahsfashfsahfsahfsahjfBolderdeneJigmed1
 
IT101 LAB NOM
IT101 LAB NOMIT101 LAB NOM
IT101 LAB NOMBPurev
 
таамаглал шалгах
таамаглал шалгахтаамаглал шалгах
таамаглал шалгахSerod Khuyagaa
 
экстраполяци хийх энгийн арга
экстраполяци хийх энгийн аргаэкстраполяци хийх энгийн арга
экстраполяци хийх энгийн аргаSerod Khuyagaa
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2Serod Khuyagaa
 
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамик
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамикБ.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамик
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамикbatnasanb
 
ҮСХ гарын авлага
ҮСХ гарын авлагаҮСХ гарын авлага
ҮСХ гарын авлагаTuul Tuul
 
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГА
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГАТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГА
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГАMr Nyak
 

Similar to Lecture_4_Numerical_Descriptive_Measures.pdf (20)

Dad_6
Dad_6Dad_6
Dad_6
 
Dad6
Dad6Dad6
Dad6
 
Descriptive statistic
Descriptive statisticDescriptive statistic
Descriptive statistic
 
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэх
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэхШинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэх
Шинжлэх ухааны судалгаанд баримтыг задлан шинжилгээ хийхэд бэлтгэх
 
Борлуулалтыг хэрхэн таамаглах вэ?
Борлуулалтыг хэрхэн таамаглах вэ?Борлуулалтыг хэрхэн таамаглах вэ?
Борлуулалтыг хэрхэн таамаглах вэ?
 
Lecture 3
Lecture 3Lecture 3
Lecture 3
 
Lecture 3
Lecture 3Lecture 3
Lecture 3
 
machine learningsahfahsfahsfashfsahfsahfsahjf
machine learningsahfahsfahsfashfsahfsahfsahjfmachine learningsahfahsfahsfashfsahfsahfsahjf
machine learningsahfahsfahsfashfsahfsahfsahjf
 
IT101 LAB NOM
IT101 LAB NOMIT101 LAB NOM
IT101 LAB NOM
 
таамаглал шалгах
таамаглал шалгахтаамаглал шалгах
таамаглал шалгах
 
экстраполяци хийх энгийн арга
экстраполяци хийх энгийн аргаэкстраполяци хийх энгийн арга
экстраполяци хийх энгийн арга
 
Econ ch 1
Econ ch 1Econ ch 1
Econ ch 1
 
Lecture 3
Lecture 3Lecture 3
Lecture 3
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
 
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамик
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамикБ.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамик
Б.Хосбаяр - Мөнгө, сангийн бодлогын харилцан үйлчлэлийн динамик
 
Lekts 6
Lekts 6Lekts 6
Lekts 6
 
Лекц №4
Лекц №4Лекц №4
Лекц №4
 
Presentation12
Presentation12Presentation12
Presentation12
 
ҮСХ гарын авлага
ҮСХ гарын авлагаҮСХ гарын авлага
ҮСХ гарын авлага
 
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГА
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГАТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГА
ТООН МЭДЭЭЛЭЛД ДҮН ШИНЖИЛГЭЭ ХИЙХ ГАРЫН АВЛАГА
 

Lecture_4_Numerical_Descriptive_Measures.pdf

  • 1. ДИСКРЕПТИВ СТАТИСТИК: ТООН ӨГӨГДЛИЙГ ТОДОРХОЙЛОГЧ ХЭМЖИГДЭХҮҮН Д.Хишигт (Ph.D.) Эдийн засгийн тэнхим МУИС-ийн ШУС
  • 2. АГУУЛГА 1. Тоон өгөгдлийг тодорхойлогч төвийн хандлагын хэмжигдэхүүн 2. Тоон өгөгдлийг тодорхойлогч хэлбэлзлийн хэмжигдэхүүн 3. Тоон өгөгдлийн тархалтын хэв маягийг тодоорхойлох 4. Тоон өгөгдлийг шинжлэх 5. Хоёр хувьсагчийн харилцан хамаарлыг тодорхойлогч хэмжигдэхүүн
  • 3. 1. ТӨВИЙН ХАНДЛАГЫН ҮЗҮҮЛЭЛТҮҮД 1. Дундаж (Mean) 2. Медиан (Median) 3. Моод (Mode) 4. Percentile, Decile, Quartile
  • 4. Арифметик дундаж (Arithmetic Mean): • Түүвэр • Эх олонлог 𝑋 = 𝑋1+𝑋2+…+𝑋𝑛 𝑛 = 𝑖=1 𝑛 𝑋𝑖 𝑛 𝜇 = 𝑋1+𝑋2+…+𝑋𝑁 𝑁 = 𝑖=1 𝑁 𝑋𝑖 𝑁
  • 5. • Жишээ: Эдийн засаг, НББ, Менежмент, Статистик, Санхүүгийн ангийн оюутнуудын тоо дараах байдлаар өгөгджээ: 46 54 42 46 32. • Энэ тохиолдолд Х1 = 46, Х2 = 54, Х3 = 42, Х4 = 46, Х5 = 32 бөгөөд 𝑋 = 𝑋1+𝑋2+𝑋3+𝑋4+𝑋5 5 = 46+54+42+46+32 5 = 44
  • 6. Жигнэгдсэн дундаж: Дундаж утгыг тооцох томъёог авч үзвэл ажиглалтын нэгж бүрт 1/n гэсэн ижил жин харгалзаж байна. 𝑋 = 𝑋𝑖 𝑛 = 1 𝑛 𝑋𝑖 = 1 𝑛 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 = 1 𝑛 (𝑋1) + 1 𝑛 (𝑋2) + ⋯ + 1 𝑛 (𝑋𝑛) Эндээс жигнэгдсэн дунджийн томъёог гарган авч бичвэл дараах хэлбэртэй болно. 𝑋 = 𝑓𝑖𝑋𝑖 𝑓𝑖
  • 7. Жишээ: Таван төрлийн түүхий эд материалын борлуулалтын мэдээ өгөгджээ. Түүхий эдийн төрөл Нэгжийн үнэ, мян.төг Борлуулсан тоо хэмжээ, кг 1 3.0 1200 2 3.4 500 3 2.8 2750 4 2.9 1000 5 3.25 800 𝑋 = 𝑋1+𝑋2+𝑋3+𝑋4+𝑋5 5 = 3+3.4+2.8+2.9+3.25 5 = 15.35 5 = 3.07 𝑋 = 𝑓𝑖𝑋𝑖 𝑓𝑖 = 1200 ∙ 3.0 + 500 ∙ 3.4 + 2750 ∙ 2.8 + 1000 ∙ 2.9 + 800 ∙ 3.25 1200 + 500 + 2750 + 1000 + 800 = 18500 6250 = 2.96
  • 8. Медиан/голч (Median): Тасралттай хувьсагч: • Тоон мэдээг багаас нь ихрүү нь дэс дараалалд оруулан байрлуулах бөгөөд эхнээс нь эрэмбэлнэ (rank).
  • 9. • Хэрвээ ажиглалтын тоо сондгой бол медиан нь эрэмблэгдсэн дэс дугаарын голын утгад харгалзна. Жишээ нь, ажиглалтын тоо 11 бол эрэмбэлэгдсэн цувааны 6 дугаар эрэмбэ дээр байгаа утга нь медиан болно. 𝑖𝑀𝑒𝑑𝑖𝑎𝑛 = 𝑛 + 1 2
  • 10. • Хэрэв ажиглалтын тоо тэгш бол медиан нь эрэмблэгдсэн дэс дугаарын голын 2 утгад харгалзах утгын дунджаар тодорхойлогдно.
  • 11. Жишээ нь: Өглөө босоод ажилдаа ажилдаа явахаар гарах хүртэл зарцуулсан хугацаа, минутаар, 10 хоног
  • 12. 7 төрлийн өдрийн хоолны калорийн хэмжээ
  • 13. Тархалт тасралтгүй: • Эхлээд медиан орших интервалыг тодорхойлно. Медиан нь нийт давтамжийн хагасыг өөртөө агуулах хамгийн эхний өсөн нэмэгдэх давтамжид харгалзах интервалд оршино.
  • 15. Ажилчдын цалингийн мэдээ өгөгджээ: Цалин, төгрөгөөр Ажилчдын тоо L 200000 хүртэл 5 5 200001-400000 15 20 400001-600000 30 50 600001-800000 22 72 800001-1000000 16 88 1000001-1200000 4 92 1200001-ээс дээш 8 100
  • 17. Моод (Mode): Моод гэдэг нь тоон мэдээний/өгөгдлийн хувьд шинж тэмдгийн хамгийн олон давтагдаж байгаа утга юм.
  • 18. Тоон мэдээ нь тасралттай тархалтын цуваа хэлбэрээр өгөгдсөн бол хамгийн олон давтамж харгалзаж байгаа утга нь моод болно.
  • 19. Харин интервал хэлбэрээр өгөгдсөн бол: • Эхлээд моод орших интервалыг тодорхойлно. Тэнцүү интервалтай мэдээний хувьд хамгийн их давтамжид харгалзах интервалд, тэнцүү биш интервалтай мэдээний хувьд хамгийн их тархалтын нягтад харгалзах интервалд мод оршдог. • Давтамжийг интервалын уртад харьцуулсан харьцааг тархалтын нягт гэнэ.
  • 20.      ) ( ) ( 1 mod 1 mod 1 mod mod           f f f f f f d X Mode e e e e
  • 21. Жишээ нь: Өглөө босоод ажилдаа явахаар гарах хүртэл зарцуулсан хугацаа, минутаар (10 өдрийн мэдээ)
  • 22. Ажилчдын цалингийн мэдээ өгөгджээ: Цалин, төгрөгөөр Ажилчдын тоо L 200000 хүртэл 5 5 200001-400000 15 20 400001-600000 30 50 600001-800000 22 72 800001-1000000 16 88 1000001-1200000 4 92 1200001-ээс дээш 8 100
  • 23.       13 . 530435 ) 22 30 ( ) 15 30 ( 15 30 199999 400001 ) ( ) ( 1 mod 1 mod 1 mod mod                    f f f f f f d X Mode e e e e
  • 24. Төвийн хандлагын үзүүлэлтээс гадна төвийн хандлыг илэрхийлэхгүй ч тоон мэдээллийг тодорхойлогч дараах үзүүлэлтүүд байдаг. • Percentile, Decile, Quartile (100, 10, 4 тэнцүү хэсэгт хуваах)
  • 25. Percentile: Percentile утга орших эрэмбэ буюу дугаарыг дараах байдлаар тодорхойлдог. Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ. Алхам 2. Дараах индексийг тооцно. 𝑖 = 𝑝∙𝑛 100 Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу ажиглалтын нэгжийн тоо. Алхам 3. a) Хэрэв i нь бухэл тоо биш бол i-ын дараагийн бүхэл тоон эрэмбэд харгалзах утгыг р дугаар Percentile-аар авна. b) Хэрэв i нь бухэл тоо бол i болон i +1 эрэмбэд харгалзах утгын дунджийг р дугаар Percentile-аар авна.
  • 26. Жишээ 1: 85 болон 50 дахь Percentile-г олохдоо дараах байдлаар тодорхойлно. i нь бухэл тоо биш учраас 10.2-ын дараагийн бүхэл тоо болох 11 гэсэн эрэмбэд харгалзах утга 3730 нь 85-р Percentile юм. i нь бухэл тоо учраас 6 болон 6+1=7 эрэмбэд харгалзах утгын дундаж буюу (3490+3520)/2=3505 нь 50-р Percentile юм.
  • 27. Percentile утга орших эрэмбэ буюу дугаарыг мөн дараах байдлаар тодорхойлж болно. Алхам 1. Өгөгдлийг өсөх эрэмбээр нь эрэмбэлнэ. Алхам 2. Дараах индексийг тооцно. 𝑖 = 𝑝 100 (𝑛 + 1) Энд р нь сонирхож буй Percentile, 𝑛 нь түүврийн хэмжээ буюу ажиглалтын нэгжийн тоо. Алхам 3. a) Хэрэв i нь бүхэл тоогоор илэрхийлэгдэж байвал тухайн дэс дугаарт харгалзаж буй утгыг сонгоно. b) Хэрэв i нь 2 дэс дугаарын голын утгаар тодорхойлогдож байвал тухайн 2 дэс дугаарт харгалзаж буй утгуудын дунджаар тодорхойлогдно. c) Хэрэв i нь 2 дэс дугаарын голын утгаар бус байдлаар (0.5 биш 0.25 ч юм уу 0.75 гэх мэт) тодорхойлогдож байвал тухайн утгад хамгийн ойр байгаа дэс дугаарт харгалзах утгыг сонгоно.
  • 28. Quartile: • 𝑄1= 25th рercentile • 𝑄2= 50th рercentile (median) • 𝑄3= 75th рercentile Өмнөх жишээний хувьд 1, 2, 3-р квартиль буюу 25, 50, 75-р рercentile-ийг тооцож үзье.
  • 29.
  • 30.
  • 31. Decile: 1-р дециль нь 10-р рercentile, 2-р дециль нь 20-р рercentile гэх мэт 9-р дециль нь 90-р рercentile байна.
  • 32. Геометрийн дундаж Өгөөжийн дундаж төвшинг тооцох геометр дундажийн арга: n n n n G X X X X X X X         ... ) ... ( 2 1 / 1 2 1 𝑅𝐺 = 1 + 𝑅1 ∙ 1 + 𝑅2 ∙ … ∙ (1 + 𝑅𝑛) 1/𝑛 − 1
  • 34. 2. ТООН МЭДЭЭГ ТОДОРХОЙЛОГЧ ХЭЛБЭЛЗЛИЙН ХЭМЖИГДЭХҮҮН 1. Далайц (Range) 2. Квартилийн далайц (Interquartile Range) 3. Вариац (Variance) 4. Стандарт хэлбэлзэл (Standard deviation) 5. Хэлбэлзлийн коэффициент буюу вариацын коэффициент (Coefficient of Variation)
  • 35. Далайц Жишээ: Өглөө босоод ажилдаа явахаар гарах хүртэл зарцуулсан хугацаа, минутаар (10 өдрийн мэдээ) Далайц нь 52-29=23 минут байна. min max X X R  
  • 36. Квартилын далайц (Interquartile Range-IQR): Өмнөх жишээн дээр Квартилын далайц=44-35=9 минут квартилын далайц = 𝑄3 − 𝑄1
  • 40. Түүврийн вариацаас квадрат язгуур авч түүврийн стандарт хэлбэлзлийг тодорхойлдог. 1 ) ( 1 2 2       n X X S S n i i
  • 42.
  • 43.
  • 44.
  • 45. Вариацын математик чанарууд: 1. Тогтмол тооны вариац тэгтэй тэнцүү. 𝜎2 = (𝐶−𝐶)2 𝑁 = 0, C=constant 2. 𝜎2 = ((𝑋𝑖−𝐶)−(𝑋−𝐶))2 𝑁 = ((𝑋𝑖−𝐶−𝑋+𝐶)2 𝑁 = (𝑋𝑖−𝑋)2 𝑁 3. 𝜎2 = ( 𝑋𝑖 𝐶 − 𝑋 𝐶 )2 𝑁 = 1 𝐶2(𝑋𝑖−𝑋)2 𝑁 = 1 𝐶2 ∙ (𝑋𝑖−𝑋)2 𝑁
  • 47. 3. ТООН МЭДЭЭНИЙ ТАРХАЛТЫН ХЭВ МАЯГИЙГ ТОДООРХОЙЛОХ Тархалтын хэв маяг (Shape): • тэгш хамтэй • тэгш бус хэмтэй
  • 48. Z хэмжигдэхүүн (Z score): Алслагдсан утга (Outlier): 𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅 𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5(𝐼𝑄𝑅)
  • 49. Х Z 39 -0,09 29 -1,57 43 0,50 52 1,83 39 -0,09 44 0,65 40 0,06 31 -1,27 44 0,65 35 -0,68 Дундаж 39,6 S 6,77
  • 50. 𝑖𝑄1 = 25∙10 100 =2.5 буюу 3-р эрэмбэд харгалзах утга 𝑄1 =35 𝑖𝑄3 = 75∙10 100 =7.5 буюу 8-р эрэмбэд харгалзах утга 𝑄3 =44 IQR=44-35=9 𝐿𝑜𝑤𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄1 − 1.5 𝐼𝑄𝑅 = 35 − 1.5 ∗ 9 = 21.5 𝑈𝑝𝑝𝑒𝑟 𝐿𝑖𝑚𝑖𝑡 = 𝑄3 + 1.5 𝐼𝑄𝑅 = 44 + 1.5 ∗ 9 = 57.5
  • 51. Чебышевын дүрэм: Тархалтын хэв маягаас үл хамааран тухайн судалж буй санамсаргүй хувьсагчийн авах утгуудын ядаж нь дунджаасаа к стандарт хэлбэлзлийн зайд тархсан байна. • Жишээ нь, к=2 үед тухайн санамсаргүй хувьсагчийн авах утгуудын ядаж нь дунджаасаа ± 2σ завсарт оршин байна.
  • 52.
  • 53.
  • 54. 4. ТООН МЭДЭЭГ ШИНЖЛЭХ m ax 3 1 m in X Q Median Q X
  • 55.
  • 56.
  • 57. Өмнөх жишээний хувьд 29 35 39,5 44 52 max 3 1 min X Q Median Q X
  • 59.
  • 60. 5. ХОЁР ХУВЬСАГЧИЙН ХАРИЛЦАН ХАМААРЛЫГ ТОДОРХОЙЛОГЧ ХЭМЖИГДЭХҮҮН Ковариац буюу хамтын хэлбэлзэл нь Х ба Ү гэсэн хоёр хувьсагчийн хоорондын шугаман хамаарлыг илэрхийлэгч үзүүлэлт юм. Түүврийн хувьд:
  • 62.