Your SlideShare is downloading. ×
  • Like
  • Save
Lecture 4
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Lecture 4

  • 1,442 views
Published

 

Published in Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,442
On SlideShare
0
From Embeds
0
Number of Embeds
3

Actions

Shares
Downloads
1
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Бизнес статистикийн үндэс Сэдэв 4 Хүснэгт, график дүрслэл, тэдгээрийн хэрэглээ
  • 2. Дэд сэдвүүд  Олон хэмжээст тоон өгөгдлийг хүснэгтлэх ба диаграмм зурах    Давталттай тархалт: хүснэгт, гистограмм, полигон Хуримтлагдсан тархалт: хүснэгт, огив Хоёр хэмжээст тоон өгөгдлийг графикт дүрслэх
  • 3. Дэд сэдвүүд  Олон хэмжээст категорийн өгөгдлийг хүснэгтлэх ба графикт дүрслэх   Тэгш өнцөгт ба дугуй диаграмм, Pareto диаграмм Хоёр хэмжээст категорийн өгөгдлийг хүснэгтлэх ба графикт дүрслэх  Санамсаргүй үзэгдлийн хүснэгт   (үргэлжлэл) Хоёр талт тэгш өнцөгт диаграмм Өгөгдлийг илэрхийлэх графикийн төгс байдал ба энгийн алдаанууд
  • 4. Эдийн засгийн үзэгдлийг илэрхийлэх аргууд     Үгээр илэрхийлэх Тоон хүснэгтээр илэрхийлэх Графикаар илэрхийлэх Аналитик хэлбэрээр илэрхийлэх
  • 5. Тоон өгөгдлийг хүснэгтлэх ба графикт дүрслэх Тоон өгөгдөл Дараалласан 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 41, 24, 32, 26, 27, 27, 30, 24, 38, 21 Давталттай тархалт Хуримтлагдсан тархалт O give 120 100 80 60 40 20 0 10 Иш ба Навч дэлгэц 2 144677 3 028 4 1 Гистограмм 20 30 6 Хүснэгт Полигон 4 3 2 1 0 10 20 30 40 50 60 50 Огив 7 5 40 60
  • 6. Тоон өгөгдлийн хүснэгт Статистик хүснэгт бол тодорхой дэс дараалал болон холбоо бүхий мөр баганын систем юм. Шинж чанараар нь статистик хүснэгтийг энгийн, бүлэглэсэн, хосолсон гэж ангилдаг. Хүснэгтэн доторхи нэр нь (баганын нэр) үзүүлэлтүүдийн нэр (үгийг товчлолгүйгээр) тэдгээрийг хэмжих нэгжийг агуулдаг.
  • 7. Тоон өгөгдлийн график Статистик график нь тоон хэмжигдэхүүн  болон тэдгээрийн харьцааг шугам, геометр дүрс, зураг, эсвэл газар зүйн карт схем зэргээр дүрслэн үзүүлдэг. Графикийг  байгуулах аргаар нь диаграмм, кортограмм, каритодиаграмм гэж
  • 8. Тоон өгөгдлийн график Мэдээллийг дүрслэх хамгийн тархсан арга нь  диаграмм юм. Энэ нь янз бүрийн хэлбэртэй. Үүнд: Шугаман, цэгэн, хавтгай, эзэлхүүнт, дүрсэн, дугуй. Диаграммийн хэлбэр нь дүрсэлж буй мэдээллийн хэлбэр (нэг, эсвэл хэд хэдэн үзүүлэлт, нэг хувьсагч, хэд хэдэн хувьсагч, тоон эсвэл чанарын үзүүлэлт) график байгуулах зорилгоос хамаарна.
  • 9. Тоон өгөгдлийн график  Дискрет шинжтэй тархалтын цувааг графикаар дүрслэн харуулахдаа полигоныг ашиглана. Интервалын тархалтын цувааг графикаар дүрслэн харуулахдаа гистограммыг ашиглана. Өсөн нэмэгдэх шууд болон урвуу давталтуудаар огивыг байгуулна. Шууд өсөн нэмэгдэх давталтаар байгуулсан огивыг "төдөөс бага", урвуу өсөн нэмэгдэх давталтаар байгуулсан огивыг "төдөөс их" гэж нэрлэнэ.
  • 10. Тоон өгөгдлийг хүснэгтлэх: Давталттай тархалт  Эмх цэгцгүй өгөгдлийг өсөх дарааллаар эрэмбэл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58  Далайцыг олох: 58 - 12 = 46  Бүлгийн тоог сонгох: 5 (ихэвчлэн 5-аас 15-ын хооронд) Бүлгийн интервалыг тооцох (width): 10 (46/5 then round  up)    Бүлгийн хилийг тодорхойлох (limits): 10, 20, 30, 40, 50, 60 Бүлгийн төвийг тооцох: 15, 25, 35, 45, 55 Ажиглалтыг тоолж бүлэглэлт хийх
  • 11. Давталттай тархалт, Харьцангуй давталтын тархалт ба Хувиарх тархалт Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Бүлэг 10 ба 20-иос бага 20 ба 30-аас бага 30 ба 40-өөс бага 40 ба 50-иас бага 50 ба 60-аас бага Нийт Харьцангуй Давталт давталт 3 .15 6 .30 5 .25 4 .20 2 .10 20 1 Хувь 15 30 25 20 10 100
  • 12. Тоон өгөгдлийн график: Гистограмм Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 y c n u q e r F Histogram 7 6 5 4 3 2 1 0 6 5 3 2 0 5 Бүлгийн хил Баганын хооронд зайгүй 4 0 15 25 36 45 Бүлгийн төв 55 More
  • 13. Тоон өгөгдлийн график: Давталттай полигон Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 y c n u q e r F Polygon 7 6 5 4 3 2 1 0 5 15 25 36 Бүлгийн төв 45 55 More
  • 14. Тоон өгөгдлийг хүснэгтлэх: Хуримтлагдсан давтамж Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Бүлэг 10 but under 20 20 but under 30 30 but under 40 40 but under 50 50 but under 60 Харьцангуй Давталт % 3 9 14 18 20 Хуримтлагдсан Давталт % 15 45 70 90 100
  • 15. Тоон өгөгдлийн график: Огив (Хуримтлагдсан % Полигон) Дараалласан өгөгдөл: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Ogive 100 80 60 40 20 0 10 20 30 40 50 60 Бүлгийн хил (Бүлгийн төв биш)
  • 16. Дискрет тархалтын цуваа Ìýðãýæëèéí Àæèë÷äûí òîî ªñºí íýìýãäýõ äàâòàìæ çýðýã Õ Òîîãîîð f Õóâèàð w Øóóä Sf Óðâóó Sfi 1 1 5 1 20 2 3 10 4 19 3 5 25 9 16 4 6 30 15 11 5 3 15 18 5 6 2 15 20 2 Ä¿í 20 100 - -
  • 17. Хоёр хэмжээст тоон өгөгдлийн график (Scatter Plot) Mutual Funds Scatter Plot 40 Total Year to Date Return (%) 30 20 10 0 0 10 20 30 Net Asset Values 40
  • 18. Категорийн өгөгдлийн хүснэгт ба график: Олон хэмжээст өгөгдөл Категорийн өгөгдөл Өгөгдлийг хүснэгтлэх Хураангуй хүснэгт Өгөгдлийн график Дугуй диаграмм Тэгш өнцөгт диаграмм Парето диаграмм
  • 19. Хураангуй хүснэгт (Хөрөнгө оруулагчийн богц) Хөрөнгө оруулалтын категор Хувьцаа Бонд CD Хадгаламж Total Дүн (мянган $) 46.5 32 15.5 16 110 Категорийн хувьсагчид Хувь 42.27 29.09 14.09 14.55 100
  • 20. Категорийн өгөгдлийн график: Олон хэмжээст өгөгдөл Категорийн өгөгдөл Өгөгдлийн график Өгөгдлийг хүснэгтлэх Хураангуй хүснэгт Дугуй диаграмм CD S avings B onds S toc k s 0 10 20 30 40 50 Тэгш өнцөгт диаграмм Парето диаграмм 45 12 0 40 10 0 35 30 80 25 60 20 15 40 10 20 5 0 0 S toc k s B ond s S a vings CD
  • 21. Дөрвөлжин диаграмм (Хөрөнгө оруулагчийн богц) Investor's Portfolio Savings CD Bonds Stocks 0 10 20 30 Amount in K$ 40 50
  • 22. Дугуй диаграмм (Хөрөнгө оруулагчийн богц) Хөрөнгө оруулалтын дүн Хадгаламж 15% Хувьцаа 42% CD 14% Бонд 29% Хувиудыг ойролцоогоор авсан
  • 23. Парето диаграмм 45% 40% Дөрвөлжин диаграмм нь категор бүрийн эзлэх хувь 100% 90% 80% 35% 70% 30% 60% 25% 50% 20% Шулуун график нь хуримтлаг дсан хувь 40% 15% 30% 10% 20% 5% 10% 0% 0% Stocks Bonds Savings CD
  • 24. Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график  Санамсаргүй үзэгдлийн хүснэгт: хөрөнгө оруулалт мянган доллараар Investment Category Investor A Investor B Investor C Total Stocks Bonds CD Savings 46.5 32 15.5 16 55 44 20 28 27.5 19 13.5 7 129 95 49 51 Total 110 147 67 324
  • 25. Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график  Хоёр талт диаграмм Comparing Investors S avings CD B onds S toc k s 0 10 Inves tor A 20 30 Inves tor B 40 50 Inves tor C 60
  • 26. Төгс графикийн зарчмууд      Мөн чанар, статистик, хэв загварыг тодорхойлохуйц өгөгдлийг илэрхийлэх Нарийн, тодорхой, үр ашигтай цогц ойлголтыг дамжуулах Хамгийн үр ашигтай аргаар хамгийн олон ойлголтыг өгөх Гол чухал хэмжигдэхүүнүүдийг хамруулах Өгөгдлийн тухай үнэнийг өгүүлэх
  • 27. Өгөгдлийг илэрхийлэхэд гардаг нийтлэг алдаа  Буруу диаграмм хэрэглэх  Бүлгүүдийн хоорондох өгөгдлийг харьцуулахдаа харьцангуй хэмжигдэхүүн хэрэглээгүйтэй холбоотой алдаа  Босоо тэнхлэгийг шахаж харуулах  Босоо тэнхлэгт тэг утгыг харуулахгүй байх
  • 28. “Буруу диаграмм” Муу танилцуулга Сайн танилцуулга Минимум цалин 1960: $1.00 1970: $1.60 Минимум цалин 4 $ 2 1980: $3.10 0 1990: $3.80 1960 1970 1980 1990
  • 29. Харьцангуй хэмжигдэхүүнд суурилаагүй Муу танилцуулга Хүлээн авсан Freq. оюутны тоо 300 200  Сайн танилцуулга 30 % Хүлээн авсан оюутны тоо 20 100 10 0 0 FR SO JR SR FR SO JR SR FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
  • 30. Босоо тэнхлэгийг шахах Муу танилцуулга 200 $ Улирлын борлуулалт Сайн танилцуулга  50 100 $ 25 0 Улирлын борлуулалт 0 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
  • 31. Босоо тэнхлэгт тэг утга аваагүй Муу танилцуулга 45 $ Сарын борлуулалт 42 39  Сайн танилцуулга 45 42 39 $ Сарын борлуулалт 36 36 J F M A M J Эхний 6 сарын борлуулалтыг дүрслэв 0 J F M A M J
  • 32. Нэг хувьсагчтай графикууд 1. Дугуй диаграмм Үндэсний орлого 6% 6% 8% 12% 68% Хөлсний ажилчдын цалин Корпорацийн ашиг Өмч эзэмшигчийн орлого Хүүгийн орлого Түрээсийн орлого
  • 33. 2. Баганан диаграмм
  • 34. 3. Хугацааны диаграмм
  • 35. Шалтгаан үр дагаврын урвуу хамаарал Цагдаагийн тоо нэмэгдсэнээр гэмт хэргийн тоо өссөн үү? Гэмт хэргийн тоо өссөнөөр цагдаагийн тоо нэмэгдсэн үү?
  • 36. Орхигдсон хувьсагчтай график Гэрт тамхилагчдын тоо тогтмол байхад өвчний эрсдэл нэмэгдэж байна. Энэ нь орхигдсон функц болох тамхи татах тоо нь их болж байгаатай холбоотой нэмэгдэж байж болох юм.
  • 37. Квантиль Бие даасан ажиглалтын утгууд нь /дискрет тархалт нь, i-р квартиль, j-р децил ба k-р перцентиль нь дарааллаж байршина/ дараах хамааралтай дискрет тархалттай байна Qi = i(n + 1) th observation in the distribution, i = 1, 2, 3 4 j(n + 1) th observation in the distribution, j = 1, 2, ,9 10 k(n + 1) Pk = th observation in the distribution, k = 1, 2,  ,99 100 Dj =
  • 38. Квартиль 7 хоногт телевиз үзэх давтамж (цаг): 25 41 27 32 43 66 35 31 15 5 34 26 32 38 16 30 38 30 20 21 Дээрх өгөгдлийг дарааллуулж бичвэл: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 37 38 41 43 66
  • 39. Квартиль 1(20 + 1) Q1 = th observation in the distribution 4 = 5.25th observation in the distribution = 5th obs. + 0.25{6th obs. - 5th obs.} = 21 + 0.25{25 - 21} = 22.0 Hours
  • 40. Квартиль 2(20 + 1) Q2 = th observation in the distribution 4 = 10.50 th observation in the distribution = 10 th obs. + 0.50{11th obs. - 10th obs.} = 30 + 0.50{31 - 30} = 30.5 Hours
  • 41. Квартиль
  • 42. Inter-quartile Range (IQR) Inter-quartile range = 3rd quartile – 1st Quartile Q3 - Q1 IQR is independent of outliers
  • 43. Inter-quartile Range X minimum 25% 12 Q1 Median (Q2) 25% 30 Q3 25% 45 57 Inter-quartile Range (IQR) = 57 – 30 = 27 X maximum 25% 70
  • 44. Five Number Summary The weekly TV viewing times (in hours). 25 34 41 27 26 32 32 38 43 66 16 30 35 38 31 15 30 20 5 21 The array of the above data is given below: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 37 38 41 43 66
  • 45. Five Number Summary LOCATION of Q1 ; 1(20 + 1) 4 th obs. in the data = 5.25th obs. VALUE of Q1 ; 5th obs. + 0.25{6th obs. - 5th obs.} = 21 + 0.25{25 - 21} = 22.0 Hrs LOCATION of Q 2 ; VALUE of Q2 2(20 + 1) 4 th obs. in the data = 10.50 th obs. ;10 th obs. + 0.50{11th obs. - 10th obs.} = 30 + 0.50{31 - 30} = 30.5 Hrs LOCATION of Q 3 ; 3(20 + 1) 4 th obs. in the data = 15.75th obs. VALUE of Q 3 ; 15th obs + 0.75 {16th obs - 15th obs} = 35 + 0.75{37 - 35} = 36.5 Hrs Minimum value=5.0 Maximum value=66.0
  • 46. Box and Whisker Diagram A box and whisker diagram or box-plot is a graphical mean for displaying the five number summary of a set of data. In a box-plot the first quartile is placed at the lower hinge and the third quartile is placed at the upper hinge. The median is placed in between these two hinges. The two lines emanating from the box are called whiskers. The box and whisker diagram was introduced by Professor Jhon W. Tukey.
  • 47. Construction of Box-Plot Max Valu 1. 2. 3. 4. Start the box from Q1 and end at Q3 Within the box draw a line to represent Q2 Draw lower whisker to Min. Value up to Q1 Draw upper Whisker from Q3 up to Max. Value e Q3 Q2 Q1 Min Value
  • 48. 70 Construction of Box-Plot 1. 2. 3. 4. Q1=22.0 Q3=36.5 Q2=30.5 Minimum Value=5.0 Maximum Value=66.0 60 50 40 30 20
  • 49. 70 Interpretation of Box-Plot Box-Whisker Plot is useful to identify 60 •Maximum and Minimum Values in the data •Median of the data 50 •IQR=Q3-Q1, Lengthy box indicates more variability in the data •Shape of the data From Position of line within box Line At the center of the box----Symmetrical skewed Line above center of the box----Negatively Line below center of the box----Positively Skewed •Detection of Outliers in the data 40 30 20
  • 50. Outliers An outlier is the values that falls well outside the overall pattern of the data. It might be • • • the result of a measurement or recording error, a member from a different population, simply an unusual extreme value. An extreme value needs not to be an outliers; it might, instead, be an indication of skewness.
  • 51. Inner and Outer Fences If Q1=22.0 Q3=36.5 Q2=30.5 Lower Inner Fence = Q1 − 1.5( IQR ) = 0.25 Inner Fences :  Upper Inner Fence = Q 3 + 1.5( IQR ) = 58.25 Lower Outer Fence = Q1 − 3( IQR ) = −21.5 Outer Fences :  Upper Outer Fence = Q 3 + 3( IQR ) = 80.0
  • 52. 80 Identification of the Outliers 70 1. The values that lie within inner fences are normal values 2. The values that lie outside inner fences but inside outer fences are possible/suspected/mild outliers 3. The values that lie outside outer fences are sure outliers 60 Only 66 is a mild outlier Plot each suspected outliers with an asterisk and each sure outliers with an hollow dot. 50 40 30 20 10 0 *
  • 53. Uses of Box and Whisker Diagram Box plots are especially suitable for comparing two or more data sets. In such a situation the box plots are constructed on the same scale. Male Female
  • 54. Standardized Variable     A variable that has mean “0” and Variance “1” is called standardized variable Values of standardized variable are called standard scores Values of standard variable i.e standard scores are unit-less Construction Variable − Mean of Variable Z= Standard Deviation of Variable
  • 55. Standardized Variable X ( X − X )2 3 25 -1.3624 1.8561 6 4 -0.5450 0.2970 Z (Z − Z ) 2 11 9 0.81741 0.6682 12 16 1.0899 32 54 0 1.1879 4.009 Variable Z has mean “0” and X 2 Sx ∑X = = 32 =8 4 n 54 = =13.5 4 Z= X− X X−8 = Sx 3.67 ∑Z Z = 2 Sz =0 n 4.009 = ≅1 4 variance “1” so Z is a standard variable. X − X 11 − 8 Z= = = 0.8174 3.67 Standard Score at X=11 is Sx
  • 56. The Empirical Rule 68.26% X ± 1S contains about 68.26% of values X X ± 1S X ± 2S contains about 95.45% of values 95.45% X ± 2S 99.73% X ± 3S X ± 3S contains about 99.73% of values
  • 57. Measures of Skewness A distribution in which the values equidistant from the centre have equal frequencies is defined to be symmetrical and any departure from symmetry is called skewness. 1. Length of Right Tail = Length of Left Tail 2. Mean = Median = Mode 3. Sk=0 a) Sk=(Mean-Mode)/SD b) Sk=(Q3-2Q2+Q1)/(Q3-Q1)
  • 58. Measures of Skewness A distribution is positively skewed, if the observations tend to concentrate more at the lower end of the possible values of the variable than the upper end. A positively skewed frequency curve has a longer tail on the right hand side 1. Length of Right Tail > Length of Left Tail 2. Mean > Median > Mode 3. SK>0
  • 59. Measures of Skewness A distribution is negatively skewed, if the observations tend to concentrate more at the upper end of the possible values of the variable than the lower end. A negatively skewed frequency curve has a longer tail on the left side. 1. Length of Right Tail < Length of Left Tail 2. Mean < Median < Mode 3. SK< 0
  • 60. Measures of Kurtosis • • • The Kurtosis is the degree of peakedness or flatness of a unimodal (single humped) distribution, When the values of a variable are highly concentrated around the mode, the peak of the curve becomes relatively high; the curve is Leptokurtic. When the values of a variable have low concentration around the mode, the peak of the curve becomes relatively flat;curve is Platykurtic. A curve, which is neither very peaked nor very flat-toped, it is taken as a basis for comparison, is called Mesokurtic/Normal.
  • 61. Measures of Kurtosis
  • 62. Measures of Kurtosis Coefficient of Kurtosis= n ∑ ( X-X ) 4 2 2  ( X-X )  ∑  1. If Coefficient of Kurtosis > 3 ----------------- Leptokurtic. 2. If Coefficient of Kurtosis = 3 ----------------- Mesokurtic. 3. If Coefficient of Kurtosis < 3 ----------------- is Platykurtic.
  • 63. Histograms and Bar Charts To help students distinguish the histogram from the simple bar chart, for the data here is the example from page 39 of the Histograms Chapter (Chapter 3) which also mentions the advantage of the histogram for larger data sets.
  • 64. Histogram, Box Plot, and CDF To compare and contrast these three basic exploratory charts, here is the example from page 83 of Chapter 4 on Landmark Summaries.
  • 65. Probability Trees Probability is less mysterious to students when there is a visual framework, as shown here in the example from page 144 of Chapter 6.
  • 66. Bivariate Data Examples Relationships and regression are powerful business concepts. Here are a couple of the examples from Chapter 11 on Bivariate Data (pages 295 and 308).
  • 67. Magazine Ads and Multiple Regression The cost of advertising can be explained, in part, by magazine characteristics such as audience size and income level in this example that is used to illustrate the power of multiple regression in business, from Chapter 12.
  • 68. Excel Guide The Excel Guide goes step-by-step through, chapter by chapter, to show students how Excel can be used to obtain statistical results. Here is the scatterplot example from page 82 of the Excel Guide.
  • 69. Сэдвийн дүгнэлт • Тоон өгөгдлийг цэгцлэх – Дараалласан тархалт ба иш-навч дэлгэц • Олон хэмжээст тоон өгөгдлийн хүснэгт ба график – Давталттай тархалт: хүснэгт, гистограмм, полигон – Хуримтлагдсан тархалт: хүснэгт ба огив • Хоёр хэмжээст тоон өгөгдлийн график
  • 70. Сэдвийн дүгнэлт (үргэлжлэл) • Олон хэмжээст категорийн өгөгдлийн хүснэгт ба график – Хураангуй хүснэгт – Тэгш өнцөгт ба дугуй диаграмм, Парето диаграмм • Хоёр хэмжээст категорийн өгөгдлийн хүснэгт ба график – Санамсаргүй үзэгдлийн хүснэгт – Хоёр талт диаграмм • Төгс график болон өгөгдлийг илэрхийлэхэд гардаг нийтлэг алдааны талаар хэлэлцсэн
  • 71. Анхаарал тавьсанд баярлалаа