ТОЙМ СТАТИСТИК
                                            (Descriptive Statistics)



                                                    Н.Хүдэрчулуун

                             Эпидемиологи Биостатистикийн Тэнхим
                              Нийгмийн Эрђђл Мэндийн Сургууль
                          Эрђђл Мэндийн Шинжлэх Ухааны Их Сургууль
                                e-mail: nhuderchuluun@yahoo.com


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                      1
Агуулга
         Статистикийн ђндсэн ойлголт, тєрєл
               Тойм ба нарийвчилсан статистик
         Мэдээллийн эх ђђсвэр
               Анхдагч
               Хоѐрдогч
         Мэдээллийн тєрєл, хэлбэр
               Хэмжилтийн тђвшин
         Тоон мэдээллийн ђндсэн ђзђђлэлтђђд
               Тєвийн хандлага
               Хэлбэлзэлийн ђзђђлэлт
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС             2
Агуулга
                                                              (continued)

         SPSS программ ашиглан Тойм статистик ђр
          дђнг тооцоолох
               ёр дђнг тооцоолох техник
               SPSS Output
         Тойм статистик ђр дђнг бичих
         Статистик программ




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС                           3
Шаардлагатай нэр томъѐо

         Эх олонлог (Population)
               Судлагдаж буй нийт масс
         Тђђвэр (Sample)
               Эх олонлогоос сонгогдсон тодорхой хэсэг
         Параметр (Parameter)
               Эх олонлогт хамаарах ђзђђлэлт
         Статистик (Statistic)
               Тђђвэр олонлогт хамаарах ђзђђлэлт

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС         4
Статистик гэж юу вэ?
    Ñòàòèñòèê íü ÒÎÎ ÌÝÄÝÝÃ öóãëóóëàõ, ýìõòãýí
     öýãöëýõ, ТОЙМЛОН ¿ç¿¿ëýõ, ГҮНЗГИЙРҮҮЛЭН
     ñóäëàõ àðãà òåõíèê¿¿äèéã áàãòààñàí øèíæëýõ óõààí.
       Тойм Статистик (Descriptive statistics)
             Ñóäëàãäàæ áóé þìñ ¿çýãäëèéí           ерєнхий   òºëºâ
              áàéäëыã ä¿ðñëýí ¿ç¿¿ëýõ
       Нарийвчилсан статистик (Inferential statistics)
             Ñóäëàãäàæ áóé þìñ ¿çýãäëèéí õºãæèë, õýòèéí
              òºëâèéí òàëààð ¿íýëãýý, ä¿ãíýëò õèéõ áîëîìæ
              îëãîäîã.
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                     5
Тойм Статистик (Descriptive
                                                    Statistics)


         Мэдээлэл цуглуулах(Collect data)
               Жнь: Асуумж

         Мэдээллийг тоймлох (Present data)
               Хђснэгт ба График г.м

         Ерєнхий ђр дђн
               Тђђврийн дундаж =                        X       i   г.м
                                                            n

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                           6
Нарийвчилсан Статистик
                                         (Inferential Statistics)


      Үнэлгээ (Estimation)
            Цэгэн ђнэлгээ
            Интервал ђнэлгээ
      Таамаглал шалгах(Hypothesis
       testing)
            t, z тест, ANOVA
            Хи-квадрат тест


                Түүврийн үр дүнд үндэслэн эх олонлогийн талаарх
                           дүнгэлт, шийдвэр гаргана.

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                   7
Мэдээллийн эх ђђсвэр (Data
                                                    Sources)


                       Анхдагч                                  Хоёрдогч
                   Мэдээллийн эх                               Мэдээллийн эх
                      үүсвэр                                      үүсвэр

                                                               Print or Electronic

           Ажиглалт                                 Асуумж



                           Туршилт



Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                    8
Мэдээллийг Тоймлох
                                                                                                                      (continued)
         Тоон мэдээлэл                                                             Frequency Polygon: Daily High Temperature
                                                                            7

               Тархалтын давтам, єсєн                                      6
                                                                            5




                                                    Frequency
                нэмэгдэх давтамж                                            4
                                                                            3
                                                                            2

                     Гистограмм                                            1
                                                                            0
                                                                                    5      15      25    35      45     55      More
                     Polygon
                                                                                     Ogive: Daily High Temperature
                     Ogive                                           100




                                                    Cumulative Percentage
               Мэдээллийг эрэмбэлэх                                        80

                                                                            60

                                                                            40
                     Steam and leaf                                        20

                                                                                0
                                                                                     10       20    30     40     50     60




                      21, 24, 24, 26,                       Stem                          Leaves

                      27, 27, 30, 32,                                           2         1 4 4 6 7 7
                                                                                3         0 2 8
                      38, 41
                                                                                4         1
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС                                                                                      9
Мэдээллийг Тоймлох
                                                                        Investor's Portfolio
         Чанарын мэдээлэл                           Savings

               Хђснэгт                                      CD
                                                          Bonds

                     Нийлбэр хђснэгт                     Stocks

                                                                   0    10           20    30       40        50
               График                                                          Amount in $1000's


                     Баганан график                45%                                                            100%



                     Бялуун диаграмм               40%                                                            90%


                                                                                                                   80%

                     Pareto diagram                35%

                                                                                                                   70%
                                                    30%

                                                                                                                   60%
                                                    25%
                                                                                                                   50%
                                                    20%
                                                                                                                   40%

                                                    15%
                                                                                                                   30%

                                                    10%
                                                                                                                   20%


                                                    5%                                                             10%


                                                    0%                                                             0%
                                                               Stocks        Bonds        Savings        CD


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС                                                                         10
Мэдээллийн тєрєл (Types of Data)
                                                    Мэдээлэл (Data)



                               Чанарын                              Тоон (Numerical)
                              (Categorical)


            Жишээ:
                Гэрлэлтийн байдал                       Тасралттай               Тасралтгүй
                Яс үндэс                                    (Discrete)            (Continuous)
                Хүйс
                (Категорт ангилагдах)               Жишээ:                   Жишээ:
                                                        Ам бүлийн тоо          БЖИ
                                                        Төрөлтийн давтамж      Цусан дахь сахарын хэмжээ
                                                        (Тасралтай тоо)

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                                        11
Тоон мэдээллийн ангилал
                      (хэмжилтийн тђвшингээс хамаатуулсан)

Утгуудын хооронд                                                  Хэмжилтийн дээд
харьцуулах                                 Харьцуулсан (Ratio)    тђвшин
боломжтой байх


Утгуудын хооронд
утга тєгєлдєр ялгаа                         Интервал (Interval)
байдаг


Дараалсан категор
(дэс дараалуулах                      Дэс дараалсан (Ordinal)
боломжтой)

Категор (зарим
тохиолдолд зєвхєн                                                 Хэмжилтийн доод
ангилагдах                                Нэрлэсэн (Nominal)      тђвшин
боломжтой)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Тоон мэдээллийн ерєнхий
                            ђзђђлэлтђђд
                                             Тоон мэдээлэл


   Төвийн үзүүлэлт                     Квартил         Хазайлт        Хэлбэр (Shape)

      Арифметик дундаж                                  Далайц             Тэгш хэм

      Голч утга                                         Завсарын квартил

      Моод                                              Дисперс

      Геометр дундаж                                    Стандарт хазайлт

                                                        Вариацийн коэффициент


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                      13
Тєвийн хандлагийн ђзђђлэлтђђд
                                      (Measures of Central Tendency)


                                           Төвийн үзүүлэлт



Арифметик дундаж                     Голч утга        Моод        Геометр дундаж

           n

          X       i
                                                                XG  (X1  X2  Xn )1/ n
  X       i1
               n              Тэнцђђ                Олон
                              хуваах утга           давтагдах
                                                    утга


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                     14
Арифметик Дундаж (Arithmetic Mean)

                Арифметик дундаж нь тєвийн хандлагийн
                 тодорхойлох нэг гол ђзђђлэлт юм

                     Дундажийг тооцох:
                                         n

                                       X           i
                                                          X1  X2    Xn
                             X         i1
                                                        
                                             n                    n

         Тђђврийн хэмжээ                                           Ажиглалтын утга

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                    15
Арифметик Дундаж (Arithmetic Mean)
                                                                       (continued)

          Тєвийн хандлага хэмжих гол ђзђђлэлт
          Дундаж = Утгуудын нийт нийлбэрийн тоонд нь хуваана
          Алслагдсан утга нєлєєлдєг (extreme values)


     0 1 2 3 4 5 6 7 8 9 10                         0 1 2 3 4 5 6 7 8 9 10



            Дундаж = 3                                    Дундаж = 4
          1 2  3  4  5 15                         1 2  3  4  10 20
                             3                                          4
                 5          5                                 5          5

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                16
Голч Утга (Median)
        Судлагдаж буй утгуудыг 2 тэнцђђ хэсэгт хуваах
         утга (50% доош, 50% дээш)

    0 1 2 3 4 5 6 7 8 9 10                          0 1 2 3 4 5 6 7 8 9 10


            Голч утга = 3                               Голч утга = 3


        Алслагдсан утгын нєлєєг тооцдоггђй


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                            17
Моод (Mode)
            Тєвийн хандлагын ђзђђлэлт
            Ихэвчилэн тохиолддог
            Алслагдсан утгууд тооцогдохгђй
            Тоон болон чанарын мэдээнд ашиглаж болно
            Огт моод байхгђй байж болно
            Олон моод байж болно


      0 1 2 3 4 5 6 7 8 9 10 11 12 13 14                     0 1 2 3 4 5 6

                                               Моод = 9        No Mode
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                            18
Жишээ: (Дундаж, Медиан, Моод)

   УБ хотын 5 баарны агаар дахь никотин тодорхойлжээ
                                                        25.2 µg/mg
                                                       $2,000 K
     Никотин:

           25.2 µg/mg
           8.7 µg/mg                                        $500 K
                                                         8.7 µg/mg
           7.4 µg/mg                   $300 K
                                     7.4 µg/mg
           6.8 µg/mg
           6.8 µg/mg

                                                    $100 K
                                                     6.8 µg/mg

                                                                  6.8 µg/mg
                                                                 $100 K

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                             19
ёр дђнгийн статистик
   Никотин:                          Дундаж: (54.9/5) = 10.98 µg/mg
                 25.2
                  8.7                Медиан: тэнцђђ хуваах = 7.4 µg/mg
                  7.4                Моод: олон давтагдах = 6.8 µg/mg
                  6.8
                  6.8            Аль ђзђђлэлт нь илђђ тодорхойлж чадах вэ?
   Нийлбэр 54.9
     Дундажийг ихэвчлэн ашигладаг ч алслагдсан утгат
      мэдрэмж єндєртэй байдаг. (outliers?)
     Медиан алслагдсан утгат мэдрэмжгђй.
       Жишээ: Моод, дунджаас илђђ медиан нь 5 баарны

        агаар дахь никотиний хэмжээг тодорхойлж байна
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                            20
Геометр Дундаж (Geometric Mean)
             Геометр дундаж
                  Хазайлт єндєртэй ђзђђлэлтийн хувьд геометр
                   дундаж тооцох тохиромжтой

                           XG  (X1  X2  Xn )   1/ n

             ѓсєлтийн дундаж хурд тооцох геометр дундаж
                  Цаг хугацаанд гарсан єєрчлєлт

       RG  [(1 R1)  (1 R2 )  (1 Rn )]              1/ n
                                                                  1
                  Ri i ђе дэхь єсєлтийн харьцаа

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                      21
Жишээ

            ѓрхийн эмнэлэгт ХБѓ-ний талаарх иргэдэд ђзђђлсэн
              тусламжийн зардал эхний сар ₮100,000, дараагийн
              сар ₮50,000 гурав дахь сард ₮100,000 байв:


                     X1  100,000 X 2  50,000 X 3  100,000


                              50% буурсан              100% єссєн

              Эхний сараас дундажаар хэдэн хувь єєрчлєгдсєн бэ?

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                   22
Жишээ:
                                                                            (continued)

         Сарын єєрчлєлтийн хувь тооцсон арифметик ба
          геометр дундаж:

 Арифметик                    (50%)  (100%)
 дундаж:                   X                  25%                Буруу ђр дђн
                                     2


 Геометр                   RG  [(1 R1)  (1 R2 )   (1 Rn )]1/ n  1
 дундаж :
                                  [(1 (50%)) (1 (100%))]1/ 2  1         Зєв ђр
                                                                              дђн
                                  [(.50)  (2)]1/ 2  1  11/ 2  1  0%
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                      23
Квартил (Quartiles)
          Квартил нь судлагдаж буй ђзђђлэлтђђдийг дєрвєн
           ижил тэнцђђ хэсэгт хуваах утгыг харуулна

                   25%               25%             25%        25%

                               Q1                   Q2     Q3

           Q1 = (n+1)/4, Q1 -аас 25% бага, 75% нь их байхаар
            хуваах утга
           Q2 = (n+1)/2, Q2 нь медиантай тэнцђђ (50% бага, 50% их
            байхаар хуваах утга)
           Q3 = 3(n+1)/4, гуравдугаар квартил нь ажиглалтын
            утгуудын 25% нь их байх утга

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                     24
Квартил тооцох

        Жишээ: Нэгдђгээр квартилыг олох
     Sample Data in Ordered Array: 11 12 13 16 16 17 18 21 22

         (n = 9)
                 Q1 = (9+1)/4 = 2.5 байрлал буюу 2 , 3 дахь
         тооны дундаж утга

                                                эндээс Q1 = 12.5

                        Q1 ба Q3 төвийн байрлалыг харуулахгүй
                        Q2 = Медиан, төвийн үзүүлэлт
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                  25
Хазайлтын ђзђђлэлт (Measures of
                                                      Variation)

                                                    Хазайлт


  Далайц                Завсарын                    Дисперс        Стандарт      Вариацийн
                         квартил                    (Variance)     хазайлт      коэффициент



    Хазайлтын ђзђђлэлтђђд
     нь мэдээллийн тархалт
     болон дундажийн талаарх
     ђр дђнг тодруулдаг.

                                                                  Ижил дундаж,
                                                                 Ялгаатай хазайлт
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                         26
Далайц (Range)

             Хамгийн энгийн хазайлтын ђзђђлэлт
             Далайц нь хамгийн их хамгийн бага утгын
              ялгавар:

                                    Далайц = Xmax– Xmin

      Жишээ:

                         0 1 2 3 4 5 6 7 8 9 10 11 12          13 14


                                        Далайц = 14 - 1 = 13

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                      27
Далайцын сул тал (Disadvantages of the
                                                         Range)

            Мэдээллийн тархалтын байдлыг тооцдоггђй

              7     8      9      10      11        12       7    8   9   10    11   12
                  Далайц = 12 - 7 = 5                             Далайц = 12 - 7 = 5

            Алсдагдсан утгад мэдрэмж ихтэй
                  1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
                                                Далайц = 5 - 1 = 4

                  1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
                                             Далайц = 120 - 1 = 119

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                         28
Завсарын Квартил (Interquartile Range)

       Завсарын квартил = 3rd quartile – 1st quartile
                         = Q 3 – Q1

            Жишээ:
                                                      Голч утга                 X
                X                          Q1                   Q3                  maximum
                    minimum                             (Q2)
                             25%                    25%        25%        25%

                  12                       30             45         57         70



                                             Завсарын квартил
                                              = 57 – 30 = 27
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                             29
Дисперс (Variance)

         Дундажаас хазайх хазайлтуудын квадратын
          хувьд тооцсон дундаж хэмжигдэхђђн
                                                            n
               Тђђврийн дисперс:
                                                            (X  X)
                                                                   i
                                                                         2

                                                    S 
                                                     2      i1
                                                                  n -1
                  ёђнд:              X = арифметик дундаж
                                     n = тђђврийн хэмжээ


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                            30
Стандарт Хазайлт (Standard Deviation)
        Хазайлтын гол ђзђђлэлт
        Дундажаасаа хазайх хазайлтуудын хувьд
         тооцсон квадрат дундаж
              Тђђврийн стандарт хазайлт:                n

 Бага стандарт хазайлт                                    (Xi  X)2
                                                    S   i1
 Их стандарт хазайлт                                           n -1


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                      31
Стандарт хазайлт тооцох

   Data (Xi) :                  10       12         14    15   17   18   18   24
                                   n=8                   Дундаж = X = 16

                 (10  X)2  (12  X)2  (14  X)2    (24  X)2
    S
                                       n 1

               (10  16)2  (12  16)2  (14  16)2    (24  16)2
        
                                       8 1

               126                                         Дундажаасаа хазайх
                                   4.2426                хазайлт
                7
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                  32
Жишээ: Стандарт хайзайлт

             A хувилбар
                                                                           Дундаж = 15.5
           11     12     13      14     15     16   17   18   19   20 21    S = 3.338

            B хувилбар
                                                                           Дундаж = 15.5
           11     12     13      14     15     16   17   18   19   20 21    S = 0.926
                   C хувилбар
                                                                           Дундаж = 15.5
           11     12     13      14     15     16   17   18   19   20 21    S = 4.570

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                      33
Вариацийн коэффициент (Coefficient of
                                                    Variation)


             Нэг тєрлийн байдал
             Дундажийн тєлєєлєх чадвар
             Тухайн ђзђђлэлтийн жигд байдалыг ђнэлэх
              шалгуур ђзђђлэлт болно
                  “33%-иас багагђй байх”


                                  S
                             CV     100%
                                  X
                                   
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                34
Жишээ: Вариацийн коэффициент
           A тохиолдол:
             Нярайн биеийн жин= 2500 грамм

             Стандарт хазайлт = 250 грамм


                            S                     250
                      CVA  
                            X             100% 
                                                        100%  10%   Хоѐр
                                                  2500               тохиолдол адил
                                                                       стандарт
           B тохиолдол:
                                                                       хазайлтай,
                Нярайн биеийн жин = 2000 грамм                        гэхдээ А
                                                                       тохиолдол
                Стандарт хазайлт = 250 грамм                          харьцангуй
                                                                       нэгэн тєрлийн
                           S                     250
                     CVB               100% 
                                                                       ђзђђлэлттэй
                           X                         100%  12.5%
                                                2000
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                  35
Тархалтын хэлбэр (Shape of a
                                                     Distribution)


         Нормал тархалт (ихэнх тохиолдолд)
         Тархалтын хэлбэр
               Тэгш хэмт эсвэл тэгш хэм хазайлттай


      Зүүн-хазайлт                                  Тэгш хэмт         Баруун-хазайлт
        Дундаж < Медиан                             Дундаж = Медиан    Медиан < Дундаж




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                        36
Хайрцган зураглал (Box and Whisker plot)

         Box-and-Whisker Plot:Гарфик аргын
          тусламжтай тойм статистик 5-н гол ђзђђлэлт:
                   Minimum -- Q1 – Медиан -- Q3 -- Maximum

          Жишээ:


                            25%                25%          25%        25%


              Min                    Q1             Голч утга     Q3         Max


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                  37
Тархалтын хэлбэр ба
                                хайрцган зураглал

   Зђђн талт                                    Тэгш хэмт             Баруун талт
   (Left-Skewed)                                (Symmetric)           (Right-Skewed)




          Q1        Q2 Q3                           Q1 Q2 Q3            Q1 Q2 Q3




    Min      Q1       Ме Q3 Max               Min    Q1 Ме Q3   Max   Min Q1 Ме   Q3   Max



Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                                            38
Статистик программ

         Statistical software                         Graphical software
           SAS                                          From list above

           R                                            Sigmaplot

           SPSS                                         Harvard Graphics

           Stata                                        Axum

           NCSS                                         Excel??

           MINITAB

           Excel??




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС                            39
SPSS программ ашиглах

              Тойм статистик ђр дђнг тооцох:
               analyze / descriptive statistics / frequencies

              Frequencies цонхноос Тойм статистик
               ђзђђлэлтийг сонгох




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС               40
SPSS программ ашиглах

                                                    Тойм статистик ђр дђнг
                                                    тооцох:
                                                    analyze / descriptive
                                                    statistics / frequencies…




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС                               41
SPSS программ ашиглах
                                                    (continued)




      Тєвийн хандлага

      Тархалт

      Хазайлтын
       ђзђђлэлтђђд




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС            42
SPSS output

 SPSS программын тойм
 статистик ђр дђн: SPSS
        output,

              Даралтын
              хэмжээ:

                          123
                          120
                          110
                          110
                          115



Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС        43
Тойм Статистик ђр дђнг бичих

                                                    Бүлэг A   Бүлэг B   p-утга
     Тоон үзүүлэлт (Жнь: Нас)
           Дундаж (SD)
           Далайц
           Медиан
     Чанарын үзүүлэлт (Жнь: Хүйс)
           Эрэгтэй                                  n1 (%)    n2 (%)
           Эмэгтэй                                  n3 (%)    n4 (%)



Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС                                44
Амжилт хүсье!




Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС   45

Descriptive statistics ph d

  • 1.
    ТОЙМ СТАТИСТИК (Descriptive Statistics) Н.Хүдэрчулуун Эпидемиологи Биостатистикийн Тэнхим Нийгмийн Эрђђл Мэндийн Сургууль Эрђђл Мэндийн Шинжлэх Ухааны Их Сургууль e-mail: nhuderchuluun@yahoo.com Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 1
  • 2.
    Агуулга  Статистикийн ђндсэн ойлголт, тєрєл  Тойм ба нарийвчилсан статистик  Мэдээллийн эх ђђсвэр  Анхдагч  Хоѐрдогч  Мэдээллийн тєрєл, хэлбэр  Хэмжилтийн тђвшин  Тоон мэдээллийн ђндсэн ђзђђлэлтђђд  Тєвийн хандлага  Хэлбэлзэлийн ђзђђлэлт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 2
  • 3.
    Агуулга (continued)  SPSS программ ашиглан Тойм статистик ђр дђнг тооцоолох  ёр дђнг тооцоолох техник  SPSS Output  Тойм статистик ђр дђнг бичих  Статистик программ Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 3
  • 4.
    Шаардлагатай нэр томъѐо  Эх олонлог (Population)  Судлагдаж буй нийт масс  Тђђвэр (Sample)  Эх олонлогоос сонгогдсон тодорхой хэсэг  Параметр (Parameter)  Эх олонлогт хамаарах ђзђђлэлт  Статистик (Statistic)  Тђђвэр олонлогт хамаарах ђзђђлэлт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 4
  • 5.
    Статистик гэж юувэ? Ñòàòèñòèê íü ÒÎÎ ÌÝÄÝÝà öóãëóóëàõ, ýìõòãýí öýãöëýõ, ТОЙМЛОН ¿ç¿¿ëýõ, ГҮНЗГИЙРҮҮЛЭН ñóäëàõ àðãà òåõíèê¿¿äèéã áàãòààñàí øèíæëýõ óõààí.  Тойм Статистик (Descriptive statistics)  Ñóäëàãäàæ áóé þìñ ¿çýãäëèéí ерєнхий òºëºâ áàéäëыã ä¿ðñëýí ¿ç¿¿ëýõ  Нарийвчилсан статистик (Inferential statistics)  Ñóäëàãäàæ áóé þìñ ¿çýãäëèéí õºãæèë, õýòèéí òºëâèéí òàëààð ¿íýëãýý, ä¿ãíýëò õèéõ áîëîìæ îëãîäîã. Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 5
  • 6.
    Тойм Статистик (Descriptive Statistics)  Мэдээлэл цуглуулах(Collect data)  Жнь: Асуумж  Мэдээллийг тоймлох (Present data)  Хђснэгт ба График г.м  Ерєнхий ђр дђн  Тђђврийн дундаж = X i г.м n Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 6
  • 7.
    Нарийвчилсан Статистик (Inferential Statistics)  Үнэлгээ (Estimation)  Цэгэн ђнэлгээ  Интервал ђнэлгээ  Таамаглал шалгах(Hypothesis testing)  t, z тест, ANOVA  Хи-квадрат тест Түүврийн үр дүнд үндэслэн эх олонлогийн талаарх дүнгэлт, шийдвэр гаргана. Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 7
  • 8.
    Мэдээллийн эх ђђсвэр(Data Sources) Анхдагч Хоёрдогч Мэдээллийн эх Мэдээллийн эх үүсвэр үүсвэр Print or Electronic Ажиглалт Асуумж Туршилт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 8
  • 9.
    Мэдээллийг Тоймлох (continued)  Тоон мэдээлэл Frequency Polygon: Daily High Temperature 7  Тархалтын давтам, єсєн 6 5 Frequency нэмэгдэх давтамж 4 3 2  Гистограмм 1 0 5 15 25 35 45 55 More  Polygon Ogive: Daily High Temperature  Ogive 100 Cumulative Percentage  Мэдээллийг эрэмбэлэх 80 60 40  Steam and leaf 20 0 10 20 30 40 50 60 21, 24, 24, 26, Stem Leaves 27, 27, 30, 32, 2 1 4 4 6 7 7 3 0 2 8 38, 41 4 1 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 9
  • 10.
    Мэдээллийг Тоймлох Investor's Portfolio  Чанарын мэдээлэл Savings  Хђснэгт CD Bonds  Нийлбэр хђснэгт Stocks 0 10 20 30 40 50  График Amount in $1000's  Баганан график 45% 100%  Бялуун диаграмм 40% 90% 80%  Pareto diagram 35% 70% 30% 60% 25% 50% 20% 40% 15% 30% 10% 20% 5% 10% 0% 0% Stocks Bonds Savings CD Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 10
  • 11.
    Мэдээллийн тєрєл (Typesof Data) Мэдээлэл (Data) Чанарын Тоон (Numerical) (Categorical) Жишээ:  Гэрлэлтийн байдал Тасралттай Тасралтгүй  Яс үндэс (Discrete) (Continuous)  Хүйс (Категорт ангилагдах) Жишээ: Жишээ:  Ам бүлийн тоо  БЖИ  Төрөлтийн давтамж  Цусан дахь сахарын хэмжээ (Тасралтай тоо) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 11
  • 12.
    Тоон мэдээллийн ангилал (хэмжилтийн тђвшингээс хамаатуулсан) Утгуудын хооронд Хэмжилтийн дээд харьцуулах Харьцуулсан (Ratio) тђвшин боломжтой байх Утгуудын хооронд утга тєгєлдєр ялгаа Интервал (Interval) байдаг Дараалсан категор (дэс дараалуулах Дэс дараалсан (Ordinal) боломжтой) Категор (зарим тохиолдолд зєвхєн Хэмжилтийн доод ангилагдах Нэрлэсэн (Nominal) тђвшин боломжтой) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 13.
    Тоон мэдээллийн ерєнхий ђзђђлэлтђђд Тоон мэдээлэл Төвийн үзүүлэлт Квартил Хазайлт Хэлбэр (Shape) Арифметик дундаж Далайц Тэгш хэм Голч утга Завсарын квартил Моод Дисперс Геометр дундаж Стандарт хазайлт Вариацийн коэффициент Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 13
  • 14.
    Тєвийн хандлагийн ђзђђлэлтђђд (Measures of Central Tendency) Төвийн үзүүлэлт Арифметик дундаж Голч утга Моод Геометр дундаж n X i XG  (X1  X2  Xn )1/ n X i1 n Тэнцђђ Олон хуваах утга давтагдах утга Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 14
  • 15.
    Арифметик Дундаж (ArithmeticMean)  Арифметик дундаж нь тєвийн хандлагийн тодорхойлох нэг гол ђзђђлэлт юм  Дундажийг тооцох: n X i X1  X2    Xn X i1  n n Тђђврийн хэмжээ Ажиглалтын утга Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 15
  • 16.
    Арифметик Дундаж (ArithmeticMean) (continued)  Тєвийн хандлага хэмжих гол ђзђђлэлт  Дундаж = Утгуудын нийт нийлбэрийн тоонд нь хуваана  Алслагдсан утга нєлєєлдєг (extreme values) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Дундаж = 3 Дундаж = 4 1 2  3  4  5 15 1 2  3  4  10 20  3  4 5 5 5 5 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 16
  • 17.
    Голч Утга (Median)  Судлагдаж буй утгуудыг 2 тэнцђђ хэсэгт хуваах утга (50% доош, 50% дээш) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Голч утга = 3 Голч утга = 3  Алслагдсан утгын нєлєєг тооцдоггђй Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 17
  • 18.
    Моод (Mode)  Тєвийн хандлагын ђзђђлэлт  Ихэвчилэн тохиолддог  Алслагдсан утгууд тооцогдохгђй  Тоон болон чанарын мэдээнд ашиглаж болно  Огт моод байхгђй байж болно  Олон моод байж болно 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 Моод = 9 No Mode Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 18
  • 19.
    Жишээ: (Дундаж, Медиан,Моод)  УБ хотын 5 баарны агаар дахь никотин тодорхойлжээ 25.2 µg/mg $2,000 K Никотин: 25.2 µg/mg 8.7 µg/mg $500 K 8.7 µg/mg 7.4 µg/mg $300 K 7.4 µg/mg 6.8 µg/mg 6.8 µg/mg $100 K 6.8 µg/mg 6.8 µg/mg $100 K Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 19
  • 20.
    ёр дђнгийн статистик Никотин:  Дундаж: (54.9/5) = 10.98 µg/mg 25.2 8.7  Медиан: тэнцђђ хуваах = 7.4 µg/mg 7.4  Моод: олон давтагдах = 6.8 µg/mg 6.8 6.8 Аль ђзђђлэлт нь илђђ тодорхойлж чадах вэ? Нийлбэр 54.9  Дундажийг ихэвчлэн ашигладаг ч алслагдсан утгат мэдрэмж єндєртэй байдаг. (outliers?)  Медиан алслагдсан утгат мэдрэмжгђй.  Жишээ: Моод, дунджаас илђђ медиан нь 5 баарны агаар дахь никотиний хэмжээг тодорхойлж байна Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 20
  • 21.
    Геометр Дундаж (GeometricMean)  Геометр дундаж  Хазайлт єндєртэй ђзђђлэлтийн хувьд геометр дундаж тооцох тохиромжтой XG  (X1  X2  Xn ) 1/ n  ѓсєлтийн дундаж хурд тооцох геометр дундаж  Цаг хугацаанд гарсан єєрчлєлт RG  [(1 R1)  (1 R2 )  (1 Rn )] 1/ n 1  Ri i ђе дэхь єсєлтийн харьцаа Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 21
  • 22.
    Жишээ ѓрхийн эмнэлэгт ХБѓ-ний талаарх иргэдэд ђзђђлсэн тусламжийн зардал эхний сар ₮100,000, дараагийн сар ₮50,000 гурав дахь сард ₮100,000 байв: X1  100,000 X 2  50,000 X 3  100,000 50% буурсан 100% єссєн Эхний сараас дундажаар хэдэн хувь єєрчлєгдсєн бэ? Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 22
  • 23.
    Жишээ: (continued) Сарын єєрчлєлтийн хувь тооцсон арифметик ба геометр дундаж: Арифметик (50%)  (100%) дундаж: X  25% Буруу ђр дђн 2 Геометр RG  [(1 R1)  (1 R2 )   (1 Rn )]1/ n  1 дундаж :  [(1 (50%)) (1 (100%))]1/ 2  1 Зєв ђр дђн  [(.50)  (2)]1/ 2  1  11/ 2  1  0% Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 23
  • 24.
    Квартил (Quartiles)  Квартил нь судлагдаж буй ђзђђлэлтђђдийг дєрвєн ижил тэнцђђ хэсэгт хуваах утгыг харуулна 25% 25% 25% 25% Q1 Q2 Q3  Q1 = (n+1)/4, Q1 -аас 25% бага, 75% нь их байхаар хуваах утга  Q2 = (n+1)/2, Q2 нь медиантай тэнцђђ (50% бага, 50% их байхаар хуваах утга)  Q3 = 3(n+1)/4, гуравдугаар квартил нь ажиглалтын утгуудын 25% нь их байх утга Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 24
  • 25.
    Квартил тооцох  Жишээ: Нэгдђгээр квартилыг олох Sample Data in Ordered Array: 11 12 13 16 16 17 18 21 22 (n = 9) Q1 = (9+1)/4 = 2.5 байрлал буюу 2 , 3 дахь тооны дундаж утга эндээс Q1 = 12.5 Q1 ба Q3 төвийн байрлалыг харуулахгүй Q2 = Медиан, төвийн үзүүлэлт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 25
  • 26.
    Хазайлтын ђзђђлэлт (Measuresof Variation) Хазайлт Далайц Завсарын Дисперс Стандарт Вариацийн квартил (Variance) хазайлт коэффициент  Хазайлтын ђзђђлэлтђђд нь мэдээллийн тархалт болон дундажийн талаарх ђр дђнг тодруулдаг. Ижил дундаж, Ялгаатай хазайлт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 26
  • 27.
    Далайц (Range)  Хамгийн энгийн хазайлтын ђзђђлэлт  Далайц нь хамгийн их хамгийн бага утгын ялгавар: Далайц = Xmax– Xmin Жишээ: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Далайц = 14 - 1 = 13 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 27
  • 28.
    Далайцын сул тал(Disadvantages of the Range)  Мэдээллийн тархалтын байдлыг тооцдоггђй 7 8 9 10 11 12 7 8 9 10 11 12 Далайц = 12 - 7 = 5 Далайц = 12 - 7 = 5  Алсдагдсан утгад мэдрэмж ихтэй 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Далайц = 5 - 1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Далайц = 120 - 1 = 119 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 28
  • 29.
    Завсарын Квартил (InterquartileRange) Завсарын квартил = 3rd quartile – 1st quartile = Q 3 – Q1 Жишээ: Голч утга X X Q1 Q3 maximum minimum (Q2) 25% 25% 25% 25% 12 30 45 57 70 Завсарын квартил = 57 – 30 = 27 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 29
  • 30.
    Дисперс (Variance)  Дундажаас хазайх хазайлтуудын квадратын хувьд тооцсон дундаж хэмжигдэхђђн n  Тђђврийн дисперс: (X  X) i 2 S  2 i1 n -1 ёђнд: X = арифметик дундаж n = тђђврийн хэмжээ Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 30
  • 31.
    Стандарт Хазайлт (StandardDeviation)  Хазайлтын гол ђзђђлэлт  Дундажаасаа хазайх хазайлтуудын хувьд тооцсон квадрат дундаж  Тђђврийн стандарт хазайлт: n Бага стандарт хазайлт  (Xi  X)2 S i1 Их стандарт хазайлт n -1 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 31
  • 32.
    Стандарт хазайлт тооцох Data (Xi) : 10 12 14 15 17 18 18 24 n=8 Дундаж = X = 16 (10  X)2  (12  X)2  (14  X)2    (24  X)2 S n 1 (10  16)2  (12  16)2  (14  16)2    (24  16)2  8 1 126 Дундажаасаа хазайх   4.2426 хазайлт 7 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 32
  • 33.
    Жишээ: Стандарт хайзайлт A хувилбар Дундаж = 15.5 11 12 13 14 15 16 17 18 19 20 21 S = 3.338 B хувилбар Дундаж = 15.5 11 12 13 14 15 16 17 18 19 20 21 S = 0.926 C хувилбар Дундаж = 15.5 11 12 13 14 15 16 17 18 19 20 21 S = 4.570 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 33
  • 34.
    Вариацийн коэффициент (Coefficientof Variation)  Нэг тєрлийн байдал  Дундажийн тєлєєлєх чадвар  Тухайн ђзђђлэлтийн жигд байдалыг ђнэлэх шалгуур ђзђђлэлт болно  “33%-иас багагђй байх” S CV     100% X   Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 34
  • 35.
    Жишээ: Вариацийн коэффициент  A тохиолдол:  Нярайн биеийн жин= 2500 грамм  Стандарт хазайлт = 250 грамм S  250 CVA   X  100%   100%  10% Хоѐр   2500 тохиолдол адил стандарт  B тохиолдол: хазайлтай,  Нярайн биеийн жин = 2000 грамм гэхдээ А тохиолдол  Стандарт хазайлт = 250 грамм харьцангуй нэгэн тєрлийн S  250 CVB    100%  ђзђђлэлттэй X  100%  12.5%   2000 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 35
  • 36.
    Тархалтын хэлбэр (Shapeof a Distribution)  Нормал тархалт (ихэнх тохиолдолд)  Тархалтын хэлбэр  Тэгш хэмт эсвэл тэгш хэм хазайлттай Зүүн-хазайлт Тэгш хэмт Баруун-хазайлт Дундаж < Медиан Дундаж = Медиан Медиан < Дундаж Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 36
  • 37.
    Хайрцган зураглал (Boxand Whisker plot)  Box-and-Whisker Plot:Гарфик аргын тусламжтай тойм статистик 5-н гол ђзђђлэлт: Minimum -- Q1 – Медиан -- Q3 -- Maximum Жишээ: 25% 25% 25% 25% Min Q1 Голч утга Q3 Max Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 37
  • 38.
    Тархалтын хэлбэр ба хайрцган зураглал Зђђн талт Тэгш хэмт Баруун талт (Left-Skewed) (Symmetric) (Right-Skewed) Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3 Min Q1 Ме Q3 Max Min Q1 Ме Q3 Max Min Q1 Ме Q3 Max Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 38
  • 39.
    Статистик программ  Statistical software  Graphical software  SAS  From list above  R  Sigmaplot  SPSS  Harvard Graphics  Stata  Axum  NCSS  Excel??  MINITAB  Excel?? Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 39
  • 40.
    SPSS программ ашиглах  Тойм статистик ђр дђнг тооцох: analyze / descriptive statistics / frequencies  Frequencies цонхноос Тойм статистик ђзђђлэлтийг сонгох Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 40
  • 41.
    SPSS программ ашиглах Тойм статистик ђр дђнг тооцох: analyze / descriptive statistics / frequencies… Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 41
  • 42.
    SPSS программ ашиглах (continued)  Тєвийн хандлага  Тархалт  Хазайлтын ђзђђлэлтђђд Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 42
  • 43.
    SPSS output SPSSпрограммын тойм статистик ђр дђн: SPSS output, Даралтын хэмжээ: 123 120 110 110 115 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 43
  • 44.
    Тойм Статистик ђрдђнг бичих Бүлэг A Бүлэг B p-утга Тоон үзүүлэлт (Жнь: Нас) Дундаж (SD) Далайц Медиан Чанарын үзүүлэлт (Жнь: Хүйс) Эрэгтэй n1 (%) n2 (%) Эмэгтэй n3 (%) n4 (%) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШИУС 44
  • 45.