SlideShare a Scribd company logo
1 of 10
Обсяг вибірки
Типове часто запитуване питання:
          Скільки людей достатньо для
           репрезентативної вибірки?
Типові відповіді:
                                    Агенція інтернет опитувань: 10 000
                                          Політичні консультанти: 1200
                                             Дослідницька агенція: 400
                                      Ін-хаус дослідницькі відділи: 275
                                    Читачі підручників зі статистики: 30
                                              Проф. В.Л. Оссовський: 1,
               Якщо його думка репрезентує всю генеральну сукупність.
То скільки людей достатньо для репрезентативної
                    вибірки?

 – А яка мета дослідження? Навіщо?
               •   Доказати правоту перед начальством/Клієнтом
   наприклад




               •   Знати структуру ринку
               •   Загальні настрої
               •   Точний % розподіл голосів
 – А що за генеральна сукупність? Про кого треба буде
   робити висновки?
               •   Міста з населенням 100 000+
   наприклад




               •   Жінки віком 25-45 з середнім та вище
               •   Користувачі інтернет
               •   Покупці iphone5
Репрезентативна вибірка – така, яка коректно
представляє тих, про кого робляться висновки.

Статистично репрезентативна                          Генеральна
вибірка, побудована на допущенні, що кожен         сукупність: про
член генеральної сукупності має однакову            кого потрібні
                                                      висновки
ймовірність потрапити у вибірку.
    Риторичне питання: якщо бренд-менеджер
                                                      База для
    провів опитування серед своїх друзів, чи має
                                                      вибірки:
    воно шанс на національну репрезентативність?        яким
%% Дослідження поширюються на певну                   чином їх
генеральну сукупність, без знання якої                досягти?
неможливо створити репрезентативну вибірку.

Для вибору людей для опитування береться              Вибірка
певна база – поштові адреси, телефони, е-мейли
– тощо. Не кожна база підходить до кожної
генеральної сукупності.
То скільки?
Якщо ваша аудиторія більша за 5000, і члени ведуть себе самостійно,
відсутня проблема досяжності - обирайте похибку або на яку надійність
претендує бюджет:
Обсяг вибірки Похибка    11.0%
     30          18,3%   10.0%
    100          10,0%    9.0%
    275           6,0%    8.0%
    400           5,0%    7.0%
    620           4,0%    6.0%
    800           3,5%    5.0%
    1200          2,9%    4.0%
    1800          2,4%    3.0%
    2400          2,0%    2.0%
    4200          1,5%    1.0%
   10000          1,0%    0.0%
                                 100
                                       800
                                             1400
                                                    2000
                                                           2600
                                                                  3200
                                                                         3800
                                                                                4400
                                                                                       5000
                                                                                              5600
                                                                                                     6200
                                                                                                            6800
                                                                                                                   7400
                                                                                                                          8000
                                                                                                                                 8600
                                                                                                                                        9200
                                                                                                                                               9800
                                                                                                                                                      10400
                                                                                                                                                              11000
                                                                                                                                                                      11600
                                                                                                                                                                              12200
                                                                                                                                                                                      12800
                                                                                                                                                                                              13400
   40000          0,5%


Наведені цифри – за використання формули простої стохастичної вибірки. Є інші і
доцільніші, але ця – найбільш поширена на ринку.
Результати будь-якого дослідження за теорією ймовірності можуть бути хибними.
Така природа довірчого інтервалу, за негласною домовленістю зазвичай це 95%
Втім
•   Репрезентативна вибірка передбачає наявність знання про структуру
    генеральної сукупності і бази вибірки.
•   Варто розуміти, який параметр має репрезентувати вибірка. Відповідність
    вибіркових даних за параметрами стать , вік та тип населеного пункту не
    гарантує наявності у вибірці прихильників всіх сегментів ринку або електорату
    всіх і кожної сили.
     – Приклад 1: в якісному опитуванні з вибіркою в 20 людей (2 фокус-групи)
         аналітик виявив загальний аспект мотивації, який підтверджується роками
         для всієї генеральної сукупності, і навіть в інших країнах.

     – Приклад 2: для досягнення аудиторії киян з рівнем доходу вище
       середнього використали послуги однієї з репрезентативних інтернет
       панелей (за параметрами стать та вік) з обсягом потрібної підвибірки в
       12000 респондентів. Отримані дані навіть наближено не відповідали
       реаліям ринку. Зокрема, по наданим даним понад 2/3 киян робили
       покупки одягу суто в одному торгівельно-розважальному центрі, який
       знаходиться не в центрі міста, в якому (по результатах багатьох інших
       досліджень) бували принаймні раз 1/5 цільової аудиторії.
Одної кількості людей мало
              How Deep Does Rabbit Hole Go?
• Окрім випадкової вибірки є інші, зі своїми формулами і
  цифрами, стратифікаційна, кластерна , квотна тощо.

• Структура населення України складно придатна для використання
  простої стохастичної вибірки, застосовується багаторівнева вибірка. На
  кожному “рівні” своя похибка, варто зважати на дизайн ефект.

• Якщо треба знати не просто %% розподіл, а взаємозв'язок факторів –
  вибірка має задовольняти вимоги нормального розподілу та
  достатньої дисперсії, це вже інші розрахунки.

• Анкета без претесту може звести нанівець всі статистичні розрахунки.
Застереження
                 коли кількість немає значення
Данні не будуть репрезентативні за жодної кількості опитаних, якщо:
• База для вибірки не відповідає генеральній сукупності
    – Якщо опитати 50 000 інтернет користувачів, за їхніми даними не можна
       судити про населення України в цілому
    – Опитування відвідувачів супермаркету не допоможе переманити
       відвідувачів іншого супермаркету
• Некоректно сформована анкета

•   Слабкий контроль безпосереднього збору даних

Не мають права на жодні претензії на репрезентативність:
    – Телевізійні дозвони
    – SMS-голосування
    – Дзвінки на гарячі лінії
    – Анкети в пресі
Дякую за увагу
              victoria.zabuzova@gmail.com

 За детальнішою та точнішою інформацією звертатися у
профільні підручники, або записатися на курс присвячений
              вибірці авторства В.І.Паніотто
PS
•   Доказати правоту перед начальством/Клієнтом
     – Репрезентативність в даному випадку не має значення, оскільки Замовник переконаний
       у певному показнику буде тиснути на дослідника і дані будуть викривлені. Тому - скільки
       не шкода, прохання-мінімум: 1 фокус-група чи 285 анкет.
•   Зрозуміти загальні настрої
     – Краще використовувати не анкетування, а якісні чи етнометоди. Кількісне опитування
       передбачає попередні знання про структуру, про мову респондентів, про фактори впливу
       тощо.
•   Точний % розподіл голосів
     – Рекомендований мінімум - 1400 анкет. Насправді треба 1200 анкет, проте в ході
       опитування завжди отримується частина порчених анкет (специфіка роботи з людьми, не
       недолік поля), частина недозаповнених, десь респонденти просто відмовляються
       відповідати. З особистого досвіду, в реаліях українських “полів” немає сенсу збирати
       понад 4000 анкет зібраних “традиційними” методами.
•   Знати структуру ринку
     – Залежить від очікуваної кількості сегментів, якщо кожен сегмент буде розглядатися
       окремо, тоді це окремі вибірки, і загальний обсяг вибірки буде сумою підвибірок по
       кожному сегменту.

More Related Content

What's hot

Test 1 - 9. Sınıf Seviye Tespit Sınavı
Test 1 - 9. Sınıf Seviye Tespit SınavıTest 1 - 9. Sınıf Seviye Tespit Sınavı
Test 1 - 9. Sınıf Seviye Tespit Sınavısorucanavari
 
Елементи статистики (Алгебра, 9 клас)
Елементи статистики (Алгебра, 9 клас)Елементи статистики (Алгебра, 9 клас)
Елементи статистики (Алгебра, 9 клас)Formula.co.ua
 
Множення натуральних чисел та його властивості
Множення натуральних чисел та його властивостіМноження натуральних чисел та його властивості
Множення натуральних чисел та його властивостіНиколай Заблуда
 
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)Μάκης Χατζόπουλος
 
олімпіада 7
олімпіада 7олімпіада 7
олімпіада 7jkmuffgrhdcv
 
Ісландія / Iceland
Ісландія / IcelandІсландія / Iceland
Ісландія / IcelandViktor Lesyk
 
похідна та її застосування
похідна та її застосуванняпохідна та її застосування
похідна та її застосуванняЮра Марчук
 
Відсоткове відношення двох чисел
Відсоткове відношення двох чиселВідсоткове відношення двох чисел
Відсоткове відношення двох чиселsergey_strizhak
 
Portfel.in.ua 102 geom_pogor
Portfel.in.ua 102 geom_pogorPortfel.in.ua 102 geom_pogor
Portfel.in.ua 102 geom_pogorportfel
 
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑJim Samios
 
κεφ. 3 εξισωσεις
κεφ. 3 εξισωσειςκεφ. 3 εξισωσεις
κεφ. 3 εξισωσειςsarantis regas
 
Презентація:Рівняння. Основні властивості рівнянь.
Презентація:Рівняння. Основні властивості рівнянь. Презентація:Рівняння. Основні властивості рівнянь.
Презентація:Рівняння. Основні властивості рівнянь. sveta7940
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛΡεβέκα Θεοδωροπούλου
 
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο Ανάλυσης
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο ΑνάλυσηςΕκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο Ανάλυσης
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο ΑνάλυσηςΜάκης Χατζόπουλος
 
Задачі на пропорційне ділення 4
Задачі на пропорційне ділення 4Задачі на пропорційне ділення 4
Задачі на пропорційне ділення 4Сергій Ільчишин
 
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)Ισλάμ (Θρησκευτικά Β΄ Λυκείου)
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)Roy Akanthopoulou
 

What's hot (20)

Test 1 - 9. Sınıf Seviye Tespit Sınavı
Test 1 - 9. Sınıf Seviye Tespit SınavıTest 1 - 9. Sınıf Seviye Tespit Sınavı
Test 1 - 9. Sınıf Seviye Tespit Sınavı
 
Елементи статистики (Алгебра, 9 клас)
Елементи статистики (Алгебра, 9 клас)Елементи статистики (Алгебра, 9 клас)
Елементи статистики (Алгебра, 9 клас)
 
Множення натуральних чисел та його властивості
Множення натуральних чисел та його властивостіМноження натуральних чисел та його властивості
Множення натуральних чисел та його властивості
 
Ρυθμός μεταβολής
Ρυθμός μεταβολήςΡυθμός μεταβολής
Ρυθμός μεταβολής
 
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
 
олімпіада 7
олімпіада 7олімпіада 7
олімпіада 7
 
Ісландія / Iceland
Ісландія / IcelandІсландія / Iceland
Ісландія / Iceland
 
похідна та її застосування
похідна та її застосуванняпохідна та її застосування
похідна та її застосування
 
Відсоткове відношення двох чисел
Відсоткове відношення двох чиселВідсоткове відношення двох чисел
Відсоткове відношення двох чисел
 
Portfel.in.ua 102 geom_pogor
Portfel.in.ua 102 geom_pogorPortfel.in.ua 102 geom_pogor
Portfel.in.ua 102 geom_pogor
 
cv
cvcv
cv
 
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ
ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ
 
κεφ. 3 εξισωσεις
κεφ. 3 εξισωσειςκεφ. 3 εξισωσεις
κεφ. 3 εξισωσεις
 
η λατρεια των εβραιων στην συναγωγη το σαββατο
η λατρεια των εβραιων στην συναγωγη το σαββατοη λατρεια των εβραιων στην συναγωγη το σαββατο
η λατρεια των εβραιων στην συναγωγη το σαββατο
 
Презентація:Рівняння. Основні властивості рівнянь.
Презентація:Рівняння. Основні властивості рівнянь. Презентація:Рівняння. Основні властивості рівнянь.
Презентація:Рівняння. Основні властивості рівнянь.
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ
 
10.Ο άνθρωπος στο αρχικό του μεγαλείο
10.Ο άνθρωπος στο αρχικό του μεγαλείο10.Ο άνθρωπος στο αρχικό του μεγαλείο
10.Ο άνθρωπος στο αρχικό του μεγαλείο
 
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο Ανάλυσης
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο ΑνάλυσηςΕκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο Ανάλυσης
Εκπαιδευτήρια Γείτονα διαγώνισμα προσομοίωσης Κεφάλαιο 1ο Ανάλυσης
 
Задачі на пропорційне ділення 4
Задачі на пропорційне ділення 4Задачі на пропорційне ділення 4
Задачі на пропорційне ділення 4
 
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)Ισλάμ (Θρησκευτικά Β΄ Λυκείου)
Ισλάμ (Θρησκευτικά Β΄ Λυκείου)
 

Viewers also liked

Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...
Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...
Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...Fernando Velasquez
 
время, которое украинцы уделяют сми
время, которое украинцы уделяют смивремя, которое украинцы уделяют сми
время, которое украинцы уделяют смиcancre
 
Horses 090323174655 Phpapp01 1
Horses 090323174655 Phpapp01 1Horses 090323174655 Phpapp01 1
Horses 090323174655 Phpapp01 1lori74
 
indo PDF
indo PDFindo PDF
indo PDFlori74
 
Instalación Pentaho
Instalación PentahoInstalación Pentaho
Instalación PentahoMarlon Alfaro
 

Viewers also liked (7)

Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...
Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...
Programacinconvisualbasicparaaplicacionesenexcelprogramacinpuraconexcel 12071...
 
время, которое украинцы уделяют сми
время, которое украинцы уделяют смивремя, которое украинцы уделяют сми
время, которое украинцы уделяют сми
 
Manual de instalacion pentaho
Manual de instalacion pentahoManual de instalacion pentaho
Manual de instalacion pentaho
 
Horses 090323174655 Phpapp01 1
Horses 090323174655 Phpapp01 1Horses 090323174655 Phpapp01 1
Horses 090323174655 Phpapp01 1
 
Infarto
InfartoInfarto
Infarto
 
indo PDF
indo PDFindo PDF
indo PDF
 
Instalación Pentaho
Instalación PentahoInstalación Pentaho
Instalación Pentaho
 

Про обсяг вибірки

  • 2. Типове часто запитуване питання: Скільки людей достатньо для репрезентативної вибірки? Типові відповіді: Агенція інтернет опитувань: 10 000 Політичні консультанти: 1200 Дослідницька агенція: 400 Ін-хаус дослідницькі відділи: 275 Читачі підручників зі статистики: 30 Проф. В.Л. Оссовський: 1, Якщо його думка репрезентує всю генеральну сукупність.
  • 3. То скільки людей достатньо для репрезентативної вибірки? – А яка мета дослідження? Навіщо? • Доказати правоту перед начальством/Клієнтом наприклад • Знати структуру ринку • Загальні настрої • Точний % розподіл голосів – А що за генеральна сукупність? Про кого треба буде робити висновки? • Міста з населенням 100 000+ наприклад • Жінки віком 25-45 з середнім та вище • Користувачі інтернет • Покупці iphone5
  • 4. Репрезентативна вибірка – така, яка коректно представляє тих, про кого робляться висновки. Статистично репрезентативна Генеральна вибірка, побудована на допущенні, що кожен сукупність: про член генеральної сукупності має однакову кого потрібні висновки ймовірність потрапити у вибірку. Риторичне питання: якщо бренд-менеджер База для провів опитування серед своїх друзів, чи має вибірки: воно шанс на національну репрезентативність? яким %% Дослідження поширюються на певну чином їх генеральну сукупність, без знання якої досягти? неможливо створити репрезентативну вибірку. Для вибору людей для опитування береться Вибірка певна база – поштові адреси, телефони, е-мейли – тощо. Не кожна база підходить до кожної генеральної сукупності.
  • 5. То скільки? Якщо ваша аудиторія більша за 5000, і члени ведуть себе самостійно, відсутня проблема досяжності - обирайте похибку або на яку надійність претендує бюджет: Обсяг вибірки Похибка 11.0% 30 18,3% 10.0% 100 10,0% 9.0% 275 6,0% 8.0% 400 5,0% 7.0% 620 4,0% 6.0% 800 3,5% 5.0% 1200 2,9% 4.0% 1800 2,4% 3.0% 2400 2,0% 2.0% 4200 1,5% 1.0% 10000 1,0% 0.0% 100 800 1400 2000 2600 3200 3800 4400 5000 5600 6200 6800 7400 8000 8600 9200 9800 10400 11000 11600 12200 12800 13400 40000 0,5% Наведені цифри – за використання формули простої стохастичної вибірки. Є інші і доцільніші, але ця – найбільш поширена на ринку. Результати будь-якого дослідження за теорією ймовірності можуть бути хибними. Така природа довірчого інтервалу, за негласною домовленістю зазвичай це 95%
  • 6. Втім • Репрезентативна вибірка передбачає наявність знання про структуру генеральної сукупності і бази вибірки. • Варто розуміти, який параметр має репрезентувати вибірка. Відповідність вибіркових даних за параметрами стать , вік та тип населеного пункту не гарантує наявності у вибірці прихильників всіх сегментів ринку або електорату всіх і кожної сили. – Приклад 1: в якісному опитуванні з вибіркою в 20 людей (2 фокус-групи) аналітик виявив загальний аспект мотивації, який підтверджується роками для всієї генеральної сукупності, і навіть в інших країнах. – Приклад 2: для досягнення аудиторії киян з рівнем доходу вище середнього використали послуги однієї з репрезентативних інтернет панелей (за параметрами стать та вік) з обсягом потрібної підвибірки в 12000 респондентів. Отримані дані навіть наближено не відповідали реаліям ринку. Зокрема, по наданим даним понад 2/3 киян робили покупки одягу суто в одному торгівельно-розважальному центрі, який знаходиться не в центрі міста, в якому (по результатах багатьох інших досліджень) бували принаймні раз 1/5 цільової аудиторії.
  • 7. Одної кількості людей мало How Deep Does Rabbit Hole Go? • Окрім випадкової вибірки є інші, зі своїми формулами і цифрами, стратифікаційна, кластерна , квотна тощо. • Структура населення України складно придатна для використання простої стохастичної вибірки, застосовується багаторівнева вибірка. На кожному “рівні” своя похибка, варто зважати на дизайн ефект. • Якщо треба знати не просто %% розподіл, а взаємозв'язок факторів – вибірка має задовольняти вимоги нормального розподілу та достатньої дисперсії, це вже інші розрахунки. • Анкета без претесту може звести нанівець всі статистичні розрахунки.
  • 8. Застереження коли кількість немає значення Данні не будуть репрезентативні за жодної кількості опитаних, якщо: • База для вибірки не відповідає генеральній сукупності – Якщо опитати 50 000 інтернет користувачів, за їхніми даними не можна судити про населення України в цілому – Опитування відвідувачів супермаркету не допоможе переманити відвідувачів іншого супермаркету • Некоректно сформована анкета • Слабкий контроль безпосереднього збору даних Не мають права на жодні претензії на репрезентативність: – Телевізійні дозвони – SMS-голосування – Дзвінки на гарячі лінії – Анкети в пресі
  • 9. Дякую за увагу victoria.zabuzova@gmail.com За детальнішою та точнішою інформацією звертатися у профільні підручники, або записатися на курс присвячений вибірці авторства В.І.Паніотто
  • 10. PS • Доказати правоту перед начальством/Клієнтом – Репрезентативність в даному випадку не має значення, оскільки Замовник переконаний у певному показнику буде тиснути на дослідника і дані будуть викривлені. Тому - скільки не шкода, прохання-мінімум: 1 фокус-група чи 285 анкет. • Зрозуміти загальні настрої – Краще використовувати не анкетування, а якісні чи етнометоди. Кількісне опитування передбачає попередні знання про структуру, про мову респондентів, про фактори впливу тощо. • Точний % розподіл голосів – Рекомендований мінімум - 1400 анкет. Насправді треба 1200 анкет, проте в ході опитування завжди отримується частина порчених анкет (специфіка роботи з людьми, не недолік поля), частина недозаповнених, десь респонденти просто відмовляються відповідати. З особистого досвіду, в реаліях українських “полів” немає сенсу збирати понад 4000 анкет зібраних “традиційними” методами. • Знати структуру ринку – Залежить від очікуваної кількості сегментів, якщо кожен сегмент буде розглядатися окремо, тоді це окремі вибірки, і загальний обсяг вибірки буде сумою підвибірок по кожному сегменту.