2. Типове часто запитуване питання:
Скільки людей достатньо для
репрезентативної вибірки?
Типові відповіді:
Агенція інтернет опитувань: 10 000
Політичні консультанти: 1200
Дослідницька агенція: 400
Ін-хаус дослідницькі відділи: 275
Читачі підручників зі статистики: 30
Проф. В.Л. Оссовський: 1,
Якщо його думка репрезентує всю генеральну сукупність.
3. То скільки людей достатньо для репрезентативної
вибірки?
– А яка мета дослідження? Навіщо?
• Доказати правоту перед начальством/Клієнтом
наприклад
• Знати структуру ринку
• Загальні настрої
• Точний % розподіл голосів
– А що за генеральна сукупність? Про кого треба буде
робити висновки?
• Міста з населенням 100 000+
наприклад
• Жінки віком 25-45 з середнім та вище
• Користувачі інтернет
• Покупці iphone5
4. Репрезентативна вибірка – така, яка коректно
представляє тих, про кого робляться висновки.
Статистично репрезентативна Генеральна
вибірка, побудована на допущенні, що кожен сукупність: про
член генеральної сукупності має однакову кого потрібні
висновки
ймовірність потрапити у вибірку.
Риторичне питання: якщо бренд-менеджер
База для
провів опитування серед своїх друзів, чи має
вибірки:
воно шанс на національну репрезентативність? яким
%% Дослідження поширюються на певну чином їх
генеральну сукупність, без знання якої досягти?
неможливо створити репрезентативну вибірку.
Для вибору людей для опитування береться Вибірка
певна база – поштові адреси, телефони, е-мейли
– тощо. Не кожна база підходить до кожної
генеральної сукупності.
5. То скільки?
Якщо ваша аудиторія більша за 5000, і члени ведуть себе самостійно,
відсутня проблема досяжності - обирайте похибку або на яку надійність
претендує бюджет:
Обсяг вибірки Похибка 11.0%
30 18,3% 10.0%
100 10,0% 9.0%
275 6,0% 8.0%
400 5,0% 7.0%
620 4,0% 6.0%
800 3,5% 5.0%
1200 2,9% 4.0%
1800 2,4% 3.0%
2400 2,0% 2.0%
4200 1,5% 1.0%
10000 1,0% 0.0%
100
800
1400
2000
2600
3200
3800
4400
5000
5600
6200
6800
7400
8000
8600
9200
9800
10400
11000
11600
12200
12800
13400
40000 0,5%
Наведені цифри – за використання формули простої стохастичної вибірки. Є інші і
доцільніші, але ця – найбільш поширена на ринку.
Результати будь-якого дослідження за теорією ймовірності можуть бути хибними.
Така природа довірчого інтервалу, за негласною домовленістю зазвичай це 95%
6. Втім
• Репрезентативна вибірка передбачає наявність знання про структуру
генеральної сукупності і бази вибірки.
• Варто розуміти, який параметр має репрезентувати вибірка. Відповідність
вибіркових даних за параметрами стать , вік та тип населеного пункту не
гарантує наявності у вибірці прихильників всіх сегментів ринку або електорату
всіх і кожної сили.
– Приклад 1: в якісному опитуванні з вибіркою в 20 людей (2 фокус-групи)
аналітик виявив загальний аспект мотивації, який підтверджується роками
для всієї генеральної сукупності, і навіть в інших країнах.
– Приклад 2: для досягнення аудиторії киян з рівнем доходу вище
середнього використали послуги однієї з репрезентативних інтернет
панелей (за параметрами стать та вік) з обсягом потрібної підвибірки в
12000 респондентів. Отримані дані навіть наближено не відповідали
реаліям ринку. Зокрема, по наданим даним понад 2/3 киян робили
покупки одягу суто в одному торгівельно-розважальному центрі, який
знаходиться не в центрі міста, в якому (по результатах багатьох інших
досліджень) бували принаймні раз 1/5 цільової аудиторії.
7. Одної кількості людей мало
How Deep Does Rabbit Hole Go?
• Окрім випадкової вибірки є інші, зі своїми формулами і
цифрами, стратифікаційна, кластерна , квотна тощо.
• Структура населення України складно придатна для використання
простої стохастичної вибірки, застосовується багаторівнева вибірка. На
кожному “рівні” своя похибка, варто зважати на дизайн ефект.
• Якщо треба знати не просто %% розподіл, а взаємозв'язок факторів –
вибірка має задовольняти вимоги нормального розподілу та
достатньої дисперсії, це вже інші розрахунки.
• Анкета без претесту може звести нанівець всі статистичні розрахунки.
8. Застереження
коли кількість немає значення
Данні не будуть репрезентативні за жодної кількості опитаних, якщо:
• База для вибірки не відповідає генеральній сукупності
– Якщо опитати 50 000 інтернет користувачів, за їхніми даними не можна
судити про населення України в цілому
– Опитування відвідувачів супермаркету не допоможе переманити
відвідувачів іншого супермаркету
• Некоректно сформована анкета
• Слабкий контроль безпосереднього збору даних
Не мають права на жодні претензії на репрезентативність:
– Телевізійні дозвони
– SMS-голосування
– Дзвінки на гарячі лінії
– Анкети в пресі
9. Дякую за увагу
victoria.zabuzova@gmail.com
За детальнішою та точнішою інформацією звертатися у
профільні підручники, або записатися на курс присвячений
вибірці авторства В.І.Паніотто
10. PS
• Доказати правоту перед начальством/Клієнтом
– Репрезентативність в даному випадку не має значення, оскільки Замовник переконаний
у певному показнику буде тиснути на дослідника і дані будуть викривлені. Тому - скільки
не шкода, прохання-мінімум: 1 фокус-група чи 285 анкет.
• Зрозуміти загальні настрої
– Краще використовувати не анкетування, а якісні чи етнометоди. Кількісне опитування
передбачає попередні знання про структуру, про мову респондентів, про фактори впливу
тощо.
• Точний % розподіл голосів
– Рекомендований мінімум - 1400 анкет. Насправді треба 1200 анкет, проте в ході
опитування завжди отримується частина порчених анкет (специфіка роботи з людьми, не
недолік поля), частина недозаповнених, десь респонденти просто відмовляються
відповідати. З особистого досвіду, в реаліях українських “полів” немає сенсу збирати
понад 4000 анкет зібраних “традиційними” методами.
• Знати структуру ринку
– Залежить від очікуваної кількості сегментів, якщо кожен сегмент буде розглядатися
окремо, тоді це окремі вибірки, і загальний обсяг вибірки буде сумою підвибірок по
кожному сегменту.