Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
КІЛЬКІСНИЙ АНАЛІЗ ДАНИХ
ОДНОВИМІРНИЙ
• 1 змінна
• Вік, стать, статус тестування
ДВОВИМІРНИЙ
• 2 змінні
• Стать та статус т...
Upcoming SlideShare
Loading in …5
×

Резюме методів аналізу кількісних даних

2,333 views

Published on

Логіка одномірного, двомірного та багатомірного аналізу, а також відповідні методи аналізу

Published in: Data & Analytics
  • Be the first to comment

Резюме методів аналізу кількісних даних

  1. 1. КІЛЬКІСНИЙ АНАЛІЗ ДАНИХ ОДНОВИМІРНИЙ • 1 змінна • Вік, стать, статус тестування ДВОВИМІРНИЙ • 2 змінні • Стать та статус тестування БАГАТОВИМІРНИЙ • >2 змінних • Вік, стать та статус тестування  Інтервальна  шкала?   •  Перевірка   нормального   розподілу   •  гістограма   •  QQ-­‐графік   •  Якщо  розподіл   близький  до   нормального:   •  Середнє   значення   •  Стандартне   відхилення     Порядкова  шкала?   Чи  інтервальна  без   нормального   розподілу?   •  Медіана   •  Міжквартильна   відстань   •  Відсотки  (якщо   шкала  Лайкерта  –  5   категорій)     Номінальна  шкала?   •  Відсотки   +  Робота  з   пропущеними   значеннями   +  Трансформація  /   перекодування   змінних     ІНТЕРПРЕТАЦІЯ:   •  опис  обраних   змінних  для   аналізу  у  термінах   категорій  відповіді   •  розуміння,  що  є   пропущеними   значеннями,  які   фільтри  можуть   знадобитися,  як   треба   трансформувати/ перекодувати   змінні  для   подальшого   аналізу     Шукаємо  рівень  зв’язку  між  двома   змінними  з  інтервальною  чи  порядковою   шкалою?   •  Перевірка  лінійності  зв’язку   •  точковий  графік   •  Якщо  лінійний:  Кореляції   •  Кореляція  Пірсона,  якщо  2  змінні  з   інтервальною  шкалою   •  Кореляція  Спірмена  якщо  2  змінні  з   порядковою  шкалою  або  порядкова +інтервальна  шкала   •  Якщо  нелінійний:  регресійний  коефіцієнт     Шукаємо  відмінності  у  середніх  значеннях/ медіанах?  Порівнюємо  значення   інтервальної/порядкової  змінної  по   категоріях  номінальної  змінної.   -­‐  Якщо  2  групи  порівняння:   •  Змінна,  що  порівнюється,  з  інтервальною   шкалою  та  нормальним  розподілом?   •  Independent  samples  t-­‐test  (Т-­‐тест  для   незалежних  груп)   •  Paired  samples  t-­‐test  (Т-­‐тест  для   залежних  груп)   •  Змінна,  що  порівнюється,  з  порядковою     шкалою  чи  ненормальним  розподілом?   •  Mann-­‐Whitney  U-­‐Test  (U-­‐тест  Манна-­‐ Уітні)  для  незалежних  груп   •  Wilcoxon  test  (Тест  Уілкоксона)  для   залежних  груп     -­‐  Якщо  3  чи  більше  груп  порівняння:   •  Змінна,  що  порівнюється,  з  інтервальною   шкалою  та  нормальним  розподілом?   •  One-­‐way  ANOVA  (однофакторний   дисперсійний  аналіз)  для  незалежних   груп   •  Repeated-­‐measures  ANOVA   (дисперсійний  аналіз  для  повторних   вимірів)  для  залежних  груп   •  Змінна,  що  порівнюється,  з  порядковою     шкалою  чи  ненормальним  розподілом?   •  Kruskal-­‐Wallis  test  (Тест  Краскела-­‐ Уолліса)  для  незалежних  груп   •  Friedman  test  (Тест  Фрідмана)  для   залежних  груп     Шукаємо  відмінності  у  відсотках?   Порівнюємо  змінні  з  номінальною  шкалою.   •  Якщо  2  незалежні  групи   •  Chi-­‐square  test    (тест  Хі-­‐квадрат)  для   великих  вибірок   •  Fisher's  test    (тест  Фішера)  для   маленьких  вибірок   •  Якщо  2  залежні  групи     •  McNemar's  test  (тест  МакНемара)   •  Якщо  3  та  більше  незалежних  груп   •  Chi-­‐square  test  (тест  Хі-­‐квадрат)   •   Якщо  3  та  більше  залежних  груп   •  Cochrane  Q  test  (Q  тест  Кохрена)     Шукаємо  відмінності  у  часі  до  події   (інтервальна  змінна)  серед  2х  чи  більше   груп  (номінальна  шкала)?     •  Log-­‐rank  test  (Тест  Логранка)   •  Криві  Каплана-­‐Мейера     ІНТЕРПРЕТАЦІЯ:   •  Наявність/відсутність  відмінностей  / зв’язку  (H0=відсутність)   •  Які  змінні  включати  у  подальший  аналіз   Аналіз  залежностей?  Є   залежна  та  незалежна(і)   змінна(і)   •  Що  є  залежною  змінною?   •  Дихотомічна   номінальна  шкала    -­‐>   логістична  регресія   •  Номінальна  шкала,  3  чи   більше  категорій   відповіді  -­‐>   мультиномінальна   регресія   •  Порядкова  шкала  -­‐>     порядкова  регресія   •  Інтервальна  шкала  та   нормальний  розподіл         -­‐>  лінійна  регресія   •  Інтервальна  шкала  та   розподіл  Пуассона  -­‐>   регресія  Пуассона  або   негативна   біномінальна  регресія   •  Інтервальна  шкала,  час   до  події  -­‐>  регресія   Кокса   •  Інтервальна  шкала,   часовий  ряд  (t>30)  -­‐>   лінійна  регресія  для   часових  рядів,  ARIMA     Аналіз  взаємозалежностей?     -­‐  Якщо  треба  побудувати   латентну  змінну   •  PCA  (Метод  головних   компонент)  –  нема  гіпотез   про  латентні  змінні   •  Конфірматорний   факторний  аналіз  –  є   гіпотези  про  латентні   змінні   -­‐  Якщо  змінні  є  одночасно   залежними  та   незалежними,  ланцюжки   причинності   •  SEM  (моделювання   структурними  рівняннями)       ІНТЕРПРЕТАЦІЯ:   •  Наявність/відсутність   зв’язків  (H0=відсутність),  їх   міра  та  напрям   •  Конфаундінг  та  інтеракції   •  Прогнозування  за  різних   сценаріїв   •  Якість  моделей                        

×