1. ТЕМА: ВСТУП ДО СТАТИСТИЧНОГО АНАЛІЗУ
1. Поняття прикладної статистики
2. Задачі, які розв’язують методами прикладної статистики
3. Планування збору даних (планування експерименту)
4. Попередня обробка і дослідження даних – другий етап
статистичного аналізу даних
2. 1. Поняття прикладної статистики
Прикладна статистика – це наука збору, обробки даних і аналізу отриманих
результатів з метою прийняття коректних обґрунтованих рішень економічного,
технічного, політичного, персонального або іншого характеру.
3. 2. Задачі, які розв’язують методами прикладної статистики
1. Аналіз стану ринку і прийняття рішення стосовно номенклатури та об’єму випуску
продукції виробничого підприємства.
2. Аналіз, прогнозування і управління соціально-економічними процесами і системами
(регіональний, галузевий та державний рівні).
3. Управління якістю продукції на виробництві.
4. Управління якістю навчання на всіх рівнях підготовки персоналу.
5. Автоматичне керування технологічними процесами і технічними системами побудова
адекватних моделей, застосування методів статистичного керування, прогнозування
розвитку процесів і аналіз якості керування за допомогою множини відповідних
статистичних параметрів.
6. Прогнозування і планування розвитку процесів різної природи на всіх рівнях ієрархії
прийняття управлінських рішень.
4. 2. Задачі, які розв’язують методами прикладної статистики
7. Статистична підтримка прийняття експертних рішень з використанням експертних систем.
8. Керування фізичними експериментами, аналіз даних і поглиблене дослідження отриманих
результатів.
9. Виконання соціальних досліджень.
10. Підтримка прийняття особистих рішень та рішень стосовно ведення домашнього господарства.
11. Контроль стану навколишнього середовища з використанням двох типів моделей – на основі
диференціальних рівнянь в частинних похідних і рівнянь авторегресії (АР), авторегресії з ковзним
середнім (АРКС), множинної регресії.
12. Аналіз даних і прийняття рішень в генетиці, біології (біостатистика), психології (наприклад,
сучасний Journal of Experimental Psychology в США).
5. Чотири етапи статистичного аналізу даних
1. Планування експерименту і збір даних. Результат – корисні інформативні та повні
дані стосовно функціонування (протікання) процесу.
2. Попередня обробка та дослідження даних, формулювання гіпотез стосовно типів
розподілів, значущості оцінок, якості (адекватності) моделей, настання можливих
ситуацій і т. ін.
3. Оцінювання параметрів математичних і статистичних моделей. Результат –
адекватні процесу математичні і статистичні моделі, що підтверджується
відповідними статистичними параметрами якості.
4. Перевірка раніше сформульованих гіпотез, прийняття рішень стосовно управління
процесами.
6. • Математичні моделі, які ми будемо розглядати, це моделі у вигляді
рівнянь різних типів: диференціальних, різницевих, алгебраїчних.
• Статистичні моделі – це моделі у формі розподілів ймовірностей
випадкових величин.
• Статистичні дані у формі вимірів, прив’язаних до конкретних моментів
часу, тобто часових рядів розглядаються у прикладній статистиці як випадкові
процеси з детермінованими складовими.
7. 3. Планування збору даних (планування
експерименту)
У процесі планування вибіркового дослідження розв’язують задачі, які можна
розділити на групи
Група 1: Визначення цілей дослідження та їх представлення у конкретному вигляді
Група 2: Створення загального плану дослідження
Група 3: Планування характеру вибірки
Група 4: Безпосередній збір даних
Процес узагальнення результатів дослідження на всю генеральну сукупність називають
статистичним висновком або рішенням.
8. 4. Попередня обробка і дослідження даних
1. Візуальне дослідження даних
За допомогою візуального аналізу можна наближено оцінити тип
розподілу за гістограмою та описовими статистичними параметрами
(ексцес, асиметрія (куртозис), статистика Жак-Бера, статистика
Колмогорова-Смірнова та інші); а також методами, які ґрунтуються на
використанні функцій-ядер.
9. Коефіцієнт асиметрії (коефіцієнт скісності або skewness) – характеризує симетричність (хвостів)
розподілу і розраховується за виразом
Якщо S>0, то правий хвіст розподілу довший, а при S<0 довшим є лівий хвіст розподілу; якщо S=0, то
розподіл симетричний.
10.
11.
12.
13. 4. Попередня обробка і дослідження даних
2. Заповнення пропусків даних, якщо вони є
3. Обробка екстремальних значень
4. Нормування даних
Стандартизація (нормування) даних є необхідним початковим
етапом перетворення даних при використанні багатьох
багатовимірних статистичних методів - зниження розмірності
простору ознак (факторний, компонентний аналіз), класифікації
об'єктів (кластерний аналіз) і ін. , особливо якщо змінні виміряні в
шкалах, істотно розрізняються в величинах (мікрони одиниць -
мільярди одиниць).
6. Кореляційний аналіз
7. Попереднє визначення структури математичних моделей