анализ данных тема 4
- 1. Т Е М А 4 . Р Е Г Р Е С С И О Н Н Ы Й А Н А Л И З
КОЛИЧЕСТВЕННЫЕ МЕТОДЫ
АНАЛИЗА ДАННЫХ
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 4. УРАВНЕНИЕ РЕГРЕССИИ
Функция f(x1, х2,…, хk)
описывающая зависимость
условного среднего значения
результативного признака у от
заданных значений аргументов
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 5. УСЛОВИЯ, В КОТОРЫХ МОЖЕТ
ПРИМЕНЯТЬСЯ МЕТОД ПКРА
Изучается взаимодействие всего двух
признаков
Можно точно указать, какой из признаков
является причиной возникновения другого, а
какой — результатом
Зависимость между признаками
стохастическая
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 6. ЭТАПЫ ПОСТРОЕНИЯ
РЕГРЕССИОННОЙ МОДЕЛИ
6. проверка качества построенной модели.
5. определение показателей эластичности;
4. определение параметров модели и оценка
тесноты связи;
3. выбор формы связи между результатом и
отобранными факторами;
2. оценка однородности исходных данных;
1. определение цели исследования;
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 7. ЭТАП 2. ОЦЕНКА ОДНОРОДНОСТИ
ИСХОДНЫХ ДАННЫХ
Признаки
однородности:
•коэффициент
вариации не превышает
60—80%,
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 8. ЭТАП 3. ВЫБОР ФОРМЫ СВЯЗИ
МЕЖДУ РЕЗУЛЬТАТОМ И
ОТОБРАННЫМИ ФАКТОРАМИ
Выбор обычно
осуществляется:
Путём изучения теории
Путём изучения поля корреляции
Перебором возможных моделей
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 10. ЭТАП 4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ
МОДЕЛИ - ПРОДОЛЖЕНИЕ
• Для линейной регрессии вида y = a + bx
• МНК будет выглядеть следующим образом:
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 13. ЭТАП 5. ОПРЕДЕЛЕНИЕ
ПОКАЗАТЕЛЕЙ ЭЛАСТИЧНОСТИ
• Может быть удобно, если единицы измерения
исследуемых показателей различаются
• Он показывает, на сколько процентов изменяется
значение у при изменении х на 1% от своего
среднего значения
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 14. ЭТАП 6. ПРОВЕРКА КАЧЕСТВА ПОСТРОЕННОЙ
МОДЕЛИ - ОТНОСИТЕЛЬНАЯ ОШИБКА
АППРОКСИМАЦИИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
ошибка аппроксимации в пределах 6 — 10%
свидетельствует о хорошем соответствии
модели исходным данным.
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 15. ЭТАП 6. ПРОВЕРКА КАЧЕСТВА ПОСТРОЕННОЙ
МОДЕЛИ - КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Остаточная
колеблемость
Общая
колеблемость
Колеблемость,
объясненная
уравнением
регрессии
- 16. ЭТАП 6. ПРОВЕРКА КАЧЕСТВА ПОСТРОЕННОЙ
МОДЕЛИ - ТЕОРЕТИЧЕСКОЕ КОРРЕЛЯЦИОННОЕ
ОТНОШЕНИЕ
Корень квадратный из
коэффициента детерминации
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 17. ПРИМЕР. ИСХОДНЫЕ ДАННЫЕ
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 18. ЭТАП 2. ОЦЕНКА ОДНОРОДНОСТИ
ИСХОДНЫХ ДАННЫХ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Коэффициент вариации:
Опечатка х ср. равно 81
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 19. ЭТАП 3. ВЫБОР ФОРМЫ СВЯЗИ
МЕЖДУ РЕЗУЛЬТАТОМ И
ОТОБРАННЫМИ ФАКТОРАМИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 20. ЭТАП 4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ
МОДЕЛИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 21. ЭТАП 4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ
МОДЕЛИ
• Уравнение регрессии имеет вид:
• Параметр а никакого содержательного смысла
не имеет.
• Параметр b (коэффициент регрессии)
показывает, что в среднем с ростом
накопленных за семестр баллов на одну
единицу оценка растет на 0,069 балла.
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 22. ЭТАП 5. ОПРЕДЕЛЕНИЕ
ПОКАЗАТЕЛЕЙ ЭЛАСТИЧНОСТИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Это означает, что при увеличении накопленных за
семестр баллов на 1% оценка за экзамен увеличивается
примерно па 15%
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 23. ЭТАП 6. ПРОВЕРКА КАЧЕСТВА ПОСТРОЕННОЙ
МОДЕЛИ - ОТНОСИТЕЛЬНАЯ ОШИБКА
АППРОКСИМАЦИИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 24. ЭТАП 6. ПРОВЕРКА КАЧЕСТВА ПОСТРОЕННОЙ
МОДЕЛИ - КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
- 25. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ,
ПОЛУЧЕННЫХ В EXCEL
© Е. Колчинская, 2017, ekolch.ucoz.ru
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,924241431
R-квадрат 0,854222222
Нормированный R-квадрат 0,829925926
Стандартная ошибка 0,426874949
Наблюдения 8
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 6,406666667 6,406666667 35,15853659 0,001026187
Остаток 6 1,093333333 0,182222222
Итого 7 7,5
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -1,83 0,953088547 -1,920073435 0,103255615 -4,16212366 0,50212366 -4,16212366 0,50212366
Переменная X 1 0,068888889 0,011618065 5,929463431 0,001026187 0,040460509 0,097317269 0,040460509 0,097317269
- 26. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ,
ПОЛУЧЕННЫХ В EXCEL
© Е. Колчинская, 2017, ekolch.ucoz.ru
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,924241431
R-квадрат 0,854222222
Нормированный R-квадрат 0,829925926
Стандартная ошибка 0,426874949
Наблюдения 8
Дисперсионный анализ
Коэффициент корреляции
Коэффициент детерминации
Имеют смысл при
множественной регрессии
- 27. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ,
ПОЛУЧЕННЫХ В EXCEL
© Е. Колчинская, 2017, ekolch.ucoz.ru
Общая
колеблемость
Колеблемость,
объясненная
уравнением
регрессии
F-статистика
На каком
уровне значима
F-статистика