анализ данных тема 3
- 1. Т Е М А 3 . К О Р Р Е Л Я Ц И О Н Н Ы Й А Н А Л И З
КОЛИЧЕСТВЕННЫЕ МЕТОДЫ
АНАЛИЗА ДАННЫХ
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 2. ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА ПО
ТЕМЕ
• Статистика : учебник и практикум для СПО / Н. А.
Садовникова [и др.]; под ред. В. Г. Минашкина. —
М.: Издательство Юрайт, 2017. 448 с.
• Статистика: учебник для прикладного
бакалавриата/ под ред. И. И. Елисеевой. —
3-е изд., перераб. и доп. — М.: Издательство
Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 3. ПРИНЦИП ВЫЯВЛЕНИЯ ПРИЧИННО-
СЛЕДСТВЕННЫХ СВЯЗЕЙ
• Причинно-
следственные
отношения — это
связь явлений и
процессов, при
которой изменение
одного из них —
причины — ведет к
изменению другого
— следствия
Следовательно, при изучении
этих явлений необходимо
выявлять главные, основные
причины, абстрагируясь от
второстепенных
Социально-экономические
явления представляют собой
результат одновременного
воздействия большого числа
причин.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 4. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ
ВЗАИМОСВЯЗЕЙ
Третий этап. Интерпретация результатов
Связан с качественными особенностями изучаемого явления.
Второй этап. Построение модели связи
Базируется на методах статистики: группировках, средних величинах,
корреляционном и регрессионном методах анализа и т.д.
Этап 1. Качественный анализ
Основан на исследовании природы социального или экономического явления
методами экономической теории, социологии, конкретной экономики
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 5. ВЗАИМОСВЯЗЬ ФАКТОРНЫХ И
РЕЗУЛЬТАТИВНЫХ ПРИЗНАКОВ
Факторные
признаки
обусловливают
результативные
Результативными
называются
признаки,
изменяющиеся
под действием
факторных
признаков,
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 8. КЛАССИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ
ЯВЛЕНИЯМИ И ИХ ПРИЗНАКАМИ
Связи между явлениями и их признаками
классифицируются
По степени тесноты
оценивается с
помощью
коэффициентов
корреляции
По направлению
прямая
обратная
По аналитическому
выражению
линейная
нелинейная
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 9. КРИТЕРИИ ОЦЕНКИ ТЕСНОТЫ СВЯЗИ
Статистика : учебник и практикум для СПО / Н. А. Садовникова [и др.]; под
ред. В. Г. Минашкина. — М.: Издательство Юрайт, 2017. 448 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 10. ОЦЕНКА СВЯЗИ ПО НАПРАВЛЕНИЮ
Прямая связь
Один признак
увеличивается
Другой признак
тоже
увеличивается
Обратная связь
Один признак
увеличивается
Другой признак
уменьшается
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 11. ПО АНАЛИТИЧЕСКОМУ
ВЫРАЖЕНИЮ РАЗЛИЧАЮТ СВЯЗИ
прямолинейные (или
просто линейные)
• статистическая связь
между признаками
описывается
уравнением прямой
вида
нелинейные
• статистическая связь
между признаками
описывается любой
нелинейной
функцией, например
параболой
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 12. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ
ОПРЕДЕЛЕНИЯ ВЗАИМОСВЯЗЕЙ МЕЖДУ
ПРИЗНАКАМИ
• приведения параллельных
данных;
• графический;
• корреляционный;
• регрессионный.
Простое
сопоставл
ение 2 или
нескольки
х рядов
данных
Рассмотрим в
теме 4
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 15. ГРАФИЧЕСКИЙ МЕТОД
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 16. КОРРЕЛЯЦИОННЫЙ МЕТОД
• используют для количественного
определения тесноты и направления
связи между двумя признаками (при
парной связи) и между
результативным и множеством
факторных признаков (при
многофакторной связи)
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 17. ВИДЫ КОРРЕЛЯЦИИ
• связь между двумя признаками
(результативным и факторным, или двумя
факторными)
парная
• зависимость между результативным и одним
факторным признаком при фиксированном
значении других факторных признаков
частная
• зависимость результативного и двух или более
факторных признаков, включенных в
исследование
множественная
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 19. ТЕСНОТА СВЯЗИ
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 20. ПРИМЕР. ИСХОДНЫЕ ДАННЫЕ
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 21. ПРИМЕР. ГРАФИЧЕСКИЙ МЕТОД.
ПОЛЕ КОРРЕЛЯЦИИ
Статистика: учебник для прикладного бакалавриата/ под ред. И. И. Елисеевой. — 3-е изд.,
перераб. и доп. — М.: Издательство Юрайт, 2017. — 361 с.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 26. ПРОВЕРКА ЗНАЧИМОСТИ ПАРНОГО И ЧАСТНОГО
КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ
Здесь
r — коэффициент корреляции;
l — число фиксируемых факторов (для парного
коэффициента корреляции l = 0)
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 30. ВЫЯВЛЕНИЕ И АНАЛИЗ ЛОЖНОЙ
КОРРЕЛЯЦИИ МЕЖДУ ПРИЗНАКАМИ
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 31. ПРИМЕР ЛОЖНОЙ КОРРЕЛЯЦИИ
Источник: Анализ данных: учебник для академического бакалавриата / под ред. В. С. Мхитаряна. — М.:
Издательство Юрайт, 2016. — 490 с. — Серия : Бакалавр. Академический курс. Глава 1.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 32. ПРИМЕР ЛОЖНОЙ КОРРЕЛЯЦИИ
(ПРОДОЛЖЕНИЕ)
Источник: Анализ данных: учебник для академического бакалавриата / под ред. В. С. Мхитаряна. — М.:
Издательство Юрайт, 2016. — 490 с. — Серия : Бакалавр. Академический курс. Глава 1.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 34. ИССЛЕДОВАНИЕ НЕЛИНЕЙНЫХ
ВЗАИМОСВЯЗЕЙ
При отклонении исследуемых зависимостей от линейного вида коэффициент
корреляции теряет свой смысл как характеристика степени тесноты
связи.
Источник: Анализ данных: учебник для академического бакалавриата / под ред. В. С. Мхитаряна. — М.:
Издательство Юрайт, 2016. — 490 с. — Серия : Бакалавр. Академический курс. Глава 1.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 36. КОРРЕЛЯЦИОННЫЙ А НА ЛИЗ ВЗА ИМОСВЯЗИ
КА ЧЕСТВЕННЫХ ПРИЗНА КОВ
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 37. КОЭФФИЦИЕНТ РАНГОВОЙ
КОРРЕЛЯЦИИ СПИРМЕНА
Коэффициент ранговой корреляции Спирмена
используется для выявления и оценки тесноты связи
между двумя рядами
сопоставляемых количественных показателей.
В том случае, если ранги показателей,
упорядоченных по степени возрастания или
убывания, в большинстве случаев совпадают
(большему значению одного показателя
соответствует большее значение другого показателя -
например, при сопоставлении роста пациента и его
массы тела), делается вывод о
наличии прямой корреляционной связи.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 38. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
СПИРМЕНА ОБЛАДАЕТ
СЛЕДУЮЩИМИ СВОЙСТВАМИ
Коэффициент корреляции может принимать значения от
минус единицы до единицы,
Если коэффициент корреляции отрицательный, то имеет
место обратная связь, если положительный, то – прямая
связь.
Если коэффициент корреляции равен нулю, то связь между
величинами практически отсутствует.
Чем ближе модуль коэффициента корреляции к единице,
тем более сильной является связь между измеряемыми
величинами.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 39. КАК РАССЧИТАТЬ КОЭФФИЦИЕНТ
СПИРМЕНА ДЛЯ ОПРЕДЕЛЕНИЯ
КОРРЕЛИРУЕМОСТИ ОЦЕНОК ЭКСПЕРТОВ
Берутся оценки разных объектов двумя
экспертами
•Желательно, чтобы это были ранговые оценки
Определяются разности рангов каждой пары
сопоставляемых значений (D)
Возводится в квадрат каждая разность
и суммируется полученный результат
Вычислить коэффициент корреляции рангов по
формуле на следующем слайде
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 41. ПРИМЕР 1. КОЭФФИЦИЕНТ
РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
Объекты Эксперт 1 Эксперт 2
D^2
Коэффицие
нт
Спирмена
А 1 2 1 0,3
Б 2 4 4
В 3 1 4
Г 4 5 1
Д 5 3 4
n 5
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 42. ПРИМЕР 2. КОЭФФИЦИЕНТ
РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
Объекты Эксперт 1 Эксперт 2
D^2
А 5 1 16 -0,3
Б 2 4 4
В 3 2 1
Г 4 5 1
Д 1 3 4
n 5
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 43. ОГРАНИЧЕНИЯ ПРИМЕНЕНИЯ
КОЭФФИЦИЕНТА СПИРМЕНА
1) по каждой переменной должно быть
представлено не менее 5 наблюдений;
2) коэффициент ранговой корреляции Спирмена при
большом количестве одинаковых рангов по одной или
обеим сопоставляемым переменным дает огрубленные
значения. В идеале оба коррелируемых ряда должны
представлять собой две последовательности
несовпадающих значений.
© Е. Колчинская, 2017, ekolch.ucoz.ru
- 44. КОЭФФИЦИЕНТ КОНКОРДАЦИИ
КЕНДАЛЛА
где
m - число экспертов в группе,
n - число объектов,
S - сумма квадратов разностей рангов (отклонений от среднего).
Если W < 0.2 - 0.4, значит слабая согласованность экспертов, если W
> 0.6 - 0.8 - сильная
Эксп. 1 Эксп. 2 Эксп 3 ∑ ∑² S W
1 2 3 6 36
2 4 1 7 49
3 1 5 9 81
4 5 2 11 121
5 3 4 12 144
45 431 26 0,29
2025
© Е. Колчинская, 2017, ekolch.ucoz.ru