2. Мультиколлинеарность 1 1 . Объяснить сущность проблемы мультиколлинеарности 2. Изучить последствия мультиколлинеарности 3. Указать средства обнаружения мультиколлинеарности 4. Обсудить проблему выбора средств борьбы с мультиколлинеарностью Цель лекции
3. Смысл мультиколлинеарности 1 Слово “коллинеарность” описывает линейную связь между двумя независимыми переменными, тогда как “мультиколлинеарность” – между более, чем двумя переменными. На практике всегда используется один термин. Коллинеарность и мультиколлинеарность Термин «мультиколлинеарность» введен Рагнаром Фришем
4. Виды мультиколлинеарности 1 1 . Строгая ( perfect) мультиколлинеарность - наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой) 2. Нестрогая ( imperfect) мультиколлинеарность - наличие сильной линейной корреляционной связи между независимыми переменными (иногда также и зависимой) Строгая и нестрогая мультиколлинеарность
5. Строгая мультиколлинеарность 1 Аналитическое выражение мультиколлинеарности (пример) Связь между объясняющими переменными функциональная
7. Сложность проблемы мультиколлинеарности 1 Проблема мультиколлинеарности 1. Корреляционные связи есть всегда. Проблема мультиколлинеарности - проблема силы проявления корреляционных связей. 2. Однозначных критериев мультиколлинеарности не существует 3. Строгая мультиколлинеарность нарушает одно из основных условий Гаусса-Маркова, и делает построение регрессии полностью невозможным . 4. Нестрогая мультиколлинеарность затрудняет работу, но не препятствует получению правильных выводов.
8. Причины мультиколлинеарности 1 1. Ошибочное включение в уравнение двух или более линейно зависимых переменных 2. Две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными. 3. В модель включается переменная, сильно коррелирующая с зависимой переменной (такая независимая переменная называется доминантной ) Когда возникает мультиколлинеарность
9. Мультиколлинеарность как результат логической ошибки 1 Z=P*S Z - сбор урожая P - урожайность S - площадь lnZ=lnP+lnS Ошибочное признание независимыми содержательно зависимых переменных Оценка уравнения невозможна!!!
10. Мультиколлинеарность из-за доминантной переменной 1 Доминантная переменная «забивает» влияние остальных Влияние остальных переменных становится незначимым
11. Неизбежность мультиколлинеарности 1 Мультиколлинеарность - нормальное явление 1. Практически любая модель содержит мультиколлинеарность 2. Мы не обращаем внимания на мультиколлинеарность до появления явных симптомов. 3. Только чрезмерно сильные связи становятся помехой
12. Механизм действия мультиколлинеарности 1 Мультиколлинеарность проявляется в совместном действии факторов 1. Построить модель - означает определить вклад каждого фактора 2. Если два или более факторов изменяются только совместно, их вклад по отдельности становится невозможно различить. 3. Чем более сильно коррелированы переменные, тем труднее различить их вклад
13. Зависимость мультиколлинеарности от выборки 1 Мультиколлинеарность - явление, проявляющееся на уровне выборки 1. В одной выборке мультиколлинеарность может быть сильной, в другой - слабой 2. Выборочные данные следует всесторонне предварительно исследовать. 3. Полезен расчет выборочных коэффициентов корреляции, ковариационной матрицы и ее определителя.
14. Зависимость мультиколлинеарности от смысла задачи 1 Мультиколлинеарность может быть выявлена при содержательном анализе задачи и данных Пример. Номинальная ( in ) и реальная ( ir ) величина процента ( inf - темп инфляции) При строгом контроле за ценами в некоторый период возникает строгая мультиколлинеарность
15. Истинная мультиколлинеарность 1 Мультиколлинеарность при отсутствии парных зависимостей Пример. Три ряда данных В данной выборке существует строгая зависимость но
16. Мультиколлинеарность: диагноз и прогноз 1 Последствия мультиколлинеарности 1. Оценки коэффициентов остаются несмещенными 2. Стандартные ошибки коэффициентов увеличиваются 3. Вычисленные t- статистики занижены. 4. Оценки становится очень чувствительными к изменению спецификации и изменению отдельных наблюдений. 5. Общее качество уравнения, а также оценки переменных, не связанных мультиколлинеарностью, остаются незатронутыми. 6. Чем ближе мультиколлинеарность к совершенной (строгой), тем серьезнее ее последствия.
17. Влияние мультиколлинеарности на стандартные ошибки 1 Увеличение стандартных ошибок коэффициентов Для уравнения с объясняющими переменными X 1 и X 2
18. «Неправильные» знаки коэффициентов 1 Увеличение стандартных ошибок коэффициентов Практически отсюда следует возможность получить незначимый коэффициент или «неправильный знак» Типичная ситуация. 1. оба коэффициента в теоретической модели положительны 2. оба парных коэффициента корреляции независимой и зависимой переменной положительны. 3. парный коэффициент корреляции между независимыми переменными положителен, причем корреляция между ними сильнее, чем каждой переменной с зависимой. В этой ситуации у одного из коэффициентов практически всегда “неправильный” знак.
19. Мультиколлинеарность: диагноз и прогноз 1 Обнаружение мультиколлинеарности 1. Высокий R 2 при всех незначимых коэффициентах. 2. Высокие парные коэффициенты корреляции 3. Высокие значения коэффициента VIF
20. Мультиколлинеарность: лечение 1 Средства от мультиколлинеарности 1. Изменить или увеличить выборку 2. Исключить одну из переменных 3. Преобразовать мультиколлинеарные переменные - использовать нелинейные формы - использовать агрегаты (линейные комбинации нескольких переменных - использовать первые разности вместо самих переменных 4. Ничего не делать! Самое главное - выбрать правильное средство.