Мониторинг и прогнозирование распространения эпидений: анализ соцмедиа vs/& анализ поисковых запросов Google Flu. Результаты исследования сентябрь-октябрь 2013г.
Портрет активных авторов социальной сети Одноклассники, апрель 2014
Социальные сети как инструмент прогнозирования
1. СОЦИАЛЬНЫЕ СЕТИ КАК
ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ
Мониторинг и прогнозирование
распространения эпидемий
Brand Analytics
(с) 2014
2. Google Flu - известный пример эффективности «больших данных»:
сервис замечает эпидемии гриппа быстрее медиков, анализируя
статистику запросов в поисковой системе Google.
Механизм действия Flu прост: заболевшие, или кто боится заболеть,
ищут в поиске лекарства, описание симптомов и прочую информацию,
связанную с гриппом. Во время эпидемий число запросов возрастает.
Мы решили проверить, можно ли сделать аналогичные выводы на
основе анализа постов в социальных сетях. Фиксируя жалобы
пользователей соцсетей на различные простудные симптомы, мы
отслеживали масштабы и распространение заболевания в разных
регионах России.
Исследование позволило сравнить данные с данными Google Flu:
• Повысить точность и оперативность определения эпидемий,
• Расширить информацию возрастом заболевших,
• Выявить основные симптомы заболевания.
СОЦИАЛЬНЫЕ СЕТИ КАК ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ
3. Исследовались публичные сообщения российских авторов социальных сетей ВКонтакте, Твиттер,
Одноклассники, Мой Мир, Facebook, LiveLournal и пр.
Индикаторами простудных заболеваний выступали сообщения с жалобами на симптомы ОРВИ и гриппа:
«кашляю», «заболело горло», «поднялась температура», «тело ломит» и пр.
Период исследования: 01.09.2013 – 31.10.2013
Всего за период зафиксировано более 220 тысяч таких сообщений от 165 тысяч авторов.
ДИНАМИКА РАЗВИТИЯ ЭПИДЕМИИ
Во время "обычного" периода: 2.500 – 3.000 сообщений в день
Резкое увеличение: с 7 по 22 сентября
Максимум: 12 сентября – 7.844 сообщений
4. СРАВНЕНИЕ С РЕЗУЛЬТАТАМИ GOOGLE FLU
Результаты нашего исследования совпадают с данными Google Flu по России: период максимального
количества запросов приходится на 8 - 22 сентября.
Данные соцмедиа являются более оперативными - обратите внимание на корреляцию между
жалобами на самочувствие в соцсетях и поисковыми запросами:
• 12 сентября фиксируется пик сообщений в соцмедиа о болезненных симптомах,
• 15 сентября (3 дня спустя) измученные гриппующие ищут через Google способы лечения.
5. Интересно проанализировать особенности
распространения заболеваний на карте России.
Мы исследовали периоды сентябрьского роста
заболеваний в разных городах нашей страны и
пришли к двум основным выводам:
Пик заболеваний наблюдался во всех
городах, но разной силы;
Везде период заболеваний совпадает по
времени.
На графиках представлены данные по Москве,
Санкт-Петербургу и Новосибирску:
Пики заболеваний во всех городах
приходится на 2-3 неделю сентября;
В Санкт-Петербурге увеличение заболеваний
является не таким резким и значительным,
как в других городах.
ГЕОГРАФИЯ
6. Так же существенно увеличилось число
жалоб от пользователей старше 45 лет – на
38%
При этом, число пользователей от 25 до 44
лет, высказывающихся о симптомах
изменилось незначительно: рост составил от
2 до 14%
ВОЗРАСТ
В период роста заболеваемости, количество упоминаний о симптомах простуды и гриппа выросло в
основном за счет сообщений от пользователей младше 18 лет. Прирост количества сообщений от этой
возрастной группы составил 110%
7. САМЫЕ РАСПРОСТРАНЕННЫЕ ЖАЛОБЫ
В исследуемый период сезонных заболеваний пользователи
соцмедиа часто жаловались на следующие симптомы:
• Болит горло – 16,65% от общего количества сообщений
• Повышенная температура – 8,52%
• Головная боль – 2,43%
• Кашель – 2,38%
• Ломит тело – 1,55%
• Знобит – 1,14%
1167
1587
2426
2484
8704
17006
0 2000 4000 6000 8000 10000 12000 14000 16000 18000
Знобит
Ломит тело
Кашель
Головная боль
Жар и температура
Болит горло
8. ПРИМЕНЕНИЕ МОНИТОРИНГА СОЦМЕДИА В МЕДИЦИНЕ
Раннее обнаружение эпидемий позволит:
• Снизить заболеваемость населения и повысить «здоровье нации»;
• Уменьшить скорость и ограничить распространение болезни;
• Сократить время и обеспечить своевременную доставку медикаментов;
• Значительно сократить расходы государства и компаний на лечение людей.
Благодаря технологиям мониторинга и анализа социальных медиа мы можем в реальном
времени видеть масштаб и распространение эпидемий и своевременно принимать
эффективные меры по борьбе с болезнями.