Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Dmitriev Социология больших данных

465 views

Published on

Социология больших данных
Big Data
Грушинская конференция, 2015

Published in: Data & Analytics
  • Be the first to comment

Dmitriev Социология больших данных

  1. 1. © 2015 IBM Corporation1 Big Data Грушинская конференция, 2015 Социология больших данных Гаяне Арутюнян, Александр Дмитриев
  2. 2. © 2015 IBM Corporation2 Проблематика
  3. 3. © 2015 IBM Corporation3 Проблематика Письмо, полученное в результате регистрации на конференцию...
  4. 4. © 2015 IBM Corporation4 Проблематика Темы, возможно интересные социологам:  маркетинг (формирование предложений на основе учета вкусов, предпочтений и персональной истории клиента/групп клиентов  финансовый сектор (отслеживание кредитной истории, обоснование выделений финансовых ресурсов, борьба с мошенничеством)  социальный сектор (отслеживание предпочтений тех или иных групп населения, отслеживание формирования новых социальных образований, возможность влияния на эти группы) Кадровые агенства Крупные торговые и промышленные предприятия Политические персоналии и группы Международные холдинги Образовательные учреждения Законодательные органы и ведомства Силовые ведомства Потенциальные клиенты
  5. 5. © 2015 IBM Corporation5 Сложности работы с «Большими Данными» Для этих направлений остаются открытыми классические вопросы социолога: • Выборка? - как убедиться, что полученные данные представляют именно нужную группу населения? Как определить количественно, сколько респондентов достаточно для выборки? • Каналы доступа? - как достичь именно нужной группы? Как и какие информационные каналы связи использовать для доступа к нужной группе? • Помехи? - Как отсеять «ненужных» респондентов? • Идентификация респондента? – как убедиться, что респондент, отметившийся как мужчина 38 лет – не мальчик 13? • ДОСТУП К РЕАЛЬНЫМ ДАННЫМ ‘…One of the reasons why risk analysis was not frequently applied in the past is that computers were not powerful enough to handle the demanding needs of Monte Carlo simulation…’ IMB White Paper
  6. 6. © 2015 IBM Corporation Тип анализа Методология обработки Частотность данных Тип данных Формат контента Источники данных Потребител и данных Оборудование Реальное время Обработка массивов Предсказательный анализ Аналитика Отчеты Прочие Сетевой анализ соцданных Анализ по локациям Распознавание образов Текстовая аналитика Статистические алгоритмы Речевая аналитика По мере поступления Постоянный поток В реальном времени Сериями Метаданные Мастер-данные Исторические данные Транзакционные данные Структурированный Образы Неструктурированный Тексты Частично структурированный Видео Документы Аудио Веб и социальные медиа Данные от оборудования Данные от людей От внутренних источников От внешних источников Транзакционные Биометрические Люди Бизнес- процессы Другие приложения Другие хранилища Стандартное Уникальное Пример классификации данных
  7. 7. © 2015 IBM Corporation7 Возможные пути решений Возможные пути решений (общие подходы): • специальные исследования по использованию информационных каналов различными группами населения (подростки – мобильные телефоны, игры, чаты и пр., женщины среднего возраста – сайты для заказов продуктов и товаров, и т.д.) и использование этих данных при исследованиях • комбинирование методов доступа до аудитории: веб, мобильные гаджеты, «традиционные» каналы (включая фокус-интервью, экспертный опрос), и т.д. • построение единой базы данных с поисковыми механизмами для социологов, где накапливался бы опыт и результаты исследований в виде, позволяющем использовать их для последующих работ.
  8. 8. © 2015 IBM Corporation8 Возможные пути решений Валидность/верификация полученных данных? Возможные пути решений - специальная «ступенчатая» методика проведения исследований: • получение доступа к данным, • получение «пилотных» данных, • обработка для формирования рабочих гипотез, • их проверка и уточнение с применением «традиционных» методов, • уточнение модели, • запуск полноценного проекта (при котором периодически модель и рабочие гипотезы, а равно и вновь обнаруженные, уточняются) • ...и так итерационно, т.к. по кругу.
  9. 9. © 2015 IBM Corporation9 Возможные пути решений Интерпретация полученных данных? Возможные пути решений: • контроль результатов «традиционными» методами (фокус-интервью, экспертные опросы, анкетирование и т.д.), • сотрудничество с ИТ-специалистами.
  10. 10. © 2015 IBM Corporation10 Возможные пути решений Также одним из направлений является создание специализированного раздела социологии, где целенаправленно бы изучались проблемы и возможности «компьютеризированной» социологии. При этом предполагается, что специалист- социолог также должен в определенной мере освоить и понимать тот или иной раздел ИТ-технологий, чтобы полноценно пользоваться предлагаемым инновационным инструментарием и понимать тонкости и «подводные камни» в своей работе. может ли дальтоник создавать полноценные web-сайты? ...есливыучит16-ричныегодыотображенияцветовойгаммынаэкранемонитора Ответ:
  11. 11. © 2015 IBM Corporation11 Примеры зарубежных исследований... Brown, Timothy A. (2006), Confirmatory Factor Analysis for Applied Research, New York, NY: Guilford Press. Cronbach, L. J. (1986), “Social Inquiry By and For Earthlings,” Metatheory in Social Science Pluralisms and Subjectivities, D.W. Fiske and R. A. Shweder, eds. Chicago: The University of Chicago Press, 83-109. Cronin, J.J.Jr. and Taylor, S.A. (1992), “Measuring service quality: a reexamination and extension,” Journal of Marketing, Vol. 56 No. 3, pp. 55-68. Cronin J.J.Jr., Brady, M.K. and Hult, T.M. (2000), “Assessing the effects of quality, value, customer satisfaction on consumer behavioral intentions in service environment,” Journal of Retailing, Vol. 76 No. 2. pp. 193-216. Dabholkar, P.A., Shepherd, C.D. and Thorpe, D.I. (2000), “A conceptual framework for service quality: an investigation of critical conceptual and measurement issues through a longitudinal study,” Journal of Retailing, Vol. 76 No. 2, pp. 139-173. Levitt, T. (1981), “Marketing Intangible Products and Product Intangibles,” Harvard Business Review, (May-June), 94-102. Lovelock, C. (2001), “A Retrospective Commentary on the Article ‘New Tools for Achieving Service Quality’,” Cornell Hotel And Restaurant Administration Quarterly, 42(4), 39-46. Olorunniwo, Festus, Maxwell K. Hsu, and Godwin Udo, (2006), “Service Quality, Customer Satisfaction, and Behavior Intentions in the Service Factory,” Journal of Services Marketing, 20(1), 59-72. Olorunniwo, Festus and Maxwell K. Hsu (2006), “A Typology Analysis of Service Quality, Customer Satisfaction and Customer Behavioral Intentions in Mass Services”, Managing Service Quality, 16(2), 106-123. Schmenner, R.W. (1986), “How can service businesses survive and prosper,” Sloan Management Review, Vol. 27 No. 3, pp. 21-32. Schmenner, R.W. (2004), “Service Businesses and Productivity,” Decision Sciences, Vol. 35 No.3, pp. 333-347. Maxwell K. Hsu, DBA Associate Professor of Marketing University of Wisconsin-Whitewater Structural Equation Modeling with IBM SPSS Amos

×