SlideShare a Scribd company logo
1 of 24
Современные методы
анализа данных
для бизнеса в стиле
“Мы тонем в информации, но
задыхаемся от нехватки знаний”
Джон Нейсбит
Информации много не бывает?
Ежедневно:
• отправляется более 144.8 млрд. email;
• пользователи Twitter публикуют более 340,000 твитов;
• пользователи Youtube загружают видео-материалы длительностью более 72
часов;
• люди тратят более 272, 000 долларов США на онлайн-шопинг ;
Каждую минуту:
• блогеры Tumblr публикуют более 27 ,000 новых постов;
• пользователи Instagram публикуют более 3,600 новых фотографий;
• в Интернете создается более чем 571 новых web-сайтов;
Каждую секунду:
• держатели VISA проводят более 2,500 транзакций.
Транзакционная база клиентов Walmart насчитывает более 2.5
петабайт информации, объем которой растет с каждой минутой!
Данные о данных
“ Когда данных становится слишком
много, меняется отношение к ним.
И проблема именно в этом – в смене
вычислительной парадигмы, в
изменении подходов”
Сергей Карелов
Информация как основной бизнес-ресурс
Что делать с этой информацией?
Варианты:
a) Ничего. Хранить и не допускать утечки
b) А что с ней делать?
c) Не стоит хранить лишнее
d) Ждать, когда эта информация понадобится
e) Анализировать информацию с целью получения новых знаний
Деятельность в любой отрасли бизнеса сопровождается регистрацией и
записью всех подробностей ее деятельности. Как результат, компании
накапливают огромные массивы данных.
Анализ
структурированных и
неструктурированных
данных:
для чего и как ?
Сначала было слово…
…или все-таки интерес к анализу данных?
1995 год…
Двое студентов-докторантов
Стэнфордского Университета Ларри
Пейдж и Сергей Брин увлечены
исследованиями в области анализа
данных в больших неструктурированных
массивах информации.
Молодые ученые приходят к выводу о
необходимости нового подхода к поиску
информации в огромных базах данных.
Особенный интерес вызывает новая область знаний, объединяющая
статистику и информационные технологии, которая называется Data Mining.
Начинаются исследования.
8
Что такое Data Mining (DM)?
Статистика
Информационные
технологии
Data Mining
Data Mining - это метод
интеллектуального анализа данных с
целью извлечения неочевидных или
скрытых закономерностей из
больших массивов данных.
Методы Data Mining получили
широкое распространение в бизнесе,
маркетинге, менеджменте, финансах,
образовании, науке, анализе
мультимедийной информации в
Интернете и пр.
Рождение эпохи
Так родилась новая технология поиска
Google, а Ларри Пейдж и Сергей
Брин основали одну из крупнейших в
мире компаний, с именем которой
ассоциируется целая эпоха свободной
информации, а также поколение
людей с нестандартным мышлением
и новыми подходами к решению
проблем.
И это поколение людей, которые
делают бизнес используя
информацию и современные
технологии, или бизнес в стиле
Преимущества Data Mining
• нахождение неявных, скрытых закономерностей в больших массивах данных
и извлечение неочевидной, скрытой информации;
• классические методы анализа данных уже не соответствуют современным
реалиям. Например, в классической статистике применяются методы
выдвижения гипотез, тогда как Data Mining выявляет объективно
существующие классы;
• Data Mining является смежной дисциплиной, объединяющей статистику,
анализ данных и IT. Поэтому не предполагает глубокой математической
подготовки специалистов. Ранее отсутствие соответствующей подготовки
специалиста приводило к поверхностному анализу данных, а важные
неочевидные закономерности в данных «ускользали» от его внимания;
• методы Data Mining развиваются стремительными темпами. Каждый год
совершенствуются программные продукты в этом направлении.
Классические стат. методы анализа данных vs. Data
Mining
Человеку, который не знаком с технологией Data Mining, может показаться,
что она ничем не отличается от обыкновенной статистики. Но это только на
первый взгляд.
На самом деле имеется ряд существенных концептуальных различий.
Например, математическая статистика предполагает усреднение значений по
произведенной выборке, вследствие чего работа будет осуществляться с
приблизительными показателями. Здесь, несомненно, есть и свои плюсы,
особенно если требуется осуществить “грубый” анализ или проверить
заранее сформулированную гипотезу. Однако для принятия управленческих
решений такой метод подходит не всегда.
В отличие от математической статистики в основу концепции Data Mining
положен принцип шаблонов (паттернов) — обнаруженных в процессе сбора
информации закономерностей, свойственных тем или иным подвыборкам
данных.
Бизнес этих компаний немыслим без инструментов
Data Mining
… и многие другие
Специалисты в сфере Data Mining и Data Analysis пользуются
огромным спросом на Западе
“Аналитик данных (Data Scientist): самая
«горячая» профессия 21-го века”
Harvard Business Review
“Аналитики данных (Data Scientists)
зарабатывают $300,000 в год“
Wall Street Journal
Развитие Data Mining и спрос на специалистов
области анализа данных
Перспективные направления Data Mining в
казахстанском бизнесе
Основные направления казахстанского бизнеса, где
использование инструментов Data Mining обеспечит
конкурентное преимущество:
• Маркетинг
• Банковский сектор
• Страхование
• и многие другие
• Анализ покупательской корзины (анализ сходства). Выявление товаров,
которые покупатели стремятся приобретать вместе. Знание покупательской
корзины необходимо для улучшения рекламы, выработки стратегии создания
запасов товаров и способов раскладки в торговых залах.
• Исследование временных шаблонов помогает принимать решения о
создании товарных запасов. Оно дает ответы на вопросы типа "Если сегодня
покупатель приобрел видеокамеру, то через какое время он вероятнее всего
купит новые батарейки и пленку?
• Создание прогнозных моделей дает возможность узнавать характер
потребностей различных категорий клиентов с определенным поведением,
например, покупающих товары известных дизайнеров или посещающих
распродажи. Эти знания нужны для разработки точно направленных,
экономичных мероприятий по продвижению товаров.
Методы Data Mining: Маркетинг
Традиционные маркетинговые исследования предполагают сбор новых
данных о клиенте с помощью опросов, фокус-групп и пр. с целью узнать
определения факторов, влияющих на потребительское поведение.
Отличие инструментов KDD в том, что выявляются скрытые закономерности
потребительской активности, самые глубокие пласты знаний о поведении
клиента на основе уже имеющихся баз данных. Метод также позволяет
сегментировать клиентов, находить клиентов с общими интересами и строить
модели, прогнозирующие поведение клиента, что позволяет принимать
более эффективные управленческие решения.
Пример: Интернет-магазин активно использует инструменты
Data Mining, благодаря которым сайт автоматически предлагает своим
клиентам новые товары на основе анализа базы истории покупок. Этот же
алгоритм использует Facebook, Linkedin прочие.
Традиционные маркетинговые исследования
vs. Data Mining
Методы Data Mining: Банковский сектор
• Управление кредитными рисками банка. Скоринговые модели для
прогнозирования дефолта заемщика: application scoring, behavior scoring и пр.
Данные модели строятся на данных о кредитной истории действующих
клиентов.
• Выявление мошенничества с кредитными карточками (fraud detection).
Путем анализа прошлых транзакций, которые впоследствии оказались
мошенническими, банк выявляет некоторые стереотипы такого
мошенничества.
• Сегментация клиентов. Разбивая клиентов на различные категории, банки
делают свою маркетинговую политику более целенаправленной и
результативной, предлагая различные виды услуг разным группам клиентов.
• Прогнозирование изменений клиентуры. Data Mining помогает банкам
строить прогнозные модели ценности своих клиентов, и соответствующим
образом обслуживать каждую категорию.
• Выявление мошенничества. Страховые компании могут снизить уровень
мошенничества, отыскивая определенные стереотипы в заявлениях о
выплате страхового возмещения, характеризующих взаимоотношения между
юристами, врачами и заявителями.
• Анализ риска. Путем выявления сочетаний факторов, связанных с
оплаченными заявлениями, страховщики могут уменьшить свои потери по
обязательствам.
Известен случай, когда в США крупная страховая компания обнаружила, что
суммы, выплаченные по заявлениям людей, состоящих в браке, вдвое
превышает суммы по заявлениям одиноких людей. Компания отреагировала
на это новое знание пересмотром своей общей политики предоставления
скидок семейным клиентам.
Методы Data Mining: Страхование
Другие приложения Data Mining в бизнесе
• выявление лояльности клиентов. Определение характеристик клиентов,
которые, один раз воспользовавшись услугами данной компании, с большой
долей вероятности останутся ей верными;
• развитие автомобильной промышленности. При сборке автомобилей
производители должны учитывать требования каждого клиента, поэтому им
нужен прогноз популярности определенных характеристик и знание того,
какие характеристики обычно заказываются вместе;
• политика гарантий. Производителям нужно предсказывать число клиентов,
которые подадут гарантийные заявки, и среднюю стоимость заявок;
• поощрение часто летающих клиентов. Авиакомпании могут обнаружить
группу клиентов, которых поощрительными мерами можно побудить летать
больше.
Например, одна авиакомпания обнаружила категорию клиентов, которые
совершали много полетов на короткие расстояния, не накапливая достаточно
миль для вступления в их клубы. Поэтому были изменены правила приема в
клуб, чтобы поощрять число полетов так же, как и мили.
20
__
__
__
__
__
__
__
__
__
Трансфор-
мированные
данные
Закономерности
и
паттерны
Target
Data
Первичные
данные
KnowledgeВалидация и
интерпретация
Интеграция
Понимание
Процесс анализа данных с применением методов
Data Mining
База
Данных
Новые сведения
и выводы
Управленческие
решения
Программные продукты для анализа с применением
методов Data Mining
• SAS Enterprise Miner (very expensive);
• R (free);
• WEKA - Waikato Environment for Knowledge Analysis (free);
• Rapid Miner (free);
• SPSS Clementine;
• Statistica Data Miner;
• MS SQL Server;
• KnowledgeMiner;
• Polyanalyst;
• KnowledgeSTUDIO;
• и прочие.
Data Mining в Казахстане
• Недостаточная осведомленность и недоверие Компаний
“Главное препятствие на пути Больших Данных – разруха в головах”
Сергей Карелов
• Нехватка специалистов. Университеты пока не готовят специалистов в
данном направлении. Кроме того, нет соответствующих курсов, тренингов и
семинаров по данной тематике.
• Отсутствие качественных БД. Не у всех компаний существуют возможности и
соответствующее ПО для хранения больших массивов данных.
• Необходимость интеграции. Для полноценного и качественного внедрения
методов Data Mining необходима интеграция с инструментами Business
Intelligence (BI), что может привести к дополнительным затратам.
В Казахстане технология анализа данных Data Mining не пользуется
популярностью. Причины могут быть следующие:
1. Обучение. Существует огромное многообразие тренингов, но нет
курсов по прикладной статистике, Data Mining и статистическому
программированию в R. Необходимо обучение как для менеджмента
компаний, так и для сотрудников соответствующих отделов.
2. Консалтинг. Назрела необходимость в консалтинге компаний, где
накапливаются крупные массивы данных, по вопроса анализа данных,
в том числе и с применением технологии Data Mining.
3. Внедрение. Внедрение методов Data Mining на базе отдельных
программных продуктов, а в последующем - интеграция с
инструментами BI.
Внедрение Data Mining в Казахстане
Спасибо за внимание!

More Related Content

What's hot

Монетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информацииМонетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информацииMike Sverdlov
 
Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingCleverDATA
 
DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014CleverDATA
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for financeCleverDATA
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.CleverDATA
 
Сегментация базы клиентов
Сегментация базы клиентовСегментация базы клиентов
Сегментация базы клиентовFutureBit
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организацииAlexey Fedorischev
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big DataAndrey Kazakevich
 
Управление качеством клиентского портфеля “по- умному”.
Управление качеством клиентского портфеля “по- умному”. Управление качеством клиентского портфеля “по- умному”.
Управление качеством клиентского портфеля “по- умному”. iECARUS
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015Ilya Gershanov
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce predictionCleverDATA
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015rusbase
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATACleverDATA
 
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...Банковское обозрение
 
Что такое Big Data ?
Что такое Big Data ?Что такое Big Data ?
Что такое Big Data ?Mikhail Alekseev
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA
 

What's hot (17)

Монетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информацииМонетизация данных: могут ли банки зарабатывать на информации
Монетизация данных: могут ли банки зарабатывать на информации
 
Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketing
 
DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for finance
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.
 
Сегментация базы клиентов
Сегментация базы клиентовСегментация базы клиентов
Сегментация базы клиентов
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организации
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Управление качеством клиентского портфеля “по- умному”.
Управление качеством клиентского портфеля “по- умному”. Управление качеством клиентского портфеля “по- умному”.
Управление качеством клиентского портфеля “по- умному”.
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce prediction
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
 
Что такое Big Data ?
Что такое Big Data ?Что такое Big Data ?
Что такое Big Data ?
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterprise
 

Viewers also liked (19)

Demokrasi dalam sosialisme modern
Demokrasi dalam sosialisme modernDemokrasi dalam sosialisme modern
Demokrasi dalam sosialisme modern
 
Instructor & Student Experiences with Open Textbooks, from the California Ope...
Instructor & Student Experiences with Open Textbooks, from the California Ope...Instructor & Student Experiences with Open Textbooks, from the California Ope...
Instructor & Student Experiences with Open Textbooks, from the California Ope...
 
Nissan Sentra SE-R Couche
Nissan Sentra SE-R CoucheNissan Sentra SE-R Couche
Nissan Sentra SE-R Couche
 
Final2
Final2Final2
Final2
 
Final
FinalFinal
Final
 
Konflik aparat antara tni vs polri
Konflik aparat antara tni vs polriKonflik aparat antara tni vs polri
Konflik aparat antara tni vs polri
 
Nissan Sedan SE-R Bond
Nissan Sedan SE-R BondNissan Sedan SE-R Bond
Nissan Sedan SE-R Bond
 
Final3 (2)
Final3 (2)Final3 (2)
Final3 (2)
 
Peradilan islam masa pra kolonial
Peradilan islam masa pra kolonialPeradilan islam masa pra kolonial
Peradilan islam masa pra kolonial
 
Armonia del color
Armonia del colorArmonia del color
Armonia del color
 
Nissan Sentra SE-R Bond
Nissan Sentra SE-R BondNissan Sentra SE-R Bond
Nissan Sentra SE-R Bond
 
The life of vincent van gogh
The life of vincent van goghThe life of vincent van gogh
The life of vincent van gogh
 
Comp107 chep6
Comp107 chep6Comp107 chep6
Comp107 chep6
 
Number systems
Number systemsNumber systems
Number systems
 
Typography
TypographyTypography
Typography
 
Judith Jarvis Thomson, "The Trolley Problem"
Judith Jarvis Thomson, "The Trolley Problem"Judith Jarvis Thomson, "The Trolley Problem"
Judith Jarvis Thomson, "The Trolley Problem"
 
Charlotte Perkins Gilman, "The Yellow Wall-Paper" and related writings
Charlotte Perkins Gilman, "The Yellow Wall-Paper" and related writingsCharlotte Perkins Gilman, "The Yellow Wall-Paper" and related writings
Charlotte Perkins Gilman, "The Yellow Wall-Paper" and related writings
 
Epicurus & Cicero on Epicureanism
Epicurus & Cicero on EpicureanismEpicurus & Cicero on Epicureanism
Epicurus & Cicero on Epicureanism
 
Office automation sysmtems
Office automation sysmtemsOffice automation sysmtems
Office automation sysmtems
 

Similar to современные методы анализа данных для бизнеса в стиле Google(2)

News roll по пятницам №13
News roll по пятницам   №13News roll по пятницам   №13
News roll по пятницам №13MedMarketing
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Den Reymer
 
Контент-маркетинг, или новая эпоха интернет-маркетинга
Контент-маркетинг, или новая эпоха интернет-маркетинга  Контент-маркетинг, или новая эпоха интернет-маркетинга
Контент-маркетинг, или новая эпоха интернет-маркетинга J Media
 
Expert Sender New Loyalty // Новая лояльность в новой медиареальности
Expert Sender New Loyalty // Новая лояльность в новой медиареальностиExpert Sender New Loyalty // Новая лояльность в новой медиареальности
Expert Sender New Loyalty // Новая лояльность в новой медиареальностиExpertSender
 
Данные - Основа Digital революции
Данные - Основа Digital революцииДанные - Основа Digital революции
Данные - Основа Digital революцииDen Reymer
 
Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechAndrey Burlutskiy
 
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataCвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataB2BConferenceGroup
 
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big DataАндрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Datavalveindustryhub
 
Доклад с конференции "Коммуникации в финансовой сфере"
Доклад с конференции "Коммуникации в финансовой сфере" Доклад с конференции "Коммуникации в финансовой сфере"
Доклад с конференции "Коммуникации в финансовой сфере" FenixConsultGroup
 
Товарные рекомендации - ключ к лояльности и повышению доходов
Товарные рекомендации - ключ к лояльности и повышению доходовТоварные рекомендации - ключ к лояльности и повышению доходов
Товарные рекомендации - ключ к лояльности и повышению доходовНовый Сайт
 
Social Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоSocial Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоСветлана Крылова
 
Революция Больших Данных
Революция Больших ДанныхРеволюция Больших Данных
Революция Больших ДанныхLeonid Zhukov
 
Интернет-маркетинг финансовых услуг
Интернет-маркетинг финансовых услугИнтернет-маркетинг финансовых услуг
Интернет-маркетинг финансовых услугMolinos
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данныхYuri Yashkin
 
Testing and Analysis - basics for effective mass fundraising mailings
Testing and Analysis - basics for effective mass fundraising mailingsTesting and Analysis - basics for effective mass fundraising mailings
Testing and Analysis - basics for effective mass fundraising mailingsAgnessa Sarkisyan
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
 
Управление целевой аудиторией_Нетология_11092013
Управление целевой аудиторией_Нетология_11092013Управление целевой аудиторией_Нетология_11092013
Управление целевой аудиторией_Нетология_11092013Евгений Храмов
 
Prospect, bribery, blackmail in social media
Prospect, bribery, blackmail in social mediaProspect, bribery, blackmail in social media
Prospect, bribery, blackmail in social mediaEkaterina Lobanova
 

Similar to современные методы анализа данных для бизнеса в стиле Google(2) (20)

News roll по пятницам №13
News roll по пятницам   №13News roll по пятницам   №13
News roll по пятницам №13
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?
 
Big Data в цифровом маркетинге
Big Data в цифровом маркетингеBig Data в цифровом маркетинге
Big Data в цифровом маркетинге
 
Контент-маркетинг, или новая эпоха интернет-маркетинга
Контент-маркетинг, или новая эпоха интернет-маркетинга  Контент-маркетинг, или новая эпоха интернет-маркетинга
Контент-маркетинг, или новая эпоха интернет-маркетинга
 
Expert Sender New Loyalty // Новая лояльность в новой медиареальности
Expert Sender New Loyalty // Новая лояльность в новой медиареальностиExpert Sender New Loyalty // Новая лояльность в новой медиареальности
Expert Sender New Loyalty // Новая лояльность в новой медиареальности
 
Данные - Основа Digital революции
Данные - Основа Digital революцииДанные - Основа Digital революции
Данные - Основа Digital революции
 
Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ Bibliotech
 
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataCвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
 
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big DataАндрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
 
Доклад с конференции "Коммуникации в финансовой сфере"
Доклад с конференции "Коммуникации в финансовой сфере" Доклад с конференции "Коммуникации в финансовой сфере"
Доклад с конференции "Коммуникации в финансовой сфере"
 
Товарные рекомендации - ключ к лояльности и повышению доходов
Товарные рекомендации - ключ к лояльности и повышению доходовТоварные рекомендации - ключ к лояльности и повышению доходов
Товарные рекомендации - ключ к лояльности и повышению доходов
 
Social Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоSocial Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущего
 
Революция Больших Данных
Революция Больших ДанныхРеволюция Больших Данных
Революция Больших Данных
 
Интернет-маркетинг финансовых услуг
Интернет-маркетинг финансовых услугИнтернет-маркетинг финансовых услуг
Интернет-маркетинг финансовых услуг
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
Testing and Analysis - basics for effective mass fundraising mailings
Testing and Analysis - basics for effective mass fundraising mailingsTesting and Analysis - basics for effective mass fundraising mailings
Testing and Analysis - basics for effective mass fundraising mailings
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
Управление целевой аудиторией_Нетология_11092013
Управление целевой аудиторией_Нетология_11092013Управление целевой аудиторией_Нетология_11092013
Управление целевой аудиторией_Нетология_11092013
 
Prospect, bribery, blackmail in social media
Prospect, bribery, blackmail in social mediaProspect, bribery, blackmail in social media
Prospect, bribery, blackmail in social media
 

современные методы анализа данных для бизнеса в стиле Google(2)

  • 2. “Мы тонем в информации, но задыхаемся от нехватки знаний” Джон Нейсбит
  • 3. Информации много не бывает? Ежедневно: • отправляется более 144.8 млрд. email; • пользователи Twitter публикуют более 340,000 твитов; • пользователи Youtube загружают видео-материалы длительностью более 72 часов; • люди тратят более 272, 000 долларов США на онлайн-шопинг ; Каждую минуту: • блогеры Tumblr публикуют более 27 ,000 новых постов; • пользователи Instagram публикуют более 3,600 новых фотографий; • в Интернете создается более чем 571 новых web-сайтов; Каждую секунду: • держатели VISA проводят более 2,500 транзакций. Транзакционная база клиентов Walmart насчитывает более 2.5 петабайт информации, объем которой растет с каждой минутой! Данные о данных
  • 4. “ Когда данных становится слишком много, меняется отношение к ним. И проблема именно в этом – в смене вычислительной парадигмы, в изменении подходов” Сергей Карелов
  • 5. Информация как основной бизнес-ресурс Что делать с этой информацией? Варианты: a) Ничего. Хранить и не допускать утечки b) А что с ней делать? c) Не стоит хранить лишнее d) Ждать, когда эта информация понадобится e) Анализировать информацию с целью получения новых знаний Деятельность в любой отрасли бизнеса сопровождается регистрацией и записью всех подробностей ее деятельности. Как результат, компании накапливают огромные массивы данных.
  • 7. Сначала было слово… …или все-таки интерес к анализу данных? 1995 год… Двое студентов-докторантов Стэнфордского Университета Ларри Пейдж и Сергей Брин увлечены исследованиями в области анализа данных в больших неструктурированных массивах информации. Молодые ученые приходят к выводу о необходимости нового подхода к поиску информации в огромных базах данных. Особенный интерес вызывает новая область знаний, объединяющая статистику и информационные технологии, которая называется Data Mining. Начинаются исследования.
  • 8. 8 Что такое Data Mining (DM)? Статистика Информационные технологии Data Mining Data Mining - это метод интеллектуального анализа данных с целью извлечения неочевидных или скрытых закономерностей из больших массивов данных. Методы Data Mining получили широкое распространение в бизнесе, маркетинге, менеджменте, финансах, образовании, науке, анализе мультимедийной информации в Интернете и пр.
  • 9. Рождение эпохи Так родилась новая технология поиска Google, а Ларри Пейдж и Сергей Брин основали одну из крупнейших в мире компаний, с именем которой ассоциируется целая эпоха свободной информации, а также поколение людей с нестандартным мышлением и новыми подходами к решению проблем. И это поколение людей, которые делают бизнес используя информацию и современные технологии, или бизнес в стиле
  • 10. Преимущества Data Mining • нахождение неявных, скрытых закономерностей в больших массивах данных и извлечение неочевидной, скрытой информации; • классические методы анализа данных уже не соответствуют современным реалиям. Например, в классической статистике применяются методы выдвижения гипотез, тогда как Data Mining выявляет объективно существующие классы; • Data Mining является смежной дисциплиной, объединяющей статистику, анализ данных и IT. Поэтому не предполагает глубокой математической подготовки специалистов. Ранее отсутствие соответствующей подготовки специалиста приводило к поверхностному анализу данных, а важные неочевидные закономерности в данных «ускользали» от его внимания; • методы Data Mining развиваются стремительными темпами. Каждый год совершенствуются программные продукты в этом направлении.
  • 11. Классические стат. методы анализа данных vs. Data Mining Человеку, который не знаком с технологией Data Mining, может показаться, что она ничем не отличается от обыкновенной статистики. Но это только на первый взгляд. На самом деле имеется ряд существенных концептуальных различий. Например, математическая статистика предполагает усреднение значений по произведенной выборке, вследствие чего работа будет осуществляться с приблизительными показателями. Здесь, несомненно, есть и свои плюсы, особенно если требуется осуществить “грубый” анализ или проверить заранее сформулированную гипотезу. Однако для принятия управленческих решений такой метод подходит не всегда. В отличие от математической статистики в основу концепции Data Mining положен принцип шаблонов (паттернов) — обнаруженных в процессе сбора информации закономерностей, свойственных тем или иным подвыборкам данных.
  • 12. Бизнес этих компаний немыслим без инструментов Data Mining … и многие другие
  • 13. Специалисты в сфере Data Mining и Data Analysis пользуются огромным спросом на Западе “Аналитик данных (Data Scientist): самая «горячая» профессия 21-го века” Harvard Business Review “Аналитики данных (Data Scientists) зарабатывают $300,000 в год“ Wall Street Journal Развитие Data Mining и спрос на специалистов области анализа данных
  • 14. Перспективные направления Data Mining в казахстанском бизнесе Основные направления казахстанского бизнеса, где использование инструментов Data Mining обеспечит конкурентное преимущество: • Маркетинг • Банковский сектор • Страхование • и многие другие
  • 15. • Анализ покупательской корзины (анализ сходства). Выявление товаров, которые покупатели стремятся приобретать вместе. Знание покупательской корзины необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов раскладки в торговых залах. • Исследование временных шаблонов помогает принимать решения о создании товарных запасов. Оно дает ответы на вопросы типа "Если сегодня покупатель приобрел видеокамеру, то через какое время он вероятнее всего купит новые батарейки и пленку? • Создание прогнозных моделей дает возможность узнавать характер потребностей различных категорий клиентов с определенным поведением, например, покупающих товары известных дизайнеров или посещающих распродажи. Эти знания нужны для разработки точно направленных, экономичных мероприятий по продвижению товаров. Методы Data Mining: Маркетинг
  • 16. Традиционные маркетинговые исследования предполагают сбор новых данных о клиенте с помощью опросов, фокус-групп и пр. с целью узнать определения факторов, влияющих на потребительское поведение. Отличие инструментов KDD в том, что выявляются скрытые закономерности потребительской активности, самые глубокие пласты знаний о поведении клиента на основе уже имеющихся баз данных. Метод также позволяет сегментировать клиентов, находить клиентов с общими интересами и строить модели, прогнозирующие поведение клиента, что позволяет принимать более эффективные управленческие решения. Пример: Интернет-магазин активно использует инструменты Data Mining, благодаря которым сайт автоматически предлагает своим клиентам новые товары на основе анализа базы истории покупок. Этот же алгоритм использует Facebook, Linkedin прочие. Традиционные маркетинговые исследования vs. Data Mining
  • 17. Методы Data Mining: Банковский сектор • Управление кредитными рисками банка. Скоринговые модели для прогнозирования дефолта заемщика: application scoring, behavior scoring и пр. Данные модели строятся на данных о кредитной истории действующих клиентов. • Выявление мошенничества с кредитными карточками (fraud detection). Путем анализа прошлых транзакций, которые впоследствии оказались мошенническими, банк выявляет некоторые стереотипы такого мошенничества. • Сегментация клиентов. Разбивая клиентов на различные категории, банки делают свою маркетинговую политику более целенаправленной и результативной, предлагая различные виды услуг разным группам клиентов. • Прогнозирование изменений клиентуры. Data Mining помогает банкам строить прогнозные модели ценности своих клиентов, и соответствующим образом обслуживать каждую категорию.
  • 18. • Выявление мошенничества. Страховые компании могут снизить уровень мошенничества, отыскивая определенные стереотипы в заявлениях о выплате страхового возмещения, характеризующих взаимоотношения между юристами, врачами и заявителями. • Анализ риска. Путем выявления сочетаний факторов, связанных с оплаченными заявлениями, страховщики могут уменьшить свои потери по обязательствам. Известен случай, когда в США крупная страховая компания обнаружила, что суммы, выплаченные по заявлениям людей, состоящих в браке, вдвое превышает суммы по заявлениям одиноких людей. Компания отреагировала на это новое знание пересмотром своей общей политики предоставления скидок семейным клиентам. Методы Data Mining: Страхование
  • 19. Другие приложения Data Mining в бизнесе • выявление лояльности клиентов. Определение характеристик клиентов, которые, один раз воспользовавшись услугами данной компании, с большой долей вероятности останутся ей верными; • развитие автомобильной промышленности. При сборке автомобилей производители должны учитывать требования каждого клиента, поэтому им нужен прогноз популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе; • политика гарантий. Производителям нужно предсказывать число клиентов, которые подадут гарантийные заявки, и среднюю стоимость заявок; • поощрение часто летающих клиентов. Авиакомпании могут обнаружить группу клиентов, которых поощрительными мерами можно побудить летать больше. Например, одна авиакомпания обнаружила категорию клиентов, которые совершали много полетов на короткие расстояния, не накапливая достаточно миль для вступления в их клубы. Поэтому были изменены правила приема в клуб, чтобы поощрять число полетов так же, как и мили.
  • 21. Программные продукты для анализа с применением методов Data Mining • SAS Enterprise Miner (very expensive); • R (free); • WEKA - Waikato Environment for Knowledge Analysis (free); • Rapid Miner (free); • SPSS Clementine; • Statistica Data Miner; • MS SQL Server; • KnowledgeMiner; • Polyanalyst; • KnowledgeSTUDIO; • и прочие.
  • 22. Data Mining в Казахстане • Недостаточная осведомленность и недоверие Компаний “Главное препятствие на пути Больших Данных – разруха в головах” Сергей Карелов • Нехватка специалистов. Университеты пока не готовят специалистов в данном направлении. Кроме того, нет соответствующих курсов, тренингов и семинаров по данной тематике. • Отсутствие качественных БД. Не у всех компаний существуют возможности и соответствующее ПО для хранения больших массивов данных. • Необходимость интеграции. Для полноценного и качественного внедрения методов Data Mining необходима интеграция с инструментами Business Intelligence (BI), что может привести к дополнительным затратам. В Казахстане технология анализа данных Data Mining не пользуется популярностью. Причины могут быть следующие:
  • 23. 1. Обучение. Существует огромное многообразие тренингов, но нет курсов по прикладной статистике, Data Mining и статистическому программированию в R. Необходимо обучение как для менеджмента компаний, так и для сотрудников соответствующих отделов. 2. Консалтинг. Назрела необходимость в консалтинге компаний, где накапливаются крупные массивы данных, по вопроса анализа данных, в том числе и с применением технологии Data Mining. 3. Внедрение. Внедрение методов Data Mining на базе отдельных программных продуктов, а в последующем - интеграция с инструментами BI. Внедрение Data Mining в Казахстане