SlideShare a Scribd company logo
BIG DATA 
Революция в области хранения 
и обработки данных
2 
История появления термина BIG DATA 
 Клиффорд Линч, редактор журнала Nature, в 2008 году впервые упомянул о термине BIG DATA в специальном 
номере журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности 
работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста 
объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка 
«от количества к качеству» 
 В 2009 году термин широко распространился в деловой прессе, а к 2010 году относят появление первых продуктов и 
решений, относящихся исключительно и непосредственно к проблеме обработки больших данных. К 2011 году 
большинство крупнейших поставщиков информационных технологий для организаций в своих деловых стратегиях 
используют понятие о больших данных, в том числе IBM, Oracle, Microsoft, Hewlett-Packard, EMC, а основные 
аналитики рынка информационных технологий посвящают концепции выделенные 
 В 2011 году Gartner отмечает большие данные как тренд номер два в информационно-технологической 
инфраструктуре (после виртуализации и как более существенный, чем энергосбережение и мониторинг). 
Прогнозируется, что внедрение технологий больших данных наибольшее влияние окажет на информационные 
технологии в производстве ,здравоохранении, торговле, государственном управлении, а также в сферах и отраслях, 
где регистрируются индивидуальные перемещения ресурсов
3 
Что же такое BIG DATA? 
Группа технологий и методов производительной обработки динамически растущих объемов 
данных( структурированных и неструктурированных) в распределенных информационных 
системах, обеспечивающих организацию качественно новой полезной информацией 
Big Data — это наборы данных такого объема, что традиционные инструменты не 
способны осуществлять их захват, управление и обработку за приемлемое для практики 
время. 
Технология Big Data предоставляет услуги, помогающие раскрыть коммерческий потенциал 
мегамассивов данных за счет поиска ценных закономерностей и фактов путем объединения 
и анализа больших объемов данных.
4 
Volume Variety Velocity 
Volume Variety Velocity 
Реально большие 
объемы данных в 
физическом смысле 
Слабо 
структурированные 
и разнородные 
данные 
Необходимость 
высокой скорости 
обработки данных 
1Gb, 1Tb, 1Pb, 1EXb, 1Zb DB, XML, Logs, Texts, 
Video, Audio
5 
Объем данных корпораций по отраслям в 2012г 
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 
Ценные бумаги 
Банкинг 
Медицина 
Энергетика 
Правительство 
Страхование 
Коммуникации и медиа 
Энергетика 
Объем данных в Тб 
Источник данных: McKinsey
6 
Интернет и мобильные технологии 
Twitter 175 млн твит сообщений в день 
Facebook 300 млн фото загружаемых ежедневно 
Google 24PB ежедневно 
AT&T передает 30Pb в день 
Walmart более 1 млн продаж в час 
Объем данных, переданных/полученных на мобильные 
устройства, — 1,3 эксабайт
7 
Основные технологии анализа в BigData 
 MapReduce - это фреймворк для вычисления некоторых наборов распределенных задач с 
использованием большого количества компьютеров (называемых «нодами»), 
образующих кластер, разработанный компанией Google. 
 Hadoop - набор утилит, библиотек и программный каркас для разработки и выполнения 
распределённых программ, работающих на кластерах из сотен и тысяч узлов. 
 NoSql - ряд подходов, направленных на реализацию хранилищ баз данных, имеющих 
существенные отличия от моделей, используемых в традиционных реляционных СУБД с 
доступом к данным средствами языка SQL. Применяется к базам данных, в которых 
делается попытка решить проблемы масштабируемости и доступности за 
счёт атомарности и согласованности данных
8 
Value
9 
Методы анализа используемые в BigData 
Уникальность подхода больших данных заключается в агрегировании 
огромного объема неструктурированной информации из разных 
источников в одном месте. 
 Классификация (методы категоризации новых данных на основе принципов, 
ранее применённых к уже наличествующим данным) 
 Кластерный анализ 
 Регрессионный анализ 
 Рекомендательные системы 
 Искусственные нейронные сети, в том числе генетические алгоритмы;
10 
Самые продвинутые отрасли BigData 
01 Маркетинг 03 
Сегментация рынка 
Моделирование 
приобретения и оттока 
клиентов 
Рекомендательные 
системы 
Анализ соц.медиа 
02 Финансы Медицина 
Детектирование 
аномального поведения 
Анализ кредитных рисков 
Страховое моделирование 
Генетический анализ 
Анализ клинических 
испытаний 
Экспертные системы
11 
Value для бизнеса 
Value 
Учитывая масштабность, перед бизнесом встала задача не только выбора 
адекватного инструментария по анализу информации, но и построения 
оптимальной вычислительной инфраструктуры, которая была бы 
эффективной и не очень дорогой. 
.Действительно, большие хранилища данных в сфере финансовых услуг, телекоммуникаций, розничной торговли и 
государственных организаций существовали на протяжении многих лет. Применялись решения по обработке данных в 
реальном времени для управления бизнес-процессами, например в торговле, а также высокопроизводительные 
вычислительные системы для научных исследований. Различие их состоит в том, что те системы, которые раньше решали 
отдельные проблемы бизнеса на больших предприятиях, сегодня становятся основой осуществления их бизнес-стратегии. 
Технология Big Data позволяет уменьшить расходы на ИТ-инфраструктуру и ПО, сократить затраты на рабочую силу за счет 
более эффективных методов интеграции данных, управления, анализа и выработки решения; обеспечить увеличение 
дохода и прибыли путем новых или более эффективных способов ведения бизнеса. То есть на современном этапе те же 
самые технологии представляют качественно новую ценность для предприятия
12 
Кейс «Как компания может узнать о ваших секретах?» 
Магазин Target и 
беременная девочка, 
США 2012г
13 
Спасибо за 
внимание! 
Алексеев Михаил 
alekseev.miha@gmail.com 
Linkedin 
Facebook 
Vk

More Related Content

What's hot

Дихальна система. Будова і функціі.
Дихальна система. Будова і функціі.Дихальна система. Будова і функціі.
Дихальна система. Будова і функціі.
labinskiir-33
 
Big Data Analytics and its Application in E-Commerce
Big Data Analytics and its Application in E-CommerceBig Data Analytics and its Application in E-Commerce
Big Data Analytics and its Application in E-Commerce
Uyoyo Edosio
 
Big Data
Big DataBig Data
Монітори
МоніториМонітори
МоніториLona_Pugach
 
Модулі Python
Модулі PythonМодулі Python
Big data
Big dataBig data
Big data
Pooja Shah
 
Етапи створення веб сайтів
Етапи створення веб сайтівЕтапи створення веб сайтів
Етапи створення веб сайтів
Yulia Vlasenko
 
Tex orolt garalt
Tex orolt garaltTex orolt garalt
Tex orolt garalt
chuluunbatbaymbasure
 
Презентація Інформаційна безпека Урок 11.pptx
Презентація Інформаційна безпека Урок 11.pptxПрезентація Інформаційна безпека Урок 11.pptx
Презентація Інформаційна безпека Урок 11.pptx
ssuserc8ab9c
 
Information security17799 khaltar
Information security17799 khaltarInformation security17799 khaltar
Information security17799 khaltar
Khaltar Togtuun
 
Big_data_ppt
Big_data_ppt Big_data_ppt
Big_data_ppt
Sadhana Singh
 
Big Data & Hadoop Introduction
Big Data & Hadoop IntroductionBig Data & Hadoop Introduction
Big Data & Hadoop Introduction
Jayant Mukherjee
 
презентація текстовий документ та його об’єкти
презентація   текстовий документ та його об’єктипрезентація   текстовий документ та його об’єкти
презентація текстовий документ та його об’єкти
Olga Sokolik
 
Big Data Presentation
Big  Data PresentationBig  Data Presentation
Big Data Presentation
Ritika Barethia
 
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Hritika Raj
 
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
StAlKeRoV
 
Робота з текстом. Робота з векторними елементами.
Робота з текстом. Робота з векторними елементами.Робота з текстом. Робота з векторними елементами.
Робота з текстом. Робота з векторними елементами.
Liya Dantseva
 
Big data
Big dataBig data
Big data
Nimish Kochhar
 
Big data introduction
Big data introductionBig data introduction
Big data introduction
Chirag Ahuja
 

What's hot (20)

Дихальна система. Будова і функціі.
Дихальна система. Будова і функціі.Дихальна система. Будова і функціі.
Дихальна система. Будова і функціі.
 
Big Data Analytics and its Application in E-Commerce
Big Data Analytics and its Application in E-CommerceBig Data Analytics and its Application in E-Commerce
Big Data Analytics and its Application in E-Commerce
 
Big Data
Big DataBig Data
Big Data
 
Монітори
МоніториМонітори
Монітори
 
Модулі Python
Модулі PythonМодулі Python
Модулі Python
 
Big data
Big dataBig data
Big data
 
Етапи створення веб сайтів
Етапи створення веб сайтівЕтапи створення веб сайтів
Етапи створення веб сайтів
 
Tex orolt garalt
Tex orolt garaltTex orolt garalt
Tex orolt garalt
 
Презентація Інформаційна безпека Урок 11.pptx
Презентація Інформаційна безпека Урок 11.pptxПрезентація Інформаційна безпека Урок 11.pptx
Презентація Інформаційна безпека Урок 11.pptx
 
Information security17799 khaltar
Information security17799 khaltarInformation security17799 khaltar
Information security17799 khaltar
 
Big_data_ppt
Big_data_ppt Big_data_ppt
Big_data_ppt
 
Big Data & Hadoop Introduction
Big Data & Hadoop IntroductionBig Data & Hadoop Introduction
Big Data & Hadoop Introduction
 
презентація текстовий документ та його об’єкти
презентація   текстовий документ та його об’єктипрезентація   текстовий документ та його об’єкти
презентація текстовий документ та його об’єкти
 
Big Data Presentation
Big  Data PresentationBig  Data Presentation
Big Data Presentation
 
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
 
9 збереження біорізноманіття
9 збереження біорізноманіття9 збереження біорізноманіття
9 збереження біорізноманіття
 
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
5 клас 29 урок. Графічні об’єкти слайдів. Вставляння зображень.
 
Робота з текстом. Робота з векторними елементами.
Робота з текстом. Робота з векторними елементами.Робота з текстом. Робота з векторними елементами.
Робота з текстом. Робота з векторними елементами.
 
Big data
Big dataBig data
Big data
 
Big data introduction
Big data introductionBig data introduction
Big data introduction
 

Viewers also liked

Андрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноАндрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноYandex
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
Evgeniy Pavlovskiy
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Techart Marketing Group
 
Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01
Vera Kovaleva
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big data
Satur-D
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
Глеб Кащеев
 
Разработка торгового робота
Разработка торгового роботаРазработка торгового робота
Разработка торгового робота
Mikhail Alekseev
 
Решение логистической задачи от компании Unilever
Решение логистической задачи от компании UnileverРешение логистической задачи от компании Unilever
Решение логистической задачи от компании Unilever
Mikhail Alekseev
 
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Mikhail Alekseev
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
antishmanti
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
CleverDATA
 
Внедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения РоссииВнедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения России
Mikhail Alekseev
 
Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"
Mikhail Alekseev
 
Titan: The Rise of Big Graph Data
Titan: The Rise of Big Graph DataTitan: The Rise of Big Graph Data
Titan: The Rise of Big Graph Data
Marko Rodriguez
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
Bernard Marr
 
Топ-5 сайтов для поиска работы
Топ-5 сайтов для поиска работыТоп-5 сайтов для поиска работы
Топ-5 сайтов для поиска работы
Sobesedovanie
 
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
World Brand Academy
 
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry BodineSDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
Service Design Network
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
Stanislav Makarov
 

Viewers also liked (20)

Андрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноАндрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересно
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big data
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
 
Разработка торгового робота
Разработка торгового роботаРазработка торгового робота
Разработка торгового робота
 
Решение логистической задачи от компании Unilever
Решение логистической задачи от компании UnileverРешение логистической задачи от компании Unilever
Решение логистической задачи от компании Unilever
 
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 
Внедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения РоссииВнедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения России
 
Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"
 
Titan: The Rise of Big Graph Data
Titan: The Rise of Big Graph DataTitan: The Rise of Big Graph Data
Titan: The Rise of Big Graph Data
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
Топ-5 сайтов для поиска работы
Топ-5 сайтов для поиска работыТоп-5 сайтов для поиска работы
Топ-5 сайтов для поиска работы
 
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
 
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry BodineSDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
 

Similar to Что такое Big Data ?

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
Andrey Kazakevich
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
Ipo Board
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
Собака Павлова
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
Vladimir Krylov
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
Newprolab
 
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиDigital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиBBDO Group
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
Sergey Gorshkov
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколения
Альбина Минуллина
 
ит тренды Gartner
ит тренды Gartnerит тренды Gartner
ит тренды GartnerExpolink
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
Yuri Yashkin
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
Olena Sukhina
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
Expert and Consulting (EnC)
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
Evgeniy Pavlovskiy
 
Практическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесеПрактическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесе
Anton Vokrug
 
пошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделіпошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделі
Mary Prokhorova
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
BranchMarketing
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
Marina Payvina
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
Elizaveta Alekseeva
 
BI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, МакаровBI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, Макаров
Stanislav Makarov
 
Отчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТОтчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТ
HEOTEX
 

Similar to Что такое Big Data ? (20)

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
 
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиDigital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколения
 
ит тренды Gartner
ит тренды Gartnerит тренды Gartner
ит тренды Gartner
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Практическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесеПрактическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесе
 
пошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделіпошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделі
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
BI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, МакаровBI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, Макаров
 
Отчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТОтчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТ
 

Что такое Big Data ?

  • 1. BIG DATA Революция в области хранения и обработки данных
  • 2. 2 История появления термина BIG DATA  Клиффорд Линч, редактор журнала Nature, в 2008 году впервые упомянул о термине BIG DATA в специальном номере журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка «от количества к качеству»  В 2009 году термин широко распространился в деловой прессе, а к 2010 году относят появление первых продуктов и решений, относящихся исключительно и непосредственно к проблеме обработки больших данных. К 2011 году большинство крупнейших поставщиков информационных технологий для организаций в своих деловых стратегиях используют понятие о больших данных, в том числе IBM, Oracle, Microsoft, Hewlett-Packard, EMC, а основные аналитики рынка информационных технологий посвящают концепции выделенные  В 2011 году Gartner отмечает большие данные как тренд номер два в информационно-технологической инфраструктуре (после виртуализации и как более существенный, чем энергосбережение и мониторинг). Прогнозируется, что внедрение технологий больших данных наибольшее влияние окажет на информационные технологии в производстве ,здравоохранении, торговле, государственном управлении, а также в сферах и отраслях, где регистрируются индивидуальные перемещения ресурсов
  • 3. 3 Что же такое BIG DATA? Группа технологий и методов производительной обработки динамически растущих объемов данных( структурированных и неструктурированных) в распределенных информационных системах, обеспечивающих организацию качественно новой полезной информацией Big Data — это наборы данных такого объема, что традиционные инструменты не способны осуществлять их захват, управление и обработку за приемлемое для практики время. Технология Big Data предоставляет услуги, помогающие раскрыть коммерческий потенциал мегамассивов данных за счет поиска ценных закономерностей и фактов путем объединения и анализа больших объемов данных.
  • 4. 4 Volume Variety Velocity Volume Variety Velocity Реально большие объемы данных в физическом смысле Слабо структурированные и разнородные данные Необходимость высокой скорости обработки данных 1Gb, 1Tb, 1Pb, 1EXb, 1Zb DB, XML, Logs, Texts, Video, Audio
  • 5. 5 Объем данных корпораций по отраслям в 2012г 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Ценные бумаги Банкинг Медицина Энергетика Правительство Страхование Коммуникации и медиа Энергетика Объем данных в Тб Источник данных: McKinsey
  • 6. 6 Интернет и мобильные технологии Twitter 175 млн твит сообщений в день Facebook 300 млн фото загружаемых ежедневно Google 24PB ежедневно AT&T передает 30Pb в день Walmart более 1 млн продаж в час Объем данных, переданных/полученных на мобильные устройства, — 1,3 эксабайт
  • 7. 7 Основные технологии анализа в BigData  MapReduce - это фреймворк для вычисления некоторых наборов распределенных задач с использованием большого количества компьютеров (называемых «нодами»), образующих кластер, разработанный компанией Google.  Hadoop - набор утилит, библиотек и программный каркас для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов.  NoSql - ряд подходов, направленных на реализацию хранилищ баз данных, имеющих существенные отличия от моделей, используемых в традиционных реляционных СУБД с доступом к данным средствами языка SQL. Применяется к базам данных, в которых делается попытка решить проблемы масштабируемости и доступности за счёт атомарности и согласованности данных
  • 9. 9 Методы анализа используемые в BigData Уникальность подхода больших данных заключается в агрегировании огромного объема неструктурированной информации из разных источников в одном месте.  Классификация (методы категоризации новых данных на основе принципов, ранее применённых к уже наличествующим данным)  Кластерный анализ  Регрессионный анализ  Рекомендательные системы  Искусственные нейронные сети, в том числе генетические алгоритмы;
  • 10. 10 Самые продвинутые отрасли BigData 01 Маркетинг 03 Сегментация рынка Моделирование приобретения и оттока клиентов Рекомендательные системы Анализ соц.медиа 02 Финансы Медицина Детектирование аномального поведения Анализ кредитных рисков Страховое моделирование Генетический анализ Анализ клинических испытаний Экспертные системы
  • 11. 11 Value для бизнеса Value Учитывая масштабность, перед бизнесом встала задача не только выбора адекватного инструментария по анализу информации, но и построения оптимальной вычислительной инфраструктуры, которая была бы эффективной и не очень дорогой. .Действительно, большие хранилища данных в сфере финансовых услуг, телекоммуникаций, розничной торговли и государственных организаций существовали на протяжении многих лет. Применялись решения по обработке данных в реальном времени для управления бизнес-процессами, например в торговле, а также высокопроизводительные вычислительные системы для научных исследований. Различие их состоит в том, что те системы, которые раньше решали отдельные проблемы бизнеса на больших предприятиях, сегодня становятся основой осуществления их бизнес-стратегии. Технология Big Data позволяет уменьшить расходы на ИТ-инфраструктуру и ПО, сократить затраты на рабочую силу за счет более эффективных методов интеграции данных, управления, анализа и выработки решения; обеспечить увеличение дохода и прибыли путем новых или более эффективных способов ведения бизнеса. То есть на современном этапе те же самые технологии представляют качественно новую ценность для предприятия
  • 12. 12 Кейс «Как компания может узнать о ваших секретах?» Магазин Target и беременная девочка, США 2012г
  • 13. 13 Спасибо за внимание! Алексеев Михаил alekseev.miha@gmail.com Linkedin Facebook Vk

Editor's Notes

  1. В мире больших данных мы можем проанализировать огромное количество данных, а в некоторых случаях – обработать ВСЕ данные, касающиеся того или иного явления, а не полагаться на случайные выборки.
  2. В мире больших данных мы можем проанализировать огромное количество данных, а в некоторых случаях – обработать ВСЕ данные, касающиеся того или иного явления, а не полагаться на случайные выборки.
  3. Два года назад огромная сеть магазинов Target стала использовать машинное обучение при взаимодействии с покупателями. В качестве обучающей выборки использовались данные, накопленные компанией за несколько лет. В качестве маркеров конкретных покупателей использовались банковские и именные скидочные карты. Алгоритмы проанализировали, как и в каких условиях менялись предпочтения покупателей и делали прогнозы. А на основе этих прогнозов покупателям делались всевозможные специальные предложения. Весной 2012 года разразился скандал, когда отец двенадцатилетней школьницы пожаловался, что его дочери присылают буклеты с предложениями для беременных. Когда сеть Target уже приготовилась признавать ошибку и извиняться перед обиженными покупателями, выяснилось, что девочка действительно была беременна, хотя ни она, ни ее отец на момент жалобы не знали об этом. Алгоритм отловил изменения в поведении покупательницы, характерные для беременных женщин.
  4. Два года назад огромная сеть магазинов Target стала использовать машинное обучение при взаимодействии с покупателями. В качестве обучающей выборки использовались данные, накопленные компанией за несколько лет. В качестве маркеров конкретных покупателей использовались банковские и именные скидочные карты. Алгоритмы проанализировали, как и в каких условиях менялись предпочтения покупателей и делали прогнозы. А на основе этих прогнозов покупателям делались всевозможные специальные предложения. Весной 2012 года разразился скандал, когда отец двенадцатилетней школьницы пожаловался, что его дочери присылают буклеты с предложениями для беременных. Когда сеть Target уже приготовилась признавать ошибку и извиняться перед обиженными покупателями, выяснилось, что девочка действительно была беременна, хотя ни она, ни ее отец на момент жалобы не знали об этом. Алгоритм отловил изменения в поведении покупательницы, характерные для беременных женщин.