SlideShare a Scribd company logo
BIG DATA 
Революция в области хранения 
и обработки данных
2 
История появления термина BIG DATA 
 Клиффорд Линч, редактор журнала Nature, в 2008 году впервые упомянул о термине BIG DATA в специальном 
номере журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности 
работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста 
объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка 
«от количества к качеству» 
 В 2009 году термин широко распространился в деловой прессе, а к 2010 году относят появление первых продуктов и 
решений, относящихся исключительно и непосредственно к проблеме обработки больших данных. К 2011 году 
большинство крупнейших поставщиков информационных технологий для организаций в своих деловых стратегиях 
используют понятие о больших данных, в том числе IBM, Oracle, Microsoft, Hewlett-Packard, EMC, а основные 
аналитики рынка информационных технологий посвящают концепции выделенные 
 В 2011 году Gartner отмечает большие данные как тренд номер два в информационно-технологической 
инфраструктуре (после виртуализации и как более существенный, чем энергосбережение и мониторинг). 
Прогнозируется, что внедрение технологий больших данных наибольшее влияние окажет на информационные 
технологии в производстве ,здравоохранении, торговле, государственном управлении, а также в сферах и отраслях, 
где регистрируются индивидуальные перемещения ресурсов
3 
Что же такое BIG DATA? 
Группа технологий и методов производительной обработки динамически растущих объемов 
данных( структурированных и неструктурированных) в распределенных информационных 
системах, обеспечивающих организацию качественно новой полезной информацией 
Big Data — это наборы данных такого объема, что традиционные инструменты не 
способны осуществлять их захват, управление и обработку за приемлемое для практики 
время. 
Технология Big Data предоставляет услуги, помогающие раскрыть коммерческий потенциал 
мегамассивов данных за счет поиска ценных закономерностей и фактов путем объединения 
и анализа больших объемов данных.
4 
Volume Variety Velocity 
Volume Variety Velocity 
Реально большие 
объемы данных в 
физическом смысле 
Слабо 
структурированные 
и разнородные 
данные 
Необходимость 
высокой скорости 
обработки данных 
1Gb, 1Tb, 1Pb, 1EXb, 1Zb DB, XML, Logs, Texts, 
Video, Audio
5 
Объем данных корпораций по отраслям в 2012г 
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 
Ценные бумаги 
Банкинг 
Медицина 
Энергетика 
Правительство 
Страхование 
Коммуникации и медиа 
Энергетика 
Объем данных в Тб 
Источник данных: McKinsey
6 
Интернет и мобильные технологии 
Twitter 175 млн твит сообщений в день 
Facebook 300 млн фото загружаемых ежедневно 
Google 24PB ежедневно 
AT&T передает 30Pb в день 
Walmart более 1 млн продаж в час 
Объем данных, переданных/полученных на мобильные 
устройства, — 1,3 эксабайт
7 
Основные технологии анализа в BigData 
 MapReduce - это фреймворк для вычисления некоторых наборов распределенных задач с 
использованием большого количества компьютеров (называемых «нодами»), 
образующих кластер, разработанный компанией Google. 
 Hadoop - набор утилит, библиотек и программный каркас для разработки и выполнения 
распределённых программ, работающих на кластерах из сотен и тысяч узлов. 
 NoSql - ряд подходов, направленных на реализацию хранилищ баз данных, имеющих 
существенные отличия от моделей, используемых в традиционных реляционных СУБД с 
доступом к данным средствами языка SQL. Применяется к базам данных, в которых 
делается попытка решить проблемы масштабируемости и доступности за 
счёт атомарности и согласованности данных
8 
Value
9 
Методы анализа используемые в BigData 
Уникальность подхода больших данных заключается в агрегировании 
огромного объема неструктурированной информации из разных 
источников в одном месте. 
 Классификация (методы категоризации новых данных на основе принципов, 
ранее применённых к уже наличествующим данным) 
 Кластерный анализ 
 Регрессионный анализ 
 Рекомендательные системы 
 Искусственные нейронные сети, в том числе генетические алгоритмы;
10 
Самые продвинутые отрасли BigData 
01 Маркетинг 03 
Сегментация рынка 
Моделирование 
приобретения и оттока 
клиентов 
Рекомендательные 
системы 
Анализ соц.медиа 
02 Финансы Медицина 
Детектирование 
аномального поведения 
Анализ кредитных рисков 
Страховое моделирование 
Генетический анализ 
Анализ клинических 
испытаний 
Экспертные системы
11 
Value для бизнеса 
Value 
Учитывая масштабность, перед бизнесом встала задача не только выбора 
адекватного инструментария по анализу информации, но и построения 
оптимальной вычислительной инфраструктуры, которая была бы 
эффективной и не очень дорогой. 
.Действительно, большие хранилища данных в сфере финансовых услуг, телекоммуникаций, розничной торговли и 
государственных организаций существовали на протяжении многих лет. Применялись решения по обработке данных в 
реальном времени для управления бизнес-процессами, например в торговле, а также высокопроизводительные 
вычислительные системы для научных исследований. Различие их состоит в том, что те системы, которые раньше решали 
отдельные проблемы бизнеса на больших предприятиях, сегодня становятся основой осуществления их бизнес-стратегии. 
Технология Big Data позволяет уменьшить расходы на ИТ-инфраструктуру и ПО, сократить затраты на рабочую силу за счет 
более эффективных методов интеграции данных, управления, анализа и выработки решения; обеспечить увеличение 
дохода и прибыли путем новых или более эффективных способов ведения бизнеса. То есть на современном этапе те же 
самые технологии представляют качественно новую ценность для предприятия
12 
Кейс «Как компания может узнать о ваших секретах?» 
Магазин Target и 
беременная девочка, 
США 2012г
13 
Спасибо за 
внимание! 
Алексеев Михаил 
alekseev.miha@gmail.com 
Linkedin 
Facebook 
Vk

More Related Content

What's hot

Data Management, Metadata Management, and Data Governance – Working Together
Data Management, Metadata Management, and Data Governance – Working TogetherData Management, Metadata Management, and Data Governance – Working Together
Data Management, Metadata Management, and Data Governance – Working Together
DATAVERSITY
 
Data Governance and Metadata Management
Data Governance and Metadata ManagementData Governance and Metadata Management
Data Governance and Metadata Management
DATAVERSITY
 
Data Products and teams
Data Products and teamsData Products and teams
Data Products and teams
Dr. Jimmy Schwarzkopf
 
What are data products and why are they different from other products?
What are data products and why are they different from other products?What are data products and why are they different from other products?
What are data products and why are they different from other products?
inovex GmbH
 
AIDRC_Generative_AI_TL_v5.pdf
AIDRC_Generative_AI_TL_v5.pdfAIDRC_Generative_AI_TL_v5.pdf
AIDRC_Generative_AI_TL_v5.pdf
Thierry Lestable
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2O
Sri Ambati
 
Data Governance by stealth v0.0.2
Data Governance by stealth v0.0.2Data Governance by stealth v0.0.2
Data Governance by stealth v0.0.2Christopher Bradley
 
Design-driven vs. Data-driven
Design-driven vs. Data-driven Design-driven vs. Data-driven
Design-driven vs. Data-driven
Mikko Eerola
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Neo4j
 
Building the Analytics Capability
Building the Analytics CapabilityBuilding the Analytics Capability
Building the Analytics CapabilityBala Iyer
 
International Data Spaces: Data Sovereignty for Business Model Innovation
International Data Spaces: Data Sovereignty for Business Model InnovationInternational Data Spaces: Data Sovereignty for Business Model Innovation
International Data Spaces: Data Sovereignty for Business Model Innovation
Boris Otto
 
How a Semantic Layer Makes Data Mesh Work at Scale
How a Semantic Layer Makes  Data Mesh Work at ScaleHow a Semantic Layer Makes  Data Mesh Work at Scale
How a Semantic Layer Makes Data Mesh Work at Scale
DATAVERSITY
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data Quality
DATAVERSITY
 
Ontologies neo4j-graph-workshop-berlin
Ontologies neo4j-graph-workshop-berlinOntologies neo4j-graph-workshop-berlin
Ontologies neo4j-graph-workshop-berlin
Simon Jupp
 
Büyük veri(bigdata)
Büyük veri(bigdata)Büyük veri(bigdata)
Büyük veri(bigdata)
Hülya Soylu
 
Accenture Technology Vision - How the trends apply to higher education
Accenture Technology Vision - How the trends apply to higher education Accenture Technology Vision - How the trends apply to higher education
Accenture Technology Vision - How the trends apply to higher education
accenture
 
DAS Slides: Enterprise Architecture vs. Data Architecture
DAS Slides: Enterprise Architecture vs. Data ArchitectureDAS Slides: Enterprise Architecture vs. Data Architecture
DAS Slides: Enterprise Architecture vs. Data Architecture
DATAVERSITY
 
Ibm data governance framework
Ibm data governance frameworkIbm data governance framework
Ibm data governance framework
kaiyun7631
 
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
Denodo
 
RGPD
RGPDRGPD

What's hot (20)

Data Management, Metadata Management, and Data Governance – Working Together
Data Management, Metadata Management, and Data Governance – Working TogetherData Management, Metadata Management, and Data Governance – Working Together
Data Management, Metadata Management, and Data Governance – Working Together
 
Data Governance and Metadata Management
Data Governance and Metadata ManagementData Governance and Metadata Management
Data Governance and Metadata Management
 
Data Products and teams
Data Products and teamsData Products and teams
Data Products and teams
 
What are data products and why are they different from other products?
What are data products and why are they different from other products?What are data products and why are they different from other products?
What are data products and why are they different from other products?
 
AIDRC_Generative_AI_TL_v5.pdf
AIDRC_Generative_AI_TL_v5.pdfAIDRC_Generative_AI_TL_v5.pdf
AIDRC_Generative_AI_TL_v5.pdf
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2O
 
Data Governance by stealth v0.0.2
Data Governance by stealth v0.0.2Data Governance by stealth v0.0.2
Data Governance by stealth v0.0.2
 
Design-driven vs. Data-driven
Design-driven vs. Data-driven Design-driven vs. Data-driven
Design-driven vs. Data-driven
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
 
Building the Analytics Capability
Building the Analytics CapabilityBuilding the Analytics Capability
Building the Analytics Capability
 
International Data Spaces: Data Sovereignty for Business Model Innovation
International Data Spaces: Data Sovereignty for Business Model InnovationInternational Data Spaces: Data Sovereignty for Business Model Innovation
International Data Spaces: Data Sovereignty for Business Model Innovation
 
How a Semantic Layer Makes Data Mesh Work at Scale
How a Semantic Layer Makes  Data Mesh Work at ScaleHow a Semantic Layer Makes  Data Mesh Work at Scale
How a Semantic Layer Makes Data Mesh Work at Scale
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data Quality
 
Ontologies neo4j-graph-workshop-berlin
Ontologies neo4j-graph-workshop-berlinOntologies neo4j-graph-workshop-berlin
Ontologies neo4j-graph-workshop-berlin
 
Büyük veri(bigdata)
Büyük veri(bigdata)Büyük veri(bigdata)
Büyük veri(bigdata)
 
Accenture Technology Vision - How the trends apply to higher education
Accenture Technology Vision - How the trends apply to higher education Accenture Technology Vision - How the trends apply to higher education
Accenture Technology Vision - How the trends apply to higher education
 
DAS Slides: Enterprise Architecture vs. Data Architecture
DAS Slides: Enterprise Architecture vs. Data ArchitectureDAS Slides: Enterprise Architecture vs. Data Architecture
DAS Slides: Enterprise Architecture vs. Data Architecture
 
Ibm data governance framework
Ibm data governance frameworkIbm data governance framework
Ibm data governance framework
 
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
Denodo: Enabling a Data Mesh Architecture and Data Sharing Culture at Landsba...
 
RGPD
RGPDRGPD
RGPD
 

Viewers also liked

Андрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноАндрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноYandex
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
Evgeniy Pavlovskiy
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Techart Marketing Group
 
Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01
Vera Kovaleva
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big data
Satur-D
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
Глеб Кащеев
 
Разработка торгового робота
Разработка торгового роботаРазработка торгового робота
Разработка торгового робота
Mikhail Alekseev
 
Решение логистической задачи от компании Unilever
Решение логистической задачи от компании UnileverРешение логистической задачи от компании Unilever
Решение логистической задачи от компании Unilever
Mikhail Alekseev
 
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Mikhail Alekseev
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
antishmanti
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
CleverDATA
 
Внедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения РоссииВнедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения России
Mikhail Alekseev
 
Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"
Mikhail Alekseev
 
Titan: The Rise of Big Graph Data
Titan: The Rise of Big Graph DataTitan: The Rise of Big Graph Data
Titan: The Rise of Big Graph Data
Marko Rodriguez
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
Bernard Marr
 
Топ-5 сайтов для поиска работы
Топ-5 сайтов для поиска работыТоп-5 сайтов для поиска работы
Топ-5 сайтов для поиска работы
Sobesedovanie
 
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
World Brand Academy
 
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry BodineSDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
Service Design Network
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
Stanislav Makarov
 

Viewers also liked (20)

Андрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересноАндрей Себрант - Что такое Big data и почему это страшно интересно
Андрей Себрант - Что такое Big data и почему это страшно интересно
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01Whatisbigdata 130718170809-phpapp01
Whatisbigdata 130718170809-phpapp01
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big data
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
 
Разработка торгового робота
Разработка торгового роботаРазработка торгового робота
Разработка торгового робота
 
Решение логистической задачи от компании Unilever
Решение логистической задачи от компании UnileverРешение логистической задачи от компании Unilever
Решение логистической задачи от компании Unilever
 
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
Changellenge Газпром.Нефть, разработка интеллектуального месторождения.
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 
Внедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения РоссииВнедрение технологии SAP HANA в медицинские учреждения России
Внедрение технологии SAP HANA в медицинские учреждения России
 
Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"Решение технологического кейса для компании "Аэрофлот"
Решение технологического кейса для компании "Аэрофлот"
 
Titan: The Rise of Big Graph Data
Titan: The Rise of Big Graph DataTitan: The Rise of Big Graph Data
Titan: The Rise of Big Graph Data
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
Топ-5 сайтов для поиска работы
Топ-5 сайтов для поиска работыТоп-5 сайтов для поиска работы
Топ-5 сайтов для поиска работы
 
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
Digital Branding Summit 15-16 october 2014. Александр Филатов (Розничная сеть...
 
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry BodineSDNC13 -Day1- The Danger of Big Data by Kerry Bodine
SDNC13 -Day1- The Danger of Big Data by Kerry Bodine
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
 

Similar to Что такое Big Data ?

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
Andrey Kazakevich
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
Ipo Board
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
Собака Павлова
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
Vladimir Krylov
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
Newprolab
 
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиDigital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиBBDO Group
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
Sergey Gorshkov
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколения
Альбина Минуллина
 
ит тренды Gartner
ит тренды Gartnerит тренды Gartner
ит тренды GartnerExpolink
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
Yuri Yashkin
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
Olena Sukhina
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
Expert and Consulting (EnC)
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
Evgeniy Pavlovskiy
 
Практическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесеПрактическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесе
Anton Vokrug
 
пошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделіпошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделі
Mary Prokhorova
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
BranchMarketing
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
Marina Payvina
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
Elizaveta Alekseeva
 
BI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, МакаровBI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, Макаров
Stanislav Makarov
 
Отчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТОтчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТ
HEOTEX
 

Similar to Что такое Big Data ? (20)

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
 
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентамиDigital Lab: Big Data: земля обетованная в управлении отношений с клиентами
Digital Lab: Big Data: земля обетованная в управлении отношений с клиентами
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколения
 
ит тренды Gartner
ит тренды Gartnerит тренды Gartner
ит тренды Gartner
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
 
перспективные технологии
перспективные технологииперспективные технологии
перспективные технологии
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Практическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесеПрактическое использование «больших данных» в бизнесе
Практическое использование «больших данных» в бизнесе
 
пошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделіпошук та-валідація-бізнес-моделі
пошук та-валідація-бізнес-моделі
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
BI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, МакаровBI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, Макаров
 
Отчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТОтчёт РУССОФТ по ИТ
Отчёт РУССОФТ по ИТ
 

Что такое Big Data ?

  • 1. BIG DATA Революция в области хранения и обработки данных
  • 2. 2 История появления термина BIG DATA  Клиффорд Линч, редактор журнала Nature, в 2008 году впервые упомянул о термине BIG DATA в специальном номере журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка «от количества к качеству»  В 2009 году термин широко распространился в деловой прессе, а к 2010 году относят появление первых продуктов и решений, относящихся исключительно и непосредственно к проблеме обработки больших данных. К 2011 году большинство крупнейших поставщиков информационных технологий для организаций в своих деловых стратегиях используют понятие о больших данных, в том числе IBM, Oracle, Microsoft, Hewlett-Packard, EMC, а основные аналитики рынка информационных технологий посвящают концепции выделенные  В 2011 году Gartner отмечает большие данные как тренд номер два в информационно-технологической инфраструктуре (после виртуализации и как более существенный, чем энергосбережение и мониторинг). Прогнозируется, что внедрение технологий больших данных наибольшее влияние окажет на информационные технологии в производстве ,здравоохранении, торговле, государственном управлении, а также в сферах и отраслях, где регистрируются индивидуальные перемещения ресурсов
  • 3. 3 Что же такое BIG DATA? Группа технологий и методов производительной обработки динамически растущих объемов данных( структурированных и неструктурированных) в распределенных информационных системах, обеспечивающих организацию качественно новой полезной информацией Big Data — это наборы данных такого объема, что традиционные инструменты не способны осуществлять их захват, управление и обработку за приемлемое для практики время. Технология Big Data предоставляет услуги, помогающие раскрыть коммерческий потенциал мегамассивов данных за счет поиска ценных закономерностей и фактов путем объединения и анализа больших объемов данных.
  • 4. 4 Volume Variety Velocity Volume Variety Velocity Реально большие объемы данных в физическом смысле Слабо структурированные и разнородные данные Необходимость высокой скорости обработки данных 1Gb, 1Tb, 1Pb, 1EXb, 1Zb DB, XML, Logs, Texts, Video, Audio
  • 5. 5 Объем данных корпораций по отраслям в 2012г 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Ценные бумаги Банкинг Медицина Энергетика Правительство Страхование Коммуникации и медиа Энергетика Объем данных в Тб Источник данных: McKinsey
  • 6. 6 Интернет и мобильные технологии Twitter 175 млн твит сообщений в день Facebook 300 млн фото загружаемых ежедневно Google 24PB ежедневно AT&T передает 30Pb в день Walmart более 1 млн продаж в час Объем данных, переданных/полученных на мобильные устройства, — 1,3 эксабайт
  • 7. 7 Основные технологии анализа в BigData  MapReduce - это фреймворк для вычисления некоторых наборов распределенных задач с использованием большого количества компьютеров (называемых «нодами»), образующих кластер, разработанный компанией Google.  Hadoop - набор утилит, библиотек и программный каркас для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов.  NoSql - ряд подходов, направленных на реализацию хранилищ баз данных, имеющих существенные отличия от моделей, используемых в традиционных реляционных СУБД с доступом к данным средствами языка SQL. Применяется к базам данных, в которых делается попытка решить проблемы масштабируемости и доступности за счёт атомарности и согласованности данных
  • 9. 9 Методы анализа используемые в BigData Уникальность подхода больших данных заключается в агрегировании огромного объема неструктурированной информации из разных источников в одном месте.  Классификация (методы категоризации новых данных на основе принципов, ранее применённых к уже наличествующим данным)  Кластерный анализ  Регрессионный анализ  Рекомендательные системы  Искусственные нейронные сети, в том числе генетические алгоритмы;
  • 10. 10 Самые продвинутые отрасли BigData 01 Маркетинг 03 Сегментация рынка Моделирование приобретения и оттока клиентов Рекомендательные системы Анализ соц.медиа 02 Финансы Медицина Детектирование аномального поведения Анализ кредитных рисков Страховое моделирование Генетический анализ Анализ клинических испытаний Экспертные системы
  • 11. 11 Value для бизнеса Value Учитывая масштабность, перед бизнесом встала задача не только выбора адекватного инструментария по анализу информации, но и построения оптимальной вычислительной инфраструктуры, которая была бы эффективной и не очень дорогой. .Действительно, большие хранилища данных в сфере финансовых услуг, телекоммуникаций, розничной торговли и государственных организаций существовали на протяжении многих лет. Применялись решения по обработке данных в реальном времени для управления бизнес-процессами, например в торговле, а также высокопроизводительные вычислительные системы для научных исследований. Различие их состоит в том, что те системы, которые раньше решали отдельные проблемы бизнеса на больших предприятиях, сегодня становятся основой осуществления их бизнес-стратегии. Технология Big Data позволяет уменьшить расходы на ИТ-инфраструктуру и ПО, сократить затраты на рабочую силу за счет более эффективных методов интеграции данных, управления, анализа и выработки решения; обеспечить увеличение дохода и прибыли путем новых или более эффективных способов ведения бизнеса. То есть на современном этапе те же самые технологии представляют качественно новую ценность для предприятия
  • 12. 12 Кейс «Как компания может узнать о ваших секретах?» Магазин Target и беременная девочка, США 2012г
  • 13. 13 Спасибо за внимание! Алексеев Михаил alekseev.miha@gmail.com Linkedin Facebook Vk

Editor's Notes

  1. В мире больших данных мы можем проанализировать огромное количество данных, а в некоторых случаях – обработать ВСЕ данные, касающиеся того или иного явления, а не полагаться на случайные выборки.
  2. В мире больших данных мы можем проанализировать огромное количество данных, а в некоторых случаях – обработать ВСЕ данные, касающиеся того или иного явления, а не полагаться на случайные выборки.
  3. Два года назад огромная сеть магазинов Target стала использовать машинное обучение при взаимодействии с покупателями. В качестве обучающей выборки использовались данные, накопленные компанией за несколько лет. В качестве маркеров конкретных покупателей использовались банковские и именные скидочные карты. Алгоритмы проанализировали, как и в каких условиях менялись предпочтения покупателей и делали прогнозы. А на основе этих прогнозов покупателям делались всевозможные специальные предложения. Весной 2012 года разразился скандал, когда отец двенадцатилетней школьницы пожаловался, что его дочери присылают буклеты с предложениями для беременных. Когда сеть Target уже приготовилась признавать ошибку и извиняться перед обиженными покупателями, выяснилось, что девочка действительно была беременна, хотя ни она, ни ее отец на момент жалобы не знали об этом. Алгоритм отловил изменения в поведении покупательницы, характерные для беременных женщин.
  4. Два года назад огромная сеть магазинов Target стала использовать машинное обучение при взаимодействии с покупателями. В качестве обучающей выборки использовались данные, накопленные компанией за несколько лет. В качестве маркеров конкретных покупателей использовались банковские и именные скидочные карты. Алгоритмы проанализировали, как и в каких условиях менялись предпочтения покупателей и делали прогнозы. А на основе этих прогнозов покупателям делались всевозможные специальные предложения. Весной 2012 года разразился скандал, когда отец двенадцатилетней школьницы пожаловался, что его дочери присылают буклеты с предложениями для беременных. Когда сеть Target уже приготовилась признавать ошибку и извиняться перед обиженными покупателями, выяснилось, что девочка действительно была беременна, хотя ни она, ни ее отец на момент жалобы не знали об этом. Алгоритм отловил изменения в поведении покупательницы, характерные для беременных женщин.