2. Data Сenter Design&Deploy Forum
2016 | Moscow
Кукса Юрий
Технический архитектор решений, Cisco Data Center EMEAR
Инфраструктура под
большие данные и
аналитику
3. Data Сenter Design&Deploy Forum 2016 | Moscow
• Большие данные и аналитика – цели и задачи,
история охоты за австралийским долларом
• Инфраструктурные решения Cisco – BiModal IT для
разных аналитик
• От лабораторного Hadoop до платформы
промышленного внедрения.
Agenda
4. Data Сenter Design&Deploy Forum 2016 | Moscow
277x data created by IoE devices vs. end users – source: 2014 Cisco® Global Cloud Index
By 2020, there will be 5200 GB of data for every person on earth – source: 2012 Digital Universe Study conducted by IDC and sponsored by EMC (see:
http://www.computerworld.com/article/2493701/data-center/by-2020--there-will-be-5-200-gb-of-data-for-every-person-on-earth.html)
180 billion mobile app downloads by 2015 – source: 2011 IDC Study: https://www.smaato.com/blog-180billiondownloads/
277X
Data created
by IoE devices
vs. end-user
30M
New devices
connected
every week
180B
Mobile apps
downloaded
in 2015
40%
Of all data will
come from
sensor
data by 2020
5TB+
of data
per person
by 2020
4.2B
Web filtering
blocks per day
Цифровизация и интернет вещей меняет мир.
Лавина данных !
DISRUPTION
5. Data Сenter Design&Deploy Forum 2016 | Moscow
Всяких разных данных .
Traditional Data
Warehouse Big Data Store
Structured Data Unstructured and Big Data Data Streaming at the Edge
Real Time
Make a Decision NOW
Short and Long Term “Rear
View Mirror”
Plan for a Business Decision Today
Collect lots of data - Optimized Analysis/Compliance
7. Data Сenter Design&Deploy Forum 2016 | Moscow
Зачем эти данные собирать и хранить ?
А еще, если хотите, чтобы ваш
товар/услуга продавались лучше ваших
конкурентов, нажмите эту кнопку !
8. Data Сenter Design&Deploy Forum 2016 | Moscow
Весь континент – “сафари” на потребителя
Добыча – австралийские
доллары
Охотник-
Woolworths и…
Ограничение:
методы отъема
денег только
законные
9. Data Сenter Design&Deploy Forum 2016 | Moscow
В арсенале охотника
• Данные - IN-STORE
• Данные – OUTSIDE-of-STORE
• Просмотр кабельного
• Активность в социальных сетях
• Транзакционная активность
• Данные полностью анонимные (Privacy)
Без помощников
не обошлось
10. Data Сenter Design&Deploy Forum 2016 | Moscow
Фокус на помощниках
- Признанный лидер в технологии Hadoop
- Имеет собственный MapR Distribution for
Hadoop
- В своей MapR Converged Data Platform
смогли объединить мощь Hadoop / Spark в
хранении и процессинге данных с
открытостью данных по известным
протоколам (NFS)
- Валидирует решения с Cisco
- Лидирует с Cisco
12. Data Сenter Design&Deploy Forum 2016 | Moscow
Hadoop Deployment Issues
• “More than 30% of all support tickets (for Hadoop) are
related to mis-configuration”
• …Customers deploying Hadoop clusters are riddled with the complexity
of deployment and manageability of Hadoop clusters at
scale
• 25% of big data implementations will fail to deliver business
value resulting from performance problems due to
inadequate network infrastructure.
• To make it worse, latent issues with incorrect configuration can
impact application and business performance
13. Data Сenter Design&Deploy Forum 2016 | Moscow
Проверенные, документированные решения с
ISV
Бандлы, оптимизированные под
производительность и емкость – снижение
рисков и совокупной стоимости владения
Масштаб
Унифицированное управление.
Простота {design, order, deploy, service}
Networking
Cisco UCS-II for Big Data
3-е поколение Cisco UCS Common Platform Architecture
Single SKU
Big Data
Bundles UCS 6200 Series
Fabric Interconnects
LAN, SAN,
Management
UCS C220/C240 M4
Servers
UCS C3160
14. Data Сenter Design&Deploy Forum 2016 | Moscow
Cisco – лидер в инфраструктурах,
оптимизированных для больших данных
Industry's best TPCx-HS
performance in ALL
categories
External Benchmarks
Key performance indicators
for Cisco UCS Integrated
Infrastructure for Big Data
IDC
A Leader in Hadoop
Optimized Systems -
Forrester
Forrester
Better Cheaper
1TB 11% 30%
3TB 14% 10%
10TB 28% 3%
30TB 12% 33%
100TB The Best – No
comparison
15. Data Сenter Design&Deploy Forum 2016 | Moscow
Много преимуществ, однако в нашем
случае MapR и Quantium решающим
оказалось:
- Партнерство с MapR
- Производительность UCS-II
- Управляемость – UCS Manager
У нас есть еще истории – читайте
периодику UnleashingIT.com/MapR
UnleashingIT.com/BigData
16. Data Сenter Design&Deploy Forum 2016 | Moscow
Аналитика – это не только Hadoop :-)
1. “Быстрая” : Аналитика передового фронта бизнеса в потоке актуальных
данных. MBs/GBs.
2. “Традиционная”: Штабная аналитика с транзакционной БД в центре,
выгрузка в хранилище (ETL ). 10s TB
3. “Big Data” – Штабная аналитика, комбинирующая данные с разных
источников, используя такие технологии, как Hadoop и NoSQL. 100s TBs
или даже PBs.
Все 3 будут будут дополнять друг друга.
Cisco’s Vision – архитектурная поддержка всех 3-х, упрощение
посредством общей инфраструктуры, управления, минимизации
переносов данных (co-location)
16
17. Data Сenter Design&Deploy Forum 2016 | Moscow
Строительные блоки Big Data & Analytics
Data
Management
Data
Integration
Analytics/
Business
Intelligence
Cisco
Integrated
Infrastructure
Cisco Connected Analytics
Collaboration
Analytics
Contact Center
Analytics
Location
Analytics
Network
Analytics
Data
Preparation
TS,ASandCCS
Analytics Ready Infrastructure
IT Operations IT Security Business Analytics
Networking Security
*Resell agreements
In-Memory MPP/NoSQL
Servers & Storage
ETL
Management
Data
Virtualization
*
*
*
Assess
Edge Analytics/Streaming
21. Data Сenter Design&Deploy Forum 2016 | Moscow
DESIGNS
Big Data
Cisco Validated Designs
for all major big data
software distributions
can be found at:
www.cisco.com/go/bigdata
Cisco Validated Design – MapR, Cloudera, Hortonworks,
Splunk, IBM,…
http://www.cisco.com/c/en/us/solutions/enterprise/data-center-designs-cloud-computing/bigdata.html
23. Data Сenter Design&Deploy Forum 2016 | Moscow
UCSD Express
UCS 6200 Series
Fabric Interconnect
UCS Manager
UCS C240 M3/M4
Series Rack Server
OS Profile
RHEL 6.5
NTP
DNS
Clustershell
Ulimit
Swappiness
T.HugePage
Firewall
SElinux
Hadoop
Profile
HDFS
CLDB
YARN
ZooKeeper
Hbase
Hive
Oozie
Hue
Spark
Solr
Sqoop
Impala
Flume
Falcon
Tez
Storm
Cisco UCS
Service Profile
NIC MACs
HBA WWNs
Server UUID
VLAN Assignments
VLAN Tagging
FC Fabrics
Assignments
FC Boot
Parameters
Number of vNICs
Boot order
PXE settings
IPMI Settings
Number of vHBAs
QoS
Call Home
Template
Association
Org & Sub Org
Assoc.
Server Pool
Association
Statistic
Thresholds
BIOS scrub actions
Disk scrub actions
BIOS firmware
Adapter firmware
BMC firmware
RAID settings
Advanced NIC
settings
Serial over LAN
settings
BIOS Settings
Hadoop
Собираем платформу для Hadoop
Programmability, Scalability and Automation