SlideShare a Scribd company logo
Аппаратное ускорение аналитики в
больших данных
Анатолий Левенчук
BigData
15 сентября 2017г.
[Тут обычно делают нудный рассказ, почему
для аналитики больших данных нужна
большая скорость вычислений]
• Во-первых, …
• Во-вторых, …
• …
• Лучше быть здоровым и богатым, чем
бедным и больным.
С быстрыми (x1000) и
дешёвыми (x40)
вычислениями
невозможное становится
возможным.
2
Типичный график сравнения производительности
с участием аппаратного ускорения
https://www.mapd.com/
Платформенный стек аналитики больших данных
3
Платформа приложений
АНАЛИТИКА БОЛЬШИХ ДАННЫХ ТУТ
Аналитические фреймворки
СУБД
CPU Оптимизаторы (драйверы)
GPU/ FPGA
Устройства
GPU/FPGA
Подрывноеобепечение
Подрывнойспрос
Спасибо играющим в компьютерные игры за их подрывной
спрос, который дал нам такое подрывное обеспечение как GPU
COMMODITY
Кто работает с FPGA? Реляционщики!
Ryft
Netezza
Swarm64
4
Scalable Data Accelerator (SDA)
PCIe card: от x10 на
IBM PureData System for Analytics
Ryft One, Ryft Cloud --up to x200
IBM PureData System for Analytics
Технология Netezza (c 1999 года): The appliance integrates through
standard ODBC, JDBC and OLE DB interfaces. FPGAs are used for data
decompression, data filtering and early SQL projections and restrictions.
5https://www.ibm.com/us-en/marketplace/puredata-system-for-analytics/
Неожиданность: GPU  GPGPU
6
• 2009 – Fermi architecture у NVIDIA, CUDA-архитектура
• 2011 – придумали ускорять deep learning на CUDA
• 2012 – придумали ускорять базы данных на CUDA
• 2017 – Volta architecture: 5120 CUDA Cores, 16GB HBM2@900GB/s, 300GB/s NVLink
• Бонус: интеграция с IBM Power8 (OpenPOWER): brings x3 faster moving data
s
TESLA V100
Где данные?!
https://db-engines.com/en/ranking_categories 7
Интересны:
• реляционные (80% всего)
• графовые (700% роста за 5 лет)
GPU и реляционные базы данных
MapD
PG-Strom
Kinetica
SQReam
Brytlyt
BlazingDB 8
In-database analytics:
• Deep learning in-database: уже есть!
Очень быстрые:
• x300 по сравнению с «традиционными»
• x50 по сравнению с in-memory
• x5 по сравнению с кластерами
https://www.kinetica.com/blog/tensorflow-distributed-deep-learning/
Графовые базы: становятся уместны
9
Графовые базы:
• Лучше реляционных, но
• Плохо масштабируются на CPU
• Медленней реляционных x10
С GPU они:
• быстрее CPU решений x700-x1800
• x40 дешевле на 1G traverse
Edges/sec
https://www.blazegraph.com
Худшие продукты на рынке?
• We verified these technologies can provide faster
queries with cheaper infrastructures than usual CPU-
based alternatives. Specially for typical “Select …
where … group by…” clauses with variable filters and
aggregations. However funcionality is actually quite
limited and not enough robust for our requirements.
And we’ve got significant problems with complex
queries.
https://labs.beeva.com/gpus-and-analytical-databases-the-beginning-of-a-beautiful-friendship-8f5e590601c5
10
Дилемма инноватора: бойтесь худших продуктов!
(Clayton Christensen из Гарварда)
11
Х
а
р
а
к
т
е
р
и
с
т
и
к
и
Время
Характеристики
лучших продуктов
На рынке
Характеристики
худших продуктов
на рынке
http://web.mit.edu/6.933/www/Fall2000/teradyne/clay.html
Спасибо за внимание
Анатолий Левенчук,
http://ailev.ru
ailev@asmp.msk.su
12

More Related Content

Viewers also liked

А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятий
Anatoly Levenchuk
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурацией
Anatoly Levenchuk
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнес
Anatoly Levenchuk
 
Future of Engineering
Future of EngineeringFuture of Engineering
Future of Engineering
Anatoly Levenchuk
 
А.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образованияА.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образования
Anatoly Levenchuk
 
Организационная инженерия
Организационная инженерияОрганизационная инженерия
Организационная инженерияAnatoly Levenchuk
 
Безлюдные организации и их проблемы
Безлюдные организации и их проблемыБезлюдные организации и их проблемы
Безлюдные организации и их проблемы
Anatoly Levenchuk
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курса
Anatoly Levenchuk
 

Viewers also liked (8)

А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятий
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурацией
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнес
 
Future of Engineering
Future of EngineeringFuture of Engineering
Future of Engineering
 
А.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образованияА.Левенчук -- автоматизация образования
А.Левенчук -- автоматизация образования
 
Организационная инженерия
Организационная инженерияОрганизационная инженерия
Организационная инженерия
 
Безлюдные организации и их проблемы
Безлюдные организации и их проблемыБезлюдные организации и их проблемы
Безлюдные организации и их проблемы
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курса
 

Similar to А.Левенчук -- аппаратное ускорение аналитики в BigData

Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
Microsoft
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
IBS
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
Ontico
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learning
Skolkovo Robotics Center
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Vsevolod Shabad
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Vsevolod Shabad
 
DataCore case studies
DataCore case studies DataCore case studies
DataCore case studies korn_aaf
 
Обзор HP Vertica
Обзор HP VerticaОбзор HP Vertica
Обзор HP Vertica
i-Teco & Vitte Consulting
 
Гиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlexГиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlex
Cisco Russia
 
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 Платформа для бизнес-приложений SAP HANA на основе решений Cisco Платформа для бизнес-приложений SAP HANA на основе решений Cisco
Платформа для бизнес-приложений SAP HANA на основе решений CiscoCisco Russia
 
Etegro, Сучков Игорь
Etegro, Сучков ИгорьEtegro, Сучков Игорь
Etegro, Сучков ИгорьDiana Mokhina
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеров
Vsevolod Shabad
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрение
Andrei Nikolaenko
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
MATLAB
 
навигатор новые решения в новых условиях
навигатор новые решения в новых условияхнавигатор новые решения в новых условиях
навигатор новые решения в новых условиях
Nick Turunov
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреDEPO Computers
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellClouds NN
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
DEPO Computers
 
С. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийС. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийExpolink
 
Гиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVityГиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVity
КРОК
 

Similar to А.Левенчук -- аппаратное ускорение аналитики в BigData (20)

Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learning
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
 
DataCore case studies
DataCore case studies DataCore case studies
DataCore case studies
 
Обзор HP Vertica
Обзор HP VerticaОбзор HP Vertica
Обзор HP Vertica
 
Гиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlexГиперконвергентное решение Cisco HyperFlex
Гиперконвергентное решение Cisco HyperFlex
 
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 Платформа для бизнес-приложений SAP HANA на основе решений Cisco Платформа для бизнес-приложений SAP HANA на основе решений Cisco
Платформа для бизнес-приложений SAP HANA на основе решений Cisco
 
Etegro, Сучков Игорь
Etegro, Сучков ИгорьEtegro, Сучков Игорь
Etegro, Сучков Игорь
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеров
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрение
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
 
навигатор новые решения в новых условиях
навигатор новые решения в новых условияхнавигатор новые решения в новых условиях
навигатор новые решения в новых условиях
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
 
С. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложенийС. Перроте (Q Logic) Ускорение работы приложений
С. Перроте (Q Logic) Ускорение работы приложений
 
Гиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVityГиперконвергентные решения SimpliVity
Гиперконвергентные решения SimpliVity
 

More from Anatoly Levenchuk

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)
Anatoly Levenchuk
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM Institute
Anatoly Levenchuk
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышление
Anatoly Levenchuk
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личности
Anatoly Levenchuk
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерство
Anatoly Levenchuk
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchi
Anatoly Levenchuk
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерии
Anatoly Levenchuk
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышление
Anatoly Levenchuk
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личности
Anatoly Levenchuk
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организации
Anatoly Levenchuk
 
Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)
Anatoly Levenchuk
 
И.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAMИ.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAM
Anatoly Levenchuk
 
М.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышлениеМ.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышление
Anatoly Levenchuk
 
А.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышленияА.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышления
Anatoly Levenchuk
 
А.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронетА.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронет
Anatoly Levenchuk
 
Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling
Anatoly Levenchuk
 
А.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозговА.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозгов
Anatoly Levenchuk
 

More from Anatoly Levenchuk (17)

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM Institute
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышление
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личности
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерство
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchi
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерии
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышление
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личности
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организации
 
Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)
 
И.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAMИ.Беспальчук -- оценка архитектуры по ATAM
И.Беспальчук -- оценка архитектуры по ATAM
 
М.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышлениеМ.Акоев -- системная динамика и мышление
М.Акоев -- системная динамика и мышление
 
А.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышленияА.Левенчук -- преподавание системного мышления
А.Левенчук -- преподавание системного мышления
 
А.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронетА.Левенчук -- privacy и нейронет
А.Левенчук -- privacy и нейронет
 
Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling Ali Mousavi -- Event modeling
Ali Mousavi -- Event modeling
 
А.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозговА.Левенчук -- тренажёр клуба одиноких мозгов
А.Левенчук -- тренажёр клуба одиноких мозгов
 

А.Левенчук -- аппаратное ускорение аналитики в BigData

  • 1. Аппаратное ускорение аналитики в больших данных Анатолий Левенчук BigData 15 сентября 2017г.
  • 2. [Тут обычно делают нудный рассказ, почему для аналитики больших данных нужна большая скорость вычислений] • Во-первых, … • Во-вторых, … • … • Лучше быть здоровым и богатым, чем бедным и больным. С быстрыми (x1000) и дешёвыми (x40) вычислениями невозможное становится возможным. 2 Типичный график сравнения производительности с участием аппаратного ускорения https://www.mapd.com/
  • 3. Платформенный стек аналитики больших данных 3 Платформа приложений АНАЛИТИКА БОЛЬШИХ ДАННЫХ ТУТ Аналитические фреймворки СУБД CPU Оптимизаторы (драйверы) GPU/ FPGA Устройства GPU/FPGA Подрывноеобепечение Подрывнойспрос Спасибо играющим в компьютерные игры за их подрывной спрос, который дал нам такое подрывное обеспечение как GPU COMMODITY
  • 4. Кто работает с FPGA? Реляционщики! Ryft Netezza Swarm64 4 Scalable Data Accelerator (SDA) PCIe card: от x10 на IBM PureData System for Analytics Ryft One, Ryft Cloud --up to x200
  • 5. IBM PureData System for Analytics Технология Netezza (c 1999 года): The appliance integrates through standard ODBC, JDBC and OLE DB interfaces. FPGAs are used for data decompression, data filtering and early SQL projections and restrictions. 5https://www.ibm.com/us-en/marketplace/puredata-system-for-analytics/
  • 6. Неожиданность: GPU  GPGPU 6 • 2009 – Fermi architecture у NVIDIA, CUDA-архитектура • 2011 – придумали ускорять deep learning на CUDA • 2012 – придумали ускорять базы данных на CUDA • 2017 – Volta architecture: 5120 CUDA Cores, 16GB HBM2@900GB/s, 300GB/s NVLink • Бонус: интеграция с IBM Power8 (OpenPOWER): brings x3 faster moving data s TESLA V100
  • 7. Где данные?! https://db-engines.com/en/ranking_categories 7 Интересны: • реляционные (80% всего) • графовые (700% роста за 5 лет)
  • 8. GPU и реляционные базы данных MapD PG-Strom Kinetica SQReam Brytlyt BlazingDB 8 In-database analytics: • Deep learning in-database: уже есть! Очень быстрые: • x300 по сравнению с «традиционными» • x50 по сравнению с in-memory • x5 по сравнению с кластерами https://www.kinetica.com/blog/tensorflow-distributed-deep-learning/
  • 9. Графовые базы: становятся уместны 9 Графовые базы: • Лучше реляционных, но • Плохо масштабируются на CPU • Медленней реляционных x10 С GPU они: • быстрее CPU решений x700-x1800 • x40 дешевле на 1G traverse Edges/sec https://www.blazegraph.com
  • 10. Худшие продукты на рынке? • We verified these technologies can provide faster queries with cheaper infrastructures than usual CPU- based alternatives. Specially for typical “Select … where … group by…” clauses with variable filters and aggregations. However funcionality is actually quite limited and not enough robust for our requirements. And we’ve got significant problems with complex queries. https://labs.beeva.com/gpus-and-analytical-databases-the-beginning-of-a-beautiful-friendship-8f5e590601c5 10
  • 11. Дилемма инноватора: бойтесь худших продуктов! (Clayton Christensen из Гарварда) 11 Х а р а к т е р и с т и к и Время Характеристики лучших продуктов На рынке Характеристики худших продуктов на рынке http://web.mit.edu/6.933/www/Fall2000/teradyne/clay.html
  • 12. Спасибо за внимание Анатолий Левенчук, http://ailev.ru ailev@asmp.msk.su 12