SlideShare a Scribd company logo
1 of 25
© MIRANTIS 2013 PAGE© MIRANTIS 2013
Sahara - Hadoop on
OpenStack
Александр Игнатов
© MIRANTIS 2013 PAGE
Содержание
• Обзор проекта
• Архитектура и ключевые возможности
• Варианты использования
© MIRANTIS 2013 PAGE
OpenStack Data Processing -
“Sahara”
Предназначен для обеспечения
масштабируемого стека обработки данных и
связанных с ними интерфейсами управления.
• Ключевые возможности:
• Запуск и управление Hadoop кластерами на
OpenStack
• Интеграция с различными Hadoop дистрибутивами
и инструментами
• Запуск и управление Hadoop задачами
© MIRANTIS 2013 PAGE
Текущее состояние проекта
• Incubated в релизе Icehouse (17 Апр)
• Integrated в релизе Juno и последующих
релизах
• Входит в состав Mirantis OpenStack
• Покрытие OpenStack Tempest тестами
• Тестирование на инфраструктуре сторонних
компаний
© MIRANTIS 2013 PAGE
Текущее состояние проекта
(прод.)
• Основные компании-участники
• Mirantis
• Red Hat
• Hortonworks
• Поддерживаемые Hadoop дистрибутивы
• Vanilla Apache Hadoop - v1 & v2
• Hortonworks Data Platform - v1 & v2
• Cloudera и Spark в разработке
© MIRANTIS 2013 PAGE
Архитектура
Python
Sahara
Client
RESTAPI
Horizon
Keystone
Auth
DAL
Nova|Heat|Cinder
Glance
Swift
Sahara
Pages
Hadoop
VM
Vendor Plugins
(Vanilla, HDP, ...)
Hadoop
VM
Hadoop
VM
Hadoop
VM
Provisioning
Engine
Image
Registry
Sahara EDP
© MIRANTIS 2013 PAGE
Основные возможности -
Кластеринг
• Запуск и управление кластерами:
• Шаблоны для конфигурации кластера
• REST API для запуска и управления
• Масштабировние кластера
• Обеспечение надежности HDFS
• Управление расположением HDFS
• Интеграция с Swift
• Управление кластером через Horizon UI
• Механизм плагинов для работы с разными
дистрибутивами Hadoop
© MIRANTIS 2013 PAGE
Топологии кластера
© MIRANTIS 2013 PAGE
Шаблон NodeGroup
Определяет:
• Hadoop процессы
• Конфигурации процессов
• Тип расположения HDFS
• OpenStack ресурсы
© MIRANTIS 2013 PAGE
Шаблон кластера
Определяет:
• Конфигурацию кластера
• Топологию кластера
• Кол-во виртуальных
машин в каждой группе
© MIRANTIS 2013 PAGE
Надежность HDFS в облаке
Гипервизор 1
DN DN
D
N
DN DN
D
N
Блок данных
Гипервизор 2
© MIRANTIS 2013 PAGE
Надежность HDFS: anti-
affinity
DN
Гипервизор 1
TT | DN DN
Гипервизор 3
DN
Cluster A
Cluster B
DN
DN
Гипервизор 2
© MIRANTIS 2013 PAGE
Надежность HDFS:
hypervisor-awareness
DNDN DNDN DNDN
Блок данных
HDFS
Гипервизор 1 Гипервизор 2 Гипервизор 3
© MIRANTIS 2013 PAGE
Надежность HDFS: Swift
интеграция
Swift
Hadoop
Job #1
HDFS
Hadoop
Job #2
...
Hadoop
Job #N
© MIRANTIS 2013 PAGE
U
s
e
r
Плагины
1.1 дай параметры
3.1 добавь/удали
ноды
2 запустить кластер
2.2 запусти кластер
1 запрос параметров
плагина
S
a
h
a
r
a
П
л
а
г
и
н
2.1 проверь параметры
кластера
3 добавить/удалить
ноды
2.3 конфигурация
2.4 запуск сервисов
2.5 запуск сервисов
3.2 конфигурация
3.3 запуск сервисов
© MIRANTIS 2013 PAGE
Основные возможности - EDP
• Elastic Data Processing - API для
выполнения MapReduce задач (аналог AWS
EMR)
• Источники данных: Swift, HDFS, Ceph*
• Типы задач: Jar, Pig, Hive
• Oozie для управления MapReduce
задачами
• Поддержка Hadoop 1 & 2 в EDP
• Выполнение задач на временных кластерах
© MIRANTIS 2013 PAGE
?
EDP. Шаг 1 - DataSources
swift://some_container/INPUT
swift://some_container/OUTPUT
Swift
Sahara EDP
INPUT OUTPUT
© MIRANTIS 2013 PAGE
EDP. Шаг 2 - Job Binaries
Swift
Sahara DB
1. Pig, Hive скрипты
2. Исполняемые Jar файлы
3. Подключаемые библиотеки
Sahara EDP
swift://some_container/script.pig
sahara-db://mapreduce.jar
© MIRANTIS 2013 PAGE
EDP. Шаг 3 - Job Execution
Sahara
Swift
INPUT
OUTPUT
DB: Jar, Pig
EDP
Jar, Pig
JobTracker
VM
Oozie
VM
Hadoop
VM
Hadoop
VM
Hadoop
VM
1. Параметры MR задач
2. URL в HDFS до
исполняемых файлов
и библиотек
3. URL для INPUT и
OUTPUT
4. Учетные данные
Data Processing
© MIRANTIS 2013 PAGE
Основные возможности - интеграция с
OpenStack
• Интеграция с Neutron и Nova-Network
• Keystone trusts для асинхронных операций
• Python клиент и CLI
• Интеграция с другими компонентами:
• Heat
• DevStack
• Tempest
© MIRANTIS 2013 PAGE
Варианты использования
Dev и QA
• Быстрое разворачивание кластера по требованию
• Увеличение гибкости и скорости инноваций
• Управляемый доступ к данным в “продакшене”
© MIRANTIS 2013 PAGE
Варианты использования
(продложение)
Analytics Use Cases
• Упрощенное выполнение задач - сложность поднятия
и управления кластером скрыта “под капотом”
• Выпоняемые Hadoop задачи требуют значительных
ресурсов только для короткого периода времени
• Использование свободных мощностей IaaS для
Hadoop задач
© MIRANTIS 2013 PAGE
Варианты использования
(продолжение)
Administrators Use Cases
• Единая точка контроля за инфраструктурой
• Возможность выбора диструбитвов от разных
вендоров для одних и тех же задач
• Интеграция со сторонними инструметами:
o Ambari от Apache/HortonWorks
o Cloudera Management Console
© MIRANTIS 2013 PAGE
Планы на Juno релиз
• Различные улучшения EDP
• новые типы задач
• новые источники данных
• Новые плагины (Cloudera, Spark)
• Поддержка Ceph
• Установка на голое железо
© MIRANTIS 2013 PAGE
Q&A

More Related Content

Viewers also liked

introduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pigintroduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and PigRicardo Varela
 
Practical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigPractical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigMilind Bhandarkar
 
HIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopHIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopZheng Shao
 
Hive Quick Start Tutorial
Hive Quick Start TutorialHive Quick Start Tutorial
Hive Quick Start TutorialCarl Steinbach
 
Integration of Hive and HBase
Integration of Hive and HBaseIntegration of Hive and HBase
Integration of Hive and HBaseHortonworks
 
Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Kevin Weil
 
Introduction To Map Reduce
Introduction To Map ReduceIntroduction To Map Reduce
Introduction To Map Reducerantav
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with HadoopPhilippe Julio
 

Viewers also liked (9)

introduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pigintroduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pig
 
Practical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigPractical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & Pig
 
HIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopHIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on Hadoop
 
Hive Quick Start Tutorial
Hive Quick Start TutorialHive Quick Start Tutorial
Hive Quick Start Tutorial
 
Integration of Hive and HBase
Integration of Hive and HBaseIntegration of Hive and HBase
Integration of Hive and HBase
 
Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)
 
Introduction To Map Reduce
Introduction To Map ReduceIntroduction To Map Reduce
Introduction To Map Reduce
 
Big data and Hadoop
Big data and HadoopBig data and Hadoop
Big data and Hadoop
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with Hadoop
 

Similar to Hadoop on OpenStack

Лекция 2. Основы Hadoop
Лекция 2. Основы HadoopЛекция 2. Основы Hadoop
Лекция 2. Основы HadoopTechnopark
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi octantishmanti
 
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...it-people
 
Mirantis OpenStack. Обзор
Mirantis OpenStack. ОбзорMirantis OpenStack. Обзор
Mirantis OpenStack. ОбзорMirantis IT Russia
 
Enabling Docker Applications on OpenStack (using Murano)
Enabling Docker Applications on OpenStack (using Murano) Enabling Docker Applications on OpenStack (using Murano)
Enabling Docker Applications on OpenStack (using Murano) Mirantis IT Russia
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big DataAndrey Akulov
 
Технологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхТехнологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхAndrey Akulov
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data propositionAndrey Akulov
 
Платформа Apache Hadoop
Платформа Apache HadoopПлатформа Apache Hadoop
Платформа Apache HadoopDotNetConf
 
Drupal в облаке - Владимир Юнев
Drupal в облаке - Владимир ЮневDrupal в облаке - Владимир Юнев
Drupal в облаке - Владимир ЮневDrupalCamp MSK
 
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников)
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников) Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников)
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников) Olga Lavrentieva
 
Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Alexey Zinoviev
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016rusbase
 
Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Евгений Плакса
 
Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Andrey Akulov
 
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...Dmitry Lazarenko
 
Git, как инструмент управления веб-контентом
Git, как инструмент управления веб-контентомGit, как инструмент управления веб-контентом
Git, как инструмент управления веб-контентомAlex Musayev
 
Net core and linux in production
Net core and linux in productionNet core and linux in production
Net core and linux in productionAnatoly Popov
 
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаков
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаковIBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаков
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаковMaxim Zinal
 
04.Службы Azure - подробнее
04.Службы Azure - подробнее04.Службы Azure - подробнее
04.Службы Azure - подробнееAlexander Babich
 

Similar to Hadoop on OpenStack (20)

Лекция 2. Основы Hadoop
Лекция 2. Основы HadoopЛекция 2. Основы Hadoop
Лекция 2. Основы Hadoop
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
 
Mirantis OpenStack. Обзор
Mirantis OpenStack. ОбзорMirantis OpenStack. Обзор
Mirantis OpenStack. Обзор
 
Enabling Docker Applications on OpenStack (using Murano)
Enabling Docker Applications on OpenStack (using Murano) Enabling Docker Applications on OpenStack (using Murano)
Enabling Docker Applications on OpenStack (using Murano)
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big Data
 
Технологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхТехнологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших Данных
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data proposition
 
Платформа Apache Hadoop
Платформа Apache HadoopПлатформа Apache Hadoop
Платформа Apache Hadoop
 
Drupal в облаке - Владимир Юнев
Drupal в облаке - Владимир ЮневDrupal в облаке - Владимир Юнев
Drupal в облаке - Владимир Юнев
 
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников)
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников) Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников)
Cloud Foundry − облачная OpenSource-платформа на Ruby (Алексей Ключников)
 
Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
 
Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3
 
Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014
 
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...
Высокая доступность приложений в гибридном облаке на базе Jelastic и Azure Tr...
 
Git, как инструмент управления веб-контентом
Git, как инструмент управления веб-контентомGit, как инструмент управления веб-контентом
Git, как инструмент управления веб-контентом
 
Net core and linux in production
Net core and linux in productionNet core and linux in production
Net core and linux in production
 
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаков
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаковIBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаков
IBM Cloudant и Apache CouchDB: NoSQL базы данных эпохи облаков
 
04.Службы Azure - подробнее
04.Службы Azure - подробнее04.Службы Azure - подробнее
04.Службы Azure - подробнее
 

More from Yandex

Предсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksПредсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksYandex
 
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Yandex
 
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаСтруктурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаYandex
 
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаПредставление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаYandex
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Yandex
 
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Yandex
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Yandex
 
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Yandex
 
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Yandex
 
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Yandex
 
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Yandex
 
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Yandex
 
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровКак защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровYandex
 
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Yandex
 
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Yandex
 
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Yandex
 
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Yandex
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Yandex
 
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Yandex
 
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Yandex
 

More from Yandex (20)

Предсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksПредсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of Tanks
 
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
 
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаСтруктурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
 
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаПредставление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
 
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
 
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
 
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
 
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
 
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
 
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
 
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровКак защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
 
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
 
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
 
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
 
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
 
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
 
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
 

Hadoop on OpenStack

  • 1. © MIRANTIS 2013 PAGE© MIRANTIS 2013 Sahara - Hadoop on OpenStack Александр Игнатов
  • 2. © MIRANTIS 2013 PAGE Содержание • Обзор проекта • Архитектура и ключевые возможности • Варианты использования
  • 3. © MIRANTIS 2013 PAGE OpenStack Data Processing - “Sahara” Предназначен для обеспечения масштабируемого стека обработки данных и связанных с ними интерфейсами управления. • Ключевые возможности: • Запуск и управление Hadoop кластерами на OpenStack • Интеграция с различными Hadoop дистрибутивами и инструментами • Запуск и управление Hadoop задачами
  • 4. © MIRANTIS 2013 PAGE Текущее состояние проекта • Incubated в релизе Icehouse (17 Апр) • Integrated в релизе Juno и последующих релизах • Входит в состав Mirantis OpenStack • Покрытие OpenStack Tempest тестами • Тестирование на инфраструктуре сторонних компаний
  • 5. © MIRANTIS 2013 PAGE Текущее состояние проекта (прод.) • Основные компании-участники • Mirantis • Red Hat • Hortonworks • Поддерживаемые Hadoop дистрибутивы • Vanilla Apache Hadoop - v1 & v2 • Hortonworks Data Platform - v1 & v2 • Cloudera и Spark в разработке
  • 6. © MIRANTIS 2013 PAGE Архитектура Python Sahara Client RESTAPI Horizon Keystone Auth DAL Nova|Heat|Cinder Glance Swift Sahara Pages Hadoop VM Vendor Plugins (Vanilla, HDP, ...) Hadoop VM Hadoop VM Hadoop VM Provisioning Engine Image Registry Sahara EDP
  • 7. © MIRANTIS 2013 PAGE Основные возможности - Кластеринг • Запуск и управление кластерами: • Шаблоны для конфигурации кластера • REST API для запуска и управления • Масштабировние кластера • Обеспечение надежности HDFS • Управление расположением HDFS • Интеграция с Swift • Управление кластером через Horizon UI • Механизм плагинов для работы с разными дистрибутивами Hadoop
  • 8. © MIRANTIS 2013 PAGE Топологии кластера
  • 9. © MIRANTIS 2013 PAGE Шаблон NodeGroup Определяет: • Hadoop процессы • Конфигурации процессов • Тип расположения HDFS • OpenStack ресурсы
  • 10. © MIRANTIS 2013 PAGE Шаблон кластера Определяет: • Конфигурацию кластера • Топологию кластера • Кол-во виртуальных машин в каждой группе
  • 11. © MIRANTIS 2013 PAGE Надежность HDFS в облаке Гипервизор 1 DN DN D N DN DN D N Блок данных Гипервизор 2
  • 12. © MIRANTIS 2013 PAGE Надежность HDFS: anti- affinity DN Гипервизор 1 TT | DN DN Гипервизор 3 DN Cluster A Cluster B DN DN Гипервизор 2
  • 13. © MIRANTIS 2013 PAGE Надежность HDFS: hypervisor-awareness DNDN DNDN DNDN Блок данных HDFS Гипервизор 1 Гипервизор 2 Гипервизор 3
  • 14. © MIRANTIS 2013 PAGE Надежность HDFS: Swift интеграция Swift Hadoop Job #1 HDFS Hadoop Job #2 ... Hadoop Job #N
  • 15. © MIRANTIS 2013 PAGE U s e r Плагины 1.1 дай параметры 3.1 добавь/удали ноды 2 запустить кластер 2.2 запусти кластер 1 запрос параметров плагина S a h a r a П л а г и н 2.1 проверь параметры кластера 3 добавить/удалить ноды 2.3 конфигурация 2.4 запуск сервисов 2.5 запуск сервисов 3.2 конфигурация 3.3 запуск сервисов
  • 16. © MIRANTIS 2013 PAGE Основные возможности - EDP • Elastic Data Processing - API для выполнения MapReduce задач (аналог AWS EMR) • Источники данных: Swift, HDFS, Ceph* • Типы задач: Jar, Pig, Hive • Oozie для управления MapReduce задачами • Поддержка Hadoop 1 & 2 в EDP • Выполнение задач на временных кластерах
  • 17. © MIRANTIS 2013 PAGE ? EDP. Шаг 1 - DataSources swift://some_container/INPUT swift://some_container/OUTPUT Swift Sahara EDP INPUT OUTPUT
  • 18. © MIRANTIS 2013 PAGE EDP. Шаг 2 - Job Binaries Swift Sahara DB 1. Pig, Hive скрипты 2. Исполняемые Jar файлы 3. Подключаемые библиотеки Sahara EDP swift://some_container/script.pig sahara-db://mapreduce.jar
  • 19. © MIRANTIS 2013 PAGE EDP. Шаг 3 - Job Execution Sahara Swift INPUT OUTPUT DB: Jar, Pig EDP Jar, Pig JobTracker VM Oozie VM Hadoop VM Hadoop VM Hadoop VM 1. Параметры MR задач 2. URL в HDFS до исполняемых файлов и библиотек 3. URL для INPUT и OUTPUT 4. Учетные данные Data Processing
  • 20. © MIRANTIS 2013 PAGE Основные возможности - интеграция с OpenStack • Интеграция с Neutron и Nova-Network • Keystone trusts для асинхронных операций • Python клиент и CLI • Интеграция с другими компонентами: • Heat • DevStack • Tempest
  • 21. © MIRANTIS 2013 PAGE Варианты использования Dev и QA • Быстрое разворачивание кластера по требованию • Увеличение гибкости и скорости инноваций • Управляемый доступ к данным в “продакшене”
  • 22. © MIRANTIS 2013 PAGE Варианты использования (продложение) Analytics Use Cases • Упрощенное выполнение задач - сложность поднятия и управления кластером скрыта “под капотом” • Выпоняемые Hadoop задачи требуют значительных ресурсов только для короткого периода времени • Использование свободных мощностей IaaS для Hadoop задач
  • 23. © MIRANTIS 2013 PAGE Варианты использования (продолжение) Administrators Use Cases • Единая точка контроля за инфраструктурой • Возможность выбора диструбитвов от разных вендоров для одних и тех же задач • Интеграция со сторонними инструметами: o Ambari от Apache/HortonWorks o Cloudera Management Console
  • 24. © MIRANTIS 2013 PAGE Планы на Juno релиз • Различные улучшения EDP • новые типы задач • новые источники данных • Новые плагины (Cloudera, Spark) • Поддержка Ceph • Установка на голое железо
  • 25. © MIRANTIS 2013 PAGE Q&A