2. Поставщик программных решений в области HPC-виртуализации,
предоставляет облачные вычислительные сервисы для наукоемких областей бизнеса.
3. ПРОБЛЕМА
Построение крупными компаниями собственных вычислительных кластеров.
Аренда в крупных научных суперкомпьютерных центрах.
Облачные HPC сервисы:
Общего назначения: Penguin on demand, Bull, Amazon EC2, Rescale, Nimbix, Cycle Computing.
Ориентированные на задачи биоинформатики: Illumina BaseSpace, DNANexus, iPlant, BGI
EasyGenomics, Knome, Quagen/CLCBio.
Высокая стоимость оборудования и обслуживания.
Трудоёмкость настройки и запуска оборудования.
Разовый доступ нерентабелен из-за длительности предварительных согласований.
Проблема остановки и возобновления задачи.
Проблема переноса настроенного окружения при смене и апгрейде суперкомпьютеров.
Сложность обеспечения конфигураций софта, удобных всем пользователям.
Не все облачные вендоры поддерживают сеть малой латентности.
Все сервисы имеют хостинг за рубежом, что накладывает ограничения по передаче данных.
Непредсказуемые санкционные риски.
Распространенные схемы использования HPC ресурсов обладают рядом существенных как технических, так и юридических
недостатков, ограничивающих применение HPC широким кругом пользователей. Быстроразвивающийся рынок HPC вычислений
требует нового уровня сервиса и упрощения коммерческого использования для вовлечения новых потребителей.
02
Традиционная
схема
Недостатки
4. РЕШЕНИЕ
Автоматизированное предоставление
(on-demand) vSC через веб-интерфейс
для B2B и B2C сегментов:
• Широкий спектр конфигураций vSC
• Оплата только за время счета
• Возможность получить vSC c
предустановленным счетным ПО
• Гибкая система управления vSC
• Cохранение копий vSC, миграция vSC,
сheckpointing (на более позднем
этапе)
HPC облако на инфраструктуре клиента:
• Средняя загрузка мощностей выше
• Простота управления мощностями
• Простое использование счётного ПО:
независимые окружения для
различных задач в рамках одного
физического кластера
• Быстрое авто-развёртывание гибкого и
всегда “чистого” HPC-окружения нужной
мощности
• Эффективный промежуточный уровень
между оборудованием
HPC и потребителями HPC-ресурсов
• Масштабируемость vSC и гибкость в
резервировании времени вычислений
• Быстрое перераспределение HPC
ресурсов
• Простая миграция между физическими
суперкомпьютерами
• Сохранение этапа выполнения задач с
последующим восстановлением
• Удобная платформа для монетизации
стороннего счетного ПО (модель SaaS)
ПРОДУКТ №1:
HPC-ОКРУЖЕНИЕ ПО ЗАПРОСУ
ПРОДУКТ №2:
ЧАСТНОЕ HPC-ОБЛАКО
ВОЗМОЖНОСТИ,
ПОЛУЧАЕМЫЕ КЛИЕНТОМ
03
5. СУПЕРКОМПЬЮТЕРНОЕ
ОБЛАКО
Объединение
вычислительных кластеров в
единую HPC-платформу, доступную
через интернет и управляемую
специальными программными
средствами.
vSC
Виртуальный суперкомпьютер,
который создается на
HPC-платформе, но
в рамках одного гомогенного
вычислительного кластера.
Front-end System
Программный слой для управления
HPC-платформой, процессом
создания vSC и обслуживания
клиентов.
СТРУКТУРА ПРОДУКТА04
СТРУКТУРА ПРОДУКТА
6. Описание архитектуры
• На первом этапе в качестве системы виртуализации была выбрана KVM
(+ LXC на более позднем этапе), удовлетворяющая требованиям,
предъявляемым к виртуальному кластеру.
• Предполагается использовать сеть малой латентности через TCP /IP стек,
что позволит избежать зависимости от аппаратной реализации данной сети
и позволит мигрировать параллельные приложения,
сохранять и восстанавливать их состояния (на более позднем этапе).
Реализуемые технические требования
• Каждая группа пользователей видит только свои виртуальные кластера,
с полным набором необходимого ПО и возможностью гибкой настройки.
• vSC сохраняет среду исполнения программ и пользовательский интерфейс реальных современных
кластеров, что ускорит внедрение и позволит использовать привычное ПО.
• vSC легко масштабируем в сторону увеличения/уменьшения количества узлов.
• vSC привносит минимальные возможные потери производительности
по сравнению с обычным кластером.
Преимущества
• На первом этапе архтектура будет базироваться на Openstack/KVM и Ceph/rbd.
• Виртуализация позволяет реализовать технологию checkpointing
и snapshoting (на более позднем этапе).
• Виртуализация позволяет реализовать возможность миграции
вычислительной среды между физическими суперкомпьютерами.
• Виртуализация позволяет реализовать легкую масштабируемость
вычислительной среды.
АРХИТЕКТУРА ОБЛАКА05
АРХИТЕКТУРА ОБЛАКА
7. FRONT-END SYSTEM
Публичная часть проекта, обеспечивающая
прием запросов от пользователей и
предоставление конечного сервиса пользователю.
FS
ФИЗИЧЕСКИЙ HPC-КЛАСТЕР
Облачная инфраструктура на HPC кластерах
под управлением Openstack и Ceph.HW
ВИРТУАЛЬНЫЙ СУПЕРКОМПЬЮТЕР
Множество вирт. машин (контейнеров),с разделяемым
хранилищем,настроенное как изолированная PC-среда
с планировщиком заданий SGE.
vSC
API
OPENSTACK
& CEPH
Архитектура нашей
облачной
инфраструктуры
позволит с
уверенностью
покрыть более 80%
счетных задач и
приложений
востребованных
рынком.
АРХИТЕКТУРА ОБЛАКА06
АРХИТЕКТУРА ОБЛАКА
8. Разделяемое файловое хранилище Ceph:
- распределенная файловая система;
- почти линейное масштабирование;
- высокая производительность.
Команда HPC Hub
использует лучшие
практики в
построении облачной
инфраструктуры,
добиваясь высокой
эластичности,
надежности и
эффективности
облачных HPC
сервисов.
Безопасность вычислений:
- L2 изоляция сети;
- виртуализация KVM.
Минимальные накладные расходы от виртуализации
за счет тонких настроек (NUMA tunning, vCPU pinning, huge pages).
Надежность хранения данных -
репликация данных на уровне Ceph.
Возможность пользователю передавать образы
вычислительного кластера друг другу.
Архитектура на основе облачного решения OpenStack.
ПРЕИМУЩЕСТВА07
ПРЕИМУЩЕСТВА
9. КОМПАНИЯ
HPC HUB
Penguin on
demand
Bull/eXreme
Factory
Amazon EC2
Rescale
Nimbix
Cycle
Computing
HPC-среда по требованию с
разделяемым файловым хранилищем.
Bare metal HPC инфраструктура.
Нет полного контроля над HPC средой.
HPC-ресурсов на условиях
предоплаты. Профсервис, консалтинг.
В основе виртуализация XEN.
Нет сети низкой латентности.
Инфраструктура AWS, Microsoft
Azure, IBM SoftLayer, Rackspace.
HPC услуги c GPU на основе
собственных дата-центров.
Предоставление различных
HPC-услуг поверх Amazon EC2.
Россия
США
Франция
США
США
США
США
0,08-0,12
>0,12
0,20-0,34
0,08-0,25
0,15-0,35
>0,40
0,25
БРИФ СТРАНА
СТОИМОСТЬ
ВЫЧИСЛЕНИЙ
(USD/ЯДРО*ЧАС)
ВИРТУАЛИЗАЦИЯ
ВЫЧИСЛЕНИЙ
УСЛУГИ В
РЕАЛЬНОМ
ВРЕМЕНИ
НАСТРОЕННАЯ
HPC СРЕДА
СЕТЬ НИЗКОЙ
ЛАТЕНТНОСТИ
CHECKPOINTING
КОНКУРЕНТЫ08
КОНКУРЕНТЫ