SlideShare a Scribd company logo
ЗАО «КАДФЕМ Си-Ай-Эс»
Аппаратное обеспечения для решения
задач механики сыпучих сред
Юрий Новожилов
Руководитель направления HPC
yury.novozhilov@cadfem-cis.ru
Консалтинг в области высокопроизводительных вычислений
2© ЗАО «КАДФЕМ Си-Ай-Эс», 2015
Компания ЗАО «КАДФЕМ Си-Ай-Эс» на постоянной основе занимается поставкой и
настройкой высокопроизводительных вычислительных систем:
• Установка и настройка программного обеспечения
• Проектирование, внедрение и поддержка вычислительных центров
• Поставка вычислительных комплексов для проведения инженерных расчетов
Через наши руки каждый год проходят десятки проектов в области HPC
Построение вычислительной инфраструктуры
для решения задач методом дискретных
элементов (DEM)
3© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Тестовая задача – конвейерная система
4© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Бункер
Первый
конвейер
Промежуточный
бункер
Второй
конвейер
Удельный весь руды 3 300 кг/м3
Производительность 10 000 т/час
Общая длина лент ≈ 20 м
Скорость ленты 4 м/c
Перепад высот 10 м
Гранулометрический состав
5© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
В расчете участвует около 1 000 000 частиц
Расчет I
Сферические частицы
Расчет II
Несферические частицы
(скругленные многоугольники – 3, 5, 7 сторон)
Размер частицы, мм Состав, % по массе
22 30
25 35
30 30
35 5
Тестовый стенд
6© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
• Intel Xeon E5-2667v3 3.2ГГц 8C x2
• 128 Гб оперативной памяти DDR4
• SSD INTEL 240GB S3500 Series x2
• Windows 8.1 Professional
• NVIDIA Tesla K40m
• NVIDIA Tesla K80
• NVIDIA Quadro M5000
Расчет I: Сферические частицы
7© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
100%
200%
300%
400%
500%
600%
700%
800%
0
1000
2000
3000
4000
5000
6000
7000
4 ядра
CPU
8 ядер
CPU
16 ядер
CPU
Tesla
K40M
Tesla
K80
Quadro
M5000
Эффективностьработырешателя
Времявыполнениярасчета,с
Расчет II: Несферические частицы
8© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
100%
300%
500%
700%
900%
1100%
1300%
1500%
0
5000
10000
15000
20000
25000
30000
35000
4 ядра
CPU
8 ядер
CPU
16 ядер
CPU
Tesla
K40M
Tesla
K80
Quadro
M5000
Эффективностьработырешателя
Времявыполнениярасчета,с
Эффективность GPU при разных постановках
9© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
0%
200%
400%
600%
800%
1000%
1200%
Tesla
K40M
Tesla
K80
Quadro
M5000
Времявыполнениярасчета,с
Сферические частицы Несферические частицы
Дополнительная статистика работы решателя
10© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Потребление оперативной памяти на решателем при работе в различных
режимах. Данные приводятся для зачади с 1 000 000 активных частиц.
Сферические
частицы
Несферические
частицы
CPU 4.0 Гб 8.0 Гб
CPU + GPU 2.1 Гб + 2.5 Гб 2.8 Гб + 4 Гб
Итоги тестирования
11© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
• В настоящий момент для работы Rocky не требуется многоядерных
серверов
• Вычислительные алгоритмы задолженные в Rocky получают
значительный прирост производительности от GPU NVIDIA
• 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
• 2 – 3 раза по сравнению в 16-ти ядерными серверами
Оптимальным решением является рабочая станция с мощным
графическим процессором NVIDIA
Спасибо за внимание!
Юрий Новожилов
Руководитель направления HPC
yury.novozhilov@cadfem-cis.ru
© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
АППАРАТНЫЕ РЕШЕНИЯ
ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ
Компания Форсайт | Евгений Зверев
e.zverev@fs-c.ru
СПЕЦИАЛИЗАЦИЯ В ОБЛАСТИ ПРОФЕССИОНАЛЬНОЙ ГРАФИКИ
Наша компания специализируется на производстве
профессиональных графических решений.
Основные направления:
• Супервычислительные станции
• Вычислительные комплексы HPC
• Виртуализация рабочих мест проектировщиков
• Видео стены и масштабная визуализация
Ключевые особенности:
 Поддержка многоядерных процессоров v3/v4
 Поддержка проф. граф. процессоров NVIDIA®
Quadro и Tesla
 Низкий уровень шума
 Поддержка СВО замкнутого цикла*
 Поддержка нестандартных частот CPU
 Система мониторинга
ГРАФИЧЕСКИЕ СУПЕРВЫЧИСЛИТЕЛЬНЫЕ СТАНЦИИ
ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ GPU В ROCKY
Вычислительные алгоритмы заложенные в Rocky получают
значительный прирост производительности при использовании GPU
NVIDIA
• 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
• 2 – 3 кратный прирост в сравнении с 16-ти ядерными серверами
Rocky не требует использования специализированных
вычислительных GPU*
НАШИ РЕКОМЕНДАЦИИ: GPU В ROCKY
Форм-фактор решателя определяет выбор GPU
Rocky на данный момент не поддерживает более одного GPU
Следует обращать внимание на объем памяти GPU особенно для
задач с несферическими частицами.
Выводы:
- оптимальный выбор для сервера Tesla K40
- оптимальный выбор для рабочей станции - QUADRO M5000
- идеальный выбор для рабочей станции: QUADRO K1200 + M5000
(Maximus/ MultiGPU)
ЦЕНТР КОМПЕТЕНЦИИ
• поиск оптимальных решений
• сравнительное и нагрузочные тестирование
• решение проблем с производительностью
• поиск “узких” мест
• тест-драйв технических новинок
Компания FORSITE | Евгений Зверев
e.zverev@fs-c.ru
+7 (911) 215-63-22
Ключевые особенности:
 Процессор: 2 x 22 Core Intel Xeon® E5v3 / v4
 Память: max 1536Gb DDR4 ECC
 GPU: 8 x ускорителей NVIDIA® TESLA
 LAN: 2 x Intel® 1000Mb/s
 InfiniBand card 56Gb/s*
 8 x SAS / SATA SSD
 Производительность: SP~ 41Tflops
ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ [HPC]

More Related Content

Similar to Aппаратное обеспечения для решения задач механики сыпучих сред

Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data MATLAB
 
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Cisco Russia
 
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Ontico
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровVsevolod Shabad
 
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...Банковское обозрение
 
Работа решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараРабота решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараYury Novozhilov
 
High performance computing - принципы проектирования сети
High performance computing - принципы проектирования сетиHigh performance computing - принципы проектирования сети
High performance computing - принципы проектирования сетиMUK
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиIBS
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)Ontico
 
Зачем нужен Flash?
Зачем нужен Flash?Зачем нужен Flash?
Зачем нужен Flash?Cisco Russia
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Ontico
 
Как запустить виртуализированный ЦОД за час?
Как запустить виртуализированный ЦОД за час?Как запустить виртуализированный ЦОД за час?
Как запустить виртуализированный ЦОД за час?Cisco Russia
 

Similar to Aппаратное обеспечения для решения задач механики сыпучих сред (20)

HPCSolutions (c)2018
HPCSolutions  (c)2018HPCSolutions  (c)2018
HPCSolutions (c)2018
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
 
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
 
supercluster
superclustersupercluster
supercluster
 
HPC solutions
HPC solutionsHPC solutions
HPC solutions
 
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеров
 
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
 
Работа решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараРабота решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте Ангара
 
High performance computing - принципы проектирования сети
High performance computing - принципы проектирования сетиHigh performance computing - принципы проектирования сети
High performance computing - принципы проектирования сети
 
Adem gpp
Adem gppAdem gpp
Adem gpp
 
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими рукамиАндрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
 
Зачем нужен Flash?
Зачем нужен Flash?Зачем нужен Flash?
Зачем нужен Flash?
 
Efficiency vvv
Efficiency vvvEfficiency vvv
Efficiency vvv
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
 
Как запустить виртуализированный ЦОД за час?
Как запустить виртуализированный ЦОД за час?Как запустить виртуализированный ЦОД за час?
Как запустить виртуализированный ЦОД за час?
 
Серверы стандартной архитектуры
Серверы стандартной архитектурыСерверы стандартной архитектуры
Серверы стандартной архитектуры
 

More from Yury Novozhilov

Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCОблачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCYury Novozhilov
 
Методики моделирования взрывов в ANSYS LS-DYNA
Методики моделирования взрывов в ANSYS LS-DYNAМетодики моделирования взрывов в ANSYS LS-DYNA
Методики моделирования взрывов в ANSYS LS-DYNAYury Novozhilov
 
Топологическая оптимизация конструкций
Топологическая оптимизация конструкцийТопологическая оптимизация конструкций
Топологическая оптимизация конструкцийYury Novozhilov
 
Оптимальное проектирование топологии в ANSYS 18
Оптимальное проектирование топологии в ANSYS 18Оптимальное проектирование топологии в ANSYS 18
Оптимальное проектирование топологии в ANSYS 18Yury Novozhilov
 
Высокопроизводительные решения в ANSYS 18
Высокопроизводительные решения в ANSYS 18Высокопроизводительные решения в ANSYS 18
Высокопроизводительные решения в ANSYS 18Yury Novozhilov
 
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...Yury Novozhilov
 
Радиопрозрачный композитный кожух параболической антенны
Радиопрозрачный композитный кожух параболической антенныРадиопрозрачный композитный кожух параболической антенны
Радиопрозрачный композитный кожух параболической антенныYury Novozhilov
 
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNA
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNAЖелезобетонные конструкции под воздействием ударных нагрузок в LS-DYNA
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNAYury Novozhilov
 
Моделирование продольного спуска судна на воду
Моделирование продольного спуска судна на водуМоделирование продольного спуска судна на воду
Моделирование продольного спуска судна на водуYury Novozhilov
 
User Defined Materials in LS-DYNA
User Defined Materials in LS-DYNAUser Defined Materials in LS-DYNA
User Defined Materials in LS-DYNAYury Novozhilov
 
Granary Square – King Cross Lighting Mast
Granary Square – King Cross Lighting MastGranary Square – King Cross Lighting Mast
Granary Square – King Cross Lighting MastYury Novozhilov
 
Моделирование и анализ прочности сэндвич-панели в ANSYS
Моделирование и анализ прочности сэндвич-панели в ANSYSМоделирование и анализ прочности сэндвич-панели в ANSYS
Моделирование и анализ прочности сэндвич-панели в ANSYSYury Novozhilov
 
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...Yury Novozhilov
 
Автоматизированные рабочие места интерактивные расчетные методики
Автоматизированные рабочие места интерактивные расчетные методикиАвтоматизированные рабочие места интерактивные расчетные методики
Автоматизированные рабочие места интерактивные расчетные методикиYury Novozhilov
 
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...Yury Novozhilov
 
Анализ собственных частот полого композитного вала
Анализ собственных частот полого композитного валаАнализ собственных частот полого композитного вала
Анализ собственных частот полого композитного валаYury Novozhilov
 
Взаимодействие нестационарных упругой волны со сферической оболочкой средствами
Взаимодействие нестационарных упругой волны со сферической оболочкой средствамиВзаимодействие нестационарных упругой волны со сферической оболочкой средствами
Взаимодействие нестационарных упругой волны со сферической оболочкой средствамиYury Novozhilov
 
Взаимодействия токоприемник - контактная сеть
Взаимодействия токоприемник - контактная сетьВзаимодействия токоприемник - контактная сеть
Взаимодействия токоприемник - контактная сетьYury Novozhilov
 
Моделирование подземного горизонтального композитного резервуара
Моделирование подземного горизонтального композитного резервуараМоделирование подземного горизонтального композитного резервуара
Моделирование подземного горизонтального композитного резервуараYury Novozhilov
 
Simulation and testing of stitched glassfibre laminates fatigue behavior
Simulation and testing of stitched glassfibre laminates fatigue behaviorSimulation and testing of stitched glassfibre laminates fatigue behavior
Simulation and testing of stitched glassfibre laminates fatigue behaviorYury Novozhilov
 

More from Yury Novozhilov (20)

Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCОблачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
 
Методики моделирования взрывов в ANSYS LS-DYNA
Методики моделирования взрывов в ANSYS LS-DYNAМетодики моделирования взрывов в ANSYS LS-DYNA
Методики моделирования взрывов в ANSYS LS-DYNA
 
Топологическая оптимизация конструкций
Топологическая оптимизация конструкцийТопологическая оптимизация конструкций
Топологическая оптимизация конструкций
 
Оптимальное проектирование топологии в ANSYS 18
Оптимальное проектирование топологии в ANSYS 18Оптимальное проектирование топологии в ANSYS 18
Оптимальное проектирование топологии в ANSYS 18
 
Высокопроизводительные решения в ANSYS 18
Высокопроизводительные решения в ANSYS 18Высокопроизводительные решения в ANSYS 18
Высокопроизводительные решения в ANSYS 18
 
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...
Продольный спуск судна на воду в ALE постановке. Работы с FSI и многофазными ...
 
Радиопрозрачный композитный кожух параболической антенны
Радиопрозрачный композитный кожух параболической антенныРадиопрозрачный композитный кожух параболической антенны
Радиопрозрачный композитный кожух параболической антенны
 
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNA
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNAЖелезобетонные конструкции под воздействием ударных нагрузок в LS-DYNA
Железобетонные конструкции под воздействием ударных нагрузок в LS-DYNA
 
Моделирование продольного спуска судна на воду
Моделирование продольного спуска судна на водуМоделирование продольного спуска судна на воду
Моделирование продольного спуска судна на воду
 
User Defined Materials in LS-DYNA
User Defined Materials in LS-DYNAUser Defined Materials in LS-DYNA
User Defined Materials in LS-DYNA
 
Granary Square – King Cross Lighting Mast
Granary Square – King Cross Lighting MastGranary Square – King Cross Lighting Mast
Granary Square – King Cross Lighting Mast
 
Моделирование и анализ прочности сэндвич-панели в ANSYS
Моделирование и анализ прочности сэндвич-панели в ANSYSМоделирование и анализ прочности сэндвич-панели в ANSYS
Моделирование и анализ прочности сэндвич-панели в ANSYS
 
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...
ANSYS EKM – эффективное управление данными инженерных расчетов в процессе раз...
 
Автоматизированные рабочие места интерактивные расчетные методики
Автоматизированные рабочие места интерактивные расчетные методикиАвтоматизированные рабочие места интерактивные расчетные методики
Автоматизированные рабочие места интерактивные расчетные методики
 
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...
ANSYS EKM-based strategy for integrated multiphysics simulation workflow auto...
 
Анализ собственных частот полого композитного вала
Анализ собственных частот полого композитного валаАнализ собственных частот полого композитного вала
Анализ собственных частот полого композитного вала
 
Взаимодействие нестационарных упругой волны со сферической оболочкой средствами
Взаимодействие нестационарных упругой волны со сферической оболочкой средствамиВзаимодействие нестационарных упругой волны со сферической оболочкой средствами
Взаимодействие нестационарных упругой волны со сферической оболочкой средствами
 
Взаимодействия токоприемник - контактная сеть
Взаимодействия токоприемник - контактная сетьВзаимодействия токоприемник - контактная сеть
Взаимодействия токоприемник - контактная сеть
 
Моделирование подземного горизонтального композитного резервуара
Моделирование подземного горизонтального композитного резервуараМоделирование подземного горизонтального композитного резервуара
Моделирование подземного горизонтального композитного резервуара
 
Simulation and testing of stitched glassfibre laminates fatigue behavior
Simulation and testing of stitched glassfibre laminates fatigue behaviorSimulation and testing of stitched glassfibre laminates fatigue behavior
Simulation and testing of stitched glassfibre laminates fatigue behavior
 

Aппаратное обеспечения для решения задач механики сыпучих сред

  • 1. ЗАО «КАДФЕМ Си-Ай-Эс» Аппаратное обеспечения для решения задач механики сыпучих сред Юрий Новожилов Руководитель направления HPC yury.novozhilov@cadfem-cis.ru
  • 2. Консалтинг в области высокопроизводительных вычислений 2© ЗАО «КАДФЕМ Си-Ай-Эс», 2015 Компания ЗАО «КАДФЕМ Си-Ай-Эс» на постоянной основе занимается поставкой и настройкой высокопроизводительных вычислительных систем: • Установка и настройка программного обеспечения • Проектирование, внедрение и поддержка вычислительных центров • Поставка вычислительных комплексов для проведения инженерных расчетов Через наши руки каждый год проходят десятки проектов в области HPC
  • 3. Построение вычислительной инфраструктуры для решения задач методом дискретных элементов (DEM) 3© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
  • 4. Тестовая задача – конвейерная система 4© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 Бункер Первый конвейер Промежуточный бункер Второй конвейер Удельный весь руды 3 300 кг/м3 Производительность 10 000 т/час Общая длина лент ≈ 20 м Скорость ленты 4 м/c Перепад высот 10 м
  • 5. Гранулометрический состав 5© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 В расчете участвует около 1 000 000 частиц Расчет I Сферические частицы Расчет II Несферические частицы (скругленные многоугольники – 3, 5, 7 сторон) Размер частицы, мм Состав, % по массе 22 30 25 35 30 30 35 5
  • 6. Тестовый стенд 6© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 • Intel Xeon E5-2667v3 3.2ГГц 8C x2 • 128 Гб оперативной памяти DDR4 • SSD INTEL 240GB S3500 Series x2 • Windows 8.1 Professional • NVIDIA Tesla K40m • NVIDIA Tesla K80 • NVIDIA Quadro M5000
  • 7. Расчет I: Сферические частицы 7© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 100% 200% 300% 400% 500% 600% 700% 800% 0 1000 2000 3000 4000 5000 6000 7000 4 ядра CPU 8 ядер CPU 16 ядер CPU Tesla K40M Tesla K80 Quadro M5000 Эффективностьработырешателя Времявыполнениярасчета,с
  • 8. Расчет II: Несферические частицы 8© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 100% 300% 500% 700% 900% 1100% 1300% 1500% 0 5000 10000 15000 20000 25000 30000 35000 4 ядра CPU 8 ядер CPU 16 ядер CPU Tesla K40M Tesla K80 Quadro M5000 Эффективностьработырешателя Времявыполнениярасчета,с
  • 9. Эффективность GPU при разных постановках 9© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 0% 200% 400% 600% 800% 1000% 1200% Tesla K40M Tesla K80 Quadro M5000 Времявыполнениярасчета,с Сферические частицы Несферические частицы
  • 10. Дополнительная статистика работы решателя 10© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 Потребление оперативной памяти на решателем при работе в различных режимах. Данные приводятся для зачади с 1 000 000 активных частиц. Сферические частицы Несферические частицы CPU 4.0 Гб 8.0 Гб CPU + GPU 2.1 Гб + 2.5 Гб 2.8 Гб + 4 Гб
  • 11. Итоги тестирования 11© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 • В настоящий момент для работы Rocky не требуется многоядерных серверов • Вычислительные алгоритмы задолженные в Rocky получают значительный прирост производительности от GPU NVIDIA • 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями • 2 – 3 раза по сравнению в 16-ти ядерными серверами Оптимальным решением является рабочая станция с мощным графическим процессором NVIDIA
  • 12. Спасибо за внимание! Юрий Новожилов Руководитель направления HPC yury.novozhilov@cadfem-cis.ru © ЗАО «КАДФЕМ Си-Ай-Эс», 2016
  • 13. АППАРАТНЫЕ РЕШЕНИЯ ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ Компания Форсайт | Евгений Зверев e.zverev@fs-c.ru
  • 14. СПЕЦИАЛИЗАЦИЯ В ОБЛАСТИ ПРОФЕССИОНАЛЬНОЙ ГРАФИКИ Наша компания специализируется на производстве профессиональных графических решений. Основные направления: • Супервычислительные станции • Вычислительные комплексы HPC • Виртуализация рабочих мест проектировщиков • Видео стены и масштабная визуализация
  • 15. Ключевые особенности:  Поддержка многоядерных процессоров v3/v4  Поддержка проф. граф. процессоров NVIDIA® Quadro и Tesla  Низкий уровень шума  Поддержка СВО замкнутого цикла*  Поддержка нестандартных частот CPU  Система мониторинга ГРАФИЧЕСКИЕ СУПЕРВЫЧИСЛИТЕЛЬНЫЕ СТАНЦИИ
  • 16. ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ GPU В ROCKY Вычислительные алгоритмы заложенные в Rocky получают значительный прирост производительности при использовании GPU NVIDIA • 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями • 2 – 3 кратный прирост в сравнении с 16-ти ядерными серверами Rocky не требует использования специализированных вычислительных GPU*
  • 17. НАШИ РЕКОМЕНДАЦИИ: GPU В ROCKY Форм-фактор решателя определяет выбор GPU Rocky на данный момент не поддерживает более одного GPU Следует обращать внимание на объем памяти GPU особенно для задач с несферическими частицами. Выводы: - оптимальный выбор для сервера Tesla K40 - оптимальный выбор для рабочей станции - QUADRO M5000 - идеальный выбор для рабочей станции: QUADRO K1200 + M5000 (Maximus/ MultiGPU)
  • 18. ЦЕНТР КОМПЕТЕНЦИИ • поиск оптимальных решений • сравнительное и нагрузочные тестирование • решение проблем с производительностью • поиск “узких” мест • тест-драйв технических новинок
  • 19. Компания FORSITE | Евгений Зверев e.zverev@fs-c.ru +7 (911) 215-63-22
  • 20. Ключевые особенности:  Процессор: 2 x 22 Core Intel Xeon® E5v3 / v4  Память: max 1536Gb DDR4 ECC  GPU: 8 x ускорителей NVIDIA® TESLA  LAN: 2 x Intel® 1000Mb/s  InfiniBand card 56Gb/s*  8 x SAS / SATA SSD  Производительность: SP~ 41Tflops ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ [HPC]

Editor's Notes

  1. Аппаратное обеспечение и IT-решения Эффективность систем автоматизации инженерных расчетов напрямую зависит и от аппаратных средств. Для ускорения инженерных расчетов мы планируем, реализуем и обслуживаем ИТ-решения от автономных рабочих станций до серверов для высокопроизводительных облачных вычислений. Мы поможем Вам разработать и согласовать техническое задание на поставку и внедрение программно-аппаратного комплекса с учетом требований и специфики решаемых задач, обеспечим поставку готовой, сконфигурированной под Ваши требования, отлаженной системы. Мы также оказываем поддержку в проектировании и реализации вычислительного центра, оптимизированного с точки зрения автоматизации инженерных расчетов, причем наши услуги охватывают весь спектр: от планирования и формирования до обеспечения текущей эксплуатации вычислительных ресурсов. Таким образом, Вы всегда можете положиться на эксплуатационную готовность и производительность своих систем. Эффективное использование всего потенциала программного и аппаратного обеспечения: снижение времени расчета; расчет более подробных моделей; повышение точности расчетов.
  2. Добрый день, меня зовут Евгений Зверев, технический директор компании Форсайт. Я отвечаю за продажи высокопроизводительных решений и систем визуализации. В первую очередь хочу выразить благодарность Юрию Новожилову и компании Кадфем за предоставленную возможность совместного тестирования нового программного продукта.
  3. Кратко хочу рассказать о профиле нашей деятельности. Итак наша компания специализируется на комплексных поставках профессиональных графических решений таких как: Графические станции для визуализации и инженерных расчетов Персональные суперкомпьютеры и вычислительные кластеры на базе ускорителей NVIDIA TESLA - Системы масштабной визуализации и отображения, т.е видеостены и видеоконтроллеры. Виртуализация инженерных рабочих мест К сожалению формат данной презентации не позволяет развернуто рассказать о каждом направлении, а так же обо всех новых GPU технологиях, поэтому постараюсь максимально кратко и сжато пробежаться по одной из тем. Итак тема моей презентации это: АППАРАТНЫЕ РЕШЕНИЯ ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ.
  4. В ходе нашего эксперимента мы использовали тестовый стенд на базе нашего типового решения, графической станции Forsite HPC, предлагаю кратко ознакомиться с основными особенностями данного решения: Поддержка многоядерных процессоров v3/v4 (буквально в следующем месяце Intel анонсирует новое поколение процессоров Intel Xeon, топовая модификация будет иметь 22 ядра. ) Поддержка проф. граф. процессоров NVIDIA® Quadro и Tesla Позвольте сделать небольшой акцент именно на достаточно нестандартной системе охлаждения нашей рабочей станции. Достаточно часто мы сталкивались с ситуацией, когда графические станции и суперкомпьютеры устанавливались в офисном помещении, и пользователи жаловались на сильный уровень шума, который явно не способствал комфортной работе. Именно поэтому в наших рабочих станциях мы используем замкнутые системы жидкостного охлаждения. Более того подобные системы значительно эффективнее обеспечивают отвод тепла от центрального процессора, что позволяет без риска повысить тактовые частоты на процессорах с разблокированным множителем. Важный аспект любого эксперимента это Система мониторинга Не важно проводим ли мы тестовый эксперимент или считаем реальную задачу, важно иметь полное понимание что происходит с рабочей станцией. Это позволяет вовремя диагностировать возможные проблемы, и найти узкие места в нашей системе.
  5. Вернемся к результатам, которые озвучил Юрий в предыдущей части презентации: Вычислительные алгоритмы заложенные в Rocky получают значительный прирост производительности при использовании GPU NVIDIA 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями 2 – 3 раза по сравнению в 16-ти ядерными серверами Первоначальный вывод к которому мы пришли : Rocky не требует использования специализированных вычислительных GPU,* На следующем слайде разберем данный момент более подробно.
  6. На данном слайде я хочу дать небольшие рекомендации, как достичь максимальной эффективности при расчетах на GPU в Rocky В первую очередь при проектировании расчетной системы надо определить для себя форм-фактор нашей будущей вычислительной системы. Почему это важно? Дело в том что ускорители предназначенные для установки в серверную платформу и в рабочую станцию, имеют разную систему охлаждения, а именно для установки в сервера используются ускорители с пассивной системой охлаждения Tesla K80 / K40 Отсутствие возможности расчета на нескольких GPU делает неэффективным применение TESLA K80, если сервер используется только для Rocky, особенно явно это заметно для задач со сферическими частицами. K80 представляет из себя двухчиповую карту, и в наших расчетах полностью задействован только 1 чип. Таким образом оптимальный вариант для использования в вычислительном сервере Игровая карта 980Ti показывает отличный результат, особенно если вспомнить тот факт, что это самая доступная по цене карта, но в задачах с несферическими частицами утилизация памяти GPU составляет около 100%. Таким образом в случае наличия более сложной задачи, есть вероятность что оперативной памяти графического ускорителя будет явно мало.
  7. Если у Вас есть задача, но в данный момент у вас нет понимания какое программно-аппаратное решение будет для Вас оптимальным, предварительное тестирование поможет определиться с выбором правильного решения.  В тестовой лаборатории нашей компании развернуты универсальные демонстрационные стенды на которых Вы можете произвести необходимое функциональное и нагрузочное тестирования на различных конфигурациях оборудования, а так же смоделировать различные сценарии.
  8. В случае если у Вас возникли вопросы технического характера, прошу обращаться, - на данном слайде мои контактные данные. Спасибо за внимание. Вопросы?