Bgp архитектура

620 views
521 views

Published on

Published in: Technology, Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
620
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • -O5 (link time, whole-program analysis, and SIMD instruction) -O4 (compile time, limited scope analysis, and SIMD instructions) – -O3 -qhot=simd (compile time, less optimization, and SIMD instructions)
  • Bgp архитектура

    1. 1. Архитектура и программное обеспечение массивно-параллельной системы IBM Blue Gene/P Попова Н.Н., доцент, ВМК МГУ Федулова И., инженер-программист, IBM RSTL , выпускница ВМиК МГУ 2 7.10.2009 ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г. Молодежная школа «Суперкомпьютерные технологии в науке, промышленности и образовании»
    2. 2. История проекта Blue Gene <ul><li>Совместный проект </li></ul><ul><ul><li>IBM </li></ul></ul><ul><ul><li>Lawrence Livermore National Laboratory </li></ul></ul><ul><ul><li>United States Department of Energy </li></ul></ul><ul><ul><li>Академические институты </li></ul></ul><ul><li>Blue Gene/L </li></ul><ul><ul><li>Начинался как массивно-параллельный компьютер для изучения фолдинга белков </li></ul></ul><ul><ul><li>Первый прототип был собран в 2004 г. </li></ul></ul><ul><ul><ul><li>занял первую строчку в Top 500 с производительностью в 70.72 Тфлоп/с </li></ul></ul></ul><ul><ul><li>2-х ядерный чип </li></ul></ul><ul><li>Blue Gene/P </li></ul><ul><ul><li>Продолжение линейки Blue Gene </li></ul></ul><ul><ul><li>Увеличена частота процессора и объем памяти </li></ul></ul><ul><ul><li>4-х ядерный чип </li></ul></ul><ul><ul><li>Самая большая система на основе Blue Gene/P установлена в Германии (JUGENE) </li></ul></ul><ul><ul><ul><li>1 Пфлоп/с пиковая, 825 Тфлоп/с реальная </li></ul></ul></ul><ul><li>Blue Gene/Q </li></ul><ul><ul><li>Ожидается в 2011 году, производительность ~20 Пфлоп/с </li></ul></ul><ul><ul><li>8-ядерный чип </li></ul></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    3. 3. Основные характеристики системы <ul><li>Производительность </li></ul><ul><li>Масштабируемость </li></ul><ul><li>Эффективное энергопотребление </li></ul><ul><li>Компактность </li></ul><ul><li>Надежность </li></ul><ul><li>Простота программирования </li></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    4. 4. “ Обязательный слайд” <ul><li>Картинка с масштабируемостью </li></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    5. 5. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    6. 6. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    7. 7. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    8. 8. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    9. 9. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    10. 10. Характеристики вычислительного узла <ul><li>4 ядерный 32-битный процессор PowerPC 850 Мгц </li></ul><ul><ul><li>Двойное устройство для работы с числами с плавающей запятой двойной точности </li></ul></ul><ul><ul><li>2 Гб памяти </li></ul></ul><ul><ul><li>Работает под управлением облегченной ОС </li></ul></ul><ul><ul><ul><li>Создание процессов и управление ими </li></ul></ul></ul><ul><ul><ul><li>Управление памятью </li></ul></ul></ul><ul><ul><ul><li>Отладка процессов </li></ul></ul></ul><ul><ul><ul><li>Ввод-вывод </li></ul></ul></ul><ul><ul><li>Объем виртуальной памяти равен объему физической </li></ul></ul><ul><ul><li>3 режима использования ядер </li></ul></ul><ul><ul><ul><li>SMP: 1 MPI процесс из 4 SMP нитей, 2 Гб памяти </li></ul></ul></ul><ul><ul><ul><li>DUAL: 2 MPI процесса по 2 SMP нити, 1 Гб памяти на MPI процесс </li></ul></ul></ul><ul><ul><ul><li>VNM: 4 MPI процесс </li></ul></ul></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    11. 11. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    12. 12. <ul><li>3-мерный тор </li></ul><ul><ul><li>Виртуальная аппаратная маршрутизация без буферизации </li></ul></ul><ul><ul><li>3.4 Гбит/с на всех 12 портах (5.1 ГБ/с на узле) </li></ul></ul><ul><ul><li>Аппаратные задержки: 0.5 мс между соседними узлами, 5 мс между самыми далекими </li></ul></ul><ul><ul><li>Задержки MPI: 3 мс между соседними узлами, 10 мс между самыми далекими </li></ul></ul><ul><ul><li>Основная коммуникационная сеть </li></ul></ul><ul><ul><ul><li>Используется в том числе для многих коллективных операций </li></ul></ul></ul><ul><li>Коллективная сеть – дерево </li></ul><ul><ul><li>Для глобальной коммуникации один-ко-всем ( broadcast, reduction) </li></ul></ul><ul><ul><li>6.8 ГБ/с на порт </li></ul></ul><ul><ul><li>Задержка на один проход дерева: аппаратная 1.3 мс, MPI 5 мс </li></ul></ul><ul><ul><li>Соединяет все вычислительные узлы и узлы ввода-вывода </li></ul></ul><ul><ul><li>Используется для коллективных операций и коммуникатора MPI_COMM_WORLD </li></ul></ul><ul><li>Высокоскоростная сеть для глобальных прерываний </li></ul><ul><ul><li>Задержка на оповещение всех узлов: аппаратная 0.65 мс, MPI 5 мс </li></ul></ul><ul><ul><li>Для MPI_Barrier </li></ul></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    13. 13. Система памяти ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    14. 14. <ul><li>SIMD инструкции могут выполняться одновременно на двух FPU </li></ul><ul><li>Параллельные операции load/store </li></ul><ul><li>Данные должны быть выровнены по 16-байтовой границе </li></ul><ul><ul><li>Иначе производительность будет значительно снижена </li></ul></ul><ul><ul><li>Даже хуже, чем при использовании только одного FPU </li></ul></ul><ul><li>Компилятор сможет сгенерировать SIMD инструкции, только если данные в памяти расположены подряд ( stride-one access) </li></ul><ul><ul><li>Хотя при более высоких ( -O4, -O5) уровнях оптимизации компилятор попытается сгенерировать SIMD инструкции и для данных, расположенных не подряд </li></ul></ul><ul><ul><li>- O3 –qarch=450d –qtune=450 </li></ul></ul>Double Hammer FPU ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    15. 15. Узлы ввода-вывода <ul><li>Используются для связи вычислительных узлов с файловой системой </li></ul><ul><li>В целом точно такие же, как и вычислительные узлы, но есть отличия: </li></ul><ul><ul><li>Установлена полноценная ОС </li></ul></ul><ul><ul><li>Отсутствует подключение к сети-тору </li></ul></ul><ul><ul><li>Имеется подключение к 10 Гб сети Ethernet </li></ul></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    16. 16. ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    17. 17. IBM Blue Gene/P на ВМК <ul><li>2 стойки по 1024 4-ядерных процессора </li></ul><ul><ul><li>Общий объем ОЗУ: 4Тб </li></ul></ul><ul><ul><li>Пиковая производительность: 27.2 Тфлоп/с </li></ul></ul><ul><ul><li>Реальная производительность по тесту Linpack: 23.2 Тфлоп/с </li></ul></ul><ul><ul><ul><li>85% от пиковой </li></ul></ul></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    18. 18. ВСТАВИТЬ ТЕКСТ ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    19. 19. Примеры программных пакетов, установленных на Blue Gene <ul><li>Computational Materials Science and Nanoscience </li></ul><ul><li>– Electronic structure, First Principles : Qbox, LSMS, QMC </li></ul><ul><li>– (mat) Molecular dynamics : CPMD, LJMD, ddcMD, MDCASK </li></ul><ul><li>– Other materials : ParaDIS </li></ul><ul><li>Nuclear Energy Systems </li></ul><ul><li>– Reactor core design and analysis ⇒ NEK5, UNIC </li></ul><ul><li>– Neutronics, Materials, Chemistry ⇒ QMC, Sweep3D, GAMESS </li></ul><ul><li>Computational Biology/Bioinformatics </li></ul><ul><li>– (bio) Molecular dynamics ⇒ NAMD, Amber7/8, BlueMatter </li></ul><ul><li>– Drug Screening ⇒ DOCK5, Autodock </li></ul><ul><li>– Genome-analysis ⇒ mpiBLAST, mrBayes, CLUSTALW-mpi </li></ul><ul><li>Computational Physics and Hydrodynamics </li></ul><ul><li>– Nuclear Theory : GFMC </li></ul><ul><li>– Quantum chromo dynamics : QCD, MILC, CPS </li></ul><ul><li>– Astrophysics/Cosmology : FLASH, ENZO </li></ul><ul><li>– Multi-Physics/CFD ⇒ ALE3D, NEK5, Miranda, SAGE </li></ul>ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.
    20. 20. Обзор алгоритмов и методов, реализованных на Blue Gene Материаловедение и нанонауки, ядерная энергетика, биоинформатика, вычислительная физика, гидродинамика (© - IBM) ННГУ им. Н.И. Лобачевского, Нижний Новгород, 26-31 октября 2009 г.

    ×