SlideShare a Scribd company logo
1 of 96
1
Компьютеры,
суперкомпьютеры,
квантовые компьютеры,
мобильные технологии ─
взгляд на развитие и новые принципы
О.Н.Граничин, В.И.Кияев
Санкт-Петербургской государственный университет
Нижний Новгород, 4-9 февраля 2012 г.
Молодежная школа «Атомосфера: разработка
программного обеспечения для мобильных
устройств»
Вычислительные устройства
Пальцы на руке (всегда!)
Абак (v век до н.э.)
Логарифмическая линейка Э. Гантера (1623 г.)
Арифмометр Тома де Кольмара (1818 г.)
Вычислительная клавишная машина Д.Пармеля (1850 г.)
1939 г. Вычислительная
машина Атанасова-Берри
1941 г. Вычислительная
машина Конрада Цузе
1944 г. Colossus 1946 г. ENIAC
Вычислительные устройства
Жесткий диск (винчестер)
корпорации IBM (1956 г.)
Первый транзистор
Bell Lab Innovation (1947 г.)
Вычислительные устройства
Изменение мощности и
функциональности
Компьютеры, ориентированные
на задачу
Операционные системы,
языки высокого уровня,
многозадачность,
межплатформенность,
универсальность и т.п.
Миниатюризация
МММ: Многоядерность
Многопроцессорность
Пути развития
Компьютерный континуум
ПК Ноутбуки Встроенные
продукты
СмартфоныНетбуки Персональные
устройства
Smart-ТВ
1 2 3
ЭНЕРГОЭФФЕКТИВНАЯ
ПРОИЗВОДИТЕЛЬНОСТЬ
ИНТЕРНЕТ-ДОСТУП
И СЕТЕВАЯ СРЕДАБЕЗОПАСНОСТЬ
И ЗАЩИТА ДАННЫХ
Центры
обработки данных «облачные» среды
Суперкомпьютеры +
Мобильные технологии
Кто выигрывает?
1964 г. CDC 6600 (Сеймур Крэй)
2006 г. Blue Gene Roadrunner (Лос-Аламосская
Национальная Лаборатория)
Super C
10
Несколько знаковых событий
Президент Д.А.Медведев
предложил назвать его
именем великого русского
ученого М.В.Ломоносова
В ноябре 2009 г. в МГУ введен в
действие новый российский
суперкомпьютер, который в
ноябрьском рейтинге Top-500
занял почетное 12-е место!
11
В 2009 году при участии
Суперкомпьютерного
консорциума университетов
России вышла книга
«Суперкомпьютерные
технологии в науке,
образовании и
промышленности».
По результатам конференции
в Абрау-Дюрсо 2010 г.
подготовлено 2-е издание
Несколько знаковых событий
12
В июне 2010 г. на Междуна-
родной суперкомпьютерной
конференции ISC`10 в
немецком Ганновере
опубликована новая редакция
TOP-500. Первую строчку
занимает американский Jaguar
Cray XT 56 (1.75 петафлопс)Китайский суперкомпьютер
Nebulae по результатам
тестирования пакетом Linpack
показал производительность на
уровне 1,271 петафлопс, оказав-
шись на втором месте между
Ягуаром (Cray Jaguar ) и IBM
Roadrunner (1,04 петафлопс).
Несколько знаковых событий
13-я конференция в Абрау-Дюрсо, 19-24 сентября 2011 г.
Тема суперкомпьютерных технологий сейчас
все время на слуху и постоянно обсуждается. Все
чаще задаются вопросы о том, суперкомпьютеры
какой мощности необходимы России, в каком
количестве и главное ─ для каких именно целей?
Анализируя мировую практику, объективный
уровень такой необходимости можно определить
так: страна, желающая создавать не просто
конкурентоспособную продукцию высочайшего
качества, а продукцию завтрашнего дня, должна
превзойти всех в высокопроизводительных
вычислениях!
Из официального резюме
Программа Конференция объединила доклады
по теоретическим и практическим аспектам
науки и образования :
Из официального резюме
 методы параллельного программирования и
параллельных вычислений
 технологии распределенной обработки
данных
 суперкомпьютерные технологии
 суперкомпьютерные центры, научные и
прикладные задачи для суперкомпьютинга
 использование сети Интернет в науке и самой
науки для развития Интернет.
Открытие Конференции
Списки Tор-500 и Тор-50
top500.org & top50.supercomputers.ru
18
Методы и технологии
программирования
«Появление многоядерных
процессоров изменило
компьютерный мир – он стал
параллельным и обратного
пути нет!
Нужно учиться жить в новых
условиях, нужно привыкать к
технологиям параллельного
программирования, нужно осваивать параллельные
вычислительные системы от уровня обычного сервера до
суперкомпьютеров.
Через несколько лет отсутствие навыков работы с параллельными
компьютерами будет равносильно компьютерной
безграмотности!» Чл.-корр. Вл.В.Воеводин
Проблемы и задачи
19
В
10 PFlops
1 PFlops
10 TFlops
1 TFlops
10 GFlops
1 GFlops
10 EFlops
1 EFlops
1993 20171999 2005 2011 2023
1 ZFlops
2029
Аэродинамика:
Лазерная оптика:
Молекулярная динамика в биологии:
Аэродинамический дизайн:
Вычислительная космология:
Турбуленция в физике:
Вычислительная химия:
1 Petaflops
10 Petaflops
20 Petaflops
1 Exaflops
10 Exaflops
100 Exaflops
1 Zettaflops
Примеры задач:
• Полное моделирование поведения самолета
• Использование знаний о геноме в медицина
• Исследование Большого Взрыва Вселенной
• Синтетические топлива
• Точное моделирование и прогноз погоды
Проблема масштаба ExaScale
1 EFlops
В.В.Самофалов
Директор академических
и исследовательских
проектов в России и СНГ,
(Intel, Нижний Новгород)
Что можно моделировать
сегодня ~100TF
Доклад о смене парадигмы
Доклад о смене парадигмы
В чем суть такой смены?
22
Область применения
суперкомпьютеров постоянно
расширяется !
23
Новые потребности
Глобализация задач
Возрастающие вычислительные
мощности
Назревает смена парадигмы !
Экспоненциальное
возрастание
сложности вычисли-
тельных систем
24
Входные
данные
Выходные
данные
Время сбора и подготовки данных
становится критичным !!!
Проблема современных
суперкомпьютеров ─ организация
эффективного взаимодействия с ними
25
Проблема современных
суперкомпьютеров ─ огромные накладные
расходы
Гигаватты потребления электроэнергии, гигакалории
на охлаждение, миллионы на обслуживание !!!
Проблема современных
суперкомпьютеров ─ организация
эффективного взаимодействия с ними
Мультиагентные системы для организации
взаимодействия с суперкомпьютерами
Активные агенты: миллион
муравьев побеждают слона!
 Абак
 Компьютер
 Кластер
 Суперкомпьютер
 ………………………………?
Что дальше?
Поколения главного элемента
1
4
2 3
Что в итоге?
5
История компьютерных технологий ─ это
последовательность перехода от одного типа
их физической реализации к другому…
E5-2600
Highest 2S Perf
Max Memory
Density and
Cost Optimized 2S
Lowest Cost
(1S only)
E5-2400
 Up to 2 CPUs
 Up to 24 DIMMs
 Up to 80 PCIe lanes
 Two QPI links
 Up to 2 CPUs
 Up to 18 DIMMs
 Up to 48 PCIe lanes
 One QPI link
 Up to 1 CPU
 Up to 4 DIMMs
 Up to 20 PCIe 2.0 lanes
 Launched in Q1 ‘11
E5-4600
Density and
Cost Optimized 4S
 Up to 4 CPUs
 Up to 48 DIMMs
 Up to 160 PCIe3
lanes
 Two QPI links
per CPU (ring
topology)
x8
Sandy
Bridge
Core
DDR3
DDR3
x4
Sandy
Bridge
Core
x8
Sandy
Bridge
Core
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
x8x4 x4
QPI
Sandy
Bridge
Core
x8
Sandy
Bridge
Core
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
x8x4 x4
QPI
QPI
Sandy
Bridge
Core
x8
Sandy
Bridge
Core
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
Sandy
Bridge
QPI
QPI
Core
x8
Sandy
Bridge
Core
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
DDR3
QPI
x8
x8
x4
x4
x4
x4
QPI
Sandy Bridge: гибкость платформы
Гибкость архитектуры
• Каждое ядро Intel® MIC архитектуры меньше,
экономичнее, имеет болeе низкую производительность
• Однако суммарная производительность Intel® MIC выше
• Приложения с высокой степенью параллелизма
выигрывают от применения архитектуры Intel® MIC
Many Integrated Core Knights Ferry
at 1-1.2 GHz
Multi-core Intel® Xeon® processor
at 2.26-3.5 GHz
Модели и инструменты
программирования
Common with
Intel® Xeon®
processors
• Программные модели
• Компиляторы C/C++, Fortran
• Инструменты и библиотеки
(MKL, IPP, TBB, ArBB, …)
• Методы оптимизации с
помощью инструментов Интел
Будущие процессоры должны поддерживать
существующую базу приложений и
минимизировать затраты на оптимизацию
Instruction
Parallelism
Data
Parallelism
Thread
Parallelism
Cluster /
Process
Parallelism
Один поток
Улучшение скалярной производительности, компиляторы
C/C++,FORTRAN, высокопроизводительные библиотеки, инструменты
анализа производительности
Уровень узла
OpenMP, , Ct , CILK
Распределенная система/ Кластер
Cluster Tools, Cluster OpenMP, MPI Checker
Модели и инструменты
программирования
Модели программирования
с использованием технологии
MPI (Message Passing Interface)
Будущие процессоры должны поддерживать
существующую базу приложений и
минимизировать затраты на оптимизацию
Offload
• MPI
процессы
только на
Xeon
• Сообщения
между Xeon
• MIC как
сопроцессор
MIC-only
• MPI
процессы на
одной MIC -
карте
• Запуск на MIC
MIC-hosted
• MPI
процессы на
нескольких
картах MIC
• Сообщения
через Xeon
Symmetric
• MPI
процессы на
MIC и Xeon
• Сообщения
между
любыми
ядрами
Модель Offload
• MPI процессы только
на Xeon
• Все сообщения только
между процессорами
• Offload используется
для ускорения MPI
процессов
• PBB, OpenMP, pthreads
используются внутри
процесса (MIC)
Однородная сеть
неоднородных
вычислителей
CPU MIC
CPU MIC
MPI
Offload
Offload
Network
Data
Data
Начало использования MIC в HPC
• Простой переход к
гетерогенным вычислениям
• Ускорение внутри одного
процесса
Симметричная программная
модель
• MPI процессы на
MIC и Xeon
• Сообщения между
любыми ядрами
• PBB, OpenMP,
pthreads могут быть
использованы
Неоднородная сеть
CPU MIC
CPU MIC
Data
MPI
Data
Network
Data
Data
Построение исполняемых модулей с
использованием Intel 64 и MIC
компиляторов
Запуск на 40 узлах на различных “Xeon+MIC”
узлах. Загружает исполняемые модули на
МIC
Массивно-параллельные
приложения
• Сложные вычислительные проблемы, которые могут быть разбиты на части,
• Сложные вычислительные проблемы, которые могут быть
разбиты на части, выполняющиеся параллельно
• Параллельные приложения отличаются по гранулярности и
программным моделям
• Массивно параллельные приложения встречаются везде! -
Workstation, HPC, Data Centers
• Примеры массивно параллельных вычислений: Vector Math,
FFTs, Sparse and Dense Matrix Multiplication, Convolution, LU
Factorization, Sort, Monte Carlo, Black-Scholes, и т. д.
Medical imaging
and biophysics
Computer Aided Design
& Manufacturing
Climate modeling &
weather prediction
Financial analyses, trading
Energy & oil exploration
Digital content creation
38
Extending Moore’s Law
90 nm
2003
180 nm
1999
130 nm
2001
65 nm
2005
45 nm
2007 32 nm
2009
On
Track
22nm
1Xnm
Линейка процессоров
Intel
?
Закон Мура и его предел
Гордон Мур: каждые 18
месяцев число транзисторов,
размещаемых в интегральной
схеме прежнего размера,
увеличивается вдвое (1965 г.)
У процесса миниатюризации
транзисторов есть физические
пределы — квантовый порог,
ниже которого они не смогут
функционировать, так как
электроны в таком случае
преодолеют барьер, ныне
вынуждающий их двигаться в соответствии с определенной
энергией по определенным траекториям.
Однако
Смена парадигмы
ExaScale
Переосмысление
понятий «вычисление»,
«сложность алгоритмов»
и идей фон Неймана и
Тьюринга об устройстве
компьютеров
Смена парадигмы
1. В информатике принимают на веру базовый «тезис
Черча-Тьюринга» о том, что «любой процесс,
который интуитивно мог бы быть назван процедурой,
можно реализовать машиной Тьюринга»
2. При разработке нового вычислительного устройства
«в железе» надо только уметь реализовывать
несколько элементарных операций, а любой более
сложный алгоритм может быть составлен из их
последовательного или параллельного применения
3. Это ведет к разделению направлений работ:
одни создают "железо", другие разрабатывают
алгоритмы
Смена парадигмы
Изучение проблем в математическом описании различных
быстроизменяющихся динамических процессов приводит к выводу о
том, что в природе есть очень много важных процессов, которые
принципиально не описываются конечномерными моделями.
Примеры: кластеризация в потоках концентрированных дисперсных
смесей, образование многомасштабных вихревых структур в
турбулентных течениях жидкости и пластических течениях твердых
материалов при импульсном нагружении, образование белка в клетках
живых микроорганизмов, а также иерархии структур в живых системах.
Вполне вероятна ошибочность тезиса Черча-Тьюринга, т. е.
совсем не обязательно какое-то вновь придуманное
изобретателем новое вычислительное устройство будет
эквивалентно (в смысле вычислительной мощности) набору
из более простых устройств!
Смена парадигмы:
обобщенная машина Тьюринга
<A,H,Q,q,q0,X,x,x0,S,s,s0,J,G,T>
• A — множество моделей (вычислительных примитивов)
• H — оператор эволюции
• Q — множество состояний(значения параметров)
• X — память
• S — обобщенная лента (граф)
• J — множество переключений
• G — программа (цели)
• T — множество останова процесса
Смена парадигмы
ExaScale
Степень параллельности
Надежность
Энергопотребление
Модель программирования
Неоднородность
Сложная иерархия памяти
Сверхпараллельный ввод/вывод
Стек системного и прикладного ПО
…………
П р о б л е м ы,
п р о б л е м ы
п р о б л е м ы
! ! !
45
Смена парадигмы
ExaScale
Процесс вычисления ─ набор асинхронных
моделей взаимодействующих динамических
систем
Стохастические
системы
Гибридные системы
………
Внешняя часть
Внутренняя
часть
The Intelligent
System?
Смена парадигмы
47
Условия для внутренней части
• Для любой задачи в системе есть
самоорганизующийся набор устройств
для ее решения
• Информация (данные) и управляющие
воздействия (сигналы) из внешнего мира
доставляется ко всем таким устройствам
одновременно
Интеллектуальный выбор
Task 1
Device 1
Task 2
Device 2
Task N
Device N
…
…
Недетерминированные
алгоритмы
Квантовые вычисления
Пример: «однопиксельная»
камера
Примеры возможной реализации
внутренней части
Информационный резонанс
Квантовый компьютер:
физические явления +
+ физическое устройство +
+ вычислительный процесс
(измерение состояния?)
П р и н ц и п ы ?
Немного истории
М. Планк (1900 г.) ─ квантовые свойства
тепловой энергии, впоследствии формула
Планка (Нобелевская премия, 1918 г.).
А. Эйнштейн (1905 г.) ─ квантовая теория
фотоэффекта (Нобелевская премия, 1921 г.).
Э.Шредингер (1926 г.) ─ волновое уравнение
(Нобелевская премия, 1933 г.)
В.Гейзенберг (1927 г.) ─ принцип неопре-
деленности (Нобелевская премия, 1932 г.)
Дж. фон Нейман (1932 г. ) ─ книга
«Математические основы квантовой
механики».
Ю.И. Манин (1980 г.) ─ идея использо-
вания квантовых вычислений
(«Вычислимое и невычислимое»).
П.Бениоф и Р. Фейнман (1982 г.) ─ показали, что классический
компьютер не в состоянии моделировать квантовые процессы.
Д. Дойч (1985 г.) ─ предложил конкретную математическую
модель квантовой машины.
П. Шор (1994 г.) ─ предложил для квантового компьютера
алгоритм разложения n-значного числа на простые множители
за время, полиномиально зависящее от n (р-полная задача -
квантовый алгоритм факторизации).
Л.Гровер (1996 г.) ─ разработал быстрый квантовый алгоритм
перебора, позволивший говорить о значительном превосходстве
квантовых компьютеров над полупроводниковыми.
Н.Гершенфельд и И.Чуанг (1997 г.) ─ создали первый прототип
квантового компьютера «на двух атомах» в Массачусетском
технологическом институте (США)
Немного истории
Подходы к реализации
|0 1|
Классический бит
(С-bit)
|0 1>
Квантовый бит
(Q-bit)
Подходы к реализации
Квантовый компьютер ─
это вычислительное устройство,
которое работает на основе
принципов квантовой механики.
Квантовый компьютер использует для вычисления не
классические алгоритмы, а более сложные процессы
квантовой природы ─ квантовые алгоритмы.
Эти алгоритмы используют понятия на базе квантовомехани-
ческих эффектов: «квантовую запутанность (Quantum Entangled
State)» и «квантовый параллелизм (Quantum Parallelism».
Подходы к реализации
Если классический процессор в каждый момент может
находиться ровно в одном из состояний:
(обозначения П.Дирака), то квантовый
процессор в каждый момент находится одновременно во
всех этих базисных состояниях ─ при этом в каждом
состоянии — со своей комплексной амплитудой λj.
Это квантовое состояние называется «квантовой
суперпозицией» данных классических состояний и
обозначается как
Подходы к реализации
В общем случае если квантовая система состоит из L q-битов,
то у неё имеется 2L возможных классических состояний,
каждое из которых может быть измерено с некоторой
вероятностью. Функция состояния такой квантовой системы
запишется в виде:
где |n> — базисные квантовые состояния (например, состояние
|001101 , а |cn|2 — вероятность нахождения в базисном
состоянии |n> .
Для того чтобы изменить состояние суперпозиции квантовой
системы, необходимо реализовать селективное внешнее
воздействие на каждый q-бит.
С математической точки зрения такое преобразование
представляется унитарными матрицами размера 2Lx2L.
В результате будет получено новое квантовое состояние
суперпозиции.
Подходы к реализации
Квантовое состояние может изменяться во времени двумя
принципиально различными путями:
─ унитарная квантовая операция (квантовый
вентиль, quantum gate).
─ измерение (наблюдение).
Подходы к реализации
Квантовый регистр представляет собой совокупность
некоторого числа L q-битов. До ввода информации в
компьютер все q-биты квантового регистра должны быть
приведены в базисные состояния |0> .
Эта операция называется подготовкой, или инициализацией.
Далее определенные q-биты подвергаются селективному
внешнему воздействию (например, с помощью импульсов
внешнего электромагнитного поля, управляемых классическим
компьютером).
Значение q-битов, из состояния |0> переходят в состояние |1>.
При этом состояние всего квантового регистра перейдет в
суперпозицию базисных состояний |nс>, то есть состояние
квантового регистра в начальный момент времени будет
определяться функцией:
Подходы к реализации
В квантовом процессоре введенные данные подвергаются
последовательности квантовых логических операций, которые
с математической точки зрения описываются унитарным
преобразованием Ûmn, действующим на состояние всего
регистра.
В результате через некоторое количество тактов работы
квантового процессора исходное квантовое состояние системы
становится новой суперпозицией вида:
Эта функция суперпозиции представляет собой результат
вычислений в квантовом процессоре. Остается лишь считать
полученные значения, для чего производится измерение
значения квантовой системы.
1. Физическая система, представляющая
собой полномасштабный квантовый
компьютер, должна содержать
достаточно большое число (L > 100)
хорошо различимых q-битов для
выполнения соответствующих
квантовых операций.
2. Необходимо обеспечить
максимальное подавление
эффектов разрушения суперпозиции
квантовых состояний, обусловленных
взаимодействием системы q-битов с
окружающей средой, в результате
чего может стать невозможным
выполнение квантовых алгоритмов.
Подходы к реализации
Подходы к реализации
3. Время разрушения суперпозиции
квантовых состояний (время декогерен-
тизации) должно по крайней мере в сто
с лишним раз превышать время
выполнения основных квантовых
операций (время такта).
Для этого система q-битов должна быть
довольно слабо связана с окружением.
4. Необходимо обеспечить измерение с достаточно высокой
надежностью состояния квантовой системы на выходе.
Измерение конечного квантового состояния является
одной из основных проблем квантовых вычислений!
Март 2010 г. В Исследовательском
центре города Юлих (Германия)
смоделировали работу квантового
компьютера с 42 q-битами, используя
мощнейший европейский супер-
компьютер JUGENE .
Производительность классических компьютеров растет
линейно: увеличение количества используемых транзисторов
на 10% в идеальном случае даст лишь 10-процентный прирост
скорости вычислений.
Кристел Михельсен: «Вычислительная мощность квантовой
системы при увеличении ее размеров растет экспоненциально.
Это открывает широчайшие возможности в будущем, но сильно
затрудняет моделирование на «классических» компьютерах»
Подходы к реализации
Пиковая производительность JUGENE
составляет один петафлопс (1015
операций с плавающей запятой в
секунду). В структуру суперкомпьютера
входят 73 728 вычислительных узлов,
на каждый из которых приходится по
2 Гб памяти. Вычислениями заняты 294 912 процессоров
PowerPC 450 с тактовой частотой 850 МГц.
Смоделированный квантовый компьютер реализовал алгоритм
Шора (разложение на простые множители): число 15 707 ему
удалось представить в виде произведения простых чисел 113 и
139. При реализации алгоритма на практике столь большие
числа недоступны, поскольку известные прототипы квантовых
компьютеров пока ненадежны и содержат не более восьми
q-битов.
Подходы к реализации
В качестве квантового процессора
рассматривали несколько схем
построения, некоторые прототипы
были созданы с использованием
органической жидкости.
В данном случае ядра отдельных
атомов рассматривались в качестве
q-битов. Все молекулы органической жидкости ведут себя
одинаково при осуществлении необходимых взаимодействий.
Благодаря этому появляется возможность применения
методики и техники ядерного магнитного резонанса (ЯМР)
─ избирательного поглощения веществом электромагнитного
излучения, обусловленного переориентацией магнитных
моментов атомных ядер, находящихся в постоянном
магнитном поле.
Физическая реализация
В такой модели отсутствует индивидуальное
обращение к отдельным q-битам, оно осущест-
вляется одновременно ко всему ансамблю
имеющихся q-битов.
Компьютер с процессором такого рода
получил название ансамблевого квантового
компьютера (Bulk-ensemble Quantum
Computer).
Докторская диссертация А.А. Кокина на тему:
«Твердотельные ядерные магнито-резонансные
ансамблевые квантовые компьютеры» (2003 г.).
Первые эксперименты на ядерных спинах двух атомов
водорода в молекулах 2,3-дибромотиофена SCH:(CBr)2:CH и
на трех ядерных спинах — одном в атоме водорода H и двух в
изотопах углерода 13C в молекулах трихлорэтилена
CCl2:CHCl — были поставлены в 1997 году в Оксфорде
(Великобритания).
Физическая реализация
Физическая реализация
Март 2011 г. Профессор
Университета Ульма
Томмасо Каларко, крупный
специалист по квантовым
компьютерам, приезжал
с лекцией в МФТИ.
Он рассказал студентам
о перспективах развития
квантовых технологий и возможном участии в этом России:
«В настоящее время речь не идёт о создании полномасштабного
квантового компьютера. Во-первых, мы не можем нормально
транспортировать атомы. Во-вторых, мы не можем присвоить
адрес в массиве конкретному q-биту для управления им. Ведь мы
хотим, чтобы система подчинялась нам и только нам. Однако,
мы рассчитываем, что теория оптимального управления
поможет нам в этом».
Сенсация?!
Канадская компания D-Wave Systems в
2007 году анонсировала первый
коммерческий квантовый компьютер
(на 16 q-битов).
В конце мая 2011 года компания заявила
о продаже квантового компьютера.
Покупателем выступила известная
компания Lockheed Martin, которая
намерена с его помощью создать некую
«киберфизическую систему», которая интегрирует внутреннее
состояние вычислителей с информацией из окружающей среды.
Джорди Роуз (учредитель и директор по технологиям D-Wave
Systems): «Эта машина должна делать одну вещь лучше, чем
обычный компьютер ─ искать ответ на проблемы, которые
могут быть по-настоящему решены только исчерпывающим
перебором всех возможных вариантов ответов».
Элементарная схема фазового q-бита и фотография
128-q-битного процессора компании D-Wave
(фото из журнала «Nature»)
Сенсация?!
11 мая 2011 г. представители
D-Wave, опубликовала в Nature
статью, объясняющую некоторые
аспекты подхода к построению
квантового процессора на примере
системы из 8 q-битов (в D-Wave One
объединено 16 таких ячеек) и
особенно — к организации на нём
определённого класса вычислений.
Скотт Ааронсон, эксперт по компьютерным системам из Масса-
чусетского технологического института скептически отметил:
«Существует огромный разрыв между демонстрацией некоего
квантового эффекта в восьми Q-битах, что они и сделали, и
заявлением, что у них есть 128-ми q-битный чип, который может
выполнять вычислительно интересные задачи много
быстрее, чем обычный компьютер».
Сенсация?!
Как и предшествующие
разработки компании
D-Wave, эта машина
основана на сверхпрово-
дящих q-битах (физически
это специальной формы
петли на основе сплава
ниобия).
Магнитные поля манипулируют энергетическим состоянием
q-битов.
А так как их совокупность находится в состоянии квантовой
суперпозиции, вычислительное устройство может
одновременно вести поиск во множестве энергетических
состояний, представляющих различные решения задачи.
Сенсация?!
Granichin O. N., Molodtsov S. L. и др. Method of measurements with
random perturbation: application in photoemission experiments // Review
of scientific instruments. 79, 036103. 2008.
Реальность!
-----------------------------------------------------------------------------------------------------------------------
МФТИ, 24 ноября 2011 г.
Вычисление свёртки функций
S layer: Structural properties H. Eberhardt et al., J. Bacteriol. 168 (1986) 309
3D reconstruction of S layer viewed from
outer (top) and inner (bottom) surface
H. Engelhardt
Sporosarcina ureae
H. Eberhardt, NATO ASI Series (Springer-Verlag,1991)
Transmission electron microscopy image
Growth of S layer on SiOx/Si substrates
Plasma treatment of substrates
with plasma treatment
without plasma treatment
Protein subunits are composed
of 20 different amino acids.
Their atomic composition is
C4912H7860N1324O1615S5
Solution of sodium phosphate,
MgCl2 and NaN3
80
ExaScale
Необходимость в новых формах
обучения и подготовки специалистов
Специализированные порталы, лекционные курсы,
практикумы, семинары, вебинары, мастер-классы,
учебно-исследовательские проекты и лаборатории
Смена парадигмы
81
Учебно-исследовательские
лаборатории Intel в университетах
Созданы по инициативе вице-президента корпорации Intel
Эндрю Гроува (предисловие к книге «Выживают только
параноики») и СЕО Intel Пола Отеллини
«Мы очень
нуждаемся в
исследователях
(Researchers),
которые могли бы
продвигать Интел к
новым
достижениям!»
Пол Отеллини. Из выступления
в Актовом зале СПбГУ
02.10.2003
82
Учебно-исследовательская
лаборатория СПРИНТ (СПбГУ-Intel)
Стратегические цели Лаборатории:
Обновление и совершенствование образовательной
деятельности в СПбГУ за счёт формирования целевых
образовательных программ
Решение актуальных научно-исследовательских задач в
области современных компьютерных систем и
высокопроизводительных вычислений
Комплексная подготовки в СПбГУ высококвалифициро-
ванных специалистов в этой области
83
Учебно-исследовательская
лаборатория СПРИНТ (СПбГУ-Intel)
Куратор Лаборатории –
руководитель Академической
программы Intel в России
А.В.Николаев
Координатор Лаборатории –
зам. директора НИИ ИТ СПбГУ
В.И.Кияев
84
Широкое сотрудничество Лаборатории
с ведущими IT-компаниями
Обучение мобильным технологиям и технологиям HPC
85
Перспективные учебно-исследователь-
ские проекты на базе НРС
Расчеты для модели человека
с использованием
геометрических объемных
элементов (voxel)
86
Всероссийская суперкомпьютерная конференция «Научный сервис в сети Интернет
Абрау-Дюрсо, 21-25 сентября 2010 г.
-----------------------------------------------------------------------------------------------------------------------
Tunnel Creek
САН-ФРАНЦИСКО (Калифорния),
14 сентября 2010 г.
Корпорация Intel представила линейку процессоров
Intel® Atom™ E600, ранее известную как Tunnel Creek. Эта
«система-на-чипе» (System-on-Chip, SoC) с ядром Atom
предусматривает прямое подключение для упрощения
взаимодействия с устройствами ввода/вывода.
Гибкость новой SoC призвана облегчить разработку уникальных по
дизайну решений, оптимально подходящих для бортовых,
информационно-развлекательных систем, смартфонов и
устройств для «умных» электрических сетей (Smart Electrical
Grid).
87
Всероссийская суперкомпьютерная конференция «Научный сервис в сети Интернет
Абрау-Дюрсо, 21-25 сентября 2010 г.
-----------------------------------------------------------------------------------------------------------------------
 Конкурс студенческих проектов «Атмосфера»
 Разработка системы CarPC на базе
ОС Moblin
 Разработка мультиагентной системы БПЛА
 Распределенные вычисления
Проекты 2010-2011 годов
в рамках программы Атомосфера»
88
Мирная «атомная» программа Intel
День разработчика ПО для
Intel® Atom™ в СПбГУ
Конкурс студенческих проектов
Программа «Атомосфера 2010-2012»
89
Малые формы высокопроизводительных вычислений:
разработка приложений для мобильных платформ
Программа «Атомосфера 2010-2012»
90
Победители и лауреаты Конкурса-2010
Программа «Атомосфера 2010-2012»
Разработка мультиагентной
системы для БПЛА
Беспилотные
летательные
аппараты
 Взаимодействие БПЛА с мобильной базовой станцией и
между собой
 Бортовой микрокомпьютер
 Автопилот Paparazzi
 Архитектура мультиагентной системы
92
Мобильная базовая станция
Бортовой микрокомпьютер
Автопилот Papapazzi
93
Внешний вид БПЛА
Система управления
94
Корпорация Intel и портал IT-Планета объявляют о
конкурсе студенческих проектов разработки
программных приложений для Intel® Atom™
«Атомосфера»
ПЕРВЫЙ ЭТАП – с 21 октября по 31 декабря 2010 г.
ВТОРОЙ ЭТАП – с 01 января по 15 марта 2011 г.
Конкурс студенческих проектов
разработки программных приложений
«Атомосфера-2011»
95
Учебный курс «Введение в разработку приложений на платформе
Atom/MeeGo»
Научные журналы кафедры системного программирования
Математико-механического факультета СПбГУ
Тематические лекции и конкурсы для студентов факультетов
СПбГУ и стажеров Лаборатории
Методические материалы
96
Вопросы?
Суждения?
Замечания?
Oleg_granichin@mail.ru
kiyaev@mail.ru

More Related Content

Similar to СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ

тест по темам принцип открытой архитектуры
тест по темам принцип открытой архитектурытест по темам принцип открытой архитектуры
тест по темам принцип открытой архитектурыJIuc
 
Альберт Ефимов "Перспективные направления исследований в области робототехник...
Альберт Ефимов "Перспективные направления исследований в области робототехник...Альберт Ефимов "Перспективные направления исследований в области робототехник...
Альберт Ефимов "Перспективные направления исследований в области робототехник...AINL Conferences
 
Семинар 8. Параллельное программирование на MPI (часть 1)
Семинар 8. Параллельное программирование на MPI (часть 1)Семинар 8. Параллельное программирование на MPI (часть 1)
Семинар 8. Параллельное программирование на MPI (часть 1)Mikhail Kurnosov
 
Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Perm State University
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Mikhail Kurnosov
 
вычислительная техника и программирование
вычислительная техника и программированиевычислительная техника и программирование
вычислительная техника и программированиеmarinaev
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКСARCCN
 
26
2626
26JIuc
 
презентация на тему архитектура компьютеров
презентация на тему архитектура компьютеровпрезентация на тему архитектура компьютеров
презентация на тему архитектура компьютеровCARINA1992
 
Нейроморфный чип
Нейроморфный чипНейроморфный чип
Нейроморфный чипmotivnt
 
TMPA-2013 Smirnov
TMPA-2013 SmirnovTMPA-2013 Smirnov
TMPA-2013 SmirnovIosif Itkin
 
Презентация Сколково на конференции Перспективные системы и задачи упралвления
 Презентация Сколково на конференции Перспективные системы и задачи упралвления Презентация Сколково на конференции Перспективные системы и задачи упралвления
Презентация Сколково на конференции Перспективные системы и задачи упралвленияAlbert Yefimov
 
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)motivnt
 
27
2727
27JIuc
 
Процессоры нетрадиционной архитектуры
Процессоры нетрадиционной архитектурыПроцессоры нетрадиционной архитектуры
Процессоры нетрадиционной архитектурыАнтон Широков
 
Кирилл Щерба - KSduino
Кирилл Щерба - KSduinoКирилл Щерба - KSduino
Кирилл Щерба - KSduinoOksana Kurysheva
 
О высокопроизводительном вычислительном комплексе информационно-вычислительно...
О высокопроизводительном вычислительном комплексе информационно-вычислительно...О высокопроизводительном вычислительном комплексе информационно-вычислительно...
О высокопроизводительном вычислительном комплексе информационно-вычислительно...Dmitri Chubarov
 

Similar to СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ (20)

тест по темам принцип открытой архитектуры
тест по темам принцип открытой архитектурытест по темам принцип открытой архитектуры
тест по темам принцип открытой архитектуры
 
Альберт Ефимов "Перспективные направления исследований в области робототехник...
Альберт Ефимов "Перспективные направления исследований в области робототехник...Альберт Ефимов "Перспективные направления исследований в области робототехник...
Альберт Ефимов "Перспективные направления исследований в области робототехник...
 
Семинар 8. Параллельное программирование на MPI (часть 1)
Семинар 8. Параллельное программирование на MPI (часть 1)Семинар 8. Параллельное программирование на MPI (часть 1)
Семинар 8. Параллельное программирование на MPI (часть 1)
 
Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...
 
CSC
CSCCSC
CSC
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
 
вычислительная техника и программирование
вычислительная техника и программированиевычислительная техника и программирование
вычислительная техника и программирование
 
ОС 2
ОС 2ОС 2
ОС 2
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКС
 
26
2626
26
 
презентация на тему архитектура компьютеров
презентация на тему архитектура компьютеровпрезентация на тему архитектура компьютеров
презентация на тему архитектура компьютеров
 
Нейроморфный чип
Нейроморфный чипНейроморфный чип
Нейроморфный чип
 
TMPA-2013 Smirnov
TMPA-2013 SmirnovTMPA-2013 Smirnov
TMPA-2013 Smirnov
 
Презентация Сколково на конференции Перспективные системы и задачи упралвления
 Презентация Сколково на конференции Перспективные системы и задачи упралвления Презентация Сколково на конференции Перспективные системы и задачи упралвления
Презентация Сколково на конференции Перспективные системы и задачи упралвления
 
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)
Нейроморфный чип “Алтай” ориентированный на использование в РТК (ПСиЗУ 2016)
 
Эволюция ПК 2
Эволюция ПК 2Эволюция ПК 2
Эволюция ПК 2
 
27
2727
27
 
Процессоры нетрадиционной архитектуры
Процессоры нетрадиционной архитектурыПроцессоры нетрадиционной архитектуры
Процессоры нетрадиционной архитектуры
 
Кирилл Щерба - KSduino
Кирилл Щерба - KSduinoКирилл Щерба - KSduino
Кирилл Щерба - KSduino
 
О высокопроизводительном вычислительном комплексе информационно-вычислительно...
О высокопроизводительном вычислительном комплексе информационно-вычислительно...О высокопроизводительном вычислительном комплексе информационно-вычислительно...
О высокопроизводительном вычислительном комплексе информационно-вычислительно...
 

More from MKoryakina

ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИ
ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИ
ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИMKoryakina
 
монография
монографиямонография
монографияMKoryakina
 
Методические указания учителю информатике 3 класс
Методические указания учителю информатике 3 классМетодические указания учителю информатике 3 класс
Методические указания учителю информатике 3 классMKoryakina
 
методические указания к выполнению лабораторных работ в Excel
методические указания к выполнению лабораторных работ в Excelметодические указания к выполнению лабораторных работ в Excel
методические указания к выполнению лабораторных работ в ExcelMKoryakina
 
Современные способы организации презентаций
Современные способы организации презентацийСовременные способы организации презентаций
Современные способы организации презентацийMKoryakina
 
Графический пакет
Графический пакетГрафический пакет
Графический пакетMKoryakina
 
Требования к презентациям
Требования к презентациямТребования к презентациям
Требования к презентациямMKoryakina
 
лб № 1 кодирование
лб № 1 кодированиелб № 1 кодирование
лб № 1 кодированиеMKoryakina
 
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИMKoryakina
 
Современные способы организации презентации
Современные способы организации презентацииСовременные способы организации презентации
Современные способы организации презентацииMKoryakina
 

More from MKoryakina (10)

ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИ
ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИ
ТЕХНИКА БЕЗОПАСНОСТИ В КАБИНЕТЕ ИНФОРМАТИКИ
 
монография
монографиямонография
монография
 
Методические указания учителю информатике 3 класс
Методические указания учителю информатике 3 классМетодические указания учителю информатике 3 класс
Методические указания учителю информатике 3 класс
 
методические указания к выполнению лабораторных работ в Excel
методические указания к выполнению лабораторных работ в Excelметодические указания к выполнению лабораторных работ в Excel
методические указания к выполнению лабораторных работ в Excel
 
Современные способы организации презентаций
Современные способы организации презентацийСовременные способы организации презентаций
Современные способы организации презентаций
 
Графический пакет
Графический пакетГрафический пакет
Графический пакет
 
Требования к презентациям
Требования к презентациямТребования к презентациям
Требования к презентациям
 
лб № 1 кодирование
лб № 1 кодированиелб № 1 кодирование
лб № 1 кодирование
 
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
 
Современные способы организации презентации
Современные способы организации презентацииСовременные способы организации презентации
Современные способы организации презентации
 

СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ

  • 1. 1 Компьютеры, суперкомпьютеры, квантовые компьютеры, мобильные технологии ─ взгляд на развитие и новые принципы О.Н.Граничин, В.И.Кияев Санкт-Петербургской государственный университет Нижний Новгород, 4-9 февраля 2012 г. Молодежная школа «Атомосфера: разработка программного обеспечения для мобильных устройств»
  • 2. Вычислительные устройства Пальцы на руке (всегда!) Абак (v век до н.э.) Логарифмическая линейка Э. Гантера (1623 г.) Арифмометр Тома де Кольмара (1818 г.) Вычислительная клавишная машина Д.Пармеля (1850 г.)
  • 3. 1939 г. Вычислительная машина Атанасова-Берри 1941 г. Вычислительная машина Конрада Цузе 1944 г. Colossus 1946 г. ENIAC Вычислительные устройства
  • 4. Жесткий диск (винчестер) корпорации IBM (1956 г.) Первый транзистор Bell Lab Innovation (1947 г.) Вычислительные устройства
  • 5. Изменение мощности и функциональности Компьютеры, ориентированные на задачу Операционные системы, языки высокого уровня, многозадачность, межплатформенность, универсальность и т.п.
  • 7. Компьютерный континуум ПК Ноутбуки Встроенные продукты СмартфоныНетбуки Персональные устройства Smart-ТВ 1 2 3 ЭНЕРГОЭФФЕКТИВНАЯ ПРОИЗВОДИТЕЛЬНОСТЬ ИНТЕРНЕТ-ДОСТУП И СЕТЕВАЯ СРЕДАБЕЗОПАСНОСТЬ И ЗАЩИТА ДАННЫХ Центры обработки данных «облачные» среды Суперкомпьютеры + Мобильные технологии
  • 9. 1964 г. CDC 6600 (Сеймур Крэй) 2006 г. Blue Gene Roadrunner (Лос-Аламосская Национальная Лаборатория) Super C
  • 10. 10 Несколько знаковых событий Президент Д.А.Медведев предложил назвать его именем великого русского ученого М.В.Ломоносова В ноябре 2009 г. в МГУ введен в действие новый российский суперкомпьютер, который в ноябрьском рейтинге Top-500 занял почетное 12-е место!
  • 11. 11 В 2009 году при участии Суперкомпьютерного консорциума университетов России вышла книга «Суперкомпьютерные технологии в науке, образовании и промышленности». По результатам конференции в Абрау-Дюрсо 2010 г. подготовлено 2-е издание Несколько знаковых событий
  • 12. 12 В июне 2010 г. на Междуна- родной суперкомпьютерной конференции ISC`10 в немецком Ганновере опубликована новая редакция TOP-500. Первую строчку занимает американский Jaguar Cray XT 56 (1.75 петафлопс)Китайский суперкомпьютер Nebulae по результатам тестирования пакетом Linpack показал производительность на уровне 1,271 петафлопс, оказав- шись на втором месте между Ягуаром (Cray Jaguar ) и IBM Roadrunner (1,04 петафлопс). Несколько знаковых событий
  • 13. 13-я конференция в Абрау-Дюрсо, 19-24 сентября 2011 г.
  • 14. Тема суперкомпьютерных технологий сейчас все время на слуху и постоянно обсуждается. Все чаще задаются вопросы о том, суперкомпьютеры какой мощности необходимы России, в каком количестве и главное ─ для каких именно целей? Анализируя мировую практику, объективный уровень такой необходимости можно определить так: страна, желающая создавать не просто конкурентоспособную продукцию высочайшего качества, а продукцию завтрашнего дня, должна превзойти всех в высокопроизводительных вычислениях! Из официального резюме
  • 15. Программа Конференция объединила доклады по теоретическим и практическим аспектам науки и образования : Из официального резюме  методы параллельного программирования и параллельных вычислений  технологии распределенной обработки данных  суперкомпьютерные технологии  суперкомпьютерные центры, научные и прикладные задачи для суперкомпьютинга  использование сети Интернет в науке и самой науки для развития Интернет.
  • 17. Списки Tор-500 и Тор-50 top500.org & top50.supercomputers.ru
  • 18. 18 Методы и технологии программирования «Появление многоядерных процессоров изменило компьютерный мир – он стал параллельным и обратного пути нет! Нужно учиться жить в новых условиях, нужно привыкать к технологиям параллельного программирования, нужно осваивать параллельные вычислительные системы от уровня обычного сервера до суперкомпьютеров. Через несколько лет отсутствие навыков работы с параллельными компьютерами будет равносильно компьютерной безграмотности!» Чл.-корр. Вл.В.Воеводин
  • 19. Проблемы и задачи 19 В 10 PFlops 1 PFlops 10 TFlops 1 TFlops 10 GFlops 1 GFlops 10 EFlops 1 EFlops 1993 20171999 2005 2011 2023 1 ZFlops 2029 Аэродинамика: Лазерная оптика: Молекулярная динамика в биологии: Аэродинамический дизайн: Вычислительная космология: Турбуленция в физике: Вычислительная химия: 1 Petaflops 10 Petaflops 20 Petaflops 1 Exaflops 10 Exaflops 100 Exaflops 1 Zettaflops Примеры задач: • Полное моделирование поведения самолета • Использование знаний о геноме в медицина • Исследование Большого Взрыва Вселенной • Синтетические топлива • Точное моделирование и прогноз погоды Проблема масштаба ExaScale 1 EFlops В.В.Самофалов Директор академических и исследовательских проектов в России и СНГ, (Intel, Нижний Новгород) Что можно моделировать сегодня ~100TF
  • 20. Доклад о смене парадигмы
  • 21. Доклад о смене парадигмы В чем суть такой смены?
  • 23. 23 Новые потребности Глобализация задач Возрастающие вычислительные мощности Назревает смена парадигмы ! Экспоненциальное возрастание сложности вычисли- тельных систем
  • 24. 24 Входные данные Выходные данные Время сбора и подготовки данных становится критичным !!! Проблема современных суперкомпьютеров ─ организация эффективного взаимодействия с ними
  • 25. 25 Проблема современных суперкомпьютеров ─ огромные накладные расходы Гигаватты потребления электроэнергии, гигакалории на охлаждение, миллионы на обслуживание !!!
  • 26. Проблема современных суперкомпьютеров ─ организация эффективного взаимодействия с ними Мультиагентные системы для организации взаимодействия с суперкомпьютерами
  • 28.  Абак  Компьютер  Кластер  Суперкомпьютер  ………………………………? Что дальше?
  • 29. Поколения главного элемента 1 4 2 3 Что в итоге? 5 История компьютерных технологий ─ это последовательность перехода от одного типа их физической реализации к другому…
  • 30. E5-2600 Highest 2S Perf Max Memory Density and Cost Optimized 2S Lowest Cost (1S only) E5-2400  Up to 2 CPUs  Up to 24 DIMMs  Up to 80 PCIe lanes  Two QPI links  Up to 2 CPUs  Up to 18 DIMMs  Up to 48 PCIe lanes  One QPI link  Up to 1 CPU  Up to 4 DIMMs  Up to 20 PCIe 2.0 lanes  Launched in Q1 ‘11 E5-4600 Density and Cost Optimized 4S  Up to 4 CPUs  Up to 48 DIMMs  Up to 160 PCIe3 lanes  Two QPI links per CPU (ring topology) x8 Sandy Bridge Core DDR3 DDR3 x4 Sandy Bridge Core x8 Sandy Bridge Core DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 x8x4 x4 QPI Sandy Bridge Core x8 Sandy Bridge Core DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 x8x4 x4 QPI QPI Sandy Bridge Core x8 Sandy Bridge Core DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 Sandy Bridge QPI QPI Core x8 Sandy Bridge Core DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 DDR3 QPI x8 x8 x4 x4 x4 x4 QPI Sandy Bridge: гибкость платформы
  • 31. Гибкость архитектуры • Каждое ядро Intel® MIC архитектуры меньше, экономичнее, имеет болeе низкую производительность • Однако суммарная производительность Intel® MIC выше • Приложения с высокой степенью параллелизма выигрывают от применения архитектуры Intel® MIC Many Integrated Core Knights Ferry at 1-1.2 GHz Multi-core Intel® Xeon® processor at 2.26-3.5 GHz
  • 32. Модели и инструменты программирования Common with Intel® Xeon® processors • Программные модели • Компиляторы C/C++, Fortran • Инструменты и библиотеки (MKL, IPP, TBB, ArBB, …) • Методы оптимизации с помощью инструментов Интел
  • 33. Будущие процессоры должны поддерживать существующую базу приложений и минимизировать затраты на оптимизацию Instruction Parallelism Data Parallelism Thread Parallelism Cluster / Process Parallelism Один поток Улучшение скалярной производительности, компиляторы C/C++,FORTRAN, высокопроизводительные библиотеки, инструменты анализа производительности Уровень узла OpenMP, , Ct , CILK Распределенная система/ Кластер Cluster Tools, Cluster OpenMP, MPI Checker Модели и инструменты программирования
  • 34. Модели программирования с использованием технологии MPI (Message Passing Interface) Будущие процессоры должны поддерживать существующую базу приложений и минимизировать затраты на оптимизацию Offload • MPI процессы только на Xeon • Сообщения между Xeon • MIC как сопроцессор MIC-only • MPI процессы на одной MIC - карте • Запуск на MIC MIC-hosted • MPI процессы на нескольких картах MIC • Сообщения через Xeon Symmetric • MPI процессы на MIC и Xeon • Сообщения между любыми ядрами
  • 35. Модель Offload • MPI процессы только на Xeon • Все сообщения только между процессорами • Offload используется для ускорения MPI процессов • PBB, OpenMP, pthreads используются внутри процесса (MIC) Однородная сеть неоднородных вычислителей CPU MIC CPU MIC MPI Offload Offload Network Data Data Начало использования MIC в HPC • Простой переход к гетерогенным вычислениям • Ускорение внутри одного процесса
  • 36. Симметричная программная модель • MPI процессы на MIC и Xeon • Сообщения между любыми ядрами • PBB, OpenMP, pthreads могут быть использованы Неоднородная сеть CPU MIC CPU MIC Data MPI Data Network Data Data Построение исполняемых модулей с использованием Intel 64 и MIC компиляторов Запуск на 40 узлах на различных “Xeon+MIC” узлах. Загружает исполняемые модули на МIC
  • 37. Массивно-параллельные приложения • Сложные вычислительные проблемы, которые могут быть разбиты на части, • Сложные вычислительные проблемы, которые могут быть разбиты на части, выполняющиеся параллельно • Параллельные приложения отличаются по гранулярности и программным моделям • Массивно параллельные приложения встречаются везде! - Workstation, HPC, Data Centers • Примеры массивно параллельных вычислений: Vector Math, FFTs, Sparse and Dense Matrix Multiplication, Convolution, LU Factorization, Sort, Monte Carlo, Black-Scholes, и т. д. Medical imaging and biophysics Computer Aided Design & Manufacturing Climate modeling & weather prediction Financial analyses, trading Energy & oil exploration Digital content creation
  • 38. 38 Extending Moore’s Law 90 nm 2003 180 nm 1999 130 nm 2001 65 nm 2005 45 nm 2007 32 nm 2009 On Track 22nm 1Xnm Линейка процессоров Intel ?
  • 39. Закон Мура и его предел Гордон Мур: каждые 18 месяцев число транзисторов, размещаемых в интегральной схеме прежнего размера, увеличивается вдвое (1965 г.) У процесса миниатюризации транзисторов есть физические пределы — квантовый порог, ниже которого они не смогут функционировать, так как электроны в таком случае преодолеют барьер, ныне вынуждающий их двигаться в соответствии с определенной энергией по определенным траекториям. Однако
  • 40. Смена парадигмы ExaScale Переосмысление понятий «вычисление», «сложность алгоритмов» и идей фон Неймана и Тьюринга об устройстве компьютеров
  • 41. Смена парадигмы 1. В информатике принимают на веру базовый «тезис Черча-Тьюринга» о том, что «любой процесс, который интуитивно мог бы быть назван процедурой, можно реализовать машиной Тьюринга» 2. При разработке нового вычислительного устройства «в железе» надо только уметь реализовывать несколько элементарных операций, а любой более сложный алгоритм может быть составлен из их последовательного или параллельного применения 3. Это ведет к разделению направлений работ: одни создают "железо", другие разрабатывают алгоритмы
  • 42. Смена парадигмы Изучение проблем в математическом описании различных быстроизменяющихся динамических процессов приводит к выводу о том, что в природе есть очень много важных процессов, которые принципиально не описываются конечномерными моделями. Примеры: кластеризация в потоках концентрированных дисперсных смесей, образование многомасштабных вихревых структур в турбулентных течениях жидкости и пластических течениях твердых материалов при импульсном нагружении, образование белка в клетках живых микроорганизмов, а также иерархии структур в живых системах. Вполне вероятна ошибочность тезиса Черча-Тьюринга, т. е. совсем не обязательно какое-то вновь придуманное изобретателем новое вычислительное устройство будет эквивалентно (в смысле вычислительной мощности) набору из более простых устройств!
  • 43. Смена парадигмы: обобщенная машина Тьюринга <A,H,Q,q,q0,X,x,x0,S,s,s0,J,G,T> • A — множество моделей (вычислительных примитивов) • H — оператор эволюции • Q — множество состояний(значения параметров) • X — память • S — обобщенная лента (граф) • J — множество переключений • G — программа (цели) • T — множество останова процесса
  • 44. Смена парадигмы ExaScale Степень параллельности Надежность Энергопотребление Модель программирования Неоднородность Сложная иерархия памяти Сверхпараллельный ввод/вывод Стек системного и прикладного ПО ………… П р о б л е м ы, п р о б л е м ы п р о б л е м ы ! ! !
  • 45. 45 Смена парадигмы ExaScale Процесс вычисления ─ набор асинхронных моделей взаимодействующих динамических систем Стохастические системы Гибридные системы ………
  • 47. 47 Условия для внутренней части • Для любой задачи в системе есть самоорганизующийся набор устройств для ее решения • Информация (данные) и управляющие воздействия (сигналы) из внешнего мира доставляется ко всем таким устройствам одновременно
  • 48. Интеллектуальный выбор Task 1 Device 1 Task 2 Device 2 Task N Device N … …
  • 53. Квантовый компьютер: физические явления + + физическое устройство + + вычислительный процесс (измерение состояния?) П р и н ц и п ы ?
  • 54. Немного истории М. Планк (1900 г.) ─ квантовые свойства тепловой энергии, впоследствии формула Планка (Нобелевская премия, 1918 г.). А. Эйнштейн (1905 г.) ─ квантовая теория фотоэффекта (Нобелевская премия, 1921 г.). Э.Шредингер (1926 г.) ─ волновое уравнение (Нобелевская премия, 1933 г.) В.Гейзенберг (1927 г.) ─ принцип неопре- деленности (Нобелевская премия, 1932 г.) Дж. фон Нейман (1932 г. ) ─ книга «Математические основы квантовой механики». Ю.И. Манин (1980 г.) ─ идея использо- вания квантовых вычислений («Вычислимое и невычислимое»).
  • 55. П.Бениоф и Р. Фейнман (1982 г.) ─ показали, что классический компьютер не в состоянии моделировать квантовые процессы. Д. Дойч (1985 г.) ─ предложил конкретную математическую модель квантовой машины. П. Шор (1994 г.) ─ предложил для квантового компьютера алгоритм разложения n-значного числа на простые множители за время, полиномиально зависящее от n (р-полная задача - квантовый алгоритм факторизации). Л.Гровер (1996 г.) ─ разработал быстрый квантовый алгоритм перебора, позволивший говорить о значительном превосходстве квантовых компьютеров над полупроводниковыми. Н.Гершенфельд и И.Чуанг (1997 г.) ─ создали первый прототип квантового компьютера «на двух атомах» в Массачусетском технологическом институте (США) Немного истории
  • 56. Подходы к реализации |0 1| Классический бит (С-bit) |0 1> Квантовый бит (Q-bit)
  • 57. Подходы к реализации Квантовый компьютер ─ это вычислительное устройство, которое работает на основе принципов квантовой механики. Квантовый компьютер использует для вычисления не классические алгоритмы, а более сложные процессы квантовой природы ─ квантовые алгоритмы. Эти алгоритмы используют понятия на базе квантовомехани- ческих эффектов: «квантовую запутанность (Quantum Entangled State)» и «квантовый параллелизм (Quantum Parallelism».
  • 58. Подходы к реализации Если классический процессор в каждый момент может находиться ровно в одном из состояний: (обозначения П.Дирака), то квантовый процессор в каждый момент находится одновременно во всех этих базисных состояниях ─ при этом в каждом состоянии — со своей комплексной амплитудой λj. Это квантовое состояние называется «квантовой суперпозицией» данных классических состояний и обозначается как
  • 59. Подходы к реализации В общем случае если квантовая система состоит из L q-битов, то у неё имеется 2L возможных классических состояний, каждое из которых может быть измерено с некоторой вероятностью. Функция состояния такой квантовой системы запишется в виде: где |n> — базисные квантовые состояния (например, состояние |001101 , а |cn|2 — вероятность нахождения в базисном состоянии |n> . Для того чтобы изменить состояние суперпозиции квантовой системы, необходимо реализовать селективное внешнее воздействие на каждый q-бит. С математической точки зрения такое преобразование представляется унитарными матрицами размера 2Lx2L. В результате будет получено новое квантовое состояние суперпозиции.
  • 60. Подходы к реализации Квантовое состояние может изменяться во времени двумя принципиально различными путями: ─ унитарная квантовая операция (квантовый вентиль, quantum gate). ─ измерение (наблюдение).
  • 61. Подходы к реализации Квантовый регистр представляет собой совокупность некоторого числа L q-битов. До ввода информации в компьютер все q-биты квантового регистра должны быть приведены в базисные состояния |0> . Эта операция называется подготовкой, или инициализацией. Далее определенные q-биты подвергаются селективному внешнему воздействию (например, с помощью импульсов внешнего электромагнитного поля, управляемых классическим компьютером). Значение q-битов, из состояния |0> переходят в состояние |1>. При этом состояние всего квантового регистра перейдет в суперпозицию базисных состояний |nс>, то есть состояние квантового регистра в начальный момент времени будет определяться функцией:
  • 62. Подходы к реализации В квантовом процессоре введенные данные подвергаются последовательности квантовых логических операций, которые с математической точки зрения описываются унитарным преобразованием Ûmn, действующим на состояние всего регистра. В результате через некоторое количество тактов работы квантового процессора исходное квантовое состояние системы становится новой суперпозицией вида: Эта функция суперпозиции представляет собой результат вычислений в квантовом процессоре. Остается лишь считать полученные значения, для чего производится измерение значения квантовой системы.
  • 63. 1. Физическая система, представляющая собой полномасштабный квантовый компьютер, должна содержать достаточно большое число (L > 100) хорошо различимых q-битов для выполнения соответствующих квантовых операций. 2. Необходимо обеспечить максимальное подавление эффектов разрушения суперпозиции квантовых состояний, обусловленных взаимодействием системы q-битов с окружающей средой, в результате чего может стать невозможным выполнение квантовых алгоритмов. Подходы к реализации
  • 64. Подходы к реализации 3. Время разрушения суперпозиции квантовых состояний (время декогерен- тизации) должно по крайней мере в сто с лишним раз превышать время выполнения основных квантовых операций (время такта). Для этого система q-битов должна быть довольно слабо связана с окружением. 4. Необходимо обеспечить измерение с достаточно высокой надежностью состояния квантовой системы на выходе. Измерение конечного квантового состояния является одной из основных проблем квантовых вычислений!
  • 65. Март 2010 г. В Исследовательском центре города Юлих (Германия) смоделировали работу квантового компьютера с 42 q-битами, используя мощнейший европейский супер- компьютер JUGENE . Производительность классических компьютеров растет линейно: увеличение количества используемых транзисторов на 10% в идеальном случае даст лишь 10-процентный прирост скорости вычислений. Кристел Михельсен: «Вычислительная мощность квантовой системы при увеличении ее размеров растет экспоненциально. Это открывает широчайшие возможности в будущем, но сильно затрудняет моделирование на «классических» компьютерах» Подходы к реализации
  • 66. Пиковая производительность JUGENE составляет один петафлопс (1015 операций с плавающей запятой в секунду). В структуру суперкомпьютера входят 73 728 вычислительных узлов, на каждый из которых приходится по 2 Гб памяти. Вычислениями заняты 294 912 процессоров PowerPC 450 с тактовой частотой 850 МГц. Смоделированный квантовый компьютер реализовал алгоритм Шора (разложение на простые множители): число 15 707 ему удалось представить в виде произведения простых чисел 113 и 139. При реализации алгоритма на практике столь большие числа недоступны, поскольку известные прототипы квантовых компьютеров пока ненадежны и содержат не более восьми q-битов. Подходы к реализации
  • 67. В качестве квантового процессора рассматривали несколько схем построения, некоторые прототипы были созданы с использованием органической жидкости. В данном случае ядра отдельных атомов рассматривались в качестве q-битов. Все молекулы органической жидкости ведут себя одинаково при осуществлении необходимых взаимодействий. Благодаря этому появляется возможность применения методики и техники ядерного магнитного резонанса (ЯМР) ─ избирательного поглощения веществом электромагнитного излучения, обусловленного переориентацией магнитных моментов атомных ядер, находящихся в постоянном магнитном поле. Физическая реализация
  • 68. В такой модели отсутствует индивидуальное обращение к отдельным q-битам, оно осущест- вляется одновременно ко всему ансамблю имеющихся q-битов. Компьютер с процессором такого рода получил название ансамблевого квантового компьютера (Bulk-ensemble Quantum Computer). Докторская диссертация А.А. Кокина на тему: «Твердотельные ядерные магнито-резонансные ансамблевые квантовые компьютеры» (2003 г.). Первые эксперименты на ядерных спинах двух атомов водорода в молекулах 2,3-дибромотиофена SCH:(CBr)2:CH и на трех ядерных спинах — одном в атоме водорода H и двух в изотопах углерода 13C в молекулах трихлорэтилена CCl2:CHCl — были поставлены в 1997 году в Оксфорде (Великобритания). Физическая реализация
  • 69. Физическая реализация Март 2011 г. Профессор Университета Ульма Томмасо Каларко, крупный специалист по квантовым компьютерам, приезжал с лекцией в МФТИ. Он рассказал студентам о перспективах развития квантовых технологий и возможном участии в этом России: «В настоящее время речь не идёт о создании полномасштабного квантового компьютера. Во-первых, мы не можем нормально транспортировать атомы. Во-вторых, мы не можем присвоить адрес в массиве конкретному q-биту для управления им. Ведь мы хотим, чтобы система подчинялась нам и только нам. Однако, мы рассчитываем, что теория оптимального управления поможет нам в этом».
  • 70. Сенсация?! Канадская компания D-Wave Systems в 2007 году анонсировала первый коммерческий квантовый компьютер (на 16 q-битов). В конце мая 2011 года компания заявила о продаже квантового компьютера. Покупателем выступила известная компания Lockheed Martin, которая намерена с его помощью создать некую «киберфизическую систему», которая интегрирует внутреннее состояние вычислителей с информацией из окружающей среды. Джорди Роуз (учредитель и директор по технологиям D-Wave Systems): «Эта машина должна делать одну вещь лучше, чем обычный компьютер ─ искать ответ на проблемы, которые могут быть по-настоящему решены только исчерпывающим перебором всех возможных вариантов ответов».
  • 71. Элементарная схема фазового q-бита и фотография 128-q-битного процессора компании D-Wave (фото из журнала «Nature») Сенсация?!
  • 72. 11 мая 2011 г. представители D-Wave, опубликовала в Nature статью, объясняющую некоторые аспекты подхода к построению квантового процессора на примере системы из 8 q-битов (в D-Wave One объединено 16 таких ячеек) и особенно — к организации на нём определённого класса вычислений. Скотт Ааронсон, эксперт по компьютерным системам из Масса- чусетского технологического института скептически отметил: «Существует огромный разрыв между демонстрацией некоего квантового эффекта в восьми Q-битах, что они и сделали, и заявлением, что у них есть 128-ми q-битный чип, который может выполнять вычислительно интересные задачи много быстрее, чем обычный компьютер». Сенсация?!
  • 73. Как и предшествующие разработки компании D-Wave, эта машина основана на сверхпрово- дящих q-битах (физически это специальной формы петли на основе сплава ниобия). Магнитные поля манипулируют энергетическим состоянием q-битов. А так как их совокупность находится в состоянии квантовой суперпозиции, вычислительное устройство может одновременно вести поиск во множестве энергетических состояний, представляющих различные решения задачи. Сенсация?!
  • 74. Granichin O. N., Molodtsov S. L. и др. Method of measurements with random perturbation: application in photoemission experiments // Review of scientific instruments. 79, 036103. 2008. Реальность!
  • 76.
  • 77. S layer: Structural properties H. Eberhardt et al., J. Bacteriol. 168 (1986) 309 3D reconstruction of S layer viewed from outer (top) and inner (bottom) surface H. Engelhardt Sporosarcina ureae H. Eberhardt, NATO ASI Series (Springer-Verlag,1991) Transmission electron microscopy image
  • 78. Growth of S layer on SiOx/Si substrates Plasma treatment of substrates with plasma treatment without plasma treatment Protein subunits are composed of 20 different amino acids. Their atomic composition is C4912H7860N1324O1615S5 Solution of sodium phosphate, MgCl2 and NaN3
  • 79.
  • 80. 80 ExaScale Необходимость в новых формах обучения и подготовки специалистов Специализированные порталы, лекционные курсы, практикумы, семинары, вебинары, мастер-классы, учебно-исследовательские проекты и лаборатории Смена парадигмы
  • 81. 81 Учебно-исследовательские лаборатории Intel в университетах Созданы по инициативе вице-президента корпорации Intel Эндрю Гроува (предисловие к книге «Выживают только параноики») и СЕО Intel Пола Отеллини «Мы очень нуждаемся в исследователях (Researchers), которые могли бы продвигать Интел к новым достижениям!» Пол Отеллини. Из выступления в Актовом зале СПбГУ 02.10.2003
  • 82. 82 Учебно-исследовательская лаборатория СПРИНТ (СПбГУ-Intel) Стратегические цели Лаборатории: Обновление и совершенствование образовательной деятельности в СПбГУ за счёт формирования целевых образовательных программ Решение актуальных научно-исследовательских задач в области современных компьютерных систем и высокопроизводительных вычислений Комплексная подготовки в СПбГУ высококвалифициро- ванных специалистов в этой области
  • 83. 83 Учебно-исследовательская лаборатория СПРИНТ (СПбГУ-Intel) Куратор Лаборатории – руководитель Академической программы Intel в России А.В.Николаев Координатор Лаборатории – зам. директора НИИ ИТ СПбГУ В.И.Кияев
  • 84. 84 Широкое сотрудничество Лаборатории с ведущими IT-компаниями Обучение мобильным технологиям и технологиям HPC
  • 85. 85 Перспективные учебно-исследователь- ские проекты на базе НРС Расчеты для модели человека с использованием геометрических объемных элементов (voxel)
  • 86. 86 Всероссийская суперкомпьютерная конференция «Научный сервис в сети Интернет Абрау-Дюрсо, 21-25 сентября 2010 г. ----------------------------------------------------------------------------------------------------------------------- Tunnel Creek САН-ФРАНЦИСКО (Калифорния), 14 сентября 2010 г. Корпорация Intel представила линейку процессоров Intel® Atom™ E600, ранее известную как Tunnel Creek. Эта «система-на-чипе» (System-on-Chip, SoC) с ядром Atom предусматривает прямое подключение для упрощения взаимодействия с устройствами ввода/вывода. Гибкость новой SoC призвана облегчить разработку уникальных по дизайну решений, оптимально подходящих для бортовых, информационно-развлекательных систем, смартфонов и устройств для «умных» электрических сетей (Smart Electrical Grid).
  • 87. 87 Всероссийская суперкомпьютерная конференция «Научный сервис в сети Интернет Абрау-Дюрсо, 21-25 сентября 2010 г. -----------------------------------------------------------------------------------------------------------------------  Конкурс студенческих проектов «Атмосфера»  Разработка системы CarPC на базе ОС Moblin  Разработка мультиагентной системы БПЛА  Распределенные вычисления Проекты 2010-2011 годов в рамках программы Атомосфера»
  • 88. 88 Мирная «атомная» программа Intel День разработчика ПО для Intel® Atom™ в СПбГУ Конкурс студенческих проектов Программа «Атомосфера 2010-2012»
  • 89. 89 Малые формы высокопроизводительных вычислений: разработка приложений для мобильных платформ Программа «Атомосфера 2010-2012»
  • 90. 90 Победители и лауреаты Конкурса-2010 Программа «Атомосфера 2010-2012»
  • 91. Разработка мультиагентной системы для БПЛА Беспилотные летательные аппараты  Взаимодействие БПЛА с мобильной базовой станцией и между собой  Бортовой микрокомпьютер  Автопилот Paparazzi  Архитектура мультиагентной системы
  • 92. 92 Мобильная базовая станция Бортовой микрокомпьютер Автопилот Papapazzi
  • 94. 94 Корпорация Intel и портал IT-Планета объявляют о конкурсе студенческих проектов разработки программных приложений для Intel® Atom™ «Атомосфера» ПЕРВЫЙ ЭТАП – с 21 октября по 31 декабря 2010 г. ВТОРОЙ ЭТАП – с 01 января по 15 марта 2011 г. Конкурс студенческих проектов разработки программных приложений «Атомосфера-2011»
  • 95. 95 Учебный курс «Введение в разработку приложений на платформе Atom/MeeGo» Научные журналы кафедры системного программирования Математико-механического факультета СПбГУ Тематические лекции и конкурсы для студентов факультетов СПбГУ и стажеров Лаборатории Методические материалы

Editor's Notes

  1. 19