Cuda, OpenCL

Большинство суперкомпьютеров
(список top500.org) – гетерогенные среды.
CPU : GPU = 1 : n (n = 1, 2, 3,…)

Технологии GPGPU. Практическое
применение

Кизько Б. А.,
5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
07.05.2013

GPU

CPU
vs
GPU
Гораздо больше транзисторов GPU
отведено на обработку данных,
а не на управление исполнением
(т.н. Flow control)

GPGPU до 2007 года

Шейдерные языки Cg, GLSL и HLSL
GLSL – OpenGL
HLSL – Microsoft DirectX
1.Широкая поддержка оборудования.
2.Отсутствие готовых библиотек.
3.Необходимо знание специализированного
языка
4.Привязка к графическим API.

NVIDIA Compute Unified Device
Architecture
Язык программирования C с расширениями
Распространённость GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600, 700

NVIDIA Compute Unified Device Architecture
GPU – сопроцессор (device) для CPU (host)
Собственная память (память устройства, device
memory)
Параллельная обработка множества потоков
Ядро (kernel) – исполняемая над большим числом
потоков функция с параллелизмом данных
Отличия потоков GPU от CPU:
•Для полной эффективности GPU нужны тысячи
потоков
•Легковесность, низкие накладные расходы на
создание

Architecture

Architecture
SIMD (Single Instruction – Multiple Data)
SIMT (Single Instruction – Multiple Thread)
Несколько видов памяти
(регистры, локальная,
разделяемая, глобальная,
константная, текстурная) с
разными правами доступа

Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple,
NVIDIA, IBM, ARM
2008 г. - OpenCL 1.0
1 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%

CPU (host) управляет OpenCL-устройствами
(devices): CPU, GPU, DSP, …

WinZip, ArcSoft, Corel VideoStudio, GIMP,
Mathematica 8, vReveal, Blender, BattleField 3, …
PyOpenCL, WebCL (JS-интерфейс для обработки
вычислений в браузере, поддержка в Firefox и
WebKit), ScalaCL, Ruby-OpenCL
PGI OpenCL Compiler, OpenCL Studio, ZiiLABD
OpenCL SDK
http://openclnews.com/apps

AMD OpenCL University Kit
Набор материалов от AMD для обучения
технологии в течение семестра.
13 лекций с примерами кода и набором заданий
http://developer.amd.com/resources/heterogeneouscomputing/opencl-zone/

HSA Foundation

AMD, ARM, Samsung, Texas Instruments,
Qualcomm, MediaTek, Imagination Technologies

Intel
Larrabee -> Xeon Phi
Архитектура x86
Много ядер Pentium в одном чипе с общей памятью

Intel Xeon Phi
Сопроцессор 5110P:
60 ядер Pentium 1GHz с EM64T, 4 потока/ядро 512бит SIMD
512К L2
1 TFLOPS
6/8 Gb GDDR5
RHEL 6.x
SuSE Linux 12

Взаимодействие NVIDIA с ВУЗами

269 университетов мира
СПбГПУ, СПбГУ, "Дубна", ОИЯИ,
МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт",
МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр
"Параллельные вычисления", Дубна

Список источников
1. Сайты HSA Foundation, NVIDIA, AMD,
Khronos Group
2. thg.ru - подробный обзор Intel Xeon Phi
3. Wikipedia
4. Статьи с habrahabr.ru
5. Сайт научно-образовательного центра
"Параллельные вычисления"
http://www.parallel-compute.ru/
6. opencl.org
7. gpgpu.org
8. Результаты НИР на 3-4 курсах. Научный
руководитель - Семьянов П. В.

Благодарю за внимание!

Cuda, OpenCL

Recommended

Recommended

More Related Content

What's hot

What's hot (9)

Similar to Cuda, OpenCL

Similar to Cuda, OpenCL (20)

More from Boris Kizko

More from Boris Kizko (9)

Cuda, OpenCL