CUDA Course 2010 at MSU

Архитектура и программирование массивно-параллельных вычислительных систем ,[object Object],[object Object],[object Object]

Существующие многоядерные системы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Существующие многоядерные системы ,[object Object],[object Object],[object Object],[object Object]

Существующие многоядерные системы ,[object Object],[object Object],[object Object],[object Object],[object Object]

Intel Core 2 Duo ,[object Object],[object Object],[object Object]

Symmetric Multiprocessor Architecture (SMP)

Symmetric Multiprocessor Architecture (SMP) ,[object Object],[object Object],[object Object],[object Object]

Cell ,[object Object],[object Object],[object Object]

BlueGene/L ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Архитектура G80 ,[object Object]

Классификация ,[object Object],[object Object],[object Object],[object Object],[object Object]

MultiThreading “Hello World” ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

MultiThreading “Hello World” ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

SSE “Hello World” ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

SIMD ,[object Object],[object Object],[object Object]

SIMD ,[object Object],[object Object]

Эволюция GPU ,[object Object],[object Object],[object Object]

Эволюция GPU ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Эволюция GPU: Шейдеры ,[object Object],[object Object],[object Object],[object Object],[object Object]

Эволюция GPU: Шейдеры ,[object Object],[object Object],[object Object]

Отличия CPU от GPU ,[object Object],[object Object],[object Object]

GPGPU ,[object Object],[object Object],[object Object],[object Object]

CUDA (Compute Unified Device Architecture) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

CUDA “Hello World” ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

CUDA “Hello World” ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

CUDA “Hello World” float a [N]; float * dev = NULL; // выделить память на GPU под N элементов cudaMalloc ( ( void **)&dev, N * sizeof ( float ) ); // запустить N нитей блоками по 512 нитей // выполняемая на нити функция - kernel // массив данных - dev kernel<<<dim3 ( (N/512),1), dim3(512,1)>>> ( dev ); // скопировать результаты из памяти GPU (DRAM) в // память CPU (N элементов ) cudaMemcpy ( a, dev, N * sizeof ( float ), cudaMemcpyDeviceToHost ); // освободить память GPU cudaFree ( dev );

Архитектура Tesla 10 Interconnection Network TPC TPC TPC TPC TPC TPC TPC TPC TPC TPC ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 DRAM DRAM DRAM DRAM DRAM DRAM DRAM DRAM CPU Bridge Host Memory Work Distribution

Архитектура Tesla : Мультипроцессор Tesla 8 TEX SM SM Texture Processing Cluster Streaming Multiprocessor Instruction $ Constant $ Instruction Fetch Shared Memory SFU SP SP SP SP SFU SP SP SP SP Register File

Архитектура Tesla Мультипроцессор Tesla 10 TEX SM SM Texture Processing Cluster SM Streaming Multiprocessor Instruction $ Constant $ Instruction Fetch Shared Memory SFU SP SP SP SP SFU SP SP SP SP Double Precision Register File

Архитектура ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

SIMT (Single Instruction, Multiple Threads) ,[object Object],[object Object],[object Object],[object Object]

Архитектура Fermi ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Архитектура Fermi. Потоковый мультипроцессор Instruction Cache Uniform Cache Warp Scheduler 64 Kb Shared Memory/ L1 Cache SFU Core Interconnection network Register File (32768 32-bit words Dispatch Unit Warp Scheduler Dispatch Unit Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core SFU SFU SFU Uniform Cache LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST LD/ST

Архитектура Fermi ,[object Object],[object Object],[object Object],[object Object]

Ресурсы нашего курса ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ресурсы нашего курса ,[object Object],[object Object],[object Object],[object Object],[object Object]

Несколько слов о курсе ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

CUDA Course 2010 at MSU

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to CUDA Course 2010 at MSU

Similar to CUDA Course 2010 at MSU (20)

CUDA Course 2010 at MSU

Editor's Notes