SlideShare a Scribd company logo
1 of 23
Аналіз технологій
мультичіпової обробки даних
на GPU для організації
масивно-паралельних
обчислень


                            Автори:
          Яровий А. А., Мудрик В. В.
   Мета досліджень: аналіз технологій
    мультичіпової обробки даних на
    GPU для організації
    високопродуктивних масивно-
    паралельних обчислень.
   Об’єкт досліджень: організація
    масивно-паралельних обчислень на
    основі графічних процесорних
    пристроїв.
   Предмет досліджень: технології
    мульчіпової обробки даних на GPU.
GPGPU
   CUDA;
   Direct Compute;
   OpenCL;
   AMD FireStream;
   C++ AMP.
Гібридні системи
  Гібридна обчислювальна система –
  система з гетерогенною апаратною
  обчислювальної структурою.
Переваги:
 ціна;

 продуктивність;

 гнучкість і зручність в

  обслуговуванні.
Що потрібно?
   відеоадаптери однакової серії, але
    необов’язково однієї моделі;
   материнська плата із мінімум двома
    роз’ємами PCI-Express;
   спеціальний місток;
   інші комплектуючі із достатньою
    конфігурацією.
SLI vs Cross Fire X
          SLI           Cross Fire X

Блок      550           700
живлення,
Ватт
Час на    1998 3dfx,    2006
ринку     2001 NVIDIA +
          3dfx, 2004
Об’єднанн               менша
я                       швидкодія
Орієнтована ціна за два
відеоадаптера початкового рівня
  $95 кожний (Radeon X1300) vs $90
  кожний (GeForce 6600LE)
Стандартний тест 3DMark
Загальний тест PCMark
Тест процесора відеоадаптера
Висновки
 На основі багатокритеріального
 порівняльного аналізу визначено,
 що для даних досліджень відносно
 кращою є технологія NVIDIA SLI,
 головною перевагою якої є простота
 реалізації, доступність компонентів
 на ринку та відносна апаратна
 дешевизна (враховуючи середню
 ціну на апаратні модулі), менші
 значення показників споживання
 електроенергії.
Практична цінність
Дані дослідження виконуються в межах наукового
   проекту “Високопродуктивний обчислювальний
   мережевий комплекс на основі сучасних
   паралельно-ієрархічних технологій для підвищення
   ефективності навчальної, наукової та управлінської
   діяльності у навчальних закладах Вінницького
   регіону”, що виконується на основі отриманого
   гранту Вінницької обласної Ради та обласної
   державної адміністрації для закладів освіти системи
   загальної середньої, професійно-технічної та вищої
   освіти в рамках реалізації обласної Програми
   "Розвитку інформаційних, телекомунікаційних та
   інноваційних технологій в закладах освіти
   Вінницького регіону до 2015 року"
ВНТУ
Кафедра Комп`ютерних наук
   2 відеоадаптери Zotac GeForce GTX590
    3072 Mb 768 bit, об’єднані за технологією
    Quad SLI; 2488,3 GFLOPS;
   материнская плата MSI Big Bang-
    XPOWER;
   DIMM 4096Mb DDR3 PC3-10600 Kingston,
    1333MHz, 512M x 64, CL9, Non-ECC,
    Retail;
   Процесор Intel Xeon E5606
    (BX80614E5606) s1366, 2.13GHz, QPI 4.8
    GT/s, 4Mb, 4 ядра, 32nm, 80W, BOX.
Scientific GPGPU (@sgpgpu)
URL:http://scientificgpgpu.blogsp
 ot.com/
VK: http://vk.com/sgpgpu
Scientific GPGPU (@sgpgpu)




http://store.ovi.com/content/268586
Scientific GPGPU (@sgpgpu)
Aналіз технологій мультичіпової обробки даних на GPU для організації масивно паралельних обчислень

More Related Content

Similar to Aналіз технологій мультичіпової обробки даних на GPU для організації масивно паралельних обчислень

Lect photoshop
Lect photoshopLect photoshop
Lect photoshopkiki
 
"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy
"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy
"Request Lifecycle at Prom.ua", Vitaliy KharytonskiyFwdays
 
Computers and Computing Works lecture №5
Computers and Computing Works lecture №5Computers and Computing Works lecture №5
Computers and Computing Works lecture №5Lesia Sobolevska
 
відеосистема
відеосистемавідеосистема
відеосистемаkalishnatalka
 
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2GoQA
 
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...De Novo
 
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...Lviv Startup Club
 
склад системного блоку
склад системного блокусклад системного блоку
склад системного блокуVsimPPT
 
Android Platform Architecture
Android Platform ArchitectureAndroid Platform Architecture
Android Platform ArchitecturePavel Bashmakov
 
відеосистема комп'ютера
відеосистема комп'ютеравідеосистема комп'ютера
відеосистема комп'ютераOliaTheltanowska
 
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙ
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙ
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙOleksii Voronkin
 
Ноутбук та його характеристика
Ноутбук та його характеристикаНоутбук та його характеристика
Ноутбук та його характеристикаІван Москаленко
 
"Rethinking Continuous Delivery", Andrii Nasinnyk
"Rethinking Continuous Delivery",  Andrii Nasinnyk"Rethinking Continuous Delivery",  Andrii Nasinnyk
"Rethinking Continuous Delivery", Andrii NasinnykFwdays
 
Lec15 архiтектура та проектування компонентних систем
Lec15 архiтектура та проектування компонентних системLec15 архiтектура та проектування компонентних систем
Lec15 архiтектура та проектування компонентних системcit-cit
 
Alexey Borisenko - Network Programmability using Python
Alexey Borisenko - Network Programmability using PythonAlexey Borisenko - Network Programmability using Python
Alexey Borisenko - Network Programmability using PythonPyCon Odessa
 

Similar to Aналіз технологій мультичіпової обробки даних на GPU для організації масивно паралельних обчислень (20)

Lect photoshop
Lect photoshopLect photoshop
Lect photoshop
 
"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy
"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy
"Request Lifecycle at Prom.ua", Vitaliy Kharytonskiy
 
Урок №6 8 клас
Урок №6 8 класУрок №6 8 клас
Урок №6 8 клас
 
Computers and Computing Works lecture №5
Computers and Computing Works lecture №5Computers and Computing Works lecture №5
Computers and Computing Works lecture №5
 
Kalyna
KalynaKalyna
Kalyna
 
відеосистема
відеосистемавідеосистема
відеосистема
 
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2
ВІКТОРІЯ ТАРАНЮК «Тестування вбудованих систем» Online QADay 2022 #2
 
Hpc 2010 @ Hpc Day 2009
Hpc 2010 @ Hpc Day 2009Hpc 2010 @ Hpc Day 2009
Hpc 2010 @ Hpc Day 2009
 
Prog inf zab_24_02_18
Prog inf zab_24_02_18Prog inf zab_24_02_18
Prog inf zab_24_02_18
 
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...
Сергей Сумец, ГП "Укрспирт": "Как происходит переход в облако в государственн...
 
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...
Lviv Outsourcing Forum 2016 Віктор Кремінь “Можливості аутсорсингу розробки f...
 
склад системного блоку
склад системного блокусклад системного блоку
склад системного блоку
 
Android Platform Architecture
Android Platform ArchitectureAndroid Platform Architecture
Android Platform Architecture
 
лр7 ethernet
лр7 ethernet лр7 ethernet
лр7 ethernet
 
відеосистема комп'ютера
відеосистема комп'ютеравідеосистема комп'ютера
відеосистема комп'ютера
 
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙ
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙ
ЗАСОБИ НАВЧАННЯ ТА ОБЛАДНАННЯ ДЛЯ НАВЧАЛЬНИХ КАБІНЕТІВ І STEM-ЛАБОРАТОРІЙ
 
Ноутбук та його характеристика
Ноутбук та його характеристикаНоутбук та його характеристика
Ноутбук та його характеристика
 
"Rethinking Continuous Delivery", Andrii Nasinnyk
"Rethinking Continuous Delivery",  Andrii Nasinnyk"Rethinking Continuous Delivery",  Andrii Nasinnyk
"Rethinking Continuous Delivery", Andrii Nasinnyk
 
Lec15 архiтектура та проектування компонентних систем
Lec15 архiтектура та проектування компонентних системLec15 архiтектура та проектування компонентних систем
Lec15 архiтектура та проектування компонентних систем
 
Alexey Borisenko - Network Programmability using Python
Alexey Borisenko - Network Programmability using PythonAlexey Borisenko - Network Programmability using Python
Alexey Borisenko - Network Programmability using Python
 

Aналіз технологій мультичіпової обробки даних на GPU для організації масивно паралельних обчислень

  • 1. Аналіз технологій мультичіпової обробки даних на GPU для організації масивно-паралельних обчислень Автори: Яровий А. А., Мудрик В. В.
  • 2. Мета досліджень: аналіз технологій мультичіпової обробки даних на GPU для організації високопродуктивних масивно- паралельних обчислень.  Об’єкт досліджень: організація масивно-паралельних обчислень на основі графічних процесорних пристроїв.  Предмет досліджень: технології мульчіпової обробки даних на GPU.
  • 3. GPGPU  CUDA;  Direct Compute;  OpenCL;  AMD FireStream;  C++ AMP.
  • 4.
  • 5.
  • 6. Гібридні системи Гібридна обчислювальна система – система з гетерогенною апаратною обчислювальної структурою. Переваги:  ціна;  продуктивність;  гнучкість і зручність в обслуговуванні.
  • 7.
  • 8. Що потрібно?  відеоадаптери однакової серії, але необов’язково однієї моделі;  материнська плата із мінімум двома роз’ємами PCI-Express;  спеціальний місток;  інші комплектуючі із достатньою конфігурацією.
  • 9.
  • 10.
  • 11. SLI vs Cross Fire X SLI Cross Fire X Блок 550 700 живлення, Ватт Час на 1998 3dfx, 2006 ринку 2001 NVIDIA + 3dfx, 2004 Об’єднанн менша я швидкодія
  • 12. Орієнтована ціна за два відеоадаптера початкового рівня $95 кожний (Radeon X1300) vs $90 кожний (GeForce 6600LE)
  • 13.
  • 17. Висновки На основі багатокритеріального порівняльного аналізу визначено, що для даних досліджень відносно кращою є технологія NVIDIA SLI, головною перевагою якої є простота реалізації, доступність компонентів на ринку та відносна апаратна дешевизна (враховуючи середню ціну на апаратні модулі), менші значення показників споживання електроенергії.
  • 18. Практична цінність Дані дослідження виконуються в межах наукового проекту “Високопродуктивний обчислювальний мережевий комплекс на основі сучасних паралельно-ієрархічних технологій для підвищення ефективності навчальної, наукової та управлінської діяльності у навчальних закладах Вінницького регіону”, що виконується на основі отриманого гранту Вінницької обласної Ради та обласної державної адміністрації для закладів освіти системи загальної середньої, професійно-технічної та вищої освіти в рамках реалізації обласної Програми "Розвитку інформаційних, телекомунікаційних та інноваційних технологій в закладах освіти Вінницького регіону до 2015 року"
  • 19. ВНТУ Кафедра Комп`ютерних наук  2 відеоадаптери Zotac GeForce GTX590 3072 Mb 768 bit, об’єднані за технологією Quad SLI; 2488,3 GFLOPS;  материнская плата MSI Big Bang- XPOWER;  DIMM 4096Mb DDR3 PC3-10600 Kingston, 1333MHz, 512M x 64, CL9, Non-ECC, Retail;  Процесор Intel Xeon E5606 (BX80614E5606) s1366, 2.13GHz, QPI 4.8 GT/s, 4Mb, 4 ядра, 32nm, 80W, BOX.