SlideShare a Scribd company logo
1 of 11
Download to read offline
Nagy teljesitmény „aprópénzért”
Mátyás Zoltán – szoftverfejlesztő
2016.05.02.
Mátyás Zoltán
• Villamosmérnök (BME)
• Vezető fejlesztő, Architect, Team Lead
• J2SE, Eclipse
• Kemény valós idejű rendszerek
– Kommunikációs protokollok
– Worst-case latency számolás
• 3 világszabadalom
– CAN
– GPU programozás
Videókártya?
• nVidia TESLA
Teljesitmény
• Intel i7 Skylake
– 4 mag / 8 szál
– 207 gflops
• AMD R9 290
– 44 processing unit (2816 stream processing unit)
– 4848 gflops
– 4 bridgelhető
• nVidia GeForce GTX 980
– 64 ROP (2088 CUDA cores)
– 4600 gflops
– 3 bridgelhető
CPU, GPU, APU
• CPU
– Egyszerű végrehajtó egység
– Általános célokra
– 4 integrált mag
• GPU
– Magasabb számitási teljesitmény
– 2D/3D megjelenités
– Csak grafikai célokra
– Szűk műveleti kör
• APU
– CPU és GPU funkció egy chip-en
– Általános célokra
– Nagyon magas számitási teljesitmény
– Mai CPU-k APU-k is egyben
API-k, Környezetek
• nVidia
– CUDA C/C++, JCUDA
• Windows
– DirectCompute
• Released with DirectX11
• Cross-Vendor
– OpenCL
GPU Architektúra
Nehézségek I.
• Nem általános célú processzor
– Akkor gyors, ha minden egység ugyanazt a múveletet végzi
• Párhuzamositási probléma
– Szálak közti szinkronizáció
• APU problémák
– Stack mérete nagyon kicsi
• Rekurzió nem támogatott (le se fordul a kód)
• Stack használatát minimalizálni kell
– Paraméterek száma
– Belső változók
– Inline függvények
• Bementi adatok helyes használata
– Duplikáció kerülése
– Keresés mellőzése
Nehézségek II.
• Memória használat
– Teljesen más memória model
– Elérési sebességek különbözőek
Memória model
• Globális memória
– Nagy kapacitás
– Lassú elérés
• Érdemes minél kevésbé használni
• Konstans memória
– Kis kapacitás
– Gyors elérés
– Read-only
• Lokális memória
– Gyorsabb elérés
– Kis kapacitás
– Random access
• Privát memória
– Nagyon gyors elérés
– Pár 100 kb
– Random access
Összefoglalás
• GPU – Nem csak grafika
• CPU, GPU, APU
• Fejlesztői környezetek
• Nehézségek, megoldások

More Related Content

Viewers also liked (20)

Doc1ااال
Doc1ااالDoc1ااال
Doc1ااال
 
www.amazon.com/shops/POWERBOOKONE
www.amazon.com/shops/POWERBOOKONEwww.amazon.com/shops/POWERBOOKONE
www.amazon.com/shops/POWERBOOKONE
 
Prismas
PrismasPrismas
Prismas
 
Estimation formula
Estimation formulaEstimation formula
Estimation formula
 
Culto mensal regi
Culto mensal regiCulto mensal regi
Culto mensal regi
 
Sec 02
Sec 02Sec 02
Sec 02
 
124
124124
124
 
No pills
No pillsNo pills
No pills
 
Mi biografia
Mi biografiaMi biografia
Mi biografia
 
CHS receives Palmetto Gold
CHS receives Palmetto GoldCHS receives Palmetto Gold
CHS receives Palmetto Gold
 
Sec 01
Sec 01Sec 01
Sec 01
 
Grafica evm
Grafica evmGrafica evm
Grafica evm
 
Resolucion 0693
Resolucion 0693Resolucion 0693
Resolucion 0693
 
Aula12
Aula12Aula12
Aula12
 
Foro ciudadano noticias
Foro ciudadano noticiasForo ciudadano noticias
Foro ciudadano noticias
 
Para minha aluna
Para minha alunaPara minha aluna
Para minha aluna
 
Cartilha1
Cartilha1Cartilha1
Cartilha1
 
Stiforp portg.
Stiforp portg.Stiforp portg.
Stiforp portg.
 
Cordel grupo 01 pdf
Cordel grupo 01 pdfCordel grupo 01 pdf
Cordel grupo 01 pdf
 
Direito tributario e_financas_publicas_iii_professor_2011-1
Direito tributario e_financas_publicas_iii_professor_2011-1Direito tributario e_financas_publicas_iii_professor_2011-1
Direito tributario e_financas_publicas_iii_professor_2011-1
 

Similar to Grafikus kártyák

Klaszter és virtualizációs technikák
Klaszter és virtualizációs technikákKlaszter és virtualizációs technikák
Klaszter és virtualizációs technikákFerenc Szalai
 
Mohácsi László: Gazdasági számítások párhuzamos számítógépeken
Mohácsi László: Gazdasági számítások párhuzamos számítógépekenMohácsi László: Gazdasági számítások párhuzamos számítógépeken
Mohácsi László: Gazdasági számítások párhuzamos számítógépekenInformatikai Intézet
 
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​RbertHahn
 
Deep reinforcement learning with DonkeyCar
Deep reinforcement learning with DonkeyCarDeep reinforcement learning with DonkeyCar
Deep reinforcement learning with DonkeyCarLeventeDmsa1
 
Net App At Egis Magyar
Net App At Egis MagyarNet App At Egis Magyar
Net App At Egis Magyargazdagf
 
Windows Szerver kiadások.
Windows Szerver kiadások.Windows Szerver kiadások.
Windows Szerver kiadások.Attila Nagy
 
Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!Open Academy
 
Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Attila Balogh-Biró
 
Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Attila Balogh-Biró
 
Virtualizáció az EGISben
Virtualizáció az EGISbenVirtualizáció az EGISben
Virtualizáció az EGISbengazdagf
 
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokon
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokonVirtualizált szolgáltatás platform kialakítása Xen és AoE alapokon
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokonFerenc Szalai
 
Új vizeken - Virtualizált szerver megoldások a Cisco-tól
Új vizeken - Virtualizált szerver megoldások a Cisco-tólÚj vizeken - Virtualizált szerver megoldások a Cisco-tól
Új vizeken - Virtualizált szerver megoldások a Cisco-tólGloster telekom Kft.
 
Virtuális Platformváltás validált környezetben
Virtuális Platformváltás validált környezetbenVirtuális Platformváltás validált környezetben
Virtuális Platformváltás validált környezetbengazdagf
 
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...Ferenc Szalai
 
App! képzés 2012. 11. 29.
App! képzés 2012. 11. 29.App! képzés 2012. 11. 29.
App! képzés 2012. 11. 29.fboldog
 

Similar to Grafikus kártyák (20)

Klaszter és virtualizációs technikák
Klaszter és virtualizációs technikákKlaszter és virtualizációs technikák
Klaszter és virtualizációs technikák
 
Mohácsi László: Gazdasági számítások párhuzamos számítógépeken
Mohácsi László: Gazdasági számítások párhuzamos számítógépekenMohácsi László: Gazdasági számítások párhuzamos számítógépeken
Mohácsi László: Gazdasági számítások párhuzamos számítógépeken
 
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​
PC KONFIGURÁCIÓ​ ÖSSZEÁLLÍTÁSA​
 
Budapest.rb 201010
Budapest.rb 201010Budapest.rb 201010
Budapest.rb 201010
 
Deep reinforcement learning with DonkeyCar
Deep reinforcement learning with DonkeyCarDeep reinforcement learning with DonkeyCar
Deep reinforcement learning with DonkeyCar
 
Polygon hirlevel 20120419_kereskedelmi
Polygon hirlevel 20120419_kereskedelmiPolygon hirlevel 20120419_kereskedelmi
Polygon hirlevel 20120419_kereskedelmi
 
Net App At Egis Magyar
Net App At Egis MagyarNet App At Egis Magyar
Net App At Egis Magyar
 
Windows Szerver kiadások.
Windows Szerver kiadások.Windows Szerver kiadások.
Windows Szerver kiadások.
 
Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!
 
Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (
 
Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (Enterprise java evolució, avagy java ee (
Enterprise java evolució, avagy java ee (
 
Virtualizáció az EGISben
Virtualizáció az EGISbenVirtualizáció az EGISben
Virtualizáció az EGISben
 
Polygon hirlevel 20110114_kereskedelmi
Polygon hirlevel 20110114_kereskedelmiPolygon hirlevel 20110114_kereskedelmi
Polygon hirlevel 20110114_kereskedelmi
 
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokon
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokonVirtualizált szolgáltatás platform kialakítása Xen és AoE alapokon
Virtualizált szolgáltatás platform kialakítása Xen és AoE alapokon
 
Xen klaszterek
Xen klaszterekXen klaszterek
Xen klaszterek
 
Új vizeken - Virtualizált szerver megoldások a Cisco-tól
Új vizeken - Virtualizált szerver megoldások a Cisco-tólÚj vizeken - Virtualizált szerver megoldások a Cisco-tól
Új vizeken - Virtualizált szerver megoldások a Cisco-tól
 
Uj vizeken
Uj vizekenUj vizeken
Uj vizeken
 
Virtuális Platformváltás validált környezetben
Virtuális Platformváltás validált környezetbenVirtuális Platformváltás validált környezetben
Virtuális Platformváltás validált környezetben
 
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...
Nagy-teljesítményű, költséghatékony adattárolási technológiák könyvtári körny...
 
App! képzés 2012. 11. 29.
App! képzés 2012. 11. 29.App! képzés 2012. 11. 29.
App! képzés 2012. 11. 29.
 

Grafikus kártyák

  • 1. Nagy teljesitmény „aprópénzért” Mátyás Zoltán – szoftverfejlesztő 2016.05.02.
  • 2. Mátyás Zoltán • Villamosmérnök (BME) • Vezető fejlesztő, Architect, Team Lead • J2SE, Eclipse • Kemény valós idejű rendszerek – Kommunikációs protokollok – Worst-case latency számolás • 3 világszabadalom – CAN – GPU programozás
  • 4. Teljesitmény • Intel i7 Skylake – 4 mag / 8 szál – 207 gflops • AMD R9 290 – 44 processing unit (2816 stream processing unit) – 4848 gflops – 4 bridgelhető • nVidia GeForce GTX 980 – 64 ROP (2088 CUDA cores) – 4600 gflops – 3 bridgelhető
  • 5. CPU, GPU, APU • CPU – Egyszerű végrehajtó egység – Általános célokra – 4 integrált mag • GPU – Magasabb számitási teljesitmény – 2D/3D megjelenités – Csak grafikai célokra – Szűk műveleti kör • APU – CPU és GPU funkció egy chip-en – Általános célokra – Nagyon magas számitási teljesitmény – Mai CPU-k APU-k is egyben
  • 6. API-k, Környezetek • nVidia – CUDA C/C++, JCUDA • Windows – DirectCompute • Released with DirectX11 • Cross-Vendor – OpenCL
  • 8. Nehézségek I. • Nem általános célú processzor – Akkor gyors, ha minden egység ugyanazt a múveletet végzi • Párhuzamositási probléma – Szálak közti szinkronizáció • APU problémák – Stack mérete nagyon kicsi • Rekurzió nem támogatott (le se fordul a kód) • Stack használatát minimalizálni kell – Paraméterek száma – Belső változók – Inline függvények • Bementi adatok helyes használata – Duplikáció kerülése – Keresés mellőzése
  • 9. Nehézségek II. • Memória használat – Teljesen más memória model – Elérési sebességek különbözőek
  • 10. Memória model • Globális memória – Nagy kapacitás – Lassú elérés • Érdemes minél kevésbé használni • Konstans memória – Kis kapacitás – Gyors elérés – Read-only • Lokális memória – Gyorsabb elérés – Kis kapacitás – Random access • Privát memória – Nagyon gyors elérés – Pár 100 kb – Random access
  • 11. Összefoglalás • GPU – Nem csak grafika • CPU, GPU, APU • Fejlesztői környezetek • Nehézségek, megoldások