SlideShare a Scribd company logo
1 of 19
Fakulta elektrotechniky a informatiky
                 VŠB-TUO




           Gaussian Blurring Mean Shift
           segmentace obrazu pomocí
            technologie NVIDIA CUDA

Vedoucí práce:    Ing. Milan Šurkala
                                         Vojtěch Cima
Oponent práce:    Ing. Karel Mozdřeň              2012
Osnova
•   Segmentace obrazu
•   Algoritmus GBMS
•   NVIDIA CUDA
•   Implementace
•   Výsledky a dosažený výkon.
Segmentace obrazu        Detekce hran




                                               Segmentační metody
  Lékářství    Průmysl




                         Prahování
  Bezpečnost




                         Clusterovací metody
  Doprava
Blurring Meanshift
Bezparametrická, clusterovací,
iterační metoda pro nalezení
míst s největší hustotou vzorků.
Kernel
„Processing flow“ na CUDA

                  Kopírování dat
                                   Pokyn ke zpracování

                  Kopírování dat


                                      Paralelní zpracování
Hierarchie paměti
Implementace GBMS                                            Vnitřní cyklus
                                                             Vypočítá novou pozici
Paralelizace smyček                                          bodu na základě prvků
                                                             výpočetního okna.

  Vnější cyklus
  Prochází vstupní množinu bodů.

                                      Paralelizace vnitřního cyklu

  Paralelizace vnějšího cyklu
                                      Block(0,0)   Block(0,1)         Block(m,n)

                                            …            …      ….          …



                        ….

        B(0,0) B(0,1)        B(m,n)
Výsledky
                 18000
                 16000
                 14000
Počet segmentů




                 12000
                 10000
                 8000
                 6000
                 4000
                 2000
                     0
                         0   1   2   3   4   5   6     7      8      9   10   11   12   13   14   15
                                                     Počet iterací
Dosažený výkon
                          60
                Čas [s]




                          50


                          40
                                                                                                           GPU kernel 1
                                                                                                           GPU kernel 2
                          30
                                                                                                           GPU kernel 3
                                                                                                           CPU (1 jádro)
                          20
                                                                                                           CPU (2 jádra)

                          10                                                                               CPU (2 jádra + HT)



                           0
                               Nvidia GeForce     Nvidia GeForce   Intel Core i5 2410M   Intel C2D T8300
                                  GT525M             8600GT              @2.3GHz            @2,4GHz


                                      GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT)
Nvidia GeForce GT525M                       0.5              0.4               0.4
Nvidia GeForce 8600GT                       2.0              1.6               1.6
Intel Core i5 2410M @2.3GHz                                                                     37.8       22.8                 16.1
Intel C2D T8300 @2,4GHz                                                                         54.9       32.0
Dosažený výkon
                                   130x rychlejší
                          60
                Čas [s]




                          50


                          40
                                                                                                           GPU kernel 1
                                                                                                           GPU kernel 2
                          30
                                                                                                           GPU kernel 3
                                                                                                           CPU (1 jádro)
                          20
                                                                                                           CPU (2 jádra)

                          10                                                                               CPU (2 jádra + HT)



                           0
                               Nvidia GeForce     Nvidia GeForce   Intel Core i5 2410M   Intel C2D T8300
                                  GT525M             8600GT              @2.3GHz            @2,4GHz


                                      GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT)
Nvidia GeForce GT525M                       0.5              0.4               0.4
Nvidia GeForce 8600GT                       2.0              1.6               1.6
Intel Core i5 2410M @2.3GHz                                                                     37.8       22.8                 16.1
Intel C2D T8300 @2,4GHz                                                                         54.9       32.0
35x                                                                 110x
                          60
                Čas [s]




                          50


                          40
                                                                                                           GPU kernel 1
                                                                                                           GPU kernel 2
                          30
                                                                                                           GPU kernel 3
                                                                                                           CPU (1 jádro)
                          20
                                                                                                           CPU (2 jádra)

                          10                                                                               CPU (2 jádra + HT)



                           0
                               Nvidia GeForce     Nvidia GeForce   Intel Core i5 2410M   Intel C2D T8300
                                  GT525M             8600GT              @2.3GHz            @2,4GHz


                                      GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT)
Nvidia GeForce GT525M                       0.5              0.4               0.4
Nvidia GeForce 8600GT                       2.0              1.6               1.6
Intel Core i5 2410M @2.3GHz                                                                     37.8       22.8                 16.1
Intel C2D T8300 @2,4GHz                                                                         54.9       32.0
Porovnání CPU implementací

           60
 Čas [s]




                                                                                         Přidání fyzického jádra
           50

           40
                                                                                         >40%
                                                                        1 jádro
           30
                                                                        2 jádra
           20                                                           2 jádra + HT

           10

           0
                Intel C2D T8300 @2.4GHz   Intel Core i5 2410M @2.3GHz




                                    1 jádro                2 jádra        2 jádra + HT
C2D T8300                            54.8                   31.9
Core i5 2410M                        37.7                   22.8                  16.1
Porovnání CPU implementací

           60
 Čas [s]




                                                                                         Přidání fyzického jádra
           50

           40
                                                                                         >40%
                                                                        1 jádro
           30
                                                                        2 jádra
           20                                                           2 jádra + HT
                                                                                         Přínos technologie HT
           10

           0
                                                                                         >57%
                Intel C2D T8300 @2.4GHz   Intel Core i5 2410M @2.3GHz




                                    1 jádro                2 jádra        2 jádra + HT
C2D T8300                            54.8                   31.9
Core i5 2410M                        37.7                   22.8                  16.1
Porovnání GPU implementací

                          2.5




                Čas [s]
                           2




>20%
                          1.5
                                                                                GPU kernel 1
                                                                                GPU kernel 2
                           1
                                                                                GPU kernel 3

                          0.5


                           0
                                Nvidia GeForce 8600GT   Nvidia GeForce GT525M




                          Kernel 1               Kernel 2                 Kernel 3
   GeForce 8600GT           2.0                     1.6                     1.6
   GeForce GT525M           0.5                    0.42                     0.49
Závěr
Prokázaní segmentačních vlastností GBMS při segmentaci obrazu.




Více než 100 násobný výkonový nárůst použitím technologie CUDA.
Děkuji za pozornost.




Q&A
Zdroje

More Related Content

Viewers also liked

A Fresh Look For the LinkedIn Profile
A Fresh Look For the LinkedIn ProfileA Fresh Look For the LinkedIn Profile
A Fresh Look For the LinkedIn ProfileLaura Craig
 
EduNeering Online Compliance Training Solutions Overview: Life Science
EduNeering Online Compliance Training Solutions Overview: Life ScienceEduNeering Online Compliance Training Solutions Overview: Life Science
EduNeering Online Compliance Training Solutions Overview: Life ScienceEduNeering
 
The Evolution of Inbound Marketing
The Evolution of Inbound MarketingThe Evolution of Inbound Marketing
The Evolution of Inbound MarketingModgility
 
Perniagaan Borong
Perniagaan Borong Perniagaan Borong
Perniagaan Borong Sharina Nor
 
Prezentace Bakalářské práce - Obhajoba 2012
Prezentace Bakalářské práce - Obhajoba 2012Prezentace Bakalářské práce - Obhajoba 2012
Prezentace Bakalářské práce - Obhajoba 2012Petr Kozlik
 
obhajoba_prace
obhajoba_praceobhajoba_prace
obhajoba_pracezlamalp
 
Prezentace k bakalářské práci
Prezentace k bakalářské práciPrezentace k bakalářské práci
Prezentace k bakalářské práciMarek Aufart
 
Rethink springfield presentation rev
Rethink springfield presentation revRethink springfield presentation rev
Rethink springfield presentation revJohn Ramsay
 
Trelise Cooper Boardroom
Trelise Cooper BoardroomTrelise Cooper Boardroom
Trelise Cooper BoardroomLynn Woods
 

Viewers also liked (20)

Eu
EuEu
Eu
 
A Fresh Look For the LinkedIn Profile
A Fresh Look For the LinkedIn ProfileA Fresh Look For the LinkedIn Profile
A Fresh Look For the LinkedIn Profile
 
Biserica primara
Biserica primaraBiserica primara
Biserica primara
 
EduNeering Online Compliance Training Solutions Overview: Life Science
EduNeering Online Compliance Training Solutions Overview: Life ScienceEduNeering Online Compliance Training Solutions Overview: Life Science
EduNeering Online Compliance Training Solutions Overview: Life Science
 
Cansellor
CansellorCansellor
Cansellor
 
The Evolution of Inbound Marketing
The Evolution of Inbound MarketingThe Evolution of Inbound Marketing
The Evolution of Inbound Marketing
 
Ppt111
Ppt111Ppt111
Ppt111
 
Perniagaan Borong
Perniagaan Borong Perniagaan Borong
Perniagaan Borong
 
Voda - Zemelod
Voda - ZemelodVoda - Zemelod
Voda - Zemelod
 
Rwd obhajoba
Rwd obhajobaRwd obhajoba
Rwd obhajoba
 
Člověk a voda
Člověk a vodaČlověk a voda
Člověk a voda
 
Den Země 2015
Den Země 2015Den Země 2015
Den Země 2015
 
Prezentace Bakalářské práce - Obhajoba 2012
Prezentace Bakalářské práce - Obhajoba 2012Prezentace Bakalářské práce - Obhajoba 2012
Prezentace Bakalářské práce - Obhajoba 2012
 
obhajoba_prace
obhajoba_praceobhajoba_prace
obhajoba_prace
 
Prezentace k bakalářské práci
Prezentace k bakalářské práciPrezentace k bakalářské práci
Prezentace k bakalářské práci
 
Slide share
Slide shareSlide share
Slide share
 
So You Want to Know About AdSense?
So You Want to Know About AdSense?So You Want to Know About AdSense?
So You Want to Know About AdSense?
 
Rethink springfield presentation rev
Rethink springfield presentation revRethink springfield presentation rev
Rethink springfield presentation rev
 
State of Search RIMC 2013
State of Search RIMC 2013State of Search RIMC 2013
State of Search RIMC 2013
 
Trelise Cooper Boardroom
Trelise Cooper BoardroomTrelise Cooper Boardroom
Trelise Cooper Boardroom
 

gbms szz in progress

  • 1. Fakulta elektrotechniky a informatiky VŠB-TUO Gaussian Blurring Mean Shift segmentace obrazu pomocí technologie NVIDIA CUDA Vedoucí práce: Ing. Milan Šurkala Vojtěch Cima Oponent práce: Ing. Karel Mozdřeň 2012
  • 2. Osnova • Segmentace obrazu • Algoritmus GBMS • NVIDIA CUDA • Implementace • Výsledky a dosažený výkon.
  • 3. Segmentace obrazu Detekce hran Segmentační metody Lékářství Průmysl Prahování Bezpečnost Clusterovací metody Doprava
  • 4. Blurring Meanshift Bezparametrická, clusterovací, iterační metoda pro nalezení míst s největší hustotou vzorků.
  • 6.
  • 7. „Processing flow“ na CUDA Kopírování dat Pokyn ke zpracování Kopírování dat Paralelní zpracování
  • 9. Implementace GBMS Vnitřní cyklus Vypočítá novou pozici Paralelizace smyček bodu na základě prvků výpočetního okna. Vnější cyklus Prochází vstupní množinu bodů. Paralelizace vnitřního cyklu Paralelizace vnějšího cyklu Block(0,0) Block(0,1) Block(m,n) … … …. … …. B(0,0) B(0,1) B(m,n)
  • 10. Výsledky 18000 16000 14000 Počet segmentů 12000 10000 8000 6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Počet iterací
  • 11. Dosažený výkon 60 Čas [s] 50 40 GPU kernel 1 GPU kernel 2 30 GPU kernel 3 CPU (1 jádro) 20 CPU (2 jádra) 10 CPU (2 jádra + HT) 0 Nvidia GeForce Nvidia GeForce Intel Core i5 2410M Intel C2D T8300 GT525M 8600GT @2.3GHz @2,4GHz GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT) Nvidia GeForce GT525M 0.5 0.4 0.4 Nvidia GeForce 8600GT 2.0 1.6 1.6 Intel Core i5 2410M @2.3GHz 37.8 22.8 16.1 Intel C2D T8300 @2,4GHz 54.9 32.0
  • 12. Dosažený výkon 130x rychlejší 60 Čas [s] 50 40 GPU kernel 1 GPU kernel 2 30 GPU kernel 3 CPU (1 jádro) 20 CPU (2 jádra) 10 CPU (2 jádra + HT) 0 Nvidia GeForce Nvidia GeForce Intel Core i5 2410M Intel C2D T8300 GT525M 8600GT @2.3GHz @2,4GHz GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT) Nvidia GeForce GT525M 0.5 0.4 0.4 Nvidia GeForce 8600GT 2.0 1.6 1.6 Intel Core i5 2410M @2.3GHz 37.8 22.8 16.1 Intel C2D T8300 @2,4GHz 54.9 32.0
  • 13. 35x 110x 60 Čas [s] 50 40 GPU kernel 1 GPU kernel 2 30 GPU kernel 3 CPU (1 jádro) 20 CPU (2 jádra) 10 CPU (2 jádra + HT) 0 Nvidia GeForce Nvidia GeForce Intel Core i5 2410M Intel C2D T8300 GT525M 8600GT @2.3GHz @2,4GHz GPU kernel1 GPU kernel 2 GPU kernel 3 CPU (1 jádro) CPU (2 jádra) CPU (2 jádra + HT) Nvidia GeForce GT525M 0.5 0.4 0.4 Nvidia GeForce 8600GT 2.0 1.6 1.6 Intel Core i5 2410M @2.3GHz 37.8 22.8 16.1 Intel C2D T8300 @2,4GHz 54.9 32.0
  • 14. Porovnání CPU implementací 60 Čas [s] Přidání fyzického jádra 50 40 >40% 1 jádro 30 2 jádra 20 2 jádra + HT 10 0 Intel C2D T8300 @2.4GHz Intel Core i5 2410M @2.3GHz 1 jádro 2 jádra 2 jádra + HT C2D T8300 54.8 31.9 Core i5 2410M 37.7 22.8 16.1
  • 15. Porovnání CPU implementací 60 Čas [s] Přidání fyzického jádra 50 40 >40% 1 jádro 30 2 jádra 20 2 jádra + HT Přínos technologie HT 10 0 >57% Intel C2D T8300 @2.4GHz Intel Core i5 2410M @2.3GHz 1 jádro 2 jádra 2 jádra + HT C2D T8300 54.8 31.9 Core i5 2410M 37.7 22.8 16.1
  • 16. Porovnání GPU implementací 2.5 Čas [s] 2 >20% 1.5 GPU kernel 1 GPU kernel 2 1 GPU kernel 3 0.5 0 Nvidia GeForce 8600GT Nvidia GeForce GT525M Kernel 1 Kernel 2 Kernel 3 GeForce 8600GT 2.0 1.6 1.6 GeForce GT525M 0.5 0.42 0.49
  • 17. Závěr Prokázaní segmentačních vlastností GBMS při segmentaci obrazu. Více než 100 násobný výkonový nárůst použitím technologie CUDA.