SlideShare a Scribd company logo
1 of 22
High performance GPU based
Master :
Dr. Ghaderi
Mohammad Amin Amjadi
Winter 2015
‫پایه‬ ‫مقاله‬
High performance GPU based optimized
feature matching for
computer vision applications
Kajal Sharma
2015 Elsevier B.V. All rights reserved
2
‫مطالب‬
.1‫مقدمه‬
.2‫مسئله‬ ‫بیان‬
.3‫کلی‬ ‫اهداف‬
.4‫پیشینه‬
.5‫طرح‬ ‫بیان‬
.6‫نتایج‬
.7‫گیری‬ ‫نتیجه‬
.8‫پیشنهادات‬
3
‫معماری‬ ‫تاریخچه‬ ‫به‬ ‫کلی‬ ‫نگاه‬CPU
‫طراحی‬ ‫و‬ ‫ساخت‬ ‫های‬‫محدودیت‬
‫همزمانی‬ ‫و‬ ‫همروندی‬ ‫افزایش‬ ‫در‬ ‫سعی‬
4
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
CPU
GPU
‫بدلیل‬ ‫گرافیکی‬ ‫های‬‫پردازنده‬‫کمتر‬ ‫محدودیت‬،‫سازی‬‫بازی‬ ‫صنعت‬ ‫و‬‫بیشتری‬ ‫پیشرفت‬‫به‬ ‫نسبت‬CPU‫است‬ ‫داشته‬
‫با‬ ‫حافظه‬‫باال‬ ‫باند‬ ‫پهنای‬
‫مجموعه‬‫منظوره‬ ‫عام‬ ‫دستورات‬
‫یک‬ ‫دارای‬‫قدرتمند‬ ‫کمکی‬ ‫پردازنده‬‫منظوره‬ ‫عام‬ ‫های‬‫برنامه‬ ‫سرعت‬ ‫افزایش‬ ‫جهت‬‫باشد‬‫می‬
‫استانداردهای‬ ‫از‬IEEE‫شناور‬ ‫ممیز‬ ‫اعداد‬‫تک‬-‫دقتی‬‫و‬‫دو‬-‫دقتی‬‫نماید‬‫می‬ ‫پشتیبانی‬
‫تک‬-‫دقتی‬‫دو‬-‫دقتی‬
5
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
−1 𝑏31 ∗ 1. 𝑏22 𝑏21 … 𝑏0 2 ∗ 2 𝑒 −127
−1 𝑏63 ∗ 1. 𝑏51 𝑏50 … 𝑏0 2 ∗ 2 𝑒 −1023
CPU vs GPU
6
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫برنامه‬ ‫جناب‬
GPGPU
general purpose graphics processing unit
GPU‫مقابل‬ ‫در‬CPU:
‫به‬ ‫نسبت‬ ‫بیشتر‬ ‫سازی‬ ‫موازی‬CPU
‫به‬ ‫نسبت‬ ‫باالتر‬ ‫سرعت‬CPU
‫از‬ ‫بیشتر‬ ‫گرافیکی‬ ‫های‬‫پردازنده‬ ‫پردازشی‬ ‫رشد‬CPU‫است‬
‫هستند‬ ‫تر‬‫ارزان‬ ،‫قیمت‬ ‫به‬ ‫کارایی‬ ‫معیار‬ ‫به‬ ‫توجه‬ ‫با‬
‫دارند‬ ‫کمتری‬ ‫مصرفی‬ ‫توان‬ ،‫وات‬ ‫به‬ ‫کارایی‬ ‫معیار‬ ‫به‬ ‫توجه‬ ‫با‬
GPGPU:
‫تکنولوژی‬‫از‬ ‫استفاده‬GPU‫منظوره‬ ‫عام‬ ‫های‬‫برنامه‬ ‫اجرای‬ ‫جهت‬
7
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫عکس‬ ‫دو‬ ‫تطبیق‬
8
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫عکس‬ ‫دو‬ ‫تطبیق‬
9
‫کلیدی‬ ‫نقاط‬ ‫نمودن‬ ‫پیدا‬
‫کلیدی‬ ‫نقاط‬ ‫اساس‬ ‫بر‬ ‫عکس‬ ‫دو‬ ‫تطبیق‬
‫مختلف‬ ‫شرایط‬ ‫در‬ ‫تطبیق‬ ‫امکان‬(‫شدن‬ ‫مات‬ ،‫اندازه‬ ‫و‬ ‫مقیاس‬ ‫تغییر‬ ،‫چرخش‬)
‫باال‬ ‫سرعتی‬ ‫با‬ ‫سازی‬ ‫پیاده‬
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
1. Schmid and Mohr
10
‫یابی‬ ‫گوشه‬ ‫از‬ ‫استفاده‬
‫است‬ ‫مناسب‬ ‫تصویر‬ ‫چرخش‬ ‫حالت‬ ‫برای‬
‫نیست‬ ‫کارآمد‬ ‫تصویر‬ ‫مقیاس‬ ‫تغییر‬ ‫حالت‬ ‫برای‬
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
2. Lowe
11
SIFT: scale invariant feature transform: ‫نابسته‬ ‫مقیاس‬ ‫ویژگی‬ ‫تبدیل‬
‫تصویر‬ ‫مقیاس‬ ‫تغییر‬ ‫و‬ ‫چرخش‬ ‫برای‬ ‫مناسب‬
‫باال‬ ‫محاسبه‬ ‫و‬ ‫پردازش‬ ‫زمان‬
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
3. SOM
Self Organizing Map
12
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
SIFT & SOM
13
‫الگوریتم‬SIFT،16‫در‬ ‫تطبیق‬0.05773‫ثانیه‬ ‫الگوریتم‬SOM،28‫در‬ ‫تطبیق‬0.03576‫ثانیه‬
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫هدف‬ ‫الگوریتم‬
14
‫الگوریتم‬ ‫سازی‬ ‫بهینه‬SOM‫روی‬ ‫بر‬ ‫آن‬ ‫از‬ ‫استفاده‬ ‫و‬GPU‫تسریع‬ ‫جهت‬
‫عصبی‬ ‫های‬‫الگوریتم‬ ‫از‬ ‫استفاده‬(‫رقابتی‬ ‫های‬‫الگوریتم‬)
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫روش‬‫پیشنهادی‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫هدف‬ ‫الگوریتم‬
o30‫پردازنده‬MultiProcessor
o‫پردازنده‬ ‫هر‬8،Thread‫نماید‬‫می‬ ‫اجرا‬ ‫موازی‬ ‫بصورت‬ ‫را‬
oThread‫پردازنده‬ ‫یک‬ ‫های‬:synchronously
o‫ها‬‫پردازنده‬:asynchronously
15
Element 0
Element 1
…
Element 7
Stream multiprocessor
Stream Processor
Stream Processor
SIMD
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫الگوریتم‬
16
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫نتایج‬
17
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫ارزشیابی‬
18
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫محاسبات‬ ‫زمان‬
19
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫روش‬‫پیشنهادی‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫گیری‬ ‫نتیجه‬
20
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
‫تطبیق‬ ‫برای‬ ‫جدید‬ ‫متد‬
‫باالتر‬ ‫سرعت‬:‫و‬ ‫عصبی‬ ‫های‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬gpu
‫دارد‬ ‫مناسبی‬ ‫عملکرد‬ ‫تصویر‬ ‫مختلف‬ ‫شرایط‬ ‫در‬ ‫الگوریتم‬ ‫که‬ ‫اند‬‫داده‬ ‫نشان‬ ‫نتایج‬
‫محاسبات‬ ‫زمان‬ ‫کاهش‬
‫پیشنهادات‬
21
‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
.1‫تر‬‫سریع‬ ‫عصبی‬ ‫شبکه‬ ‫های‬‫الگوریتم‬ ‫از‬ ‫استفاده‬
.2‫از‬ ‫استفاده‬MultiGPU‫همزمانی‬ ‫سطح‬ ‫افزایش‬ ‫جهت‬
.3‫سمت‬ ‫را‬ ‫بیشتری‬ ‫محاسبات‬ ،‫الگوریتم‬ ‫بهبودسازی‬ ‫با‬GPU‫برده‬
.4‫از‬ ‫استفاده‬FPGA‫داخل‬ ‫در‬GPU‫الگوریتم‬ ‫براساس‬ ‫آن‬ ‫سازی‬ ‫بهینه‬ ‫و‬ ،‫کمکی‬ ‫پردازنده‬ ‫عنوان‬ ‫به‬
.5‫همزمان‬ ‫اجرای‬‫الگوریتم‬ ‫چندین‬
Question ?
☻Thanks☻
22

More Related Content

Similar to Seminar-Architecture

ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از
ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از
ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از Mojtaba Hasanlu
 
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسان
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارساننمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسان
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسانtarasad
 
MicroController AVR ATMEGA32#1
MicroController AVR ATMEGA32#1MicroController AVR ATMEGA32#1
MicroController AVR ATMEGA32#1Alireza Akoushideh
 
A Novel Aprroach for smart contract audit.pdf
A Novel Aprroach for smart contract audit.pdfA Novel Aprroach for smart contract audit.pdf
A Novel Aprroach for smart contract audit.pdfSaeidGhasemshirazi
 
Final presentation for Master Degree Thesis
Final presentation for Master Degree ThesisFinal presentation for Master Degree Thesis
Final presentation for Master Degree ThesisShahram Foroozan
 
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسی
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسیپایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسی
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسیS.sajad mousavi.nejad.S
 
IoT Course - Chapter 2
IoT Course -  Chapter 2IoT Course -  Chapter 2
IoT Course - Chapter 2M Nemati
 
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...Amir M. Mir
 
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وب
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وبطراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وب
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وبMoEii Hm
 
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلی
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلیآشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلی
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلیMorteza Dalil
 
Effect of PEVs parking lots in energy and reserve market
Effect of PEVs parking lots in energy and reserve marketEffect of PEVs parking lots in energy and reserve market
Effect of PEVs parking lots in energy and reserve marketMahdi Firouzi Nezamabadi
 
teleoperationنگار پژوه :: تله اپراتور برای آموزش جراحی رباتیک
teleoperationنگار پژوه :: تله اپراتور  برای آموزش جراحی رباتیکteleoperationنگار پژوه :: تله اپراتور  برای آموزش جراحی رباتیک
teleoperationنگار پژوه :: تله اپراتور برای آموزش جراحی رباتیکMojtaba Hasanlu
 
Lean Six Sigma Introduction
Lean Six Sigma IntroductionLean Six Sigma Introduction
Lean Six Sigma Introductionpouyafani
 

Similar to Seminar-Architecture (20)

Seminar-Parallel Processing
Seminar-Parallel ProcessingSeminar-Parallel Processing
Seminar-Parallel Processing
 
GpuInCloud
GpuInCloudGpuInCloud
GpuInCloud
 
Tpm and Sis Sigma
Tpm and Sis SigmaTpm and Sis Sigma
Tpm and Sis Sigma
 
ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از
ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از
ANSYSآنالیز مودال و ارتعاشی استند تست موتور توربوشفت با استفاده از
 
GPGPU
GPGPUGPGPU
GPGPU
 
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسان
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارساننمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسان
نمونه سوال رایانه کار مقدماتی -هاجر امینی-هنرستان رازی باباحیدر-منطقه فارسان
 
MicroController AVR ATMEGA32#1
MicroController AVR ATMEGA32#1MicroController AVR ATMEGA32#1
MicroController AVR ATMEGA32#1
 
A Novel Aprroach for smart contract audit.pdf
A Novel Aprroach for smart contract audit.pdfA Novel Aprroach for smart contract audit.pdf
A Novel Aprroach for smart contract audit.pdf
 
Final presentation for Master Degree Thesis
Final presentation for Master Degree ThesisFinal presentation for Master Degree Thesis
Final presentation for Master Degree Thesis
 
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسی
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسیپایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسی
پایانامه تحصیلی برای دریافت درجه کارشناسی ارشد مهندسی
 
IoT Course - Chapter 2
IoT Course -  Chapter 2IoT Course -  Chapter 2
IoT Course - Chapter 2
 
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...
A. Mir's Master's Thesis - Robust Twin Support Vector Machine for Noisy Data ...
 
ATM
ATMATM
ATM
 
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وب
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وبطراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وب
طراحی، پیاده‌سازی و ارزیابی رایانش توری تحت وب
 
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلی
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلیآشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلی
آشنایی با بهینه سازی غیرگرادیانی شکل در جریان داخلی
 
Effect of PEVs parking lots in energy and reserve market
Effect of PEVs parking lots in energy and reserve marketEffect of PEVs parking lots in energy and reserve market
Effect of PEVs parking lots in energy and reserve market
 
Crisp dm.1.0
Crisp dm.1.0Crisp dm.1.0
Crisp dm.1.0
 
آشنایی با Opnet
آشنایی با Opnetآشنایی با Opnet
آشنایی با Opnet
 
teleoperationنگار پژوه :: تله اپراتور برای آموزش جراحی رباتیک
teleoperationنگار پژوه :: تله اپراتور  برای آموزش جراحی رباتیکteleoperationنگار پژوه :: تله اپراتور  برای آموزش جراحی رباتیک
teleoperationنگار پژوه :: تله اپراتور برای آموزش جراحی رباتیک
 
Lean Six Sigma Introduction
Lean Six Sigma IntroductionLean Six Sigma Introduction
Lean Six Sigma Introduction
 

More from Mohammad Amin Amjadi (14)

Image Cryptography and Steganography
Image Cryptography and SteganographyImage Cryptography and Steganography
Image Cryptography and Steganography
 
memetic algorithm
memetic algorithmmemetic algorithm
memetic algorithm
 
Amjadi - Ebook 7 - Class - v1
Amjadi - Ebook 7 - Class - v1Amjadi - Ebook 7 - Class - v1
Amjadi - Ebook 7 - Class - v1
 
Amjadi - Ebook 6 - Ref,Out - v1
Amjadi - Ebook 6 - Ref,Out - v1Amjadi - Ebook 6 - Ref,Out - v1
Amjadi - Ebook 6 - Ref,Out - v1
 
Amjadi - Ebook 5 - Function - v1
Amjadi - Ebook 5 - Function - v1Amjadi - Ebook 5 - Function - v1
Amjadi - Ebook 5 - Function - v1
 
Az Micro
Az MicroAz Micro
Az Micro
 
my project
my projectmy project
my project
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
rivercode.PDF
rivercode.PDFrivercode.PDF
rivercode.PDF
 
Documention
DocumentionDocumention
Documention
 
HotSpot
HotSpotHotSpot
HotSpot
 
Lecture3
Lecture3Lecture3
Lecture3
 
Lecture2
Lecture2Lecture2
Lecture2
 
Lecture 1
Lecture 1Lecture 1
Lecture 1
 

Seminar-Architecture

  • 1. High performance GPU based Master : Dr. Ghaderi Mohammad Amin Amjadi Winter 2015
  • 2. ‫پایه‬ ‫مقاله‬ High performance GPU based optimized feature matching for computer vision applications Kajal Sharma 2015 Elsevier B.V. All rights reserved 2
  • 3. ‫مطالب‬ .1‫مقدمه‬ .2‫مسئله‬ ‫بیان‬ .3‫کلی‬ ‫اهداف‬ .4‫پیشینه‬ .5‫طرح‬ ‫بیان‬ .6‫نتایج‬ .7‫گیری‬ ‫نتیجه‬ .8‫پیشنهادات‬ 3
  • 4. ‫معماری‬ ‫تاریخچه‬ ‫به‬ ‫کلی‬ ‫نگاه‬CPU ‫طراحی‬ ‫و‬ ‫ساخت‬ ‫های‬‫محدودیت‬ ‫همزمانی‬ ‫و‬ ‫همروندی‬ ‫افزایش‬ ‫در‬ ‫سعی‬ 4 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬ CPU
  • 5. GPU ‫بدلیل‬ ‫گرافیکی‬ ‫های‬‫پردازنده‬‫کمتر‬ ‫محدودیت‬،‫سازی‬‫بازی‬ ‫صنعت‬ ‫و‬‫بیشتری‬ ‫پیشرفت‬‫به‬ ‫نسبت‬CPU‫است‬ ‫داشته‬ ‫با‬ ‫حافظه‬‫باال‬ ‫باند‬ ‫پهنای‬ ‫مجموعه‬‫منظوره‬ ‫عام‬ ‫دستورات‬ ‫یک‬ ‫دارای‬‫قدرتمند‬ ‫کمکی‬ ‫پردازنده‬‫منظوره‬ ‫عام‬ ‫های‬‫برنامه‬ ‫سرعت‬ ‫افزایش‬ ‫جهت‬‫باشد‬‫می‬ ‫استانداردهای‬ ‫از‬IEEE‫شناور‬ ‫ممیز‬ ‫اعداد‬‫تک‬-‫دقتی‬‫و‬‫دو‬-‫دقتی‬‫نماید‬‫می‬ ‫پشتیبانی‬ ‫تک‬-‫دقتی‬‫دو‬-‫دقتی‬ 5 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬ −1 𝑏31 ∗ 1. 𝑏22 𝑏21 … 𝑏0 2 ∗ 2 𝑒 −127 −1 𝑏63 ∗ 1. 𝑏51 𝑏50 … 𝑏0 2 ∗ 2 𝑒 −1023
  • 6. CPU vs GPU 6 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬ ‫برنامه‬ ‫جناب‬
  • 7. GPGPU general purpose graphics processing unit GPU‫مقابل‬ ‫در‬CPU: ‫به‬ ‫نسبت‬ ‫بیشتر‬ ‫سازی‬ ‫موازی‬CPU ‫به‬ ‫نسبت‬ ‫باالتر‬ ‫سرعت‬CPU ‫از‬ ‫بیشتر‬ ‫گرافیکی‬ ‫های‬‫پردازنده‬ ‫پردازشی‬ ‫رشد‬CPU‫است‬ ‫هستند‬ ‫تر‬‫ارزان‬ ،‫قیمت‬ ‫به‬ ‫کارایی‬ ‫معیار‬ ‫به‬ ‫توجه‬ ‫با‬ ‫دارند‬ ‫کمتری‬ ‫مصرفی‬ ‫توان‬ ،‫وات‬ ‫به‬ ‫کارایی‬ ‫معیار‬ ‫به‬ ‫توجه‬ ‫با‬ GPGPU: ‫تکنولوژی‬‫از‬ ‫استفاده‬GPU‫منظوره‬ ‫عام‬ ‫های‬‫برنامه‬ ‫اجرای‬ ‫جهت‬ 7 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 8. ‫عکس‬ ‫دو‬ ‫تطبیق‬ 8 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 9. ‫عکس‬ ‫دو‬ ‫تطبیق‬ 9 ‫کلیدی‬ ‫نقاط‬ ‫نمودن‬ ‫پیدا‬ ‫کلیدی‬ ‫نقاط‬ ‫اساس‬ ‫بر‬ ‫عکس‬ ‫دو‬ ‫تطبیق‬ ‫مختلف‬ ‫شرایط‬ ‫در‬ ‫تطبیق‬ ‫امکان‬(‫شدن‬ ‫مات‬ ،‫اندازه‬ ‫و‬ ‫مقیاس‬ ‫تغییر‬ ،‫چرخش‬) ‫باال‬ ‫سرعتی‬ ‫با‬ ‫سازی‬ ‫پیاده‬ ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 10. 1. Schmid and Mohr 10 ‫یابی‬ ‫گوشه‬ ‫از‬ ‫استفاده‬ ‫است‬ ‫مناسب‬ ‫تصویر‬ ‫چرخش‬ ‫حالت‬ ‫برای‬ ‫نیست‬ ‫کارآمد‬ ‫تصویر‬ ‫مقیاس‬ ‫تغییر‬ ‫حالت‬ ‫برای‬ ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 11. 2. Lowe 11 SIFT: scale invariant feature transform: ‫نابسته‬ ‫مقیاس‬ ‫ویژگی‬ ‫تبدیل‬ ‫تصویر‬ ‫مقیاس‬ ‫تغییر‬ ‫و‬ ‫چرخش‬ ‫برای‬ ‫مناسب‬ ‫باال‬ ‫محاسبه‬ ‫و‬ ‫پردازش‬ ‫زمان‬ ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 12. 3. SOM Self Organizing Map 12 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 13. SIFT & SOM 13 ‫الگوریتم‬SIFT،16‫در‬ ‫تطبیق‬0.05773‫ثانیه‬ ‫الگوریتم‬SOM،28‫در‬ ‫تطبیق‬0.03576‫ثانیه‬ ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 14. ‫هدف‬ ‫الگوریتم‬ 14 ‫الگوریتم‬ ‫سازی‬ ‫بهینه‬SOM‫روی‬ ‫بر‬ ‫آن‬ ‫از‬ ‫استفاده‬ ‫و‬GPU‫تسریع‬ ‫جهت‬ ‫عصبی‬ ‫های‬‫الگوریتم‬ ‫از‬ ‫استفاده‬(‫رقابتی‬ ‫های‬‫الگوریتم‬) ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫روش‬‫پیشنهادی‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 15. ‫هدف‬ ‫الگوریتم‬ o30‫پردازنده‬MultiProcessor o‫پردازنده‬ ‫هر‬8،Thread‫نماید‬‫می‬ ‫اجرا‬ ‫موازی‬ ‫بصورت‬ ‫را‬ oThread‫پردازنده‬ ‫یک‬ ‫های‬:synchronously o‫ها‬‫پردازنده‬:asynchronously 15 Element 0 Element 1 … Element 7 Stream multiprocessor Stream Processor Stream Processor SIMD ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 16. ‫الگوریتم‬ 16 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 17. ‫نتایج‬ 17 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 18. ‫ارزشیابی‬ 18 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 19. ‫محاسبات‬ ‫زمان‬ 19 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫روش‬‫پیشنهادی‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬
  • 20. ‫گیری‬ ‫نتیجه‬ 20 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬ ‫تطبیق‬ ‫برای‬ ‫جدید‬ ‫متد‬ ‫باالتر‬ ‫سرعت‬:‫و‬ ‫عصبی‬ ‫های‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬gpu ‫دارد‬ ‫مناسبی‬ ‫عملکرد‬ ‫تصویر‬ ‫مختلف‬ ‫شرایط‬ ‫در‬ ‫الگوریتم‬ ‫که‬ ‫اند‬‫داده‬ ‫نشان‬ ‫نتایج‬ ‫محاسبات‬ ‫زمان‬ ‫کاهش‬
  • 21. ‫پیشنهادات‬ 21 ‫مقدمه‬ ‫مسئله‬ ‫اهداف‬ ‫پیشینه‬ ‫پیشنهادی‬ ‫روش‬ ‫نتایج‬ ‫گیری‬ ‫نتیجه‬ ‫پیشنهادات‬ .1‫تر‬‫سریع‬ ‫عصبی‬ ‫شبکه‬ ‫های‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ .2‫از‬ ‫استفاده‬MultiGPU‫همزمانی‬ ‫سطح‬ ‫افزایش‬ ‫جهت‬ .3‫سمت‬ ‫را‬ ‫بیشتری‬ ‫محاسبات‬ ،‫الگوریتم‬ ‫بهبودسازی‬ ‫با‬GPU‫برده‬ .4‫از‬ ‫استفاده‬FPGA‫داخل‬ ‫در‬GPU‫الگوریتم‬ ‫براساس‬ ‫آن‬ ‫سازی‬ ‫بهینه‬ ‫و‬ ،‫کمکی‬ ‫پردازنده‬ ‫عنوان‬ ‫به‬ .5‫همزمان‬ ‫اجرای‬‫الگوریتم‬ ‫چندین‬