SlideShare a Scribd company logo
‫حافظه‬
‫مدت‬‫کوتاه‬‫نی‬‫ال‬‫طو‬
LongShort-TermMemory(LSTM)
‫گردآورنده‬
:
‫ماهرخ‬ ‫مهندس‬
‫صحرایی‬
PAGE 1
‫تهران‬ ‫دانشگاه‬ ‫فنی‬ ‫دانشگده‬
‫دوره‬
‫یادگیری‬ ‫آموزشی‬
‫عص‬ ‫شبکه‬ ‫و‬ ‫ماشین‬
‫بی‬
‫اول‬ ‫درس‬
:
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
‫دوم‬ ‫درس‬
‫سوم‬ ‫درس‬
‫چهارم‬ ‫درس‬
‫پنجم‬ ‫درس‬
PAGE 2
PAGE 3
▪ ‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
▪ lstm
‫آنچه‬
‫در‬
‫این‬
‫دوره‬
‫فراخواهیم‬
‫گرفت‬
:
‫کلی‬ ‫طرح‬
▪
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
(
RNN
)
▪
‫های‬ ‫شبکه‬ ‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مشکل‬
LSTM
▪
‫انواع‬ ‫پشت‬ ‫اصلی‬ ‫ایده‬
LSTM
▪
‫سازی‬ ‫پیاده‬ ‫مراحل‬
LSTM
▪
‫های‬ ‫مدل‬ ‫انواع‬
LSTM
▪
‫منابع‬ ‫و‬ ‫گیری‬ ‫نتیجه‬
▪
‫ها‬ ‫پیوست‬
(BPTT >> Gradient Exploding/ Vanishing)
PAGE 4
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
(
RNN
)
‫ایده‬
:
▪
‫شرط‬
‫گذاری‬
‫کردن‬
‫شبکه‬
‫عصبی‬
‫بر‬
‫اساس‬
‫تمام‬
‫اطالعات‬
‫قبلی‬
‫و‬
‫تنظیم‬
‫وزن‬
‫ها‬
‫در‬
‫هر‬
‫گام‬
‫زمانی‬
‫پیش‬
‫فرض‬
:
▪
‫اطالعات‬
‫زمانی‬
‫دارای‬
‫اهمیت‬
‫هستند‬
(
‫به‬
‫عنوان‬
‫مثال‬
‫داده‬
‫های‬
‫وابسته‬
‫به‬
‫سری‬
‫زمانی‬
)
PAGE 5
‫بازگشتی‬ ‫عصبی‬ ‫شبکه‬
Recurrent Neural Network
‫ای‬‫دسته‬
‫دیگر‬
‫از‬
‫شبکه‬
‫های‬
‫عصبی‬
‫است‬
.
‫صورت‬‫به‬
‫خالصه‬
‫به‬
‫این‬
‫خانواده‬
‫از‬
،‫ها‬‫شبکه‬
‫شبکه‬
RNN
‫نیز‬
‫گفته‬
‫شود‬‫می‬
.
‫مناسب‬
‫برای‬
‫پردازش‬
‫داده‬
‫سری‬
‫زمانی‬
(
Time Series
)
‫و‬
‫داده‬
‫ترتیبی‬
(Sequential)
‫برای‬
‫شبکه‬
‫بازگشتی‬
‫مولفه‬
‫زمان‬
‫اهمیت‬
‫زیادی‬
‫دارد‬
.
‫که‬‫درحالی‬
‫در‬
‫شبکه‬
MLP
‫و‬
‫شبکه‬
CNN
‫توجه‬
‫به‬
‫مولفه‬
‫زمانی‬
‫دیده‬
‫شود‬‫نمی‬
.
‫ساختار‬
‫شبکه‬
‫بازگشتی‬
‫بسیار‬
‫به‬
‫شبکه‬
‫عصبی‬
MLP
‫شبیه‬
‫هست‬
.
‫می‬
‫توان‬
‫گفت‬
RNN
‫مدل‬
‫توسعه‬
‫یافته‬
MLP
‫است‬
.
PAGE 6
‫بازگشتی‬ ‫عصبی‬ ‫شبکه‬
Recurrent Neural Network
‫درمورد‬
‫شبکه‬
‫عصبی‬
‫بازگشتی‬
‫دو‬
‫نکته‬
‫مهم‬
‫زیر‬
‫را‬
‫به‬
‫یاد‬
‫داشته‬
‫ب‬
‫اشید‬
:
•
‫شبکه‬
‫بازگشتی‬
‫به‬
‫مولفه‬
‫زمانی‬
‫اهمیت‬
‫دهد‬‫می‬
‫و‬
‫مناسب‬
‫های‬‫داده‬
‫مبتنی‬
‫بر‬
‫زمان‬
‫هست‬
.
•
‫سه‬
‫شبکه‬
RNN LSTM GRU
‫پرکاربرد‬
‫ترین‬
‫خانواده‬
‫شبکه‬
‫های‬
‫بازگشتی‬
‫هستند‬
.
PAGE 7
‫سهام‬
‫در‬
‫بورس‬
‫و‬
‫های‬‫داده‬
‫متنی‬
(
‫جمله‬
‫و‬
‫پاراگراف‬
)
‫ترتیب‬‫به‬
‫هایی‬‫مثال‬
‫از‬
‫داده‬
‫سری‬
‫زمانی‬
‫و‬
‫ترتیبی‬
‫ه‬
‫ستند‬
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
RNN
▪
‫تعریف‬
RNN
▪
‫مدل‬ ‫آموزش‬
:
▪
‫مدل‬ ‫پارامترهای‬ ‫تمام‬
𝜃
=
{
𝑈
،
𝑉
،
𝑊
}
‫با‬ ‫توان‬ ‫می‬ ‫را‬
‫روزرسانی‬ ‫به‬ ‫نزولی‬ ‫گرادیان‬
‫کرد‬
PAGE 8
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مشکل‬
▪
‫مثال‬
:
(
‫تالش‬
‫برای‬
‫پیش‬
‫بینی‬
‫آخرین‬
‫کلمه‬
‫در‬
‫یک‬
‫متن‬
‫را‬
‫در‬
‫ن‬
‫ظر‬
‫بگیرید‬
)
"
‫است‬ ‫آفتابی‬ ‫هوا‬ ‫امروز‬
"
▪
"
‫خوانم‬ ‫می‬ ‫درس‬ ‫بجنورد‬ ‫شهر‬ ‫در‬ ‫دانشگاهی‬ ‫در‬ ‫من‬ ،‫حاضر‬ ‫حال‬ ‫در‬
...
‫هستم‬ ‫بجنورد‬ ‫ساکن‬ ‫االن‬ ‫من‬
"
PAGE 9
‫درک‬
‫وابستگی‬
‫بین‬
‫کلمات‬
‫و‬
‫یافتن‬
‫ارتباط‬
‫معنایی‬
‫میان‬
‫ج‬
‫مالت‬
‫از‬
‫جمله‬
‫مواردی‬
‫است‬
‫که‬
‫در‬
،‫حرف‬
RNN
‫ها‬
‫می‬
‫توانند‬
‫آن‬
‫را‬
‫کنترل‬
‫کنند‬
‫ولی‬
‫متاسفانه‬
‫در‬
‫عمل‬
‫چنین‬
‫چیزی‬
‫ممکن‬
‫نیست‬
!
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬
▪
‫این‬
‫ها‬‫شبکه‬
‫به‬
‫مقدار‬
‫زیادی‬
‫به‬
‫ها‬‫دنباله‬
‫و‬
‫ها‬‫لیست‬
‫مرتبط‬
‫هستند‬
.
▪
‫در‬
‫حقیقت‬
‫های‬‫شبکه‬
‫عصبی‬
‫بازگشتی‬
‫اولین‬
‫انتخاب‬
‫برای‬
‫کار‬
‫با‬
‫چنین‬
‫هایی‬‫داده‬
‫هستند‬
.
PAGE 10
PAGE 11
RNN
t
:
‫مرحله‬
‫زمانی‬
:X
‫ورودی‬
: h
‫حالت‬
‫پنهان‬
‫طول‬
X
:
‫اندازه‬
/
‫بعد‬
‫ورودی‬
‫طول‬
h
:
‫شماره‬
‫واحدهای‬
‫پنهان‬
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬
‫آموزش‬ ‫مشکالت‬
RNN
:
1
-
‫گرادیان‬
‫محصول‬
‫محاسبات‬
‫ماتریس‬
‫های‬
‫ژاکوبینی‬
‫که‬
‫هر‬
‫ک‬
‫دام‬
‫با‬
‫یک‬
‫گام‬
‫در‬
‫محاسبه‬
‫پیشرونده‬
،‫همراهند‬
‫می‬
‫باشد‬
2
-
‫تکثیر‬
‫ماتریس‬
‫های‬
‫مشابه‬
‫در‬
‫هر‬
‫گام‬
‫زمانی‬
‫در‬
‫طول‬
BPTT
▪
‫گرادیان‬
‫به‬
‫سرعت‬
‫خیلی‬
‫کوچک‬
‫یا‬
‫خیلی‬
‫بزرگ‬
‫می‬
‫شود‬
•
‫انفجار‬
‫یا‬
‫محو‬
‫شدگی‬
‫گرادیان‬
•
‫سطح‬
‫خطا‬
‫یا‬
‫بسیار‬
‫مسطح‬
‫یا‬
‫بسیار‬
‫شیب‬
‫دار‬
‫است‬
PAGE 12
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مشکل‬ ‫و‬ ‫مسئله‬
▪
‫راه‬
‫حل‬
‫های‬
‫ممکن‬
:
▪
‫انفجار‬
‫گرادیان‬
▪
‫مقاله‬
:
https://arxiv.org/abs/1211.5063?context=cs
▪
‫محو‬
‫شدگی‬
‫گرادیان‬
:
▪
‫مقداردهی‬
‫اولیه‬
‫بهتر‬
:
https://arxiv.org/abs/1504.00941
▪
‫مکانیسم‬
‫دروازه‬
‫ای‬
‫یا‬
‫گیت‬
(
LSTM
،
GRU
،
…
‫و‬
‫غیره‬
)
▪
‫این‬
‫مکانیسم‬
‫ها‬
‫را‬
‫مطالعه‬
‫کنید‬
:
https://arxiv.org/pdf/1706.03762.pdf
‫زمان‬
‫گیر‬
‫بودن‬
‫فرایند‬
‫یادگیری‬
‫ذخیره‬
‫سازی‬
‫اطالعات‬
‫در‬
‫فواصل‬
‫زمانی‬
‫طوالنی‬
‫از‬
‫طریق‬
‫تکرار‬
‫و‬
‫ت‬
،‫ناوب‬
‫به‬
‫دلیل‬
‫خطای‬
‫محوشدگی‬
:
‫مطالعه‬
Hochreiter
‫در‬
‫سال‬
1991
‫یک‬
‫راهکار‬
‫مناسب‬
‫برای‬
‫این‬
‫مسئله‬
PAGE 13
PAGE 14
LSTM
:
‫بر‬ ‫مبتنی‬ ‫و‬ ‫کارآمد‬ ‫راهکاری‬
‫گرادیان‬
‫مهارت‬ ‫یادگیری‬ ‫در‬ ‫توانمند‬
‫کمترین‬ ‫با‬ ‫ارتباط‬ ‫برقراری‬
‫از‬ ‫بیش‬ ‫در‬ ،‫زمان‬
1000
‫مرحله‬
‫اجرای‬ ‫با‬ ،‫گسسته‬ ‫زمانی‬
‫چرخ‬ ‫طریق‬ ‫از‬ ‫ثابت‬ ‫خطای‬
‫چرخشی‬ ‫های‬
/
‫ثابت‬ ‫خطای‬
‫ویژه‬ ‫واحدهای‬ ‫در‬
‫محلی‬ ‫زمان‬ ‫و‬ ‫مکان‬ ‫نظر‬ ‫از‬
‫است‬
.
‫با‬ ‫مقایسه‬ ‫در‬
RTRL
،
BPTT
،
Recurrent
Cascade-Correlation
،
Elman nets
‫و‬
Neural
Sequence Chunking
،
LSTM
‫اجرای‬ ‫به‬ ‫منجر‬
‫و‬ ‫شود‬ ‫می‬ ‫آمیزتر‬ ‫موفقیت‬
‫آموزد‬ ‫می‬ ‫تر‬ ‫سریع‬ ‫بسیار‬
.
‫تأ‬ ‫فنی‬ ‫و‬ ‫پیچیده‬ ‫وظایفی‬
‫خیر‬
‫که‬ ‫کند‬ ‫می‬ ‫حل‬ ‫را‬ ‫طوالنی‬
‫های‬ ‫الگوریتم‬ ‫توسط‬ ‫هرگز‬
‫نشده‬ ‫حل‬ ‫شبکه‬ ‫تکراری‬
‫است‬
.
Long Short-Term Memory
‫؟‬ ‫چرا‬
‫های‬ ‫شبکه‬
LSTM
-
‫پشت‬ ‫اصلی‬ ‫ایده‬
LSTM
‫ها‬
PAGE 15
‫مولفه‬
‫اصلی‬
LSTM
‫سلول‬
‫حالت‬
(
cell
state)
‫است‬
‫که‬
‫در‬
‫حقیقت‬
‫یک‬
‫خط‬
‫افقی‬
‫است‬
‫که‬
‫در‬
‫باالی‬
‫شکل‬
‫قرار‬
‫دارد‬
.
‫سلول‬
‫حالت‬
‫را‬
‫توان‬‫می‬
‫به‬
‫صورت‬
‫یک‬
‫تسمه‬
‫نقاله‬
‫تصور‬
‫کرد‬
‫که‬
‫از‬
‫اول‬
‫تا‬
‫آخر‬
‫دنباله‬
‫یا‬
‫همان‬
‫زنجیره‬
‫با‬
‫تعامالت‬
‫خطی‬
‫جزئی‬
‫در‬
‫حرکت‬
‫است‬
(
‫یعنی‬
‫ساختار‬
‫آن‬
‫بسیار‬
‫ساده‬
‫است‬
‫و‬
‫تغییرات‬
‫کمی‬
‫در‬
‫آ‬
‫ن‬
‫اتفاق‬
‫افتد‬‫می‬
)
.
‫های‬ ‫شبکه‬
-LSTM
‫پشت‬ ‫اصلی‬ ‫ایده‬
LSTM
‫ها‬
PAGE 16
‫شبکه‬
LSTM
‫این‬
‫توانائی‬
‫را‬
‫دارد‬
‫که‬
‫اطالعات‬
‫جدیدی‬
‫را‬
‫به‬
‫سلول‬
‫حالت‬
‫اضافه‬
‫یا‬
‫اطالعات‬
‫آن‬
‫را‬
‫حذف‬
‫کنید‬
.
‫این‬
‫کار‬
‫توسط‬
‫ساختارهای‬
‫دقیقی‬
‫ب‬
‫ه‬
‫نام‬
‫ها‬‫دروازه‬
gates
‫انجام‬
‫شود‬‫می‬
.
‫ها‬‫گیت‬
‫راهی‬
‫هستند‬
‫برای‬
‫ورود‬
‫اختیاری‬
‫اطالعات‬
.
‫ها‬‫آن‬
‫از‬
‫یک‬
‫الیه‬
‫شبکه‬
‫عصبی‬
‫سیگموید‬
sigmoid
‫به‬
‫همراه‬
‫یک‬
‫عملگر‬
‫ضرب‬
‫نقطه‬
‫به‬
‫نقط‬
‫ه‬
‫تشکیل‬
‫اند‬‫شده‬
.
‫های‬ ‫شبکه‬
LSTM
-
‫مرحله‬
(0/4)
‫شبکه‬ ‫معماری‬
PAGE 17
‫های‬ ‫شبکه‬
LSTM
-
‫مرحله‬
(0/4)
‫شبکه‬ ‫معماری‬
▪
‫سلول‬
‫حالت‬
‫فقط‬
‫با‬
‫برخی‬
‫از‬
‫فعل‬
‫و‬
‫انفعاالت‬
‫خطی‬
‫مستقیم‬
‫به‬
‫پایین‬
‫کل‬
‫زنجیره‬
‫منتقل‬
‫می‬
‫شود‬
.
▪
>>
‫برای‬
‫اطالعات‬
‫آسان‬
‫است‬
‫که‬
‫جریان‬
‫داشته‬
‫باشند‬
‫در‬
‫طول‬
‫این‬
‫حرکت‬
‫آن‬
‫هم‬
‫بدون‬
‫تغییر‬
▪
LSTM
‫توانایی‬
‫حذف‬
‫یا‬
‫افزودن‬
‫اطالعات‬
‫به‬
‫سلول‬
‫حالت‬
‫را‬
،‫دارد‬
‫که‬
‫توسط‬
‫ساختارهایی‬
‫به‬
‫نام‬
(
‫گیت‬
)
‫تنظیم‬
‫می‬
‫شود‬
.
▪
‫خروجی‬
‫الیه‬
‫سیگموید‬
‫عددی‬
‫بین‬
‫صفر‬
‫و‬
‫یک‬
،‫است‬
‫که‬
‫نشان‬
‫دهد‬‫می‬
‫چه‬
‫مقدار‬
‫از‬
‫وروی‬
‫باید‬
‫به‬
‫خروجی‬
‫ارسال‬
‫شود‬
.
‫مقدار‬
‫صف‬
‫ر‬
‫یعنی‬
‫هیچ‬
‫اطالعاتی‬
‫نباید‬
‫به‬
‫خروجی‬
‫ارسال‬
‫شود‬
‫در‬
‫حالی‬
‫که‬
‫مقدار‬
‫یک‬
‫یعنی‬
‫تمام‬
‫ورودی‬
‫به‬
‫خروجی‬
‫ارسال‬
‫شود‬
!
▪
‫شبکه‬
LSTM
‫دارای‬
۳
‫دروازه‬
‫مشابه‬
‫برای‬
‫کنترل‬
‫مقدار‬
‫سلول‬
‫حالت‬
‫است‬
.
PAGE 18
‫های‬ ‫شبکه‬
- LSTM
‫مرحله‬
(1/4)
‫شبکه‬ ‫معماری‬
▪
‫فراموش‬
‫کردن‬
‫گیت‬
(
‫سیگموئید‬
+
‫اپراتور‬
‫ضرب‬
‫داخلی‬
/
‫نقطه‬
‫ای‬
)
:
▪
‫تصمیم‬
‫می‬
‫گیرد‬
‫چه‬
‫اطالعاتی‬
‫را‬
‫از‬
‫وضعیت‬
‫سلول‬
‫دور‬
‫بر‬
‫یزیم‬
▪
1
:
‫حفظ‬
‫کردن‬
‫یک‬
‫ها‬
▪
0
:
‫حذف‬
‫کردن‬
‫صفرها‬
PAGE 19
‫های‬ ‫شبکه‬
LSTM
–
‫مرحله‬
(
2/4
)
▪
‫ورودی‬ ‫گیت‬
(
‫سیگموئید‬
+
‫ای‬ ‫نقطه‬ ‫ضرب‬ ‫اپراتور‬
:)
‫حالت‬ ‫در‬ ‫را‬ ‫جدیدی‬ ‫اطالعات‬ ‫چه‬ ‫که‬ ‫گیرد‬ ‫می‬ ‫تصمیم‬
‫کنیم‬ ‫ذخیره‬ ‫سلول‬
PAGE 20
‫های‬ ‫شبکه‬
LSTM
–
‫مرحله‬
(
۳/4
)
▪
‫به‬
‫روزرسانی‬
‫سلول‬
‫حالت‬
:
‫مواردی‬
‫را‬
‫که‬
‫تصمیم‬
‫گرفتیم‬
‫زودتر‬
‫فراموش‬
‫کنیم‬
‫و‬
‫مقادیر‬
‫جدید‬
‫من‬
‫تخب‬
‫را‬
‫اضافه‬
‫می‬
،‫کنیم‬
‫با‬
‫توجه‬
‫به‬
‫مقدار‬
‫تصمیم‬
‫گ‬
‫یری‬
‫برای‬
‫به‬
‫روزرسانی‬
▪
t
𝑓
:
‫تصمیم‬
‫بگیرید‬
‫که‬
‫کدام‬
‫یک‬
‫را‬
‫فراموش‬
‫کن‬
‫ید‬
▪
𝑡
𝑖
:
‫تصمیم‬
‫بگیرید‬
‫که‬
‫کدام‬
‫یک‬
‫را‬
‫به‬
‫روز‬
‫ک‬
‫نید‬
▪
<< ct
‫در‬
‫گام‬
‫زمانی‬
t
‫به‬
‫روز‬
‫شده‬
‫است‬
‫و‬
‫به‬
‫آرامی‬
‫تغییر‬
‫می‬
‫کند‬
!
PAGE 21
‫های‬ ‫شبکه‬
LSTM
–
‫مرحله‬
(
4/4
)
▪
‫خروجی‬ ‫گیت‬
(
‫سیگموئید‬
+
‫ای‬ ‫نقطه‬ ‫ضرب‬ ‫اپراتور‬
:)
▪
‫کنیم‬ ‫تولید‬ ‫را‬ ‫جدیدی‬ ‫اطالعات‬ ‫چه‬ ‫گیرد‬ ‫می‬ ‫تصمیم‬
▪
<< ht
‫در‬
‫مرحله‬
t
‫به‬
‫روز‬
‫شده‬
،‫است‬
‫که‬
‫سریعتر‬
‫تغییر‬
‫میکند‬
!
PAGE 22
PAGE 23
‫از‬ ‫انیمیشنی‬
LSTM
C — cell state
‫های‬ ‫شبکه‬ ‫انواع‬
LSTM
(1/3)
▪
LSTM
‫اتصاالت‬ ‫با‬
Peephole
▪
‫ایده‬
:
‫تا‬ ‫دهد‬ ‫می‬ ‫اجازه‬ ‫گیت‬ ‫های‬ ‫الیه‬ ‫به‬
‫حالت‬ ‫سلول‬
‫ر‬
‫ا‬
‫کنیم‬ ‫بررسی‬
PAGE 24
‫های‬ ‫شبکه‬ ‫انواع‬
LSTM
(2/3)
▪
LSTM
‫فراموشی‬ ‫گیت‬ ‫جفت‬ ‫با‬
/
‫ورودی‬ ‫گیت‬
‫ایده‬
:
‫در‬
‫این‬
،‫مدل‬
‫فقط‬
‫زمانی‬
‫فراموشی‬
‫اطالعات‬
‫را‬
‫داریم‬
‫ک‬
‫ه‬
‫بخواهیم‬
‫چیزی‬
‫را‬
‫به‬
‫جای‬
‫آن‬
‫وارد‬
‫کنیم‬
(
‫جایگزین‬
‫کنیم‬
)
‫و‬
‫برعکس‬
.
PAGE 25
‫های‬ ‫شبکه‬ ‫انواع‬
LSTM
(3/3)
‫واحد‬
‫مکرر‬
‫گیت‬
GRU
▪
‫ایده‬
:
‫ترکیب‬
‫گیت‬
‫های‬
‫فراموشی‬
‫و‬
‫ورودی‬
‫در‬
‫یک‬
"
‫گیت‬
‫بروزرسانی‬
"
‫واحد‬
▪
‫ادغام‬
‫حالت‬
‫سلول‬
‫و‬
‫حالت‬
‫مخفی‬
PAGE 26
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
‫آموزش‬ ‫مسئله‬
:RNN
- Gradient Vanishing
- Gradient Exploding
‫مرور‬
Backpropagation (BP)
‫توسط‬ ‫شده‬ ‫داده‬ ‫شرح‬
Backpropagation
‫در‬
‫زمان‬ ‫طول‬
BPTT
PAGE 27
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
▪
‫عصبی‬ ‫های‬ ‫شبکه‬ ‫برای‬ ‫کاهشی‬ ‫گرادیان‬ ‫نزول‬
▪
‫است‬ ‫پارامتر‬ ‫ها‬ ‫میلیون‬ ‫شامل‬ ‫گرادیان‬ ‫محاسبه‬
.
▪
‫از‬ ،‫آن‬ ‫کارآمد‬ ‫محاسبه‬ ‫برای‬
backpropagation
‫شود‬ ‫می‬ ‫استفاده‬
.
▪
‫کنید‬ ‫مخاسبه‬ ‫عقب‬ ‫روبه‬ ‫و‬ ‫جلو‬ ‫روبه‬ ‫شده‬ ‫محاسبه‬ ‫قبل‬ ‫از‬ ‫ترم‬ ‫دو‬ ‫اساس‬ ‫بر‬ ‫را‬ ‫گرادیان‬
PAGE 28
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
▪
WLOG
،
‫نمایش‬ ‫برای‬ ‫کنیم‬ ‫می‬ ‫استفاده‬ ‫از‬
PAGE 29
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
▪
WLOG
،
‫کنیم‬ ‫می‬ ‫استفاده‬ ‫از‬ ‫دادن‬ ‫نشان‬ ‫برای‬ ‫ما‬
PAGE 30
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
PAGE 31
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
▪
‫مورد‬ ‫در‬ ‫نهایی‬ ‫سخنان‬
Backpropagation (BP)
PAGE 32
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
▪
‫معماری‬ ‫خالصه‬
Recurrent Neuron Network (RNN)
▪
‫مدل‬ ‫آموزش‬
:
▪
‫مدل‬ ‫پارامترهای‬ ‫تمام‬
𝜃
=
{
𝑈
,
𝑉
,
𝑊
}
‫کرد‬ ‫روز‬ ‫به‬ ‫شیب‬ ‫نزول‬ ‫با‬ ‫توان‬ ‫می‬ ‫را‬
PAGE 33
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
PAGE 34
‫ضمیمه‬
-
‫مدت‬ ‫طوالنی‬ ‫های‬ ‫وابستگی‬ ‫مسئله‬
PAGE 35
‫ضمیمه‬
-
‫مسئله‬
‫وابستگی‬
‫های‬
‫طوالنی‬
‫مدت‬
PAGE 36
‫گیری‬ ‫نتیجه‬
▪
‫بازگشتی‬ ‫عصبی‬ ‫های‬ ‫شبکه‬ ‫آموزش‬ ‫در‬ ‫مشکالت‬ ‫درک‬
▪
‫انفجار‬
‫گرادیان‬
▪
‫رود‬ ‫می‬ ‫بین‬ ‫از‬ ‫گرادیان‬
▪
،‫گرادیان‬ ‫رفتن‬ ‫بین‬ ‫از‬ ‫مسئله‬ ‫حل‬ ‫برای‬ ‫ممکن‬ ‫های‬ ‫حل‬ ‫راه‬ ‫از‬ ‫یکی‬
"
‫گیتینگ‬ ‫مکانیزم‬
"
‫اصلی‬ ‫مفهوم‬ ‫که‬ ‫است‬
LSTM
‫است‬
▪
‫سلول‬ ‫چندین‬ ‫اگر‬
LSTM
،‫دهیم‬ ‫قرار‬ ‫هم‬ ‫روی‬ ‫را‬
LSTM
‫تواند‬ ‫می‬
"
‫عمیق‬
"
‫باشد‬
▪
‫ها‬ ‫افزونه‬
:
▪
‫و‬ ‫جهته‬ ‫تک‬
‫جهته‬ ‫دو‬
▪
‫چند‬ ‫به‬ ‫چند‬ ،‫یک‬ ‫به‬ ‫چند‬ ، ‫یک‬ ‫به‬ ‫یک‬ ، ‫یک‬ ‫به‬ ‫یک‬
PAGE 37
‫مرتب‬ ‫ویدیوهای‬ ‫و‬ ‫منابع‬
‫ط‬
‫او‬ ‫درس‬ ‫با‬
‫ل‬
▪ Understanding LSTM Networks
▪ http://colah.github.io/posts/2015-08-Understanding-LSTMs
▪ • Prof. Hung-yi Lee Courses
▪ https://www.youtube.com/watch?v=xCGidAeyS4M
▪ https://www.youtube.com/watch?v=rTqmWlnwz_0
▪ • On the difficulty of training recurrent neural networks
▪ https://arxiv.org/abs/1211.5063
▪ • UDACITY Courses: Intro to Deep Learning with PyTorch
▪ https://classroom.udacity.com/courses/ud188
PAGE 38
First Skill Second Skill Third Skill
Conclusion

More Related Content

Similar to حافظه طولانی کوتاه مدت Long Short-Term Memory (LSTM)

Exploration lan switching_chapter5
Exploration lan switching_chapter5Exploration lan switching_chapter5
Exploration lan switching_chapter5robertoxe
 
Exploration lan switching_chapter5
Exploration lan switching_chapter5Exploration lan switching_chapter5
Exploration lan switching_chapter5robertoxe
 
64 bit sram memory: design paper
64 bit sram memory: design paper64 bit sram memory: design paper
64 bit sram memory: design paper
Mamoon Ismail Khalid
 
Ch13.pdf
Ch13.pdfCh13.pdf
Ch13.pdf
Sourav Roy
 
Df33642645
Df33642645Df33642645
Df33642645
IJERA Editor
 
Df33642645
Df33642645Df33642645
Df33642645
IJERA Editor
 
Lte pre launch
Lte pre launchLte pre launch
Lte pre launch
Hatim100
 
SS7 - MTP3 Technical Training from TelcoBridges
SS7 - MTP3 Technical Training from TelcoBridgesSS7 - MTP3 Technical Training from TelcoBridges
SS7 - MTP3 Technical Training from TelcoBridges
AdminatTelcoBridges
 
UNIT-4-Logic styles for low power_part_2.ppt
UNIT-4-Logic styles for low power_part_2.pptUNIT-4-Logic styles for low power_part_2.ppt
UNIT-4-Logic styles for low power_part_2.ppt
Ravi Selvaraj
 
Power analysis of 4 t sram by stacking technique using tanner tool
Power analysis of 4 t sram by stacking technique using tanner toolPower analysis of 4 t sram by stacking technique using tanner tool
Power analysis of 4 t sram by stacking technique using tanner tool
eSAT Publishing House
 
Advantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAMAdvantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAM
IJSRED
 
Advantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAMAdvantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAM
IJSRED
 
Review of crosstalk free Network
Review of crosstalk free NetworkReview of crosstalk free Network
Review of crosstalk free Network
IJMER
 
Machine Learning - Introduction to Recurrent Neural Networks
Machine Learning - Introduction to Recurrent Neural NetworksMachine Learning - Introduction to Recurrent Neural Networks
Machine Learning - Introduction to Recurrent Neural Networks
Andrew Ferlitsch
 
Recurrent neural networks rnn
Recurrent neural networks   rnnRecurrent neural networks   rnn
Recurrent neural networks rnn
Kuppusamy P
 
Level sensitive scan design(LSSD) and Boundry scan(BS)
Level sensitive scan design(LSSD) and Boundry scan(BS)Level sensitive scan design(LSSD) and Boundry scan(BS)
Level sensitive scan design(LSSD) and Boundry scan(BS)
Praveen Kumar
 
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutions
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutionsSwitching vla ns_secugenius_harksh_mikemclain_secugenius security solutions
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutionsMike McLain
 
Threads and multi threading
Threads and multi threadingThreads and multi threading
Threads and multi threading
Antonio Cesarano
 
Programmable logic array
Programmable logic arrayProgrammable logic array
Programmable logic array
Huba Akhtar
 

Similar to حافظه طولانی کوتاه مدت Long Short-Term Memory (LSTM) (20)

Exploration lan switching_chapter5
Exploration lan switching_chapter5Exploration lan switching_chapter5
Exploration lan switching_chapter5
 
Protocolo Spanning Tree
Protocolo Spanning TreeProtocolo Spanning Tree
Protocolo Spanning Tree
 
Exploration lan switching_chapter5
Exploration lan switching_chapter5Exploration lan switching_chapter5
Exploration lan switching_chapter5
 
64 bit sram memory: design paper
64 bit sram memory: design paper64 bit sram memory: design paper
64 bit sram memory: design paper
 
Ch13.pdf
Ch13.pdfCh13.pdf
Ch13.pdf
 
Df33642645
Df33642645Df33642645
Df33642645
 
Df33642645
Df33642645Df33642645
Df33642645
 
Lte pre launch
Lte pre launchLte pre launch
Lte pre launch
 
SS7 - MTP3 Technical Training from TelcoBridges
SS7 - MTP3 Technical Training from TelcoBridgesSS7 - MTP3 Technical Training from TelcoBridges
SS7 - MTP3 Technical Training from TelcoBridges
 
UNIT-4-Logic styles for low power_part_2.ppt
UNIT-4-Logic styles for low power_part_2.pptUNIT-4-Logic styles for low power_part_2.ppt
UNIT-4-Logic styles for low power_part_2.ppt
 
Power analysis of 4 t sram by stacking technique using tanner tool
Power analysis of 4 t sram by stacking technique using tanner toolPower analysis of 4 t sram by stacking technique using tanner tool
Power analysis of 4 t sram by stacking technique using tanner tool
 
Advantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAMAdvantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAM
 
Advantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAMAdvantages of 64 Bit 5T SRAM
Advantages of 64 Bit 5T SRAM
 
Review of crosstalk free Network
Review of crosstalk free NetworkReview of crosstalk free Network
Review of crosstalk free Network
 
Machine Learning - Introduction to Recurrent Neural Networks
Machine Learning - Introduction to Recurrent Neural NetworksMachine Learning - Introduction to Recurrent Neural Networks
Machine Learning - Introduction to Recurrent Neural Networks
 
Recurrent neural networks rnn
Recurrent neural networks   rnnRecurrent neural networks   rnn
Recurrent neural networks rnn
 
Level sensitive scan design(LSSD) and Boundry scan(BS)
Level sensitive scan design(LSSD) and Boundry scan(BS)Level sensitive scan design(LSSD) and Boundry scan(BS)
Level sensitive scan design(LSSD) and Boundry scan(BS)
 
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutions
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutionsSwitching vla ns_secugenius_harksh_mikemclain_secugenius security solutions
Switching vla ns_secugenius_harksh_mikemclain_secugenius security solutions
 
Threads and multi threading
Threads and multi threadingThreads and multi threading
Threads and multi threading
 
Programmable logic array
Programmable logic arrayProgrammable logic array
Programmable logic array
 

Recently uploaded

fluid mechanics gate notes . gate all pyqs answer
fluid mechanics gate notes . gate all pyqs answerfluid mechanics gate notes . gate all pyqs answer
fluid mechanics gate notes . gate all pyqs answer
apareshmondalnita
 
weather web application report.pdf
weather web application report.pdfweather web application report.pdf
weather web application report.pdf
Pratik Pawar
 
HYDROPOWER - Hydroelectric power generation
HYDROPOWER - Hydroelectric power generationHYDROPOWER - Hydroelectric power generation
HYDROPOWER - Hydroelectric power generation
Robbie Edward Sayers
 
Standard Reomte Control Interface - Neometrix
Standard Reomte Control Interface - NeometrixStandard Reomte Control Interface - Neometrix
Standard Reomte Control Interface - Neometrix
Neometrix_Engineering_Pvt_Ltd
 
Final project report on grocery store management system..pdf
Final project report on grocery store management system..pdfFinal project report on grocery store management system..pdf
Final project report on grocery store management system..pdf
Kamal Acharya
 
Vaccine management system project report documentation..pdf
Vaccine management system project report documentation..pdfVaccine management system project report documentation..pdf
Vaccine management system project report documentation..pdf
Kamal Acharya
 
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
Amil baba
 
CME397 Surface Engineering- Professional Elective
CME397 Surface Engineering- Professional ElectiveCME397 Surface Engineering- Professional Elective
CME397 Surface Engineering- Professional Elective
karthi keyan
 
The Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdfThe Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdf
Pipe Restoration Solutions
 
Event Management System Vb Net Project Report.pdf
Event Management System Vb Net  Project Report.pdfEvent Management System Vb Net  Project Report.pdf
Event Management System Vb Net Project Report.pdf
Kamal Acharya
 
Halogenation process of chemical process industries
Halogenation process of chemical process industriesHalogenation process of chemical process industries
Halogenation process of chemical process industries
MuhammadTufail242431
 
Water Industry Process Automation and Control Monthly - May 2024.pdf
Water Industry Process Automation and Control Monthly - May 2024.pdfWater Industry Process Automation and Control Monthly - May 2024.pdf
Water Industry Process Automation and Control Monthly - May 2024.pdf
Water Industry Process Automation & Control
 
WATER CRISIS and its solutions-pptx 1234
WATER CRISIS and its solutions-pptx 1234WATER CRISIS and its solutions-pptx 1234
WATER CRISIS and its solutions-pptx 1234
AafreenAbuthahir2
 
Online resume builder management system project report.pdf
Online resume builder management system project report.pdfOnline resume builder management system project report.pdf
Online resume builder management system project report.pdf
Kamal Acharya
 
İTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering WorkshopİTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering Workshop
Emre Günaydın
 
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
Dr.Costas Sachpazis
 
Danfoss NeoCharge Technology -A Revolution in 2024.pdf
Danfoss NeoCharge Technology -A Revolution in 2024.pdfDanfoss NeoCharge Technology -A Revolution in 2024.pdf
Danfoss NeoCharge Technology -A Revolution in 2024.pdf
NurvisNavarroSanchez
 
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdfA CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
Kamal Acharya
 
Automobile Management System Project Report.pdf
Automobile Management System Project Report.pdfAutomobile Management System Project Report.pdf
Automobile Management System Project Report.pdf
Kamal Acharya
 
Explosives Industry manufacturing process.pdf
Explosives Industry manufacturing process.pdfExplosives Industry manufacturing process.pdf
Explosives Industry manufacturing process.pdf
884710SadaqatAli
 

Recently uploaded (20)

fluid mechanics gate notes . gate all pyqs answer
fluid mechanics gate notes . gate all pyqs answerfluid mechanics gate notes . gate all pyqs answer
fluid mechanics gate notes . gate all pyqs answer
 
weather web application report.pdf
weather web application report.pdfweather web application report.pdf
weather web application report.pdf
 
HYDROPOWER - Hydroelectric power generation
HYDROPOWER - Hydroelectric power generationHYDROPOWER - Hydroelectric power generation
HYDROPOWER - Hydroelectric power generation
 
Standard Reomte Control Interface - Neometrix
Standard Reomte Control Interface - NeometrixStandard Reomte Control Interface - Neometrix
Standard Reomte Control Interface - Neometrix
 
Final project report on grocery store management system..pdf
Final project report on grocery store management system..pdfFinal project report on grocery store management system..pdf
Final project report on grocery store management system..pdf
 
Vaccine management system project report documentation..pdf
Vaccine management system project report documentation..pdfVaccine management system project report documentation..pdf
Vaccine management system project report documentation..pdf
 
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
NO1 Pandit Amil Baba In Bahawalpur, Sargodha, Sialkot, Sheikhupura, Rahim Yar...
 
CME397 Surface Engineering- Professional Elective
CME397 Surface Engineering- Professional ElectiveCME397 Surface Engineering- Professional Elective
CME397 Surface Engineering- Professional Elective
 
The Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdfThe Benefits and Techniques of Trenchless Pipe Repair.pdf
The Benefits and Techniques of Trenchless Pipe Repair.pdf
 
Event Management System Vb Net Project Report.pdf
Event Management System Vb Net  Project Report.pdfEvent Management System Vb Net  Project Report.pdf
Event Management System Vb Net Project Report.pdf
 
Halogenation process of chemical process industries
Halogenation process of chemical process industriesHalogenation process of chemical process industries
Halogenation process of chemical process industries
 
Water Industry Process Automation and Control Monthly - May 2024.pdf
Water Industry Process Automation and Control Monthly - May 2024.pdfWater Industry Process Automation and Control Monthly - May 2024.pdf
Water Industry Process Automation and Control Monthly - May 2024.pdf
 
WATER CRISIS and its solutions-pptx 1234
WATER CRISIS and its solutions-pptx 1234WATER CRISIS and its solutions-pptx 1234
WATER CRISIS and its solutions-pptx 1234
 
Online resume builder management system project report.pdf
Online resume builder management system project report.pdfOnline resume builder management system project report.pdf
Online resume builder management system project report.pdf
 
İTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering WorkshopİTÜ CAD and Reverse Engineering Workshop
İTÜ CAD and Reverse Engineering Workshop
 
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
Sachpazis:Terzaghi Bearing Capacity Estimation in simple terms with Calculati...
 
Danfoss NeoCharge Technology -A Revolution in 2024.pdf
Danfoss NeoCharge Technology -A Revolution in 2024.pdfDanfoss NeoCharge Technology -A Revolution in 2024.pdf
Danfoss NeoCharge Technology -A Revolution in 2024.pdf
 
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdfA CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
A CASE STUDY ON ONLINE TICKET BOOKING SYSTEM PROJECT.pdf
 
Automobile Management System Project Report.pdf
Automobile Management System Project Report.pdfAutomobile Management System Project Report.pdf
Automobile Management System Project Report.pdf
 
Explosives Industry manufacturing process.pdf
Explosives Industry manufacturing process.pdfExplosives Industry manufacturing process.pdf
Explosives Industry manufacturing process.pdf
 

حافظه طولانی کوتاه مدت Long Short-Term Memory (LSTM)