Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
TH
Uploaded by
Tomoyuki Hioki
2,865 views
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
LSTM
Data & Analytics
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Downloaded 12 times
1
/ 16
2
/ 16
3
/ 16
4
/ 16
Most read
5
/ 16
6
/ 16
7
/ 16
8
/ 16
9
/ 16
10
/ 16
11
/ 16
12
/ 16
13
/ 16
14
/ 16
Most read
15
/ 16
16
/ 16
Most read
More Related Content
PDF
Recurrent Neural Networks
by
Seiya Tokui
PDF
Learning to forget continual prediction with lstm
by
Fujimoto Keisuke
PDF
グラフニューラルネットワークとグラフ組合せ問題
by
joisino
PDF
LSTM (Long short-term memory) 概要
by
Kenji Urai
PPTX
海鳥の経路予測のための逆強化学習
by
Tsubasa Hirakawa
PDF
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
by
SSII
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
by
RyuichiKanoh
PPTX
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
by
Deep Learning JP
Recurrent Neural Networks
by
Seiya Tokui
Learning to forget continual prediction with lstm
by
Fujimoto Keisuke
グラフニューラルネットワークとグラフ組合せ問題
by
joisino
LSTM (Long short-term memory) 概要
by
Kenji Urai
海鳥の経路予測のための逆強化学習
by
Tsubasa Hirakawa
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
by
SSII
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
by
RyuichiKanoh
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
by
Deep Learning JP
What's hot
PDF
SSII2019企画: 点群深層学習の研究動向
by
SSII
PDF
局所特徴量と統計学習手法による物体検出
by
MPRG_Chubu_University
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
by
Deep Learning JP
PPTX
強化学習における好奇心
by
Shota Imai
PPTX
強化学習 DQNからPPOまで
by
harmonylab
PDF
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
by
Preferred Networks
PDF
方策勾配型強化学習の基礎と応用
by
Ryo Iwaki
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
by
Yuta Kikuchi
PDF
敵対的生成ネットワーク(GAN)
by
cvpaper. challenge
PPTX
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
by
SSII
PDF
[DL輪読会]Understanding Black-box Predictions via Influence Functions
by
Deep Learning JP
PDF
機械学習モデルの判断根拠の説明
by
Satoshi Hara
PDF
PRML学習者から入る深層生成モデル入門
by
tmtm otm
PPTX
マルチモーダル深層学習の研究動向
by
Koichiro Mori
PPTX
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
by
Shota Imai
PDF
Deeplearning輪読会
by
正志 坪坂
PDF
【チュートリアル】コンピュータビジョンによる動画認識
by
Hirokatsu Kataoka
PDF
グラフデータの機械学習における特徴表現の設計と学習
by
Ichigaku Takigawa
PDF
PCAの最終形態GPLVMの解説
by
弘毅 露崎
PDF
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
SSII2019企画: 点群深層学習の研究動向
by
SSII
局所特徴量と統計学習手法による物体検出
by
MPRG_Chubu_University
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
by
Deep Learning JP
強化学習における好奇心
by
Shota Imai
強化学習 DQNからPPOまで
by
harmonylab
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
by
Preferred Networks
方策勾配型強化学習の基礎と応用
by
Ryo Iwaki
最近のDeep Learning (NLP) 界隈におけるAttention事情
by
Yuta Kikuchi
敵対的生成ネットワーク(GAN)
by
cvpaper. challenge
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
by
SSII
[DL輪読会]Understanding Black-box Predictions via Influence Functions
by
Deep Learning JP
機械学習モデルの判断根拠の説明
by
Satoshi Hara
PRML学習者から入る深層生成モデル入門
by
tmtm otm
マルチモーダル深層学習の研究動向
by
Koichiro Mori
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
by
Shota Imai
Deeplearning輪読会
by
正志 坪坂
【チュートリアル】コンピュータビジョンによる動画認識
by
Hirokatsu Kataoka
グラフデータの機械学習における特徴表現の設計と学習
by
Ichigaku Takigawa
PCAの最終形態GPLVMの解説
by
弘毅 露崎
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
Similar to [論文紹介] LSTM (LONG SHORT-TERM MEMORY)
PPTX
Long short-term memory (LSTM)
by
Kenta Ishii
PDF
Deep Learning
by
Masayoshi Kondo
PPTX
Recurrent Neural Network
by
KozoChikai
PDF
Lstm shannonlab
by
Shannon Lab
PPTX
RNN.pptx
by
FumiyaOnishi
PDF
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
by
Shotaro Sano
PDF
TensorFlow math ja 05 word2vec
by
Shin Asakawa
PDF
Deep Learningの基礎と応用
by
Seiya Tokui
PDF
Rnn+lstmを理解する
by
Arata Honda
PDF
深層学習レポートDay3(小川成)
by
ssuser441cb9
PPTX
深層学習とTensorFlow入門
by
tak9029
PDF
Study aiラビットチャレンジ 深層学習Day3
by
Naoki Nishikawa
PPTX
Paper: seq2seq 20190320
by
Yusuke Fujimoto
PDF
音声認識と深層学習
by
Preferred Networks
PDF
Multivariate Time series analysis via interpretable RNNs
by
ohken
PPTX
ラビットチャレンジレポート 深層学習Day3
by
ssuserf4860b
PDF
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
by
Deep Learning JP
PPTX
深層学習による自然言語処理 第2章 ニューラルネットの基礎
by
Shion Honda
DOCX
レポート深層学習Day3
by
ssuser9d95b3
PPTX
[DL輪読会]QUASI-RECURRENT NEURAL NETWORKS
by
Deep Learning JP
Long short-term memory (LSTM)
by
Kenta Ishii
Deep Learning
by
Masayoshi Kondo
Recurrent Neural Network
by
KozoChikai
Lstm shannonlab
by
Shannon Lab
RNN.pptx
by
FumiyaOnishi
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
by
Shotaro Sano
TensorFlow math ja 05 word2vec
by
Shin Asakawa
Deep Learningの基礎と応用
by
Seiya Tokui
Rnn+lstmを理解する
by
Arata Honda
深層学習レポートDay3(小川成)
by
ssuser441cb9
深層学習とTensorFlow入門
by
tak9029
Study aiラビットチャレンジ 深層学習Day3
by
Naoki Nishikawa
Paper: seq2seq 20190320
by
Yusuke Fujimoto
音声認識と深層学習
by
Preferred Networks
Multivariate Time series analysis via interpretable RNNs
by
ohken
ラビットチャレンジレポート 深層学習Day3
by
ssuserf4860b
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
by
Deep Learning JP
深層学習による自然言語処理 第2章 ニューラルネットの基礎
by
Shion Honda
レポート深層学習Day3
by
ssuser9d95b3
[DL輪読会]QUASI-RECURRENT NEURAL NETWORKS
by
Deep Learning JP
More from Tomoyuki Hioki
PDF
Analysis of cancer by structural equation
by
Tomoyuki Hioki
PDF
Analysis of cancer and health in each prefecture
by
Tomoyuki Hioki
PDF
Marketing Strategy by American Express
by
Tomoyuki Hioki
PDF
製品改良と満足度との関係:多属性モデルに基づくシミュレーション
by
Tomoyuki Hioki
PDF
Power energy system optimization research by reinforcement learning extended ...
by
Tomoyuki Hioki
PDF
Power energy system optimization research by reinforcement learning extended ...
by
Tomoyuki Hioki
PDF
【論文紹介】Understanding Back-Translation at Scale
by
Tomoyuki Hioki
PPTX
Smart Grid Optimization by Deep Reinforcement Learning over Discrete and Cont...
by
Tomoyuki Hioki
PDF
【論文紹介】Deep Mimic: Example-Guided Deep Reinforcement Learning of Physics-Based...
by
Tomoyuki Hioki
PDF
【論文紹介】Seq2Seq (NIPS 2014)
by
Tomoyuki Hioki
PDF
【論文紹介】Deep Reinforcement Learning for Solving the Vehicle Routing Problem
by
Tomoyuki Hioki
PDF
Prml1.2.5~1.2.6
by
Tomoyuki Hioki
PDF
Prml1.2.4
by
Tomoyuki Hioki
PDF
Prml1.2.3
by
Tomoyuki Hioki
PDF
Prml1.2.1~1.2.2
by
Tomoyuki Hioki
PPTX
PRML1.1
by
Tomoyuki Hioki
PPTX
PRML1.2
by
Tomoyuki Hioki
PDF
PRML1.1
by
Tomoyuki Hioki
Analysis of cancer by structural equation
by
Tomoyuki Hioki
Analysis of cancer and health in each prefecture
by
Tomoyuki Hioki
Marketing Strategy by American Express
by
Tomoyuki Hioki
製品改良と満足度との関係:多属性モデルに基づくシミュレーション
by
Tomoyuki Hioki
Power energy system optimization research by reinforcement learning extended ...
by
Tomoyuki Hioki
Power energy system optimization research by reinforcement learning extended ...
by
Tomoyuki Hioki
【論文紹介】Understanding Back-Translation at Scale
by
Tomoyuki Hioki
Smart Grid Optimization by Deep Reinforcement Learning over Discrete and Cont...
by
Tomoyuki Hioki
【論文紹介】Deep Mimic: Example-Guided Deep Reinforcement Learning of Physics-Based...
by
Tomoyuki Hioki
【論文紹介】Seq2Seq (NIPS 2014)
by
Tomoyuki Hioki
【論文紹介】Deep Reinforcement Learning for Solving the Vehicle Routing Problem
by
Tomoyuki Hioki
Prml1.2.5~1.2.6
by
Tomoyuki Hioki
Prml1.2.4
by
Tomoyuki Hioki
Prml1.2.3
by
Tomoyuki Hioki
Prml1.2.1~1.2.2
by
Tomoyuki Hioki
PRML1.1
by
Tomoyuki Hioki
PRML1.2
by
Tomoyuki Hioki
PRML1.1
by
Tomoyuki Hioki
Recently uploaded
PPTX
KNIMEで奈良の気温を調べてみた_2026_0207_KNIMEST.pptx
by
syk zassou
PPTX
What's New In Qlik ~ 2025年12月&2026年1月リリース最新機能のご紹介 ~
by
QlikPresalesJapan
PPTX
【Qlik 医療データ活用勉強会】医療の質可視化アプリの公開-その2- 20260128
by
QlikPresalesJapan
PPTX
KNIMEは地味だが役に立つ_2026_0207_DojoMeeting_Kansai_#1.pptx
by
syk zassou
PDF
EspressReport Enterprise Server ホワイトペーパー
by
株式会社クライム
PDF
研究資料ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
by
4fqg857pxh
KNIMEで奈良の気温を調べてみた_2026_0207_KNIMEST.pptx
by
syk zassou
What's New In Qlik ~ 2025年12月&2026年1月リリース最新機能のご紹介 ~
by
QlikPresalesJapan
【Qlik 医療データ活用勉強会】医療の質可視化アプリの公開-その2- 20260128
by
QlikPresalesJapan
KNIMEは地味だが役に立つ_2026_0207_DojoMeeting_Kansai_#1.pptx
by
syk zassou
EspressReport Enterprise Server ホワイトペーパー
by
株式会社クライム
研究資料ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
by
4fqg857pxh
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
1.
LONG SHORT-TERM MEMORY NEURAL COMUPATION
9(8):1735-1780, 1997 Sepp Hochreiter Fakultat fur Informatik Technische Universit at Munchen 80290 Munchen, Germany Jurgen Schmidhuber IDSIA Corso Elvezia 36 6900 Lugano, Switzerland
2.
時系列データの問題 時系列データ:𝑥", 𝑥$, 𝑥%
… , 𝑥' 添字tはデータの種類によって異なる 時系列データの例:⽂章・対話の⽣成 tは単語を前から並べたときの番号 ⾳声認識 tは⼀定の時間間隔(数ms)でのサンプル時間 映像認識 etc. 時系列データの問題例: ⽂章・対話の⽣成 今までの単語列を⼊⼒として、もっともらしい次の単語を予測する 1 背景
3.
2 背景 sequential: 1 bit at a time Gradient-based RNNs1980s: BPTT, RTRL - gradients based on “unfolding” etc. (Williams, Werbos, Robinson) Recurrent
networks(詳しくは後⽇説明します)
4.
Recurrent networks:従来の⽅法 ⼊⼒信号と教師信号の誤差を最⼩にするため、主に2つの⼿法が⽤いられた “Back-Propagation Through
Time” (BPTT, e.g., Williams and Zipser 1992,) “Real-Time Recurrent Learning” (RTRL,Werbos 1988RTRL, e.g., Robinson and Fallside 1987) これらのアルゴリズム特徴:誤差逆伝播の勾配法 ⼤きな難点 逆伝搬された誤差の時間的進展は、重みのサイズに指数関数的に依存する ⾔い換えると、勾配は時間ステップに指数関数的に⽐例する 勾配消失問題(Hochreiter 1991) ⻑期にわたる誤差逆伝播では勾配の爆発・消失が⽣じる 3 背景
5.
ex.)ステップtにおけるユニットuからqステップ前のユニットv への誤差の逆伝播について考える 逆伝播の公式より … ユニットjへの出⼒ … ユニットjの重み …
ユニットkの出⼒誤差(ykは出⼒値、tkは⽬標変数) 従って誤差は 𝜕𝑣*(𝑡 − 𝑞) 𝜕𝑣0(𝑡) = 𝑓3 * 𝑛𝑒𝑡* 𝑡 − 1 𝑤0* 𝑞 = 1 𝑓3 * 𝑛𝑒𝑡* 𝑡 − 𝑞 9 𝜕𝑣* 𝑡 − 𝑞 + 1 𝜕𝑣0 𝑡 ; <=" 𝑤<* 𝑞 > 1 4 背景
6.
ex.)ステップtにおけるユニットuからqステップ前のユニットv への誤差の逆伝播について考える 誤差は 𝜕𝑣*(𝑡 − 𝑞) 𝜕𝑣0(𝑡) = 𝑓3 * 𝑛𝑒𝑡*
𝑡 − 1 𝑤0* 𝑞 = 1 𝑓3 * 𝑛𝑒𝑡* 𝑡 − 𝑞 9 𝜕𝑣* 𝑡 − 𝑞 + 1 𝜕𝑣0 𝑡 ; <=" 𝑤<* 𝑞 > 1 𝑘@ = 𝑣, 𝑘A, = 𝑢を⽤いると、 𝜕𝑣*(𝑡 − 𝑞) 𝜕𝑣0(𝑡) = 9 … 9 C 𝑓3 <D 𝑛𝑒𝑡<D 𝑡 − 𝑚 𝑤<D @ F=" ; <GHI=" ; <I=" 𝑘FJ" |𝑓3 <D 𝑛𝑒𝑡<D 𝑡 − 𝑚 𝑤<D 𝑘FJ"| > 1.0 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑚 発散(爆発) 𝑓3 <D 𝑛𝑒𝑡<D 𝑡 − 𝑚 𝑤<D 𝑘FJ" < 1.0 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑚 収束(消失) 5 背景 勾配消失問題
7.
LSTM(Long short-term memory)は、 RNN(Recurrent
Neural Network)の拡張として、 時系列データ(sequential data)に対するモデル、 あるいは構造(architecture)の1種 その名は、Long term memory(⻑期記憶)とShort term memory(短期記憶)という 神経科学における⽤語から取られている LSTMはRNNの中間層のユニットをLSTM blockと呼ばれるメモリと3つのゲートを持つ ブロックに置き換えることで実現されている 従来のRNNでは1000ステップにわたる ⻑期の系列は学習困難であった LSTMでは1000ステップにわたる ⻑期依存に加え、短期依存も可能! 6 LSTM(1990s〜)
8.
LSTMには近年のLSTMに到るまでに様々な改良がされてきた 近年のLSTMまでに4つの代表的な世代がある 1) Original (95,97年)[Hochreiter
& Schmidhuber, 95;97] 2) Forget Gateの導⼊ (99年)[Gers & Schmidhuber, 99] 3) Peephole Connectionの導⼊ (00年)[Gers & Schmidhuber, 00] 4) Full Gradientの導⼊ (05年)[Graves & Schmidhuber, 05] 7 LSTM(1990s〜)
9.
Original LSTM LSTMには⼊⼒値と2つのゲートがあり、 それぞれ「実際の⼊⼒値」「⼊⼒ゲート」 「出⼒ゲート」となっている ⼊⼒ゲートと出⼒ゲートは⼊⼒値と 内部のメモリセルの状態(state)制御に 使⽤される ⼊⼒層の出⼒xt及び中間層の1ステップ前 の出⼒yt-1は、それぞれ3か所に同時に ⼊⼒として供給される 各⼊⼒は重み⾏列wz,in,out ,Rz,in,out によって重み付けされ、加算されのち 各ゲートの活性化関数を通る CEC(Constant
Error Carousel)とは 勾配消失問題に対応する機能を持ったアプローチ 8 第1世代LSTM(1995〜) ・ ・ ・ ⼊⼒層の出⼒xt 1ステップ前のユニットの出⼒yt-1 出力ゲート 入力ゲート 実際の入力値 𝑓3 <D 𝑛𝑒𝑡<D 𝑡 − 𝑚 𝑤<D 𝑘FJ" = 1.0
10.
Original LSTM Input weight
conflict 従来のRNNでは、重み更新に⽭盾があった ・以前の⼊⼒情報を記憶する(覚える) ・以前の⼊⼒が無関係な場合保護する (読まない) しかし、重み付けのみで表現することは 難しい… ⼊⼒したくないデータを⼊⼒ゲートで除去 ⼊⼒ゲートで必要な誤差信号のみが伝搬 するように閉じたり開いたりする 記憶データとWinの内積で⼊⼒可否を判断 output weight conflict Input weight conflictと同様に ・以前の⼊⼒情報を記憶する(覚える) ・以前の⼊⼒が無関係な場合保護する(書かない) 従来の重み付けのみの表現では⽭盾が⽣じる… 出⼒したくないデータを出⼒ゲートで除去 ⼊⼒ゲートと同様に出⼒ゲートで必要な出⼒かどうか判断 記憶データとWoutの内積で出⼒可否を判断 9 第1世代LSTM(1995〜) 入力ゲート 出力ゲート 実際の入力値
11.
LSTMには近年のLSTMに到るまでに様々な改良がされてきた 近年のLSTMまでに4つの代表的な世代がある 1) Original (95,97年)[Hochreiter
& Schmidhuber, 95;97] 2) Forget Gateの導⼊ (99年)[Gers & Schmidhuber, 99] 3) Peephole Connectionの導⼊ (00年)[Gers & Schmidhuber, 00] 4) Full Gradientの導⼊ (05年)[Graves & Schmidhuber, 05] 10 LSTM(1990s〜)
12.
11 第2世代LSTM(1999〜) Forget Gate Original LSTMで⻑期記憶可能となったことで、 遠くまで誤差を伝達できるようになった 強み
弱点 メモリセルの状態が飽和する 古くなった記憶情報をリセットしたい! Forget Gateの導⼊ ・ ・ ・ ⼊⼒層の出⼒xt 1ステップ前のユニットの出⼒yt-1
13.
LSTMには近年のLSTMに到るまでに様々な改良がされてきた 近年のLSTMまでに4つの代表的な世代がある 1) Original (95,97年)[Hochreiter
& Schmidhuber, 95;97] 2) Forget Gateの導⼊ (99年)[Gers & Schmidhuber, 99] 3) Peephole Connectionの導⼊ (00年)[Gers & Schmidhuber, 00] 4) Full Gradientの導⼊ (05年)[Graves & Schmidhuber, 05] 12 LSTM(1990s〜)
14.
Peephole Connection ・⼊⼒ゲート ・出⼒ゲート ・忘却ゲート の3つからなるゲートによって LSTMは完成されたかと思われたが、 ⼤きな問題がひとつあった 各ゲートは⼊⼒層とすべての出⼒の情報 を受け取るがCECからの情報はなかった 例えば、出⼒ゲートが閉じていた場合、CECの 情報はゼロとして扱われ、制御に利⽤できない! Peephole Connectionの導⼊ 13 第3世代LSTM(00〜)
15.
14 補⾜
16.
15 補⾜
Download