SlideShare a Scribd company logo
ニューラルネットワーク
勉強会
第4回
柳本 豪一
本日の予定
リカレントニューラルネットワークで言語モデルを構
築します。
• リカレントニューラルネットワークを構築する
リカレントニューラルネットワーク言語モデル
一般的なリカレントニューラルネットワーク
入力層
隠れ層(t)
出力層
隠れ層(t-1)
リカレントニューラルネットワーク言語モデル
一般的なリカレントニューラルネットワーク
入力層
隠れ層(t)
出力層
隠れ層(t-1)
コンテキストユニット
言語モデルの特徴
過去の入力を考慮した予測が可能
フィードバックにより隠れ層に履歴が保存
→多層NNに比べPerplexityは改善
長期におよぶ過去の情報の保存は困難
フィードバック結合の重み行列の固有値の問題
固有値が1より大きい→発散
固有値が1より小さい→消失
言語モデルの特徴
過去の入力を考慮した予測が可能
フィードバックにより隠れ層に履歴が保存
→多層NNに比べPerplexityは改善
長期におよぶ過去の情報の保存は困難
フィードバック結合の重み行列の固有値の問題
固有値が1より大きい→発散
固有値が1より小さい→消失
Long Short Term Memory(LSTM)の登場
(次回)
入出力
1-of-nコーディングにより単語を入力
EmbedIDを使って分散表現を作成
Softmax関数を使った単語の予測
softmax_cross_entropy関数を利用
Chainerでの実装
FunctionSetを用いてニューラルネットワークを構成
model = FunctionSet(
embed = F.EmbedID(V, R),
x_to_h = F.Linear(R, H),
h_to_h = F.Linear(H, H), //フィードバック
h_to_y = F.Linear(H, V),
)
Chainerでの実装
フィードバックの実装
• 1文ごとに隠れ層を初期化
• 単語ごとに隠れ層の状態を計算し、次の計算に利用
→ 関数による実装
def forward(sent):
loss = Variable(np.zeros((), dtype=np.float32))
h = Variable(np.zeros((1, H), dtype=np.float32))
for cur_word, next_word in zip(sent[:-1], sent[1:]):
h, new_loss = forward_one_each(h, cur_word, next_word)
loss += new_loss
return loss
Chainerでの実装
フィードバックの実装
• 1文ごとに隠れ層を初期化
• 単語ごとに隠れ層の状態を計算し、次の計算に利用
→ 関数による実装
def forward_one_step(h, cur_word, next_word):
i = Variable(np.array([cur_word], dtype=np.int32))
t = Variable(np.array([next_word], dtype=np.int32))
x = model.embed(i)
h = F.tanh(model.x_to_h(x) + model.h_to_h(h))
y = F.tanh(model.h_to_y(h))
return h, F.softmax_cross_entropy(y, t)
ライブコーディング
リカレントニューラルネットワークを用いた言語モデ
ルの構築

More Related Content

Viewers also liked

Presentation123
Presentation123Presentation123
Presentation123
megikatq
 
GlobalWA Brochure
GlobalWA BrochureGlobalWA Brochure
GlobalWA Brochure
Sara Atalla
 
J431 Strategic Communications Campaign Plan
J431 Strategic Communications Campaign PlanJ431 Strategic Communications Campaign Plan
J431 Strategic Communications Campaign Plan
Sara Kate Nash
 
GlobalWA Philanthropy Guide
GlobalWA Philanthropy GuideGlobalWA Philanthropy Guide
GlobalWA Philanthropy Guide
Sara Atalla
 
ден на христ.сем во-8 зала
ден на христ.сем во-8 заладен на христ.сем во-8 зала
ден на христ.сем во-8 зала
megikatq
 

Viewers also liked (17)

ニューラルネットワーク勉強会1
ニューラルネットワーク勉強会1ニューラルネットワーク勉強会1
ニューラルネットワーク勉強会1
 
ニューラルネットワーク勉強会5
ニューラルネットワーク勉強会5ニューラルネットワーク勉強会5
ニューラルネットワーク勉強会5
 
ニューラルネットワーク ことはじめ
ニューラルネットワーク ことはじめニューラルネットワーク ことはじめ
ニューラルネットワーク ことはじめ
 
Public Safety Hiring Tutorial
Public Safety Hiring TutorialPublic Safety Hiring Tutorial
Public Safety Hiring Tutorial
 
Definitions of unit 2
Definitions of unit 2Definitions of unit 2
Definitions of unit 2
 
Kolumbina
Kolumbina Kolumbina
Kolumbina
 
Presentation123
Presentation123Presentation123
Presentation123
 
GlobalWA Brochure
GlobalWA BrochureGlobalWA Brochure
GlobalWA Brochure
 
турция
турциятурция
турция
 
J431 Strategic Communications Campaign Plan
J431 Strategic Communications Campaign PlanJ431 Strategic Communications Campaign Plan
J431 Strategic Communications Campaign Plan
 
แรง
แรงแรง
แรง
 
GlobalWA Philanthropy Guide
GlobalWA Philanthropy GuideGlobalWA Philanthropy Guide
GlobalWA Philanthropy Guide
 
коледен експрес
коледен експресколеден експрес
коледен експрес
 
Futbolen turnir
Futbolen turnirFutbolen turnir
Futbolen turnir
 
ден на християнското семейство
ден на християнското семействоден на християнското семейство
ден на християнското семейство
 
Presentation1pdf
Presentation1pdfPresentation1pdf
Presentation1pdf
 
ден на христ.сем во-8 зала
ден на христ.сем во-8 заладен на христ.сем во-8 зала
ден на христ.сем во-8 зала
 

Recently uploaded

2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
ssuserbefd24
 

Recently uploaded (10)

【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
 
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
 

ニューラルネットワーク勉強会4