SlideShare a Scribd company logo
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
父親
りんご
青
交差点
食べる
みかん
銀杏
小豆
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用
6章ニューラルネットワークの利用

More Related Content

Featured

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 

Featured (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

Editor's Notes

  1. ニューラルネットワークの利用と題しまして、野本が発表させていただきます。
  2. 今回の発表の流れです。まずニューラルネットの概要について説明し、その後自然言語処理におけるニューラルネットの利用例を2つ紹介します。そのあと、皆さんの元気が残っていたら軽く演習問題をやりたいなと思っています。 今回の内容、ニューラルネットをあまり知らない人にとってはとっても重たい内容になっています。少しでもわからなくなったら内容の確認とかでも構いませんので、どんどん止めてください。 <送り>ではまず、ニューラルネットワークの基礎についてやっていきます。
  3. いきなりですが、これがニューラルネットワークです。この場合だと3次元のベクトルを入力したらなんからの3次元のベクトルが出てくるという代物になります。 この○一個一個を[ニューロン]とか、[細胞]と言います。<アニメ送り> この塊を[層]と呼びます。入力部分を入力層<送り>、出力部分を出力層<送り>といい、その間は<送り>隠れ層や中間層と呼ばれます。 中間層はいくつあっても構いません。また、各層の細胞数は自由に決めることができますが、隠れ層の細胞数は揃えるのが基本らしいです。
  4. ニューロンは何か入力が入ってくると、それを次の層のニューロンへ<送り>重みをつけて送り出します。 例えば、このニューロンの重みが
  5. このニューロンの重みが10と-5で、3が入力だった時、
  6. 次の層は3に10と-5の重みがかけられて30と-15になります。
  7. 一つのニューロンへ複数の入力があるときは、それを足し合わせ一定のバイアスを加えます。<アニメ送り> また、ニューロン内でその数字に何かしらの関数による演算を行って次への出力とする場合もあります。この関数を活性化関数と言います。例えば活性化関数がこれを0.1倍するものの場合<アニメ>、3.3が次の層への出力となります。
  8. 活性化関数は自由に決めることができ、一般的にはシグモイド関数が用いられます<送り>これを使うと、出力を0から1の間に収めることができるからです。<送り> ここまででニューラルネットの動きは大体わかりましたでしょうか? ニューラルネットの構造で私たちが決められるのは中間層の数、各層の細胞数(入出力層の細胞数は問題設定から決まってしまうので、厳密には中間層の細胞数)と、各層の活性化関数です。ただ、これらを決めただけでは、入力から正しい出力を得ることができません。そのためには<ページ送り>正しい重みを見つけてやる必要があります。これを見つける作業を学習と言います。
  9. 正しい重みを見つけてやる必要があります。これを見つける作業を学習と言います。学習ではニューラルネットの出力と、<送り>正解との誤差を用い、これが小さくなるように(、正しい重みに近づくように)各重みを更新します。 ただ、出力層付近の重みの更新は問題ないのですが、出力層から遠い、入力層付近では手がかりとなる誤差から遠いため、重みの更新の計算がべらぼうにややこしくなります。それを解決するのが誤差逆伝搬法です。
  10. 詳しい説明は割愛しますが、誤差逆伝搬法では<送り>誤差を元に新たな数字列<送り>δを作り、それを<送り>出力層から入力層へと伝播させていきます。重みの更新は、
  11. 出力層から<送り>入力層の一個前まで伝播させていきます。
  12. 入力層の一個前まで伝播させていきます。重みの更新は、
  13. 重みの更新は、<送り>例えばここの重みについてみると、準伝播の時のニューロンの<送り>出力と、<送り>デルタの値によって簡単に計算できます。
  14. つまり、<送り>準伝播、<送り>逆伝播、<送り>重みの更新のサイクルを何回も繰り返すことで学習を進めていきます。
  15. 教科書にはありませんが、NNの学習の進め方をまとめました。 大きく分けて準備、学習、検証の3ステップです。 準備フェーズでは学習データを用意し、それを学習用、検証用、評価用に分けます。 学習フェーズでは訓練データを使って先ほどの準伝播、逆伝播、重みの更新を繰り返します。この時、訓練データの誤差と検証データの誤差をエポックごとに記録しておきます。エポックとは、訓練データを一回総なめすることです。検証データで重みの更新をしないように注意しましょう。 検証フェーズでは、学習時に記録しておいた訓練誤差と検証誤差を元に過学習を起こし始めているところを見つけ、その直前のモデルを最終的なモデルとし、これに評価データを入力して誤差などを評価します。過学習については次のスライドで説明します。<送り>
  16. 訓練誤差と検証誤差をグラフに書くとこのような形になります。学習の最初の方は訓練誤差と検証誤差がともに小さくなっていき、あるところから検証誤差だけが大きくっていきます。これが<送り>過学習です。訓練誤差が小さいのに検証誤差が大きいのが特徴です。過学習はモデルが訓練データに寄りすぎ、そのほかのデータへの当てはめつまり汎化性能が悪くなることで起こります。 ということで、検証誤差がもっとも小さい<送り>このあたりのモデルが一番良い性能を持っていると言えます。 この過学習を抑える方法にドロップアウトというものがあります。学習時にランダムにいくつかのニューロンをないものとして扱うというものです。これは、多数の異なるNNの結果を平均しているのと同じような状況になるため、過学習を抑える効果があるらしいです。 (アンサンブル学習: 個々に学習したモデルの出力結果の平均を取って結果とすると汎化性能が向上する。ランダムフォレストなどはこの一例。なぜ有効なのかは証明されていない) ここまででニューラルネットワーク概論が終わりです。質問ありませんか?
  17. これは完全に余談ですが、ニューラルネットワークは行列で表現できます。各層の値をベクトル、層から層への重みを行列としてかきます。大体どの参考書でもこの表記が使われていますので、知っておいてください。
  18. 次に、自然言語処理におけるニューラルネットの利用例を説明していきます。まずはワードエンベッディングから。
  19. ワードエンベッディングとは、語をベクトルで表現することです。これの特徴としまして、意味の演算ができるというものがあります。
  20. ワードエンベッディングは次のような仮定に基づきベクトルを計算します。<仮定読み上げ> 4.2.2で紹介されていたベクトルの算出方法は、自己相互情報量に基づくものであり、これは文脈語を数えることで得られます。 ワードエンベッディングの学習にはskip-gramモデルとCBoW(シーボウ)モデルの2種類あり、ここでは<送り>skip-gramについて説明します。
  21. skip-gramモデルでは、このような目的関数の最大化を目指します。<送り>
  22. 目的関数全体の意味は、単語wtから前後c単語の文脈語を予測し、それをコーパス中の全単語について行うことです。単語w_tが入ってきたときの文脈語の予測確率を計算機で扱える形に定義する必要があります。そのために、全ての単語に関して単語ベクトルvと単語予測ベクトルuを定義します。 これを用いてpは<ページ送り>
  23. このように定義することにします。 Wはコーパス中の全語彙で、その全てに関してこの演算をして足し合わせますよーっていみになります。
  24. expの中身は、wtの単語ベクトルと該当の単語予測ベクトルとの内積です。 ちなみにこういう、それぞれのexpの和分の対象のexpという形の関数をソフトマックスと呼びます。
  25. この定義のポイントは、各単語が予測元と予測先の2つのベクトルを持つということです。これにより、よく共起する<送り>りんごと<送り>食べるが<送り>近いベクトルを持つの<送り>ではなく、
  26. 同じ食べるを予測語とするりんごとみかんが<送り>近いベクトルを持つことになります。
  27. 実際には分母の計算コストがべらぼうに高いので、学習時にはランダムにK単語取ってきてそのK個の単語に関して<分母を差しながら>これを計算します。このK単語を疑似負例と言います。
  28. ここまでをまとめると、こうなります。この目的関数の最大化を目指します。ただし、pはこのように定義されます。 目的関数を最大化したいなら(上のpを差しながら)これを大きくすればよく、したがって<送り>これを大きくしつつ、<送り>これを小さくすればよいことがわかります。ここでお待ちかね、NNの出番です。
  29. このようなモデルを考えます。結合は略してますが、全部繋がってます。大きくする小さくするを扱いやすくするために、シグモイド関数をかけて、これを1に、これを0に近づける形にします。
  30. 例えばwtがりんごの場合入力のベクトルはこうします。
  31. すると、隠れ層の値にはりんごから各ニューロンへの重みがそのまま反映されることになります。これが<送り>りんごベクトルに相当します。
  32. そして隠れ層から出力層への重みを単語予測ベクトル(u)と見立てると、出力層の各ニューロンの値は、りんごベクトルとその単語予測ベクトルとの内積になります。そして、出力層の活性化関数としてシグモイド関数を適用すれば、
  33. そして、出力層の活性化関数としてシグモイド関数を適用すれば、
  34. 正例1, 負例0, そのほかはNoneとした正解ラベルに近づくように、このネットワークを学習することができます。
  35. このようにして得られたりんごベクトルとcos類似度の高い語はこうなったそうです。カタカナのりんごがもっとも近く、そのあとは果物が続いています。
  36. ここまでをフルスクラッチで実装してみました。それに100本ノックのコーパスである吾輩は猫であるを喰わせた結果がこれになります。<送り>いくつか単語を入れて近い9件を出してみました。<送り>gitにコードを上げておくので参考にしてください。今回は誤差逆伝播もコードに書きたかったのでフルスクラッチですが、世の中にはChainerやTensorflowといったNN学習用の便利なモジュールがありますので、研究でNNを組み立てる時はそれを使うようにしてください。 ここまでで、WEについては終了です。ここまでで質問はありますか? 次はRNNについて説明していきます。これが今日ラストのトピックですので皆さん頑張ってください。
  37. ここまでをフルスクラッチで実装してみました。それに100本ノックのコーパスである吾輩は猫であるを喰わせた結果がこれになります。<送り>いくつか単語を入れて近い9件を出してみました。<送り>gitにコードを上げておくので参考にしてください。今回は誤差逆伝播もコードに書きたかったのでフルスクラッチですが、世の中にはChainerやTensorflowといったNN学習用の便利なモジュールがありますので、研究でNNを組み立てる時はそれを使うようにしてください。 ここまでで、WEについては終了です。ここまでで質問はありますか? 次はRNNについて説明していきます。これが今日ラストのトピックですので皆さん頑張ってください。
  38. リカレントニューラルネットワークは、隠れ層の値を次の入力に引き継ぎます。これにより、時系列データの解析ができるようになります。 自然言語処理では、言語モデル学習や系列ラベリングなどに用いられます。
  39. 言語モデルは、<送り>n-gramなどが代表的であり、RNNを使うとn-gramよりも賢い言語モデルを学習することができます。 系列ラベリングとは<送り>品詞タグ付けに代表されるような問題です。
  40. RNNの構造を図説します。 リカレントNNは中間層の値を<送り>次のステップでの入力にします。
  41. 次の入力が来たら、こうなって、こうなります。 <黙ってアニメーションを送る> <アニメーション後>こうすることで、中間層にこれまで入力された情報を保持することができ、過去の入力を加味した解析ができるようになります。<送り>
  42. 次に学習について見ていきます。 このままでは重みの更新をどうすればいいのかわかりにくいので、これを90度回転させます。<送り> 一応前のステップでの入出力も書いておきます。<送り> 次の状態をその横に<送り>
  43. またその次の状態をその横に書きます。以降では結合を全部書くのはしんどいので、1本の矢印で表すことにします。<アニメ送り> こうすると、RNNは順伝播型のNNとして記述できます。 ということで、誤差逆伝播法を適用できるようになりました。 つまり、RNNの学習では、一定ステップごとに区切って、それをこのように展開し、誤差逆伝播により重みを更新します。 ただし、区切るステップが大きくなりすぎると、それだけ中間層が多くなり、誤差が入力層付近にまで反映されず学習ができなくなる勾配消失問題にぶつかります。RNNが保持できる情報はせいぜい前10単語までです。もっと前の単語も加味したい場合は、RNNを進化させたLSTMというNNを使います。
  44. RNNで言語モデルを学習すると、次のような利点があります。 一つには、n-gramのnを決定しなくてよい。言語モデルの代表格として、n-gramがありますが、bi-gramにするのか、トライgramにするのか、もっと多い5gramにするのかは、恣意的に決定する必要があります。これを決定しなくてよくなるというのは利点です。 二つには、単語を汎化したモデルを作れる、というのがあります。<送り>[大阪]が入力されたときに[行く]がくると予測するのと、[京都]が入力されたときに[行く]を予測するのが、従来は独立に計算されていました。なので、大阪から, 行く、京都から, 行く、を予測できても、<送り>愛媛の場合は予測できない、というようなことが起こっていました。RNNを使うと<送り>[大阪]も[京都]も[愛媛]も、地名であると考えることができるようになるため、<送り>[行く]を予測しやすくなります。このように、[大阪], [京都]といった単語を、[地名]という括りに汎化することができるようになります。 以上でRNNの説明は終わります。