SlideShare a Scribd company logo
1 of 24
Download to read offline
なんちゃって文豪が詠む
万葉和歌
なんちゃって文豪
白川、入江、瀧井(発表順)
発表内容
1. 講義の復習をやりました。
2. 文章生成へのとりくみ。
3. 文章生成を試みました。
4. 生成する文書(万葉和歌)をお見せします。
5. 感想
1. 講義の復習をやりました。
実際にやった復習
・初級編とAutoencoderの復習
・CNNとRNNの復習
これらの復習の終わりに文章の生成というものがありました。
復習の集大成として何か文章を生成しようということになりました。
2. 文章生成へのとりくみ
習った文章生成は、漢字があると厳しい。
⇒
ひらがなばかりものが良い。
⇒
百人一首はどうか?
⇒
百人一首ではサンプルが少ない。
固定長の文の生成なら全結合でできてしまうので、RNNを使うなら不定長が良いとアド
バイスをいただいたこともあります。
2. 文章生成へのとりくみ
万葉集ではどうか?
→
ネットで調べてみると…
[歌番号]01/0001
「こもよ みこもち ふくしもよ みぶくしもち このをかに なつますこ いへきかな のらさね そらみつ やまとのくにはおしなべて われこそをれ しき
なべて われこそませ われこそば のらめ いへをもなをも」
[歌番号]01/0003
「やすみしし わがおほきみのあしたには とりなでたまひゆふへには いよりたたしし みとらしの あづさのゆみのなかはずの おとすなり あさ
がりに いまたたすらしゆふがりに いまたたすらしみとらしの あづさのゆみのなかはずの おとすなり」
[歌番号]01/0004
「たまきはる うちのおほのにうまなめて あさふますらむそのくさふかの」
2. 文章生成へのとりくみ
・ひらがなの素材!
・いろんな長さのうたがあって不定長!!
・たくさんサンプルがある!!!
∴
万葉集をサンプルにしよう!
3. 文章生成を試みました
万葉集の和歌のサンプルと分類
● 57577
○ 『むつきたち はるのきたらば かくしこそ うめををきつつ たのしきをへめ』
○ 『あらたしき としのはじめの はつはるの けふふるゆきの いやしけよごと』
● 57577(字足らず・字余り)
○ 『あきののの みくさかりふき やどれりし うぢのみやこの かりいほしおもほゆ』
○ 『むらさきの いとをぞわがよる あしひきの やまたちばなを ぬかむとおもひて』
○ 『おしてる なにはほりえの あしへには かりねたるかも しものふらくに』
● その他
○ 『みぬさとり みわのはふりが いはふすぎはら たきぎこり ほとほとしくに てをのとらえぬ』
○ 『おしてる なにはをすぎて うちなびく くさかのやまを ゆふぐれに わがこえくれば やまもせに さけるあしびの あしから
ぬ きみをいつしか ゆきてはやみむ』
○ 『やまとには むらやまあれど とりよろふ あめのかぐやま のぼりたち くにみをすれば くにはらは けぶりたちたつ うな
はらは かまめたちたつ うましくにぞ あきづしま やまとのくには』
○ 『こもよ みこもち ふくしもよ みぶくしもち このをかに なつますこ いへきかな のらさね そらみつ やまとのくには おしな
べて われこそをれ しきなべて われこそませ われこそば のらめ いへをもなをも』
3. 文章生成を試みました
万葉集の和歌の特徴
● 大半は57577の形式(パターン)で詠まれている
○ 字余り、字足らずも多い
● 577577や、もっと長い和歌もある
○ 最大で1035文字の和歌もあった
 ⇒学習用データ
● 仮名、57577などの区切り文字、末尾文字で全71種をID化
○ オバマ氏のスピーチの学習を参考
○ 和歌の終了も学習すると期待されるので生成される長さも自動的に決定される
3. 文章生成を試みました
57577のパターンの学習データ化(オバマ氏のスピーチと大きく異なる点)
● 区切り文字を入れることでパターンを学習できるか?
● 全結合Autoencoderは学習できそう
○ 先頭40文字分の学習データを試すと読み込みエラー
○ 先頭37文字分の学習データでは、パターンは学習できたように見える
(57577+区切り文字×4+終端+字余り1=37文字)
3. 文章生成を試みました
全結合のAutoencoderで学習した結果
3. 文章生成を試みました
全結合のAutoencoderで学習した結果(偶数行目が生成結果、太字が正答 )
3. 文章生成を試みました
57577のパターンの学習データ化(オバマ氏のスピーチと大きく異なる点)
● 全結合Autoencoderでは37文字までの和歌しか生成できない
⇒RNNを使いたい
● RNNの場合、学習対象のループの回数を長くすればある程度学習できそう
○ 問題点
■ 『くもがくり かりなくときは あきやまの』(19文字)は、『くもがくり かりなくときは あきやまの も
みち~』なのか、『~つきも くもがくり かりなくときは あきやまのくに』なのか、区別できない
■ 生成時に最初に与える文字数に影響するためあまり長くしたくない
○ ⇒インデックスとセットで学習してみてはどうか
3. 文章生成を試みました
インデックスつきデータ インデックスなしデータ
3. 文章生成を試みました モデル及び学習条件は下記の
通りです。
<固定>
 モデル:LSTM
 中間層の次元:100
 OneHot:有
 Dropout:P=0.5
 学習データ件数:5万件
 検証データ件数:1万件
 Max Epoch:100
 Batch Size:32
 CPU
<試行錯誤ポイント>
 入力文字数:5 or 7 or 13
 インデックス:無 or 有
3. 文章生成を試みました
モデル①
Input:Size=5
OneHot:Shape=89
インデックス:無
 
3. 文章生成を試みました
モデル①
学習時間:20分程
 
3. 文章生成を試みました
モデル①
 
3. 文章生成を試みました
モデル④
Input:Size=5
OneHot1:Shape=89
OneHot2:Shape=40
※MinimumScalar
インデックス:有
 
3. 文章生成を試みました
モデル④
学習時間:27分程
 
3. 文章生成を試みました
モデル④
 
4. 生成する文書(万葉和歌)をお見せします。
松

島

や

秋

の

宇

良

野

狩

り
の
浦

の

宮

も
見

え

つ

つ

も

浅

か

り

ま

し

も

5. 感想
・PythonやTensorFlowを使ってドヤらなくても機械学習ができるところが良いと思いまし
た。一方で、詳細なことができる余地があるのも良いと思いました。ただ、今回の勉強会
では深い所までやれきれず、更に復習が必要と感じました(白川)。
・LayerをD&Dして繋ぐだけでモデルが出来上がるUIですが、コンポーネントの選択やハ
イパーパラメータの調整はやはり慣れや試行錯誤が必要で、期待したような動作をする
モデルができるまで苦労しました。試行錯誤はNNCのサポートもありやりやすかったで
す(入江)。
・NNCは、Pythonでのコーディングに比べてモデル構築の試行錯誤がしやすく、スピー
ディに開発を進めることができると実感しました。ただし、細部をこだわろうとすると、ハイ
パーパラメータや各Layerの知識が必要になるので、難しいと感じました(瀧井)。
ご清聴ありがとうございました
3. 文章生成を試みました
全結合のAutoencoderで学習した結果
※偶数行目(背景色あり)が生成結果、正答を太字

More Related Content

More from aitc_jp

ITフォーラム2024 AITCセッション(2)
ITフォーラム2024 AITCセッション(2)ITフォーラム2024 AITCセッション(2)
ITフォーラム2024 AITCセッション(2)aitc_jp
 
ITフォーラム2024 AITCセッション
ITフォーラム2024  AITCセッションITフォーラム2024  AITCセッション
ITフォーラム2024 AITCセッションaitc_jp
 
2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定aitc_jp
 
TForum2023_AITC_2.pdf
TForum2023_AITC_2.pdfTForum2023_AITC_2.pdf
TForum2023_AITC_2.pdfaitc_jp
 
2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定aitc_jp
 
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web35)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3aitc_jp
 
4)技術視点でウェルビーイングを考える
4)技術視点でウェルビーイングを考える4)技術視点でウェルビーイングを考える
4)技術視点でウェルビーイングを考えるaitc_jp
 
3-2)『空気を読む家』とメタバース駆動開発構想
3-2)『空気を読む家』とメタバース駆動開発構想3-2)『空気を読む家』とメタバース駆動開発構想
3-2)『空気を読む家』とメタバース駆動開発構想aitc_jp
 
3-1)『空気を読む家』とメタバース駆動開発構想 空間OS モノと社会をつなげる
3-1)『空気を読む家』とメタバース駆動開発構想   空間OS モノと社会をつなげる3-1)『空気を読む家』とメタバース駆動開発構想   空間OS モノと社会をつなげる
3-1)『空気を読む家』とメタバース駆動開発構想 空間OS モノと社会をつなげるaitc_jp
 
1)空気を読む家』のこれまでの取り組み
1)空気を読む家』のこれまでの取り組み1)空気を読む家』のこれまでの取り組み
1)空気を読む家』のこれまでの取り組みaitc_jp
 
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」aitc_jp
 
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」aitc_jp
 
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」aitc_jp
 
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」2022/03/23 AITCオープンラボ第1回「メタ―バース入門」
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)ITフォーラム2022 先端IT活用推進コミュニティ(3-1)
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)ITフォーラム2022 先端IT活用推進コミュニティ(5-2)
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)ITフォーラム2022 先端IT活用推進コミュニティ(5-1)
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)ITフォーラム2022 先端IT活用推進コミュニティ(4-2)
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)ITフォーラム2022 先端IT活用推進コミュニティ(4-1)
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)aitc_jp
 
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)ITフォーラム2022 先端IT活用推進コミュニティ(3-2)
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)aitc_jp
 

More from aitc_jp (20)

ITフォーラム2024 AITCセッション(2)
ITフォーラム2024 AITCセッション(2)ITフォーラム2024 AITCセッション(2)
ITフォーラム2024 AITCセッション(2)
 
ITフォーラム2024 AITCセッション
ITフォーラム2024  AITCセッションITフォーラム2024  AITCセッション
ITフォーラム2024 AITCセッション
 
2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定
 
TForum2023_AITC_2.pdf
TForum2023_AITC_2.pdfTForum2023_AITC_2.pdf
TForum2023_AITC_2.pdf
 
2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定2)AIを活用したウェルビーイングを測定
2)AIを活用したウェルビーイングを測定
 
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web35)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3
5)パネルディスカッション:『空気を読む家』×ウェルビーイング/メタバース・Web3
 
4)技術視点でウェルビーイングを考える
4)技術視点でウェルビーイングを考える4)技術視点でウェルビーイングを考える
4)技術視点でウェルビーイングを考える
 
3-2)『空気を読む家』とメタバース駆動開発構想
3-2)『空気を読む家』とメタバース駆動開発構想3-2)『空気を読む家』とメタバース駆動開発構想
3-2)『空気を読む家』とメタバース駆動開発構想
 
3-1)『空気を読む家』とメタバース駆動開発構想 空間OS モノと社会をつなげる
3-1)『空気を読む家』とメタバース駆動開発構想   空間OS モノと社会をつなげる3-1)『空気を読む家』とメタバース駆動開発構想   空間OS モノと社会をつなげる
3-1)『空気を読む家』とメタバース駆動開発構想 空間OS モノと社会をつなげる
 
1)空気を読む家』のこれまでの取り組み
1)空気を読む家』のこれまでの取り組み1)空気を読む家』のこれまでの取り組み
1)空気を読む家』のこれまでの取り組み
 
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション2 「空間OSと空気を読む家の実証」
 
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」
2022/07/22 AITC 第4回オープンラボ「メタバース応用編~空間OSのこれまでとこれから~」セッション1 「空間OSとメタバース」
 
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」
2022/04/20 AITCオープンラボ第2回「田園都市国家構想とデジタル政策について」
 
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」2022/03/23 AITCオープンラボ第1回「メタ―バース入門」
2022/03/23 AITCオープンラボ第1回「メタ―バース入門」
 
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)ITフォーラム2022 先端IT活用推進コミュニティ(3-1)
ITフォーラム2022 先端IT活用推進コミュニティ(3-1)
 
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)ITフォーラム2022 先端IT活用推進コミュニティ(5-2)
ITフォーラム2022 先端IT活用推進コミュニティ(5-2)
 
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)ITフォーラム2022 先端IT活用推進コミュニティ(5-1)
ITフォーラム2022 先端IT活用推進コミュニティ(5-1)
 
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)ITフォーラム2022 先端IT活用推進コミュニティ(4-2)
ITフォーラム2022 先端IT活用推進コミュニティ(4-2)
 
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)ITフォーラム2022 先端IT活用推進コミュニティ(4-1)
ITフォーラム2022 先端IT活用推進コミュニティ(4-1)
 
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)ITフォーラム2022 先端IT活用推進コミュニティ(3-2)
ITフォーラム2022 先端IT活用推進コミュニティ(3-2)
 

Recently uploaded

あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]
あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]
あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]Taka Narita
 
動的 & 非同期コンポーネント / Dynamic & Async Components
動的 & 非同期コンポーネント / Dynamic & Async Components動的 & 非同期コンポーネント / Dynamic & Async Components
動的 & 非同期コンポーネント / Dynamic & Async Componentsokitamasashi
 
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーン
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーンWindowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーン
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーンivanwang53
 
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docx
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docxWindows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docx
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docxivanwang53
 
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元ivanwang53
 
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法ivanwang53
 

Recently uploaded (6)

あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]
あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]
あらゆる通信環境で切れない「ネットモーション」のモバイルアクセス [NetMotion]
 
動的 & 非同期コンポーネント / Dynamic & Async Components
動的 & 非同期コンポーネント / Dynamic & Async Components動的 & 非同期コンポーネント / Dynamic & Async Components
動的 & 非同期コンポーネント / Dynamic & Async Components
 
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーン
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーンWindowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーン
Windowsアップデート後の黒い画面を修正する方法|データ復元|ブラックスクリーン
 
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docx
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docxWindows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docx
Windows Defenderのフル・クイック・カスタム・オフラインスキャンを実行する方法.docx
 
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元
Windows 10、Windows 11の付箋を簡単に復元する6つの方法|データ復元
 
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法
ダウンロードがダウンロード(Downloads)フォルダに表示されない」問題の対処法
 

2020年1月25日 AITC AT勉強会 成果発表会(3) なんちゃって文豪