6. 6
実験: 2
p O:
: S =
p
: =
単純に規模を拡大するだけでは汎化に関しての問題を解決できない
小さなデータセットでの性能を評価
(大きいデータセットでも実験は行う)
7. 7
実験
pWord level language modelling
n Penn Tree Bank (PTB)
n Wikitext-2
pCharacter level language modelling
n Enwiki-8 (Hutter Prize dataset)
n Multilingual Wikipedia Corpus (MWC)
Ø 英語
Ø フィンランド語
8. 8
実験
pWord level language modelling
n Penn Tree Bank (PTB)
Ø 約1,000,000件のデータ
Ø 10,000語彙
n Wikitext-2
Ø PTBの約2倍
Ø 語彙もPTBより多い
ともに「小さい」データセット
10. 10
実験
pCharacter level language modelling
n Enwiki-8 (Hutter Prize dataset)
n 90,000,000文字で学習,10,000,000文字で評価
n Multilingual Wikipedia Corpus (MWC)
n (詳細の記述はないが)Large settingの例