9. 人間が使うような、一般的な言語をコンピュータに処理させる技術の総称
自然言語理解
◦ 自然言語処理の一分野であり、言語の意味を理解させることに主眼をおいた試み
◦ 対話、翻訳、要約など多くのタスクが含まれる
基本的にはテキスト情報を扱う
◦ ある意味を持つトークン(基本的には単語)の系列
9
government of the people, by the people, for the people
15. 機械学習(教師あり)
15
“cat”
( )
{ }
N
i
yi
i ,...,
1
,
, =
x
x y
未知のデータ(学習データに含まれない)を正しく認識させることが目標 (=汎化)
大量のラベル付き訓練データ
(x:画像,y:ラベル)
…
cat dog bird
( )
x
f
21. Sequence to sequence model [Sutskever+, NIPS’14]
◦ 二つのRNN (LSTM) を接続し、ソース言語の単語列をターゲット言語の単語列へ
変換するエンドツーエンドなネットワークを構成
◦ 翻訳先言語の言語モデル(デコーダ)を入力文の特徴ベクトルで条件づける
◦ 自然言語処理における深層学習の最初のブレークスルーの一つ
21
Sutskever et al., “Sequence to Sequence Learning with Neural Networks”, In Proc. of NIPS, 2014.
私 が 行く I
【BOS】 go
go
I 【EOS】
入力を集積するRNN(エンコーダ) 出力用RNN(デコーダ)
単語埋め込み層
RNNの隠れ層
入力文の
特徴ベクトル
条件付け
28. 28
Dosovitskiy et al., An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, ICLR 2021.
n x n 分割した画像の各領域(=パッチ)
□: 畳込みニューラルネットワーク
〇: Transformer
大きさがパラメータ数に対応
120万
1400万 3億
画像パッチを”単語”と見なし、Transformerを適用
◦ 画像認識分野でも主流になりつつある
44. Google (DeepMind) の囲碁AIが世界トップ棋士に勝利 (2016年3月)
◦ 初期は人間の棋士のデータから教師あり学習し、自己対局に基づく強化学習へ移行
◦ 次世代のAlpha Zeroはルールのみ与えられゼロから学習
44
http://japan.cnet.com/news/service/35079593/
D. Silver et al., “Mastering the Game of Go with Deep Neural Networks and
Tree Search,” Nature, Vol. 529, No. 7587, pp.484-489, 2016.
50. データの漏洩
◦ LLMは学習データを丸覚えしている場合があり、それがそのまま出力されることがある
◦ 悪意のある人が情報を狙うリスクはもちろん、知らないうちに権利侵害する可能性がある
50
Carlini et al., Extracting Training Data from Large Language Models, USENIX 2021.
Web上のテキスト断片でプロンプティング
して、個人情報を取り出せた例
参考:画像生成AIの例
Carlini et al., Extracting Training Data from Diffusion Models, 2023.
https://arxiv.org/pdf/2012.07805.pdf https://arxiv.org/pdf/2301.13188.pdf