41. テクノロジーと経済、社会、そして人
ゆめさが大学講演資料
A B C D
03
04
05
A B C D
02
03
04
ニューラルネットワークとRNN
41
A B C D
01
02
03
A B C D
01
02
03
一般的な
NN
A
B
D
C ?
RNN
再帰的
ニューラル
ネットワーク
A
B
D
C
!A
B
D
C
時系列属性を持つ
データが扱えるように!
(各種指標、音声、文章、動画…)
※ 発展形として…
・ 入力層の手前に画像処理と同じ畳み込み層を追加したもの
・ 前時点の隠れ層の入力を加減するもの(LSTM、GRUなど)
43. テクノロジーと経済、社会、そして人
ゆめさが大学講演資料
機械翻訳やチャットボットの実際
43
普通の人
が考える
機械翻訳
今、実際に
使われて
いる仕組み
This is a pen.
これは です。ペン
① 単語を訳す
② 並べ替える
山のようなデータベース、複雑なアルゴリズム…
☞どれだけ人と時間があってもできるはずない!
単語
に
分割
分散
表現
RNN RNN
分散
表現
単語
に
直す
① 器を作る
② 学習させる
(データを「食わせる」)
This is a pen.
これはペンです。
I wrote with a pen.
私はペンで書いた。
なるほど
するとペンって
もしかして…
N-gram
Wordpiece
など
Word2Vec
Doc2Vecなど
Seq2Seq
(Sequence to Sequence)
AIと少し似たものとして、RPAというのもあって…RPA。Robotics Process Automeationの略だが、この「プロセス」、何だろう?
要はソフトウエアロボットによる事務作業の自動化。例えば注文伝票を受けてそれをシステムに入力し、整理・計算して伝票等を発行する、これまではこういったものを人がやっていた。ただ、RPAは一度、この作業手順を教え込むと、以降は人手を介することなく自動でやってくれる。
このことの何がすごいかというと、まずは「早い」こと。おそらく人間よりも数千倍、数万倍といった単位で、実際、ある自治体(さいたま市)で保育所の入所受け付けとマッチングに使ったところ、従来、1500時間かかっていたのが数秒で済むようになったという。それから、早いだけでなく正確。もちろん、最初に間違った手順を教えてしまうと以降、全て間違えてしまうが、それがない限りは基本、ニューマンエラーは起こらない。さらには、人間と違って、必要なら24時間365日、不満も言わずに働いてくれる。
ちなみに県内企業では、佐賀電算センターが最近、注力している分野。
AIと並んで皆さん、お聞きになる言葉としてIoTもあるのでは。Internet of thaingsの略。日本語ではモノのインターネット化と言われるが、これ、訳がすごく難しい…日本語のあいまいさの利点として「化」をつけると何かそれっぽくなるというか。
いわんとするのは、いろんなものをインターネットに繋いだら、いろんな情報が一元的に吸い上げあられるし、離れたところから操作できるし、すごく便利じゃない、という考え方。ちなみに、なのでIoTのoは小文字。これ、若い人とかも間違えることあるので「なぜ小文字?」というのは覚えておいていいと思う。
シェアエコにも関連した話題として…最近なんとかaaSという言葉がある。aaSはas a Service、つまり、「サービスとして」という意味。
もともとIT業界で使われていた用語で、ソフトやOS、データベース、ハードウェアなどを、以前のように「買って保有する」のではなく、「必要な時だけ借りて使う」といったサービス。MSのOffice365やイラストレーター、フォトショップを出しているAdobeも最近、やっているが、「持たざる経営」だったり、「ストックのフロー化」だったり、「コストの平準化」といった経営トレンドに沿ったもの。
これが最近は、転じていろんな場面で使われるようになった。最近、よく聞くのがMobility as a Serviceで、これは先ほどのカーシェアやUberなどのライドシェア、あるいは今後は自動運転や自動交通システムなども組み合わせ、「移動」をサービスとして提供しようという考え方。
さらに今後、こういうのが例えばロボットや工場、オフィスなどにも広がっていくかもしれない。なので逆に、身近なものを「○aaSできないか?」と視点を変えることで、新たなビジネスにつながる可能性もある。
これらいろんなテクノロジーが相まって、まさにSoftware eats the Worldなんだが、○○Techという言葉もいろいろ、登場してきた。
最近よく聞くのはFintech、これは金融。先ほどの仮想通貨や電子決済、AIによる与信審査など。あるいはAdtechという言葉もあって、これは広告。リスティング広告などは言葉は知らなくても皆さん、日々、芽にしているはず。AgriTechは農業、で、佐賀県内でも例えばオプティムが相当、蓄積してきている。EdTechは教育、MedTechは医療、HRTechは人材といった具合。
さてでは、先ほどの二つのアプローチのうち、辞書はわかりやすいと思うが、脳の神経回路、つまりディープラーニングはわかりづらいかもしれない。さっきの仮想通貨同様、やや技術的になるが解説してみたい。
例えばネコの画像があったとする。脳の神経回路の一番表層には「それはネコかどうか」を判断する神経細胞があって、Yes or Noで判定する。ただ、そこに至るには、実はもっと多層の網の目のような神経細胞のネットワークがあって、低次の情報から高次へと伝播する判断が、最終的に先ほどの答えにたどり着く。
こいつをソフトウエアのアルゴリズムとして作って、この一つ一つの神経細胞が「Yes or Noの境目をどこに置くか(x)」と「次の細胞にどの程度の重みで伝えるか(w)」を大量データを使って繰り返し演算し、収束させていくという考え方自体は、もう数十年前からあった。私もいくつかのデータで試したことがあるが、ほとんど規則性のないデータでもほぼ十中八九、「当てる」ことができる数理モデルが得られる。数学的に言うと「非線形関数の再現性が高い、柔軟なアルゴリズム」ということだ。
ただ、厄介なのは、技術的な言葉で「過学習」というが、こういうやり方の場合、だいたい、「学習用データは精密に再現するが、ホントに判別や予測したい未知のデータでは使えない」という結果に陥りがち。なのでずいぶん長い間、実用には使えなかった。
ところが、これはほんのこの数年のことだが、あるエンジニアがこの神経回路網の手前に、画像の圧縮技術でいう「畳み込み」を行えば、未知のデータでも精度高く判別できるモデルが得られることを発見した。画像に適当なフィルターをかけてデータを加工・縮約するというプロセスを何回か、繰り返す、というもの。ちなみに、ここにあるフィルタは9マス中、真ん中の1段目と2段目が1で他は0だが、これを画像に適用するとどういうものが得られるかわかるだろうか?通常、こういうのを使うと輪郭抽出ができたりする。
今の画像解析や音声認識、あるいは機械翻訳には、正確にはテーマによってバリエーションがあるものの、こういった技術がベースになっている。
先にSoftware eats the Worldという言葉を紹介した。じゃあ、ソフトウエアが食べるのは一体、何なのか?
ソフトウエアとは情報処理のプロセス。その中で、AIやIoTで従来、人が担ってきた知的活動も代替し得るようになりつつある。これらは実は知識社会における競争力の源泉。それがソフトウエアに食べられる、というと、じゃあ、人には何が残るんだろうか?