SlideShare a Scribd company logo
自然言語処理における近年の動向
2017/2/19
垣内 秀介
センター試験模試、
AIは文章を読むのが苦手
■問題
10人が3個ずつりんごをもらった。
りんごは全部でいくつ?
⇒「10、3、ずつ」ってことは、たぶん「10×3=30」が答えだろう
■問題
1日10台の自動車を生産する工場が3日間操業した。
自動車は何台?
⇒「10、3」ってことは、+-×÷どれ?
参考、引用:http://bylines.news.yahoo.co.jp/yuasamakoto/20161114-00064079/
2016年6月
人工知能「DeepText」の威力
10億語を数分で学習できる自然言語処理ツールらしい
■Word2Vec
「イチロー」={怠惰さ:0.01、スポーツ:0.99、土地:0.04、・・・}
のように言葉がベクトルをもつという考え方
これにより、
・「王様」- 「男」+ 「女」= 「女王」
・「パリ」- 「フランス」+ 「日本」= 「東京」
のようなことができるようになる可能性がある。
2016年6月
参考、引用:http://techwave.jp/archives/deeptext-21812.html
参考、引用:https://deepage.net/bigdata/machine_learning/2016/08/28/fast_text_facebook.html
Google、
文章要約の人工知能の開発動向
2016年8月
「アリスとボブは、列車に乗って動物園に行った。
彼らは子供のキリン、ライオン、色とりどりの熱帯鳥の群れを見た」
■逆文書頻度(IDF)
重要に見える部分を抽出し、要約する方式
「アリスとボブは動物園に行く。鳥の群れを見た」
⇒文法的に奇妙な感じがする。
■抽象的な要約(abstractive summarization)
内容をある程度書き換えさせる方式
「アリスとボブは動物園に行き、獣や鳥を見た」
⇒人間は似たような分量の単語により多くの情報を保存する。
原文にない単語を用いた抽象的要約が有効。
参考、引用:https://roboteer-tokyo.com/archives/5778
文章の中から意味ある語句を抽出
「iKnow Japanese」
2016年12月
Congressional hearing attacks EpiPen price hikes
■トップダウン式
①すべての単語を切り分ける。
Congressional / hearing / attacks / EpiPen / price / hikes
②ひとつづつ結合して最長のものを、意味ある語句として抽出
Congressional ⇒意味あり
Congressional hearin ⇒意味あり⇒これに決定
Congressional hearing attacks ⇒意味なし
■ボトムアップ式
①ひとつの単語では意味をなさないものを文法から抽出
今回の場合は、「 attacks 」がそれにあたる。
②その両側が意味あるものとして抽出
参考、引用:http://it.impressbm.co.jp/articles/-/14110
で、どんなふうに、
マネタイズされているのか?
AIが記事検索からの
記事自動作成
Articoolo社による記事自動作成サービスが開始。
①キーワードを指定
②AIがWEB上からキーワードに基づく情報を集める
③それらをAIがまとめて記事完成
参考、引用:https://bita.jp/dml/articoolo
2016年8月
この動画がわかりやすい。
https://www.youtube.com/watch?time_continue=35&v=2HNrlUujfEk
で、私がやりたいことは、
こんなこと
名前 時間 食べ物1 食べ物2 食べ物3
田中 朝 パン 牛乳 -
山下 昼 かつ丼 - -
田中さんは朝ごはんに、パンと牛乳を食べました。
山下さんは昼ごはんにかつ丼を食べました。
と思ったら、
すでにやられていました。
つまり、頑張れば、
実現可能という事なのです。
AIスタートアップ「Connectifier」
WEBサイトから人材DB作成?
Connectifier は、2012年に元グーグル社員が創業したスタートアップ企業
人工知能をベースにした検索技術により、
・SNSや個人情報が公開されている何百万ものサイトをクロールしプロフィール作成
・情報の鮮度を判断し、現在のプロフィールの精度を高める
検索インデックスには4億以上の求職者のプロフィールが含まれる
「人工知能を用いて採用を効率化する」と企業情報に明記されてはいるが、
どのように人工知能を利用しているのかという方法論については公開されていない。
参考、引用:http://thebridge.jp/2016/02/linkedin-acquired-connectifier-pickupnews
2016年2月

More Related Content

Viewers also liked

TranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたちTranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたち
Masakazu Matsushita
 
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
Haruki Yamashita
 
DeNAのAIとは #denatechcon
DeNAのAIとは #denatechconDeNAのAIとは #denatechcon
DeNAのAIとは #denatechcon
DeNA
 
プログラマのための線形代数再入門
プログラマのための線形代数再入門プログラマのための線形代数再入門
プログラマのための線形代数再入門
Taketo Sano
 
ヘルスケア分野の改革を加速する人工知能 AI
ヘルスケア分野の改革を加速する人工知能 AIヘルスケア分野の改革を加速する人工知能 AI
ヘルスケア分野の改革を加速する人工知能 AI
NVIDIA Japan
 
SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編
itno
 

Viewers also liked (7)

Come si scrive articolo
Come si scrive articoloCome si scrive articolo
Come si scrive articolo
 
TranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたちTranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたち
 
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
 
DeNAのAIとは #denatechcon
DeNAのAIとは #denatechconDeNAのAIとは #denatechcon
DeNAのAIとは #denatechcon
 
プログラマのための線形代数再入門
プログラマのための線形代数再入門プログラマのための線形代数再入門
プログラマのための線形代数再入門
 
ヘルスケア分野の改革を加速する人工知能 AI
ヘルスケア分野の改革を加速する人工知能 AIヘルスケア分野の改革を加速する人工知能 AI
ヘルスケア分野の改革を加速する人工知能 AI
 
SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編
 

More from shusuke kakiuchi

垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
shusuke kakiuchi
 
垣内のひとりプレゼン★RPAとは?
垣内のひとりプレゼン★RPAとは?垣内のひとりプレゼン★RPAとは?
垣内のひとりプレゼン★RPAとは?
shusuke kakiuchi
 
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
shusuke kakiuchi
 
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
shusuke kakiuchi
 
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
shusuke kakiuchi
 
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
shusuke kakiuchi
 

More from shusuke kakiuchi (6)

垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
垣内のひとりプレゼン★ブロックチェーンをちゃんと理解してみる
 
垣内のひとりプレゼン★RPAとは?
垣内のひとりプレゼン★RPAとは?垣内のひとりプレゼン★RPAとは?
垣内のひとりプレゼン★RPAとは?
 
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
垣内のひとりプレゼン★はじめてのAI編その3(AIでいう学習ってなんだ?ディープラーニングって何?)
 
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
垣内のひとりプレゼン★はじめてのAI編その2(画像認識、音声認識、文章認識のヒミツ)
 
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
垣内のひとりプレゼン★はじめてのAI編その1(AI、機械学習、ディープラーニングって結局なに?)
 
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
垣内のひとりプレゼン(酔っぱらーモード)★AI編その1
 

Recently uploaded

本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
Masatsugu Matsushita
 
「VRC海のおはなし会_深海探査とロボットのお話」発表資料
「VRC海のおはなし会_深海探査とロボットのお話」発表資料「VRC海のおはなし会_深海探査とロボットのお話」発表資料
「VRC海のおはなし会_深海探査とロボットのお話」発表資料
Yuuitirou528 default
 
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
miyp
 
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
Toru Miyahara
 
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
Toru Miyahara
 
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHubCompute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
K Kinzal
 
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Toru Miyahara
 

Recently uploaded (7)

本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
 
「VRC海のおはなし会_深海探査とロボットのお話」発表資料
「VRC海のおはなし会_深海探査とロボットのお話」発表資料「VRC海のおはなし会_深海探査とロボットのお話」発表資料
「VRC海のおはなし会_深海探査とロボットのお話」発表資料
 
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
 
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
 
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
 
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHubCompute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
 
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
 

Aiは文章読むのが苦手らしい