Recommended
PPTX
PPTX
PDF
PDF
PDF
PDF
人工知能学会合同研究会2017-汎用人工知能研究会(SIG-AGI)招待講演
PDF
PDF
PPTX
PPTX
PPT
Brain-Inspired Robotics and Neural Dynamics: Lecture 02 (2015)
PPT
Brain-Inspired Robotics and Neural Dynamics: Lecture 01 (2015)
PDF
PPTX
PPTX
PPTX
PDF
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
PDF
出版記念イベント「なぜ人工知能は人と会話ができるか?」講演資料
PDF
PDF
人工知能に何ができないか? ー ゲームと人工知能の視点から -
PDF
2021.1.28 understanding brain
PDF
PDF
立命館大学 AMLコロキウム 2011.10.20
PDF
PPTX
PDF
Toward Research that Matters
PDF
PDF
Neuroscience inspired artificial intelligence
PPTX
Convolutionl Neural Network 入門
PPTX
ContainerとName Space Isolation
More Related Content
PPTX
PPTX
PDF
PDF
PDF
PDF
人工知能学会合同研究会2017-汎用人工知能研究会(SIG-AGI)招待講演
PDF
PDF
Similar to 人間の思考、機械の思考
PPTX
PPTX
PPT
Brain-Inspired Robotics and Neural Dynamics: Lecture 02 (2015)
PPT
Brain-Inspired Robotics and Neural Dynamics: Lecture 01 (2015)
PDF
PPTX
PPTX
PPTX
PDF
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
PDF
出版記念イベント「なぜ人工知能は人と会話ができるか?」講演資料
PDF
PDF
人工知能に何ができないか? ー ゲームと人工知能の視点から -
PDF
2021.1.28 understanding brain
PDF
PDF
立命館大学 AMLコロキウム 2011.10.20
PDF
PPTX
PDF
Toward Research that Matters
PDF
PDF
Neuroscience inspired artificial intelligence
More from maruyama097
PPTX
Convolutionl Neural Network 入門
PPTX
ContainerとName Space Isolation
PPTX
PPTX
PPTX
Neural Network + Tensorflow 入門講座
PDF
機械学習技術の現在+TensolFlow White Paper
PPTX
PPTX
PDF
PPTX
PPTX
PPTX
Project Araと新しいものづくりのエコシステム
PPTX
PPTX
人間に出来ること --- 人間 vs 機械 Part I 進化と自然認識
PPTX
Cyber-Physical Systems とは何か?
PPTX
Project Araと新しいものづくりのエコシステム
PPTX
グローバル・ネットワークの成立とネットワーク・マーケット
PPTX
PPTX
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
PPTX
人間の思考、機械の思考 1. 2. It’s not who has the best algorithm that wins.
It’s who has the most data.
--- Andrew Ng
3. 4. はじめに
「機械は人間のように考えることは可能か?」という問題
を考えてみよう。そうした能力をもつと皆が認める機械は、
現状では存在しないので、こうした問いかけに、ただちに
肯定的に答えることは出来ない。
ただ、問題を、「機械は部分的には人間のような知的な振
る舞いを行うことは可能か?」に大幅にゆるめると、我々
は”Yes!”と答えることが出来る。
そこでは、現代のIT技術の進歩が大きな役割を果たして
いる。そうした「賢い機械」の出現が、近い未来のITの利
用シーンを大きく変えることは確実である。IT技術者が、
「人間の思考、機械の思考」に関心をもつ必要性は、ます
ます大きくなると思う。
5. はじめに
小論の前半では、「知能研究」への、いくつかのアプロー
チを紹介した。「人間の思考、機械の思考」の問題は、IT
技術・コンピュータサイエンスに閉じている訳ではない。
様々の領域から、多様なアプローチが行われている。
小論の後半では、ITの領域にフォーカスして、現代の大
規模分散システムと、それが検索と広告を通じてグローバ
ルに張り巡らしたネットワークが、「知識」を扱い始めようと
していることに注目した。いわば、「ネットの知性」とも言う
べきものが生まれ始めているのかもしれない。
動物(人間を含む)の知覚・運動能力について、機械でそ
れを実現することは、十分に可能だろう。人間の言語能力
の解明が、我々人間にとっても、機械にとっても、今後の
大きな課題となろう。
6. Agenda
「賢い」機械たちの登場
生物と人間と機械の進化
人間の脳へのアプローチ
ニューラル・ネットワークのアプローチ
言語能力へのアプローチ
大規模システムと検索の変化
機械とネットワークに「知識」を持たせる試み
7. 8. 11. 12. 13. 14. 15. 16. 22. 23. 24. 運転自動化の取り組み
ベンツ:
https://www.youtube.com/watch?v=u5NDv1cyjiA
Audi:
https://www.youtube.com/watch?v=YSfijL7pkyI
トヨタ:
https://www.youtube.com/watch?v=of9-zKSLBUA
日産:
https://www.youtube.com/watch?v=mYnIcTquLN
Y
ホンダ:
https://www.youtube.com/watch?v=UGlrq1atZM4
25. 26. 29. 32. 生物と機械との
問題解決のスタイルの違い
進化が作り上げた生物と人間が発明した機械と
では、問題解決のスタイルに大きな違いがある。
空を飛ぶという同じ目標に、生物の進化による飛
行能力の獲得と人間による飛行機の発明は、違
うアプローチをとった。
人間が、鳥の真似をして空を飛ぼうという試みは、
うまく行かなかった。飛行機という機械を発明して、
人間は初めて空を自由に飛べるようになった。
33. 34. 35. 生物の知能
人間だけが「知能」を持つ訳ではない。多くの生き物が、
感覚・知覚・記憶・認知の能力を持っている。
人間の思考能力もこれらの感覚・知覚・記憶・認知の能力
の土台の上に構築されている。
多くの生き物は、こうした感覚・知覚の能力を運動能力と
結び付けている。脳や神経は、「考える」より前に、まず、
そうした能力の担い手として進化してきた。そして、多くの
動物は、考えることを始める。
また、少なくない生き物が、コミュニケーション能力を持っ
ている。
37. 視覚の誕生と発展
生物の最も高度な知覚の器官は「眼」である。視
覚は、今から5億年以上前のカンブリア紀に大き
な進化を遂げたという。
捕食者として当時の生態系の頂点に立ったアノマ
カリスは立派な眼を持っていた。視覚に生物学的
な(視覚神経的な)共通の基礎があるのは当然の
ことだと思う。
機械学習の最も基本的なモデルは視覚だといっ
ていいと思う。
39. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. DNAシークエンサーの進歩
最初のヒトゲノムの解析には、10年と30億ドル
かかった。
2010年までには、ヒトゲノムの解析は、一ヶ月以
内で3万ドルで出来るようになった。
今では、ヒトゲノムの解析は、数日で4000ドル以
下で出来る。
DNAシーケンサーのコスト・パフォーマンスは、コ
ンピュータでのMooreの法則よりも速いスピード
で向上しているという。個人が、ゲノムを解析する
時代が始まろうとしている。
63. 脳研究のプロジェクト
Blue Brain Project
EU Human Brain Project
NIH Human Connectome Project
US BRAIN Initiative
64. Blue Brain Project
Henry Markram
“I wanted to model the brain because
we didn’t understand it.”
“The best way to figure out how
something works is to try to build it
from scratch.”
65. 66. 67. 68. 69. 70. 71. 72. EU Human Brain Project
ビジョン
人間の脳を理解することは、21世紀の科学が
直面している最も偉大な挑戦の一つである。
もしも、我々が、それに対して立ちあがること
が出来るならば、我々は、我々を人間にして
いるものが何であるかについて深い洞察を得
て、革命的なコンピュータ技術を構築し、脳の
異常に対して新しい治療法を開発出来るだろ
う。今日、初めて、現代のICT技術が、こうした
目標を到達可能なものにしている。
73. EU Human Brain Project
中心的な戦略目標
未来のニューロサイエンス
遺伝子から行動に至る、生物学的器官のすべてのレベルを
貫いて、健康な脳と病気の脳についてのデータと知識を統合
した、人間の脳の統一された複数レベルでの理解を達成する。
こうして、脳を理解する基本的な方法論として、シリコン上で
の実験を確立する。
未来のコンピューティング
脳の回路とコンピュータの原理に基づいて、新しいニューロコ
ンピュータとニューロロボットの技術を開発する。脳のシミュ
レーション、ロボットと自律的なシステムコントロール、その他
のデータを大量に利用するアプリケーションの為にスーパー
コンピュータの技術を開発する。
74. EU Human Brain Project
中心的な戦略目標
未来の医療
複数レベルの臨床データに基づいて、客観的で生物学的に
基礎付けられた、神経症と精神病のマップを開発する。この
マップを利用して、脳の病気の分類と診断を行い、これらの病
気のモデルを構成する。シリコン上での実験を利用して、脳の
病気の原因を理解し、新薬やその他の治療法を開発する。神
経症と精神病に対して、個人化された医療を確立する。
75. 76. 脳研究をめぐる「対立」の構図
認知科学vs 脳科学、トップダウンvs ボトムアップ
発端は、来年度のプロジェクトの予算配分で、認知科学的
なアプローチの予算が、ばっさりと切られたことにあるらし
い。それに反発した研究者のグループが、150名の連名
で、欧州委員会に公開質問状を提出した。
対立の根底にあるのは、脳研究でのアプローチの違い。
Henry Markramら主流派は、ニューロンとシナプスの数
学的モデルに基づいて脳全体のモデルをボトムアップに
作り上げようというアプローチ。一方、反対派は、脳研究
には、認知科学の知見に基づいたトップダウンのリバー
ス・エンジニア的なアプローチが必要だという。
「鳥の羽の全てをシミュレーションしたとしても、鳥が空を
飛べることを解明出来ないのと同じことだ」
77. 78. 80. 81. US BRAIN Initiative
研究目的
異なる脳細胞のタイプを同定し、それへの実験的
なアクセスを与えて、健康と疾患におけるそれぞ
れの役割を決定する。
シナプスから脳全体にいたるまでの異なる精度で、
脳の回路図を作り出す。
82. US BRAIN Initiative
研究目的
神経活動の大規模なモニタリングの改良された
方法を開発・適用して、脳機能の動的な描像を生
み出す。
神経回路の動的な働きを変更する精細な干渉
ツールによって、脳活動から行動へのリンクを付
ける。
83. US BRAIN Initiative
研究目的
新しい理論的なデータ解析ツールの開発を通じて、
精神過程の生物学的基礎の理解の為の概念的
な基礎理論を生み出す。
人間の脳を理解しその障害を扱う為の革新的な
技術を開発する。その為に、統合された脳研究の
ネットワークを作り出し、それをサポートする。
新しいテクノロジーと他の目的で生み出された概
念的なアプローチを統合して、健康と疾患におい
て、神経活動の動的なパターンが、どのようにし
て、認識・感情・知覚・行動に変換されるのかを発
見する。
84. US BRAIN Initiative
倫理規定
神経科学研究の倫理的含意を考慮すること。
NIHと納税者と、応用・臨床分野の基礎的な神経
科学者のコミュニティに対する説明責任を果たす
ことを保証するメカニズムを作り出すこと。
85. 86. 87. NN & Deep Learningの
Lecture Note
Geoffrey Hinton
“Neural Networks for Machine Learning”
http://www.cs.toronto.edu/~tijmen/csc321/
http://www.cs.toronto.edu/~hinton/csc2535/lectu
res.html
Andrew Ng
“Machine Learning”
https://class.coursera.org/ml-007/lecture
http://cs229.stanford.edu/materials.html
88. 89. 90. 92. 93. 95. 97. 98. 99. 100. 102. Andrew Ngらの新しい知覚研究と
Googleの協力
“Building High-level Features Using Large
Scale Unsupervised Learning”
Jeff Dean & Andrew Y. Ng et al
2012年7月
http://arxiv.org/pdf/1112.6209.pdf&embed
ded=true
103. 104. 105. 106. Face
no Face
これが、一千万個の画像
データから、16,000コア
のマシンが三日間かけて
抽出した「人間の顔」のイ
メージらしい。子供の絵に
似ているのが面白い。
107. 108. Now You Can Build Google’s $1M
Artificial Brain on the Cheap
On Monday, he’s publishing a paper that
shows how to build the same type of
system for just $20,000 using cheap,
but powerful, graphics microprocessors,
or GPUs. It’s a sort of DIY cookbook on
how to build a low-cost neural network.
http://www.wired.com/2013/06/andrew_ng/
GPUを利用した、NNのコモディティ化
109. 110. 111. DARPA SyNAPSE Program
DARPAは、SyNAPSE Programを展開し、積極
的な資金援助を行っている。
http://www.artificialbrains.com/darpa-synapse-program
112. 113. 122. 言語能力へのアプローチ
Cartesian Linguistic : Chomsky
Bio/Gene Linguistic : Fischer
Power of Data : Google
Deep Learning : Sutskever
123. 124. 125. Chomskyの観察
Cartesian Linguistic
言語能力は、デカルトのいうように、人間という類
を、人間以外の動物と区別するものである。
人間の言語能力の最大の特徴は、その創造性。
いままで聞いたこともしゃべったことも無い、まっ
たく新しい文章を、理解し発話出来る。
有限個の単語から無限の文を生成出来る。
言語の獲得には、可能な文型を全てカバーする
大量のデータが必要な訳ではない。
人間には、全ての人間に共通の生物学的基礎を
持つ、「普遍文法」と「言語獲得装置」とも言うべき
ものが、生まれつき備わっている。
126. 無限性Recursion
I ate a banana
I know I ate a banana
I think I know I ate a banana
I declare I think I know I ate a banana
What do you declare I think I know I ate?
This is the banana I declare I think I know I
ate
There are more bananas I declare I think I
know I ate than bananas that still grow on the
tree
This is the cat that caught the rat that ate the
cheese that... http://bit.ly/1uc4Taj
127. The Faculty of Language:
What Is It, Who Has it,
and How Did It Evolve?
http://www.chomsky.info/
articles/20021122.pdf
言語のRecursionの能力は、
数の概念の形成能力とも結
びついている。ハトは、3以上
の数を区別出来ない。サルは、
個別の数を個別に学ぶが、
人間の子のように一般化出来
ない。
128. 129. 130. マックス・プランク研究所
"Language and Genetics"
より根本的なレベルで、発話と言語は、人間であ
る条件の諸特徴、我々人類という種の中心的な
諸相を定義している。
ただ、我々は、遺伝子が言語に対応出来る脳を
いかにして構成出来るのかについては、いまだ、
ほとんど何も知っていない。また、我々に最も近
い親類たちでさえも、この領域では、人間の能力
にかなうことが、全く出来ないように見えるのは何
故かについても、ほとんど何も知らない。
http://www.mpi.nl/departments/language-and-genetics
131. 言語能力に関係する遺伝子FOXP2
Simon E. Fisherらによって発見された人間の
言語能力に関係する遺伝子FOXP2 は、は虫類
にも鳥類にも存在する。面白いことに、FOXP2は
鳥のさえずりやコウモリの音響定位の能力とも関
係しているらしい。
http://bit.ly/1tgaQ5o
132. 133. Power of Data
Googleの言語へのアプローチ
Ben Jai “What’s Google Doing” から
http://life.math.ntu.edu.tw/sites/
life.math.ntu.edu.tw/files/
Fall-2006-Campus-Talk-TW.pdf
134. データの力
これまでの知見
計算パワーが増大するにつれて、以前には実際には
計算することができなかった問題が解けるようになる。
新しい知見
データの量が増大するにつれて、以前には解けなかっ
た問題が解けるようになる!
それは単に、より堅実な解法を得るというだけの
問題ではない
少数のデータで考えると失敗するように見える方法が、
巨大な量のデータのもとでは、うまくいくことがある。
135. 136. 「スペル訂正」の課題
「スペル訂正の」こうしたやり方は、Web上では、
多くの問題にぶつかることになる
検索の多くは、固有名である。しかし、固有名は、
語彙集にはほとんどのっていない
例えば、よく使われている、ワープロソフトでは、
“Kofi Annan”(元の国連事務総長)は、スペルミ
スになる。提案される訂正は、”KokiAnna”
(誰?)
Web上で使われる言葉の集合は、標準的な語彙
集より遥かに大きく、かつ、定期的に変化する
137. Web上での「スペル訂正」
“britney spears”のような、ポピュラーな名前で
も、間違ったスペルで検索する。
実際の例。800以上もあった。
britney spears
brittany spears
brittney spears
britany spears
britny spears
briteny spears
britteny spears
briney spears
brittny spears
brintey spears
138. 139. Google流の「スペル訂正」
Webをコンテキスト語彙集として利用し、ミススペ
ルを、Webの文脈上での利用に基づいて見つけ
る。
語のスペルの、確率的なモデルを構築し、語彙集
をWebでの語の使用に適合させると、より豊かな
スペル訂正のモデルが出来る。
Googleを使った場合の例
“Kofi Annan”は、スペルミスではない
“Kofee Annan” は、“Kofi Annan” に訂正される
“Kofee Shop” は、“Coffee Shop” に訂正される
コンテキストがキーである。
140. 応用: 自動機械翻訳
目標: 異なる言語間のテキストの、高品質な
自動変換を提供する
元のテキストがいかなる言語であっても、
Web上の全てのテキスト・データを、アクセス
可能なものにすることが出来る
長い期間を要する、挑戦的なAIの問題
しかし、沢山のデータは、実際に役に立つ!
141. アプローチ: 統計的機械翻訳
機械翻訳では、不確実さのもとで、決定を行う必
要がある。(例えば、いかにして、あるフレーズを
他のフレーズに変換するのか?)
目標: 最良で、理想的には最適な決定を行う
一般理論:
翻訳の統計モデルを構築する
最適な決定を行う決定理論を利用する
143. 144. 145. 146. Google?
「スペル訂正」でのGoogleのアプローチは、正しいと思う。
データがパワーだという新しい認識も、その限りでは正し
いものだ。
ただ、「統計的機械翻訳」のアプローチは、正しくないと思
う。現実にも、Googleは、それだけで機械翻訳を実装し
てはいないだろう。
人間が、言語を習得する過程も、こうしたモデルには合致
していない。我々は、Google的感覚からすると、少数の
文を経験するだけで、正しい意味のある文を無限に生成
する能力を獲得する。もっとも、機械と人間が、同じアルゴ
リズムに従う必要はないのだが。
147. 148. ニューラル・ネットを使った単語選択
{to, two, too}という言葉は、発音はよく似てい
る。今、次の文の下線部に、先の三つの単語{to,
two, too}から、一つ選んで文章を作るという問
題を考えよう。
For breakfast I ate _____eggs.
正解は、もちろんtwoである。多くの人は、two以
外だと文法的に正しくないし、意味が通らないと
考えるだろう。
ところが、ニューロ・ネットを使った、単語選択の
考え方は、それとは異なる。沢山の用例を調べて、
同じようなものがあれば、それを選ぶ。
149. It’s not who has the best algorithm that wins.
It’s who has the most data.
http://bit.ly/1qKh8ro
横軸が対数のグラフ
10億
150. 151. "An example of what recurrent neural nets
can now do (to whet your interest!) "
It is less favorable to the good boy for when to
remove her bigger. In the show’s agreement
unanimously resurfaced. The wild pasteured
with consistent street forests were
incorporated by the 15th century BE. In 1996
the primary rapford undergoes an effort that
the reserve conditioning, written into Jewish
cities, sleepers to incorporate the .St Eurasia
that activates the population. Mar??a Nationale,
Kelli, Zedlat-Dukastoe, Florendon, Ptu’s
thought is. To adapt in most parts of North
America, the dynamic fairy Dan please believes,
the free speech are much related to the
http://bit.ly/1qN5Pes
152. "An example of what recurrent neural nets
can now do (to whet your interest!) "
while he was giving attention to the second
advantage of school building a 2-for-2 stool
killed by the Cultures saddled with a halfsuit
defending the Bharatiya Fernall ’s office . Ms .
Claire Parters will also have a history temple
for him to raise jobs until naked Prodiena to
paint baseball partners , provided people to
ride both of Manhattan in 1978 , but what was
largely directed to China in 1946 , focusing on
the trademark period is the sailboat yesterday
and comments on whom they obtain overheard
within the 120th anniversary , where ......
http://bit.ly/1qN5Pes
153. 154. 155. 156. 2000年代
大規模データ処理の第一世代の開始
現代のITの中核的な技術の一つは、大規模分散
システムによる大規模データの処理技術である。
「世界中の情報を検索可能にする」というミッショ
ンを掲げたGoogleの、Webスケールの検索技
術の実現がこうした時代の幕を開いた。21世紀
の始まりとその時期は、ほぼ等しい。
クローリングで収集した膨大なページへのイン
デックス付けとPageRankの計算が、Webス
ケールのデータ処理の中心だったのだが、そうし
た処理は、MapReduceを用いたバッチ処理で
行われていた。
157. 2010年代
大規模データ処理の第二世代への転化
モバイル・デバイスSNSの爆発的な普及を背景と
して、2010年ごろ、バッチ処理からリアルタイム
処理への大規模データ処理の大きな転換が始ま
る。
Googleのシステムの転換については、丸山の「大規模分
散システムの現在--- GFS, MapReduce, BigTableは、
どう進化したか」を参照されたい。
https://drive.google.com/file/d/0B04ol8GVySU
ueWQ2dkZUSFFETlk/edit?usp=sharing
158. ソーシャル・グラフと
大規模グラフデータ処理
こうした変化の口火を切ったのは、個人とモバイ
ルをターゲットとして、「世界をもっとつながったも
のに」を会社のミッションとするFacebookの躍進
だった。2010年4月に公開されたFacebookの
Open Graphは、「ソーシャル・グラフ=大規模
グラフデータ」処理の重要性に多くの人の目を向
けさせた。
Googleの対応も興味深い。2010年6月、前述
の検索インデキシングのリアルタイム化を実現し
たCaffeinの投入と同じ日に、大規模グラフデー
タ処理のエンジンPregelを発表する。
159. 検索の変化
--- 文字列の検索から知識の検索へ
2010年に行われた技術的転換は、バッチか
らリアルタイムへの進化だけではなく、データ
の量への注目からデータの質的なグラフ構造
への注目を特質とする大規模データ処理の第
二世代の開始を意味するものである。
160. 161. Google Knowledge Graph
新しい検索の三つの特徴
正しい「もの」を見つける。(Find the right
thing)
最良の要約を得る。(Get the best
summary)
さらに深く、さらに広く。(Go deeper and
broader)
GoogleのKnowledge Graphについては、2012年7月12日の
クラウド研究会での丸山の資料「Googleの新しい検索技術
Knowledge Graphについて」を参照されたい。
https://drive.google.com/file/d/
0B04ol8GVySUuUFUtbWcxNFlHY3c/edit?usp=sharing
162. Facebook Graph Search
リンクではなく、答えを与える
「Facebookが現在行っているこれら全てのこと
より、ずっと面白いのは、人々に彼らが望むグラ
フのどんな断片でも得ることが出来るパワーと
ツールを与える事である。」
「Graph Searchは、正確な検索をすれば、ある
一つの答えを与えるようにデザインされている。
答えを与えるかもしれない複数のリンクではな
い。... 例えば、Graph Searchに「サンフランシ
スコに住んでいる私の友達は誰?」と質問出来
る。」
http://techcrunch.com/2013/01/15/
facebook-announces-its-third-pillar-graph-search/
163. MS Bing Snapshot/Satori
検索は現実の世界の反映
Bingでは、我々は検索はwebのページを指す青
いリンク以上のものであるべきだと信じている。
我々はまた検索は現実の世界の反映であるべき
だと信じている。
Snapshotの基礎にある技術は、我々を取り巻く世界を、
単に「人、場所、物」といったものの集まりとしてだけでは
なく、これらのものの関係として、深く理解することを目的
にデザインされた。Bingのエンジニアリング・チームの中
では、この技術は、理解を意味する日本語の「悟り
(Satori)」と呼ばれていた。
http://www.bing.com/blogs/site_blogs/b/search/
archive/2013/03/21/satorii.aspx
164. 165. Facebook
next 10-year plans
「Graph Searchは、ほとんど動かない」
2013年1月30日
Interview with Business Week
http://www.businessweek.com/articles/201
4-01-30/facebook-turns-10-the-mark-zuckerberg-
interview#p4
166. Facebookの10年計画
1. 高度にパーソナライズ化されたターゲット広告を
ニュースフィードに配信し、ユーザーあたりの平均
の収入と利益幅を大幅に増加させる
2. ユニークな経験を配信し、巨大なFacebookの
データハブに接続する主要なスポークとして、スタ
ンドアロンのアプリを確立する
3. 多様な人工知能サービスを可能とするSearch
Graphで、伝統的な検索を凌駕する
4. たえず安価になり、より機能的なデバイスとデー
タセンターをインターネットにもたらす
http://www.dnaindia.com/scitech/report-mark-zuckerberg-unveils-facebook-
s-next-10-year-plans-1958538
167. 検索の現状と未来
2013年10月23日
Pubcon Las Vegas 2013
Keynote Talk With Matt Cutts
http://www.youtube.com/watch?v=K7JhnW
HbwnE
http://www.bruceclay.com/blog/2013/10/m
att-cutts-pubcon-las-vegas-keynote/
168. Moonshot Changes
Knowledge Graph: 文字列ではなく物事。
質問の背後に実際にあるものを知る
Voice search: ますます改良されている
Conversational search: 代名詞を考える
Google Now: 質問をしなくても、次のステップ
を先読みする
Deep learning: 神経回路網を学習する為に、
数千のコンピュータが利用されている
169. Hummingbirdでの検索
質問を行っているのなら、それは、自然言語での
質問かもしれないし、そこには必要ではない言葉
が含まれているかもしれない。
「愛しのテキサスの首府は?」
Hummingbirdは、重要な言葉を切り出して、そ
の言葉にもっと知的に点数を加えるという方向へ
の一つのステップである。
Hummingbirdは、Googleの最新の検索エンジン
2013年9月26日発表
http://insidesearch.blogspot.jp/2013/09/fift
een-years-onand-were-just-getting.html
170. 検索の未来
未来の大きな流れ
機械学習: 検索をする人に、如何にしたらもっと大きな価
値を与えられるかを解き明かす試みを、続けていこうとし
ている
モバイル: 2011年のYouTubeの携帯電話からのトラ
フィックは6%だった。2012年には、それは25%になり、
2014年にはYouTubeのトラフィックの40%を占めると予
想されている。もし、モバイルについての戦略を明確に
持っていないのなら、それについて考えた方がいい。
社会性/主体性/著作権: 自分が何者であるかを知ること。
主体性は大きな違いを生み出しうる。人々が耳を傾ける
人物であるという事は、長期間続くシグナルである。
171. 広告の変化と「知的な機械」
GoogleやFacebookの知識検索に対する関心は、直接
的には、モバイルと個人に対して(両者はほとんど同義で
ある)最適のタイミングで最適の広告を配布するというビ
ジネス上の動機でドライブされている。それは、現代のIT
企業間の競争のもっとも中心的な分野である。
モバイルと個人に対する「最適の広告」を「最適の情報」と
読み替えると、現在進行中の技術的変化の特質がよく理
解出来ると思う。それは、無理な読み替えではない。両者
は、同じ技術を共有しているからだ。人間が望むことを理
解し、必要な情報を与えてくれる機械。
検索では機械は受動的だが、広告では機械は能動的に
人間に働きかける。機械が主体的に考え始めるのなら、
広告での競争は最大の「淘汰圧」の一つになるだろう。
172. 検索とグラフをめぐる主要な出来事
2010/04/21 Facebook Open Graph公開
2010/06/01 Schmidt 自己批判
2010/06/08 Google Caffeine投入
2010/06/08 Google Pregel Paper
SIGMOD 2010
2011/09/21 Google Google+スタート
2012/02/06 Apache Giraph 0.1
incubating
2012/06/16 Google Knowledge Graph
173. 検索とグラフをめぐる主要な出来事
2012/06/16 Google Knowledge Graph
2013/01/15 Facebook Search Graph
2013/03/21 Microsoft Satori
2013/06/26 Microsoft Trnity
2013/08/15 Facebook Trillon Edges
Giraph
2013/09/26 Google Hammingbird
174. 175. 176. 177. 178. Types = “is-a”
Person
Location
Business
Movie
TV show
Fictional
character
Winery
Automobile model
Airport
Travel destination
Ingredient
Mountain
Cause of death
Political party
179. Properties = “has-a”
PersonのProperty
gender
date of birth
place of birth
profession
nationality
ethnicity
parents
children
religion
education
employment
history
... and more
180. Freebaseの基本的なコンセプト
Topics
Graph: データはグラフとして格納される。
グラフのnode は、/type/object で定義され、
グラフのedgesは、/type/link で定義される。
Topics: Freebaseは、people, places, things のよ
うな現実世界の実体について3,900万のtopicを持って
いる。topicのtypeの例。
Physical entities, e.g., Bob Dylan, the Louvre
Museum, the Saturn planet
Artistic/media creations, e.g., The Dark Knight
(film), Hotel California (song)
Classifications, e.g., noble gas, Chordate
Abstract concepts, e.g., love
181. Freebaseの基本的なコンセプト
TypeとProperty
topicは、いろいろな観点からみることが出来る。
例えば
Bob Dylan was a song writer, singer, performer,
book author, and film actor;
Leonardo da Vinci was a painter, a sculptor, an
anatomist, an architect, an engineer, ...;
Love is a book subject, film subject, play subject,
poetry subject, ...;
Freebaseのtopicには、任意の数のtypeを割り当てるこ
とが出来る。Bob Dylanのtopicには、song writer,
singer, performer, book author、film actor といっ
たtypeが割り当てられる。
182. Freebaseの基本的なコンセプト
TypeとProperty
それぞれのtypeは、そのtypeに固有のpropertyを持つ。
例えば、
The music artist type contains a property that lists
all the albums that Bob Dylan has produced as well
as all the music instruments he was known to play;
The book author type contains a property that lists
all the books Bob Dylan has written or edited, as
well as his writing school of thoughts or
movement;
Typeは、Propertyのコンテナーと考えていい。
183. Freebaseの基本的なコンセプト
DomainとID
propertyがtypeでまとめられるように、typeはdomain
にまとめられる。domainにはIDが与えられる。例えば、
/business is the ID of the Business domain
/music - the Music domain
/film - the Film domain
/medicine - the Medicine domain
それぞれのtypeもIDを持つ。例えば、
/music/album is the ID of the (Music) Album type,
belonging in the Music domain
/film/actor - the Actor type in the Film domain
/medicine/disease - the Disease type in the Medicine
domain
184. 185. 186. “Blue bottle”の検索の例
import json
import urllib
api_key = open(".api_key").read()
query = 'blue bottle'
service_url = 'https://www.googleapis.com/freebase/v1/search'
params = {
'query': query,
'key': api_key
}
url = service_url + '?' + urllib.urlencode(params)
response = json.loads(urllib.urlopen(url).read())
for result in response['result']:
print result['name'] + ' (' + str(result['score']) + ')'
187. 検索のオプションとfiltering
paramsにfilterを追加
query: "gore"
query: "gore" lang: "fr"
query: "gore" lang: "de”
filter: "(all name:gore alias:gore
type:/people/person)”
filter: "(all (not name:gore) alias:gore
type:/people/person)”
query: "gore" type: "/people/person”
query "john" filter: "(all type:/people/person
/people/person/nationality:"Canada")"
188. Search Output
Find entities named "Blade Runner" and return
their contributors
filter=(all name{phrase}:"Blade Runner")
&output=(contributor)
Find US Presidents and return their date of
birth as well as their spouses' date_of_birth:
filter=(all type:/government/us_president)
&output=(/people/person/date_of_birth
(/people/marriage/spouse
/people/person/date_of_birth))
189. 検索結果の例
{
"status": "200 OK",
"result": [
{
"mid": "/m/02mjmr",
"id": "/en/barack_obama",
"name": "Barack Obama",
"notable": {
"name": "US President",
"id": "/government/us_president"
},
"lang": "en",
"score": 31.618755,
"output": {
"/people/person/date_of_birth": {
"/people/person/date_of_birth": [
"1961-08-04"
190. {
"status": "200 OK",
"result": [
{
"mid": "/m/02mjmr",
"id": "/en/barack_obama",
"name": "Barack Obama",
"notable": {
"name": "US President",
"id": "/government/us_president"
},
"lang": "en",
"score": 31.618755,
"output": {
"/people/person/date_of_birth": {
"/people/person/date_of_birth": [
"1961-08-04"
]
},
"/people/marriage/spouse": {
"/people/marriage/spouse": [
{
"mid": "/m/025s5v9",
191. "name": "Michelle Obama",
"/people/person/date_of_birth": {
"/people/person/date_of_birth": [
"1964-01-17"
]
}
}
]
},
"/people/marriage/spouse": {
"/people/marriage/spouse": [
{
"mid": "/m/025s5v9",
"name": "Michelle Obama",
"/people/person/date_of_birth": {
"/people/person/date_of_birth": [
"1964-01-17"
]
}
}
]
}
}
},
192. Data Dump
Data Dumpは、Freebaseのデータのダウ
ンロード可能なバージョンである。
https://developers.google.com/freebase/dat
a?hl=ja
193. Freebase Triples
Total triples: 1.9 billion
Updated: Weekly
Data Format: N-Triples RDF
License: CC-BY
22 GB gzip
250 GB uncompressed
194. 195. 情報の2つのタイプ
ネットワーク上の情報には、大雑把に言って2つのタイプ
がある。一つは、典型的には個人と個人のコミュニケー
ションで用いられる、基本的に共時的なメッセージ達と、も
う一つは、時間を超えて累積されることを望む、通時的な
メッセージ達である。
この2つのタイプの区別は、コトバと文字の分離に起源を
もつ古いものだが、2つの型の情報のいずれもが、我々に
取っては、本質的に重要なものである。
コミュニケーションの媒体は変わっても、個人間のコミュニ
ケーションの本質は大きく変わっていないように見える。た
だ、集合的で蓄積的な知のあり方は、グローバルなネット
ワークという新しいメディアの登場によって、大きく変わる
可能性はある。
196. ネットワーク上での知識の集積
ネットワークこそが、集合的で累積的な知識の担い手であ
るべきだという意識は、新しいものである。
Googleの検索システムの変化の方向も、こうした意識の
変化を反映し、同時に、こうした変化を後押しするものに
なるのかもしれない。
次のセクションでは、ネットワーク上に、構造化された知的
な情報を蓄積しようという、いくつかの試みを見ることにし
よう。ただ、おそらくは、いずれもプリミティブなものである。
根本的には、「データの蓄積」といったレベルの抽象では
不十分で、コトバにしろ、文字にしろ、我々の言語能力自
体の理解が、次の飛躍には不可欠なのである。我々は、
そのことに気付きつつある。
197. Semantic Web /
HTML5 Microdata
最終更新2012/06/29
http://www.whatwg.org/specs/web-apps/
current-work/
multipage/microdata.html#encoding-microdata
198. 199. 200. <section itemscope itemtype="http://data-vocabulary.org/Person">
僕の名前は、
<span itemprop=“name”>丸山不二夫</span>です。
<span itemprop=“affiliation”>クラウド大学大学院</span>の
<span itemprop=“title”>客員教授</span>をしています。
友達は、僕のこと
<span itemprop=“nickname”>マル</span>と呼んでいます。.
僕のホームページは、
<a href="http://cloud.ac.jp/~maruyama097" itemprop="url">
マルのページ</a>です。
<section itemprop="address" itemscope
itemtype="http://data-vocabulary.org/Address">
僕は、
<span itemprop=“region”>北海道</span>の
<span itemprop=“locality”>稚内市</span>
<span itemprop=“street-address”>富岡5-9-1</span>
に住んでいます。
</section>
</section>
ならば、それぞれの情報にタグ付けしよう。
201. Ontology / Taxsonomy ?
Semantic Webで、Ontology(存在論)という古めかし
い言葉が使われたのは、面倒な「コトバの意味」を扱うの
を避けて、「客観的」な「存在の関係」に意味を還元した
かったのだと思う。ただ、コトバは存在しないものを表現出
来るし、Tripletは、言語のモデルとしては、あまりに貧弱
である。
意外なことだが、中世を脱して自然科学が起こり始めた
17世紀、「普遍言語」とTaxsonomyに対する関心が大き
く盛り上がったらしい。http://bit.ly/1wMVxjq
20世紀に、アリストテレスや中世のスコラ哲学流の古い
考え方であるOntologyが復活したのも、それに似ている
のかもしれない。
202. Ontology / Taxsonomy ?
誰が、タグ付けを行うのか? それは人間である。それは、
Crowd Computingの応用としては面白いが、典型的な
教師付きの学習である。Deep Learningが、画像の認
識では教師なしの学習を実現したように、言語理解でも別
の発展が起こりうると思う。
別の問題もある。本来は、言語に依存しない事物の関係
を表現するはずのタグに、我々は特定の言語を固定して
使う(よく考えれば、それ以外の方法はないのだ)。たいて
いは英語だが。タグが精緻化するほど、それは英語の辞
書に近づき、タグ付けは翻訳作業に近づいてくる。当たり
前に思えるかもしれないが、本当はおかしい。
203. Facebook Open Graph
「今日のウェブは、さまざまページの間に張ら
れた無構造でランダムなリンクによって成り
たっています。Open Graph(オープンググラ
フ)は人々の間の関係を構造化します。」
Zuckerberg 2010年4月f8コンファレンス
204. Objectのマークアップ
<meta property="fb:app_id"
content="YOUR_APP_ID" />
<meta property="og:type"
content="recipebox:recipe" />
<meta property="og:title"
content="Chocolate Chip Cookies" />
<meta property="og:image"
content="http://www.example.com/cookies.png" />
<meta property="og:description"
content="Best Cookies on Earth!" />
<meta property="recipebox:chef"
content="http://www.example.com/john_smith"/>
205. Retrieving Objects
GET /{object-instance-id}
GET https://graph.facebook.com/1015012577744568
{
"id": "1015012577744568"
"type": "recipebox:recipe",
"url": "http://www.example.com/cookies.html",
"description": "Best Cookies on Earth!",
"title": "Chocolate Chip Cookies",
"image": "http://www.example.com/cookies.png”
}
206. Built-in Object Types
Article
Blog
Book
Profile (External)
Movie
TV Episode
TV Show
Video
Website
207. <html>
<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb#
book: http://ogp.me/ns/book#">
<meta property="fb:app_id" content="YOUR_APP_ID">
<meta property="og:type" content="book">
<meta property="og:url" content="URL of this object">
<meta property="og:image" content="URL to an image">
<meta property="og:description" content="Description of content">
<meta property="og:title" content="Name of book">
<meta property="book:release_date" content="DateTime”>
<meta property="book:author" content="Who wrote this">
<meta property="book:isbn" content="ISBN Number">
<meta property="book:tag" content="keywords">
</head>
<body>
<!--a wonderful book -->
</body>
</html>
Book オブジェクトの記述例
208. <html>
<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb#
video: http://ogp.me/ns/video#">
<meta property="fb:app_id" content="YOUR_APP_ID">
<meta property="og:type" content="video.movie">
<meta property="og:url" content="URL of this object">
<meta property="og:image" content="URL to an image">
<meta property="og:title" content="Movie title">
<meta property="og:description” content="Description of movie">
<meta property="video:release_date" content="DateTime">
<meta property="video:actor" content="URL to Profile">
<meta property="video:actor:rol content="Role in Move">
<meta property="video:duration" content="runtime in secs">
<meta property="video:director" content="URL to Profile">
<meta property="video:writer" content="URL to Profile">
<meta property="video:tag" content="keyword">
</head>
<body>
<!--a wonderful movie -->
</body>
</html>
Movie オブジェクトの記述例
209. Built-in Action Types
Like - Any Object Type
Follow - Profile
Listen - Song
Read - Article
Watch - Video, Movie, TV Show, or TV
Episode
210. 211. Gooogle
Actions in the Inbox
Schema.orgのマークアップをe-mailに埋め
込む技術。Google Nowで使われている。
https://developers.google.com/gmail/action
s/
212. Adding structured data
to the email
<html>
<head>
<title>Did you enjoy Google Cafe?</title>
</head>
<body>
<p>
Dear John, please rate Google Cafe between 1 and 5 stars and,
optionally, add a text comment.
</p>
</body>
</html>
213. <html>
<head>
<title>Did you enjoy Google Cafe?</title>
</head>
<body>
<script type="application/ld+json">
{
"@context": "http://schema.org",
"@type": "Restaurant",
"name": "Google Cafe",
"action": {
"@type": "ReviewAction",
"review": {
"@type": "Review",
"reviewRating": {
"@type": "Rating",
"bestRating": "5",
"worstRating": "1"
}
},
"handler": {
"@type": "HttpActionHandler",
"url": "{{ review_url }}”,
214. "encoding": {
"url": "http://schema.org/Encoding/UrlEncoded"
},
"method": "http://schema.org/HttpRequestMethod/POST",
"requiredProperty": {
"@type": "Property",
"name": "review.reviewRating.ratingValue"
},
"optionalProperty": {
"@type": "Property",
"name": "review.reviewBody"
}
}
}
}
</script>
<p>
Dear John, please rate Google Cafe between 1 and 5 stars and,
optionally, add a text comment.
</p>
</body>
</html>
216. 217. <script type="application/ld+json">
{
"@context": "http://schema.org",
"@type": "FlightReservation",
"reservationNumber": "RXJ34P",
"reservationStatus": "http://schema.org/Confirmed",
"underName": {
"@type": "Person",
"name": "Eva Green"
},
"reservationFor": {
"@type": "Flight",
"flightNumber": "110",
"airline": {
"@type": "Airline",
"name": "United",
"iataCode": "UA"
},
218. "departureAirport": {
"@type": "Airport",
"name": "San Francisco Airport",
"iataCode": "SFO"
},
"departureTime": "2017-03-04T20:15:00-08:00",
"arrivalAirport": {
"@type": "Airport",
"name": "John F. Kennedy International Airport",
"iataCode": "JFK"
},
"arrivalTime": "2017-03-05T06:30:00-05:00"
}
}
</script>
219. 220. <script type="application/ld+json">
{
"@context": "http://schema.org",
"@type": "FlightReservation",
"reservationNumber": "RXJ34P",
"reservationStatus": "http://schema.org/Confirmed",
"underName": {
"@type": "Person",
"name": "Eva Green"
},
"reservationFor": {
"@type": "Flight",
"flightNumber": "110",
"airline": {
"@type": "Airline",
"name": "United",
"iataCode": "UA"
},
"departureAirport": {
"@type": "Airport",
"name": "San Francisco Airport",
"iataCode": "SFO"
},
221. "departureTime": "2017-03-04T20:15:00-08:00",
"arrivalAirport": {
"@type": "Airport",
"name": "John F. Kennedy International Airport",
"iataCode": "JFK"
},
"arrivalTime": "2017-03-05T06:30:00-05:00"
},
"airplaneSeat": "9A",
"airplaneSeatClass": {
"@type": "AirplaneSeatClass",
"name": "Business"
},
"ticketNumber": "ABC1234",
"ticketToken": "qrCode:AB34"
}
</script>
222. 223. <script type=“application/ld+json”>
{
“@context”: “http://schema.org”,
“@type”: “LodgingReservation”,
“reservationNumber”: “abc456”,
“reservationStatus”: “http://schema.org/Confirmed”,
“underName”: {
“@type”: “Person”,
“name”: “John Smith”
},
“reservationFor”: {
“@type”: “LodgingBusiness”,
“name”: “Hilton San Francisco Union Square”,
“address”: {
“@type”: “PostalAddress”,
“streetAddress”: “333 O‘Farrell St”,
“addressLocality”: “San Francisco”,
“addressRegion”: “CA”,
“postalCode”: “94102”,
“addressCountry”: “US”
},
“telephone”: “415-771-1400”
},
“checkinDate”: “2017-04-11T16:00:00-08:00”,
“checkoutDate”: “2017-04-13T11:00:00-08:00”
}
</script>
224. Android
Advertising ID
「2014年8月1日から、Play ストアにアップ
ロードされたすべての更新や新着アプリには、
広告目的で使用する端末ID として広告ID
(端末で利用可能な場合)を使用する必要が
あります。」
https://play.google.com/about/developer-content-
policy.html#ADID
225. Using the Advertising ID
The advertising ID is a unique but
user-resettable string identifier that lets
ad networks and other apps
anonymously identify a user. The user's
advertising ID is made available to apps
through APIs provided in Google Play
services.
226. Using the Advertising ID
Users can reset their advertising ID at
any time, right from the Ads section of
the Google Settings app on their devices.
From the same app, users can also opt-out
of targeted advertising based on the
advertising ID by setting the appropriate
ad tracking preference. When the
user opts-out of targeted ads, this ad
tracking preference is made available to
apps through a Google Play services API.
227. Android 広告ID の使用
Google Play 開発者サービスバージョン4.0
では、広告と分析のプロバイダが使用する新しい
API とID が導入されました。このAPI とID を
使用するための規約は以下のとおりです。
個人を特定できる情報またはその他のID との
関連付け: 広告ID をユーザーの明示的な同意
なしに、個人を特定できる情報にリンクしたり、永
続的なデバイスID(例: SSAID、MAC アドレス、
IMEI など)に関連付けたりしてはいけません。
228. Android 広告ID の使用
ユーザーの選択を優先: リセットする際にユーザーの明
示的な同意なしに、新しい広告ID を以前の広告ID や
以前の広告ID からのデータにリンクしてはいけません。
さらに、ユーザーの[インタレストベース広告をオプトアウ
ト] 設定を遵守する必要があります。ユーザーがこの設定
を有効にした場合は、広告目的でユーザーのプロフィー
ルを作成したり、ユーザーをインタレストベース広告の
ターゲットに設定したりするために広告ID を使用しては
いけません。ただし、コンテンツターゲット広告、フリーク
エンシーキャップ、コンバージョントラッキング、レポート、
セキュリティや不正行為の検出などに使用することはでき
ます。
229. Android 広告ID の使用
ユーザーに対する透明性: 広告ID の収集と使用、その
規約への同意について、法的に適切なプライバシー通知
でユーザーに公開する必要があります。
利用規約の遵守: 広告ID はその利用規約を遵守する
場合にのみ使用できます。貴社のビジネスで共有する可
能性のある団体が使用する場合も同様です。2014 年8
月1 日から、Play ストアにアップロードされたすべての
更新や新着アプリには、広告目的で使用する端末ID と
して広告ID(端末で利用可能な場合)を使用する必要が
あります。
230. 231. 232. 233. 235. 236. 237. 238. 239. 240. 241. 242. マルゼミ「人間の思考、機械の思考」
、次の要領で第三回マルゼミを開催します
日時: 10月7日19:00~
場所: KDDI 渋谷ヒカリエオフィス34階
定員: 40名
申込: 9月30日12:00〜
登壇者:
丸山不二夫「人間に出来ること」
金山博IBM東京基礎研究所
「質問応答システムWatsonの技術」
細金正隆電通サイエンスジャム
「脳の生体信号を使った感性把握ビジネス」