More Related Content
More from TeruKamogashira
More from TeruKamogashira (20)
ビジョンより 2002
- 7. う際には細心の注意を払わねばならない。特に表現される情報の種類や実現すべき処理過程が明らかにな
るまでは十分な注意が必要となる。
他方、心理物理学はアルゴリズムと表現の水準に直接関係している。異なるアルゴリズムは、その能力
の限界まで使われたり、重要な情報が与えられなかったりすると、全く異なる仕方で機能が低下するもの
である。後述するように、主に心理物理学的証拠によって、Poggio と私は我々の最初の立体照合アルゴリ
ズム(Marr and Poggio, 1976)が脳で用いられているものとおおよそ一致していることを示す最も良い証拠も
やはり心理物理学からもたらせれたのである。もちろんいずれの場合も基礎となる計算理論は同一であり 、
アルゴリズムだけが異なっていたのである。
心理物理学は表現の性質を決定する場合にも有効である。
((中略))
一般的に言えば、異なる現象は異なる水準で説明される必要があることをはっきりと心に留めておけば 、
しばしば提起されるさまざまな反論の妥当性を評価する際にそれが役に立つ。たとえば、脳は並列的であ
り計算機は直列的であるから脳と計算機は全く異なっているという議論がその好例である。もちろんこれ
に対する答は、並列性と直列性との差はアルゴリズムの差であり、それは決して根本的な差ではないとい
うことである。すなわち、並列的にプログラムされたものはどんなものでも直列的に書き直すことができ
るのである(逆は必ずしも成り立たないが)。したがって、脳と計算機がきわめて異なる操作を行なうと
しても、計算機に同じ課題を達成させることはできないということにはならない。
計算理論の重要性
アルゴリズムや機構は実験的にとらえやすいが、情報処理という観点から非常に重要なのは最高位の水
準である計算理論である。その理由は、知覚の基礎となる計算の性質が、実現される特定のハードウェア
よりも解かなければならない計算論的問題に依存するからである。言い換えれば、アルゴリズムはそれが
実現されている機構(とハードウェア)を調べるよりも、解こうとしている問題の性質から理解していく
方が、理解が容易になるということである。
同様の理由によって、知覚を神経細胞の研究のみによって理解しようとすることは、鳥の飛行を羽の研
究のみによって理解しようとするようなもので、決してうまくいかないのである。鳥の飛行を理解するた
めには、空気力学を理解しなければならない。そうしてはじめて羽の構造が理解でき、異なる形状の翼の
意味がわかるようになるのである。さらに後述するように、解剖学や生理学を研究するだけでは、網膜神
経節細胞や外側膝状体の神経細胞の受容野がなぜそのような形をしているのかを理解できない。これらの
細胞や神経細胞が実際どのように振舞うかはその結合様式や相互作用を研究すれば理解できる。しかし、
なぜ受容野がそのような特徴をもっているか(なぜそれは円対称なのか、なぜその興奮領域と抑制領域が
特徴的な形や感度分布をしているのか)を理解するためには、微分演算子や帯域通過チャンネルの理論と
不確定性原理の数学を多少は知らなければならないのである(第2章参照)。
神経科学において高度に専門化された実験的規範のために計算理論の欠如が全く認識されなかったとい
うことはそれほど驚くに足りない。しかし人工知能の初期の発展において、この水準のアプローチが強力
- 9. 単純さに惑わされた思想家は Gibson だけではなかった。知覚の本質を哲学的に探究してきた研究のいずれ
においても、そこに含まれる情報処理の複雑さをそれほど真剣にとらえていなかったと思われる。たとえ
ば、初期の哲学者が好んだと思われる議論に、我々が時々錯覚にだまされる(たとえば真直ぐな棒の一部
を水に入れると折れ曲がって見える)ので我々は対象そのもではなくむしろ感覚所与を見ているというも
のがある。しかし Austin(1962)は「感覚と感覚可能物(Sense and Sensibilia)」の中でこのような説を見事に否定
した。この問いに対する答えは単に、通常我々の知覚処理は正しく働く(何が存在するかについての正し
い記述を伝える)が、我々の処理が進化によって多くの変化(一定でない照明のような)に対応できるよ
うになったにもかかわらず、水による光の屈折で生ずる乱れには対応できないということである。ところ
で、折れ曲がった棒の例はアリストテレス以来論議されてきたが、たとえばアオサギの知覚の本質を哲学
的に探究した例はまだ見たことがない。アオサギは水面の上から魚を見つけそれをついばむ鳥である。こ
のような鳥の場合は、視覚的な修正が行なわれていてもおかしくない。
p34
それは変化しない実形状をもつ。しかし実際コインはかなり特殊な例である。まずその輪郭はきわめて
明確であり、非常に安定しているということ、さらに既知で命名できる形状をもつということである。し
かしこのような性質をもたない物は数多く存在する。雲の形状は一体何か。あるいは、猫の場合はどうか 。
猫が動くとき、その実形状は常に変化するのか。もしそうでなければどのような姿勢が実形状なのか。さ
らに、その実形状は十分滑らかな輪郭をもつのか。あるいはそれはそれぞれの毛がわかるほど十分に細か
いぎざぎざをもつのか。明らかに、これらの質問に対する答えは存在しないし、答えを出すための規則や
手続きも存在しない。(強調は筆者による)(p67)
しかし、これらの質問に対する答えは実際存在するのである。すなわち猫の形状を任意の正確さで記述
する方法がある(第5章参照)。そしてそのような記述に到達するための規則や手続きが存在する。それ
がまさに視覚の本質であり、まさにそのために視覚が複雑になっているのである。
p39
私にとって最も重要なことは、彼女が2種類の患者群を区別したことである (Warrington and Taylor, 1978 参
照)。右側損傷患者は、ある意味で自然な方向から観察する状況では、通常の物体を認識することが可能
である。彼女は慣例的(conventional)、非慣例的(unconventional)という語を用いた。すなわち、水バケツやクラ
リネットを側面から見れば、「慣例的」光景が得られるが、端の方から見れば「非慣例的」光景を得るの
である。この患者がその物体を完全に認識できた場合には、その名前やその意味(すなわち、その用途、
目的、大きさ、重さ、材質など)を理解できた。その光景が非慣例的である場合は(たとえばバケツを上
から見れば)、患者はそれを認識できないだけでなく、それがバケツの一側面であることを猛烈に否定し
たのである。一方、左頭頂葉損傷患者は全く異なった振舞いをする。彼らはしばしば言葉をもたず、した
がって観察した物体を名付けることもその目的や意味を述べることもできない。しかし彼らはたとえ非慣
- 14. かをまねようとします。私はこれを模倣段階と呼びます。したがって、人々は模造の翼を作り、それで羽
ばたいてみたのです。しかし、これもまたうまく行きませんでした。この段階は本質的に、下位の二つの
水準あるいはおそらく第2水準だけで真似をしているのです。しかし翼が Berboulli の方程式に従って揚力
を与えることを理解したときにのみ本当の進歩があります。これが第1水準の部分、すなわち空気力学な
のです。これが鳥と 747 が似ている理由であり、その両者がブヨとは似ていない理由なのです。ブヨは翼
を用いるという方法ではなく、本質的に乱動状態で「空気を踏みつける」ことによって自らを空中に保っ
ているのです。
p382
しかし主としてその理由は、眼球運動の第1水準の理論が単純すぎてそれがあることさえ気づかないとい
うことなのです。実際計算理論の一般的な考えは、Gibson の思想の中に見いだせると思いますし、1960 年
の終わりから 1970 年代初めにかけて、Marvin Minsky と Seymour Papert がこういう考えを明らかに示していた
のは確かです。しかし、この一般的な考えの細部は全く埋められなかったのです。その理由を少しひねっ
て言ってみれば、人工知能は常に「大脳切除」されていたということでしょうか。人工知能の研究では、
発見されるべき第1水準理論の存在が決して認識されなかったのです。人工知能は機構論的説明の泥沼に
はまって全く動けなくなっていましたし、今でもなおそのような傾向が見られます。そこでは、記憶があ
る種の神経回路網によって実現されると考えられたり、計算機のある処理によって実現されると考えたり 、
手続きの集まりによって実現されると考えられたりしていたわけです。
((中略))
眼球運動のような単純な場合は、そのようなかなり直接的な方法で考え、うまく解決することができます 、
しかしこの種の考え方から、神経機構が解こうとしている計算論的問題に対して何らかの洞察が常に得ら
れるのではないかと期待するのは非常に危険です。
p383
その結論が出るまではフレームや属性リストのような考え方に対して我々は用心しなければならないので
す。なぜならば、そこでは実際、現実の事柄について考えるというよりはむしろ、直喩(simile)として考え
られているからです。それはちょうど視覚研究において、フーリエスペクトルのさまざまな成分に基づい
て考えることが、さまざまな尺度での画像の記述について考える直喩となっているようなものです。それ
は、あまりにも厳密さに欠くため、役に立たないのです。このような例では、我々の第1水準の意味で情
報処理的問題を厳密に定式化することによってのみ、真の進歩をとげることができるのです。
((中略))
機構に基づくアプローチは本当に危険です。その問題点は、このような研究の目標が真の理解ではなくむ
しろ模倣にあり、よってそのような研究では、人間の能力のある側面を、啓発的でないやり方で模倣して
いるにすぎないプログラムを書くだけになってしまうということなのです。
p384
- 17. するためにはそれが形状の決定と同じくらい有用な方法です(Warrington and Taylor, 1978)。我々が対象の意味
論と呼んでいるものを理解するという問題は魅力的だと思いますが、同時にこの問題は実際非常に難しく 、
今のところ視知覚の問題に比べてはるかに取り扱いにくいと思います。
p397
Q:他のたとえば自然言語のような問題に対して、あなたの提唱しているアプローチはどれほど普遍性が
あるのですか。それはどの程度まで適用できるのですか。どのような問題に対してはうまくいかないと思
われますか。
A:モジュール性をもたない系に対してはうまくいかないでしょう。アミノ酸の連鎖が折りたたまれて蛋
白質を形成する過程のように、無視できない多くの影響が存在する複雑で相互作用のある系の場合です。
自然言語理解の研究においてきわめて重要な問題は、言うまでもなく、それがどの程度モジュール的であ
り、何がモジュールであるかということです。
((中略))
ところで自然言語の問題に戻ると、そこではどのようなモジュールが発見されたのでしょうか。
A:それははっきりしていませんし、自然言語は本質的にモジュール性をもたず、もっと非階層的に
(heterarchically)とらえるべきであると主張する人もいます。
((中略))
Q:しかし統語構造はどれくらいモジュール的といえるのですか。Schank のような人工知能研究者は統語
構造は分離可能なモジュールでは決してないと主張しているのではないでしょうか。
A:ええそうです。文の構文解析は明らかにその意味解析と全く独立に進めることはできません。しかし
両者の間に必要な相互作用の程度が小さく、構文に関して解くべき問題がきわめて単純に、たとえばある
節は名詞句1を指示するのか、あるいは名詞句2を指示するのかといった問題になるようなしっかりした
議論が構築されつつあります。Marcus(1980)ははじめてこれらの問題を詳細に検討し、非常に満足のいくモ
ジュールを構文解析機構(parsing system)から作り出せることを示したのです。しかしながら構文解析より上
の水準では、何がモジュールとなるかについての手がかりも現在ほとんど得られていません。しかしそれ
は存在するに違いないと私は思っています。
Q:なぜ人工知能の研究者達は構文解析に対する伝統的な Chomsky 流のアプローチにそのような抵抗を示し
たのですか。Marcus だけがそのアプローチを受け入れたように思われますが。
A:それには二つの理由があると思います。第1に、何らかの意味解析を伴わなければっ構文が解析でき
ない例を挙げることは簡単だということです。したがって統語構造は真に独立したモジュールではないこ
とになりますが、この事実から人工知能の研究者達は統語構造は決してモジュールではないという逆の結
論にまで飛躍してしまったのです。この結論は正しくありません。本当は、統語構造はほぼモジュール的
であり、意味構造との相互作用はある程度必要となりますが、その相互作用の型はきわめて少ないのです。
第2に、これまで何度も述べてきた水準の問題があります。Noam Chomsky の変形文法は第1水準の理論
であり、構文認識がいかにして実現されるのかとは全く関係ないのです。それは単に、任意の文の分解が
何であるべきかを述べた規則にすぎないのです。Chomsky の変形文法を言語能力(competence)の理論だとして
- 18. いるのはこのことを彼流に述べているのです。
しかしながら、この水準の考え方を計算言語学者(computational linguists)は正しく理解してこなかったのです。
事実、Winograd が Chomsky の考え方を否定した理由は、一つに変形構造を逆行させてそれを構文解析機構と
して用いることはできないということだったのです。このような見方をした人は、第1水準(何となぜ)
と第2水準(どのように)の差が理解できていなかったと思われます。しかしながら、このような誤りを
犯したのは Winograd だけではありません。人工知能の研究者は皆そうだったのです。そして言語学者達自
身が計算機アプローチに注目してきている現在、彼らも同じ罠に捕われつつあるのです。その結果、自然
言語の計算機プログラムは自然言語理解にはほとんど寄与してこなかったのではないかと、私は懸念して
います。ただし例外として、Marcus(1980)は最近、我々が用いている構文解析のアルゴリズムについてまさ
に第2水準の理論を構築しつつあります。
p402
事実、人間の個性の構造のある部分は、幾千ものこういった小さな計画から形成されており、その計画す
べてが適切な条件が生じたときに人のある行動を引き起こすように設定されているのです。しかし何かが
これらの計画を書き込まなければなりません。