アンディ・クラーク「現れる存在/脳と身体と世界の再統合」を読む

本日はアンディ・クラーク著「現れる存在/脳と身体と世界の再統合」を読むことといたします。

とは言いましても、この大著の全てを読みかつ理解したわけではありませんので、本日は気の付いたところを簡単にご紹介します。

ユクスキュル

まず、同書は、一見したところAIで制御されたロボットを扱う書物であるように読み取れます。それも、脳の生理的機能に注目した人工知能研究に関わる書物であるように見受けられます。

しかしながら、著者のよって立つところは哲学。いわゆる「心の哲学」に分類される哲学であり、現象学のアプローチであるように読み取られます。これを象徴いたしますのが、知能は脳と環境の相互作用により生み出されているというユクスキュルばりの主張であり、ハイデガーやメルロー・ポンチなどの、現象学のメインストリームである人々の哲学へとつながってまいります。

このあたりにつきましては、以前読みました木田元氏の「ハイデガー『存在と時間』の構築」あたりを読みますとなんとなく雰囲気がつかめるかと思います。

クラークは、カップに腕を伸ばす作業について、次のように記述しています。

脳は運動エミュレーションと呼ばれる、(産業用の制御システムでは広くつかわれている)トリックを使っているかもしれない。エミュレータはオンボード回路の一部で、身体を含めた大きなシステムがとる時間ダイナミクスのうち、ある一面を再現しようとするものである。運動コマンドのコピーを入力として受けとり、感覚末梢部位から戻ってくるシグナルと同じ形式で出力を出す。もしこのデバイスに信頼性があれば、本物の感覚シグナルの代わりに予測したものを使うことで、より早くエラーを修正するための動作が実現できる。

この部分、原著 “Being There/Putting Brain, Body, and World Together Again”では次のようになっています。

To solve the problem, the brain may use a trick (widely used in industrial control systems) called motor emulation. An emulator is a piece of onboard circuitry that replicates certain aspects of the temporal dynamics of the larger system. It takes as input a copy of a motor command and yields as output a signal identical in form to one returning from the sensory peripheries. That is, it predicts what the proprioceptive feedback should be. If the device is reliable, these predictions can be used instead of the real sensory signals so as to generate faster error-correcting activity.

これ、現代制御理論でいう、オブザーバと状態フィードバックに相当するのですね。この場合、制御装置は、制御の対象である世界の数値モデルをもち、このパラメータを常に更新しております。そして、そこからいかなる応答が返ってくるかをシステム自身が予測してこれを制御に用いるというわけです。

脳は、これと同じことを実現しており、脳の内部に環境が取り込まれているとみなすことができます。

ジグソーパズル

49ページになりますと目から鱗の記述が出てまいります。

ジグソーパズルを考えてみよう。パズルを解くための一つの(実際にはやらないかもしれない)方法は、一個のピースをじっと眺め、ある場所にはまるかどうかを、推論だけで決定しようつすることだろう。しかし実際にわれわれがパズルを解くときには、頭の中で見当をつけた後、そのピースがはまるかどうか手を動かして試してみるというふうに戦略を混ぜて使っている。普通われわれは、身体的操作をする前からピースがはまるかどうかを確信できるほど、詳細にピースの形を頭の中に表現しているわけではない。そればかりか、はまるかどうか試す前にも候補となるピースを手で回転させることがある。それは、はまる可能性のある場所を大まかに探すという、より「心的な」タスクのほうを簡単にするためである(...)。つまりジグソーパズルを完成させるという現象のうちには、こんがらがった反復ダンスがあるのだ。「純粋思考」が行為につながり、今度はその行為が「純粋思考」に立ちはだかる問題を変化させ、簡単にするのである。これがおそらく行為のループとして知られる現象の最も簡単な例である。

最近のエスター・テーレンとリンダ・スミスによる発達に関する研究では、そのような思考と行為のあいだの相互影響は、普遍的かつ根源的なものだという可能性が指摘されている。そのためテーレンとスミスは、われわれの発達初期の知識はすべて、「ある状況の流れの中で起きた、知覚と行為の同時的相互作用を通して」できるのではないかと考えた。

原文は以下の通りです。

Consider a jigsaw puzzle. One (unlikely) way to tackle such a puzzle would be to look very hard at a piece and to try to determine by reason alone whether it will fit in a certain location. Our actual practice, however, exploits a mixed strategy in which we make a rough mental determination and then physically try out the piece to see if it will fit. We do not, in general, represent the detailed shape of a piece well enough to know for certain if it is going to fit in advance of such a physical manipulation. Moreover, we may physically rotate candidate pieces even before we try to fit them, so as to simplify even the more "mentalistic" task of roughly assessing potential fit. (......) Completing a jigsaw puzzle thus involves an intricate and iterated dance in which "pure thought" leads to actions which in turn change or simplify the problems confronting "pure thought.'' This is probably the simplest kind of example of the phenomena known as action loops.

Recent developmental research by Esther Thelen and Linda Smith suggests that such interplays between thought and action may be so ubiquitous and so fundamental that these researchers suspect that all our early knowledge is built "though the time-locked interactions of perceiving and acting in particular contexts".

ジグソーパズルのピースを組み合わせるためには、双方の嵌合部が同じ形をしている必要があります。回転した状態の嵌合部が同じ形状であるか否かを判断することは、頭の中で考えることも不可能ではないのですが、現実のピースを回転させて観察するのが手っ取り早い。知的作用による結果と同じことが、手を動かして目で観察することで実現できるのですね。また、そのピースが相手に合うかどうかは、頭であれこれ考えるよりも、嵌めてみれば一目瞭然です。

前の節で、運動エミュレータについて触れていますが、現代制御理論を応用した制御装置は、制御対象の状態を観測し、システム内部に備えたオブザーバにより現状を把握しております。この際に、制御対象のパラメータ(たとえば、アームの慣性モーメントや外力など)は、制御の過程で学習しております。

この場合の学習とは、アームに加えた力とアームの運動に関わる観測結果をシステム内部で物理モデルにあてはめてパラメータを推定しているわけで、力を印加した際の動きを観測しているという意味では、ジグソーパズルのピースをあてはめてみているのと類似した状況が生じています。つまり、力を印加してみないことには、アームも運動せず、アームを制御するための適切な制御パラメータも知ることができない。行動してはじめて、いかなる行動が適切であるかを知ることができます。

上記引用部の後半は、幼児が運動能力を獲得する過程を議論しているのですが、場所の傾斜や自己の運動能力などの思考を取り巻く環境をフィードバックする形でニューラルネットワークの形成がおこなわれる。これもある意味では当たり前のことであるといえるでしょう。

環境を利用する知性

同書では、知性の環境の利用について多々触れているのですが、よく考えてみれば、こんなことはあたりまえの話であるようにも思えます。

これは、計算をすることを考えてみてもわかることです。ものを数える際の頭で記憶する以外の、小石を置いたり紙に正の字を書いて数えることも環境の利用です。筆算も環境の利用なら、電卓やコンピュータを使うことも環境の利用に他なりません。一般に、書物やインターネットを利用してものを調べたり、問題解決を図ることも、環境の利用に他なりません。

人の知性は、個々人の脳という限られた場所で活動しているのではなく、その人の周囲を巻き込む形で活動しているといえるのですね。

考え込む前に走れ

このあたりは、以前BLOGOSにコメントをつけたのですが、今日の日本社会で、個人も企業も、新しいことを始められない理由であるようにも思えます。今日の我が国の企業も個人も、新しいことをはじめるに躊躇してしまう、頭の中ですべて読み切れない間は、実行に踏み切れないでいる、というのですから。

本来知性というものは、環境からのフィードバックを含める形で思考していたのですが、全てを読み切らないと何も始められないとなりますと、知性が本来持つ思考能力を大幅に損ねてしまいます。

日本人や日本企業も、以前はいろいろな試みを活発に行っていたのですが、最近は新たな試みにブレーキがかかる。これは、知性の劣化であるともいえそうな気がいたします。

ホリエモンやイケハヤ師の一見無茶苦茶にみえる物言いも、もしかすると今日の我が国の閉塞状況を打破する、重要な点を指摘しているのかもしれません。(ホリエモンの著書の紹介もご参照ください。)

AIの変遷と知性の形

今回読みました「現れる存在」は、その表題からしてハイデッガーの「現存在(ダーザイン)」をベースとして書かれている書物で、脳科学に近い知性の発現メカニズムを扱いつつも、哲学的観点を意識しております。ただ、ハイデッガー、メルロー・ポンチと続く同書がベースとする正統派(?)現象学の系譜は、私には哲学の正統な発展過程とも思われず、本来歩むべきカントからフッサールに続く哲学の道を自然科学の方向に踏み外してしまっていると認識しております。(原文の“Being There”がハイデガーのいう「現存在」、ドイツ語の “Dasein” を意味します。用例はこちらのアブストラクト部分など。ちなみに、本書の邦題「現れる存在」も、漢字だけ拾えば「現存在」でして、訳者もこのあたりを意識してたように思われます。それが読者に伝わったかどうかは別の話なのですが。)

そういう観点から今日のAI研究をながめますと、哲学的に大きな問題を抱えているように思われてなりません。

カントは人の知性を理性と悟性に分けて扱っております。理性とは、言語的、論理的な知性のあり方である一方、悟性とは直感的、非言語的な知性のあり方であり、知覚を概念化する働きが悟性の重要な働きなのですが、悟性には理性の働きの幅広い部分をカバーすることもできます。これは、頭で考える理性の働きを、「体が覚える」と言われるような、直観的、反射的な判断に置き換えることで、多くの場合、同様の動作を繰り返し行うことで、頭で考えることなく反射的に対応できるようになります。

外国語も、習い始めたばかりの時は、理性がボキャブラリを探り、文法規則をあてはめて理解しようとします。しかしながら、場数を踏み経験を重ねてまいりますと、言葉を聞き単語を見れば、考えることなく、直観的にその言葉の持つイメージを把握することができます。これは、理性が担っていた言語理解能力を悟性が担うようになったと言えるでしょう。

理性は、一度に一つのことしか扱えず、考えるにも時間がかかります。これは、瞬時に反応する悟性の働きに比べて理性の劣る点です。一方で、悟性は応答が速く複数のタスクを同時にこなすことができるのですが、対象となるのはこれまでに何度も経験したことで、全く新しいことには対応できないという問題があります。

そして、最近はやりの「ディープラーニング」に代表される今日研究が盛んにおこなわれているAIは、悟性に対応する知性、人間の頭の中にあるのと同様な、ニューラルネットワークによって実現される知性なのですね。

確かに、悟性は理性がなしていた知的タスクを理性に代わって実行することができます。そして、多くの場合、悟性は理性よりもうまくそれをやってのけます。意識しないでも二足歩行ができ、言語を理解し、風景から目的とするものを見つけ出す。これらは悟性のなせるわざであり、無意識のうちにきわめて高速に、他のことを考えながらでも実行することができます。

ただし、悟性の知的作用は、繰り返しそれを行うことにより獲得されます。これは、今日研究されているAIが、ディープラーニングと呼ばれる教示過程を経て初めて知的能力を獲得することとよく似ております。

そして、人間の知的能力を機械的に実現しようと思えば、少々非効率的ではあるものの新しい問題にも対処できる、理性の部分についても考えてみる必要があるでしょう。

理性はいかに実現されるか

第五世代コンピュータなどと呼ばれるAIが研究されていた時代には、主に知識ベースと呼ばれる方式が研究対象となっていました。このシステムは、多数のルール(言語を処理するなら辞書と文法のルール)を保持し、与えられた入力に対して知識ベースとパターンマッチングすることにより問題を解決する(たとえば翻訳をしたり、定理を証明したり、数式を解いたりする)ことがおこなわれておりました。

この場合は、与えられた知識の範囲内でのみ考えることができるという限界はありますが、さまざまな専門家の知識をデータベース化すれば、それぞれの分野の専門家に代わって問題を解くことができるであろうと期待されておりました。

この方式は、言語化された知識を対象に思考すること、つまりは論理的思考能力であることから、人間の知性でいえば理性に非常に近い形式をもっています。でも、人間の理性がかつて経験したことのない問題にも対応できるのに対し、知識ベースのAIは、あらかじめ与えられた範囲の問題のみを処理することができるという限界がありました。

人間の理性がどのように構成されているか、これまでのところ明確な解は与えられておりません。おそらくそれは、何らかのシーケンシャルなメカニズムに従って処理がおこなわれているはずですし、どこかにこの処理を専門に行うセンター的な部分があるのでしょうし、これを構成するデバイスは、悟性と同じ、ニューラルネットワークであろうと思われます。

今日のAI研究の中心は、ニューラルネットワークそのものであり、人間でいえば悟性に相当する部分が主に研究されています。これはいうなれば、知性のうちの「体で覚える」部分であり、体育会系の知性のあり方ともいえるでしょう。

でも人の知性の優れた部分は、理性の部分を兼ね備えた点にあり、この部分を含むAIができてはじめてAIは人の知性を凌駕することができます

単なる論理的な思考能力だけであれば古くから研究されていた知識ベースに基づくAIでも対応できるのですが、今後求められることは、理性を含む人の知性に対応した、未経験の問題も論理的に処理できるAIであるはずです。

今日のAI研究の進歩は、確かに急速ではあるのですが、一般に思われているほどAIの未来はバラ色でもない、これが人間を凌駕するためには、まだまだ越えなければいけないハードルがあるように私には思われます。