ニューラルネットと AI

技術論ばかり先行して、本題がなかなか先に進まないのが難点ですが、、、

バックプロパゲーションによるニューラルネットワークの学習は、教師、つまり、好ましい反応を与える必要があります。人間の脳で行われていることは、教師なしの学習ですから、これを使うことは困難です。それに対して、ヘッブ則、つまり、ニューロンの興奮に寄与した接続(シナプス)を強化する、というやり方は、教師が不要で、人間に近いニューラルネットへの応用も可能です。

しかし、こんな単純なやり方で、好ましいニューラルネットが形成されるようには思えません。(単なる勘だけど)

そこで、好ましさをフィードバックする方法を考えました。

人間でも、面白いことは、努力しなくても覚えてしまうものです。ロールプレイングゲームに熱中すると、町の名前や、怪物の得意技を実に良く覚えます。それをみた教育ママは、勉強も同じようにやってくれたらよいのに、と嘆くのですが、勉強をつまらないと感じていれば、いくら時間を掛けても、なかなか、知識は身に付かないものです。

面白い、という感覚は、おそらく、全てのニューロンに何らかの影響を与えているでしょう。【快信号】と【不快信号】というのを、全てのニューロンにフィードバックさせたらどうでしょうか。直前に興奮したニューロンの、興奮に寄与した接続部は、快信号によって強化され、不快信号によって弱められます。

この信号は、システム全体に対して与えるだけでなく、ボード単位、ケーブル単位にも与えるようにすれば、興奮しているニューロンの集中を抑える働きもできるでしょう。

快信号、不快信号は、ニューラルネットワークの目的に即して生成させることもできますが、複雑さを嫌い、情報量の多さを求めるという、システムの処理内容からも作り出すことができます。そうすれば、ニューラルネットが自動的に賢くなることも期待できますね。