ホーキンス 考える脳考えるコンピュータ (2005) |
Jeff Hawkins & Sandra Blakeslee, On Intelligence, 2004
2016.9.8 更新2016.9.17
松田さんの本に、ホーキンスのHTM理論の有望性が語られていましたので、この本も、ゆっくり読むことにしました。
2004年に出版されたこの本の日本語訳は、2005年にランダムハウス講談社から出版されました。
原題は、インテリジェンスについて、ですが、インテリジェンスは、知能、理解力という意味のほかに、
諜報、情報機関における情報、情報収集の意味ももっているために、題を変えたのだと思われます。
副題は、How a New Understanding of the Brain will Lead to the Creation of Truly Intelligent Machine
和訳すると、脳の新しい理解は、いかにして真の知能機械の創生に導くか です。
日本語訳には、「日本のみなさんへ」という著者からのメッセージが掲載されているのですが、最初に、
知能について、あるいは知能を備えた機械についての新しいアイデアが喜んで受け入れられるとすれば、
その最初の場所は日本だろう。 と、日本に対する期待が表明されています。
また、日本語訳には、原書の巻末の Appendix: Testable Predictions が専門的な内容のため省略されているのですが、
その日本語訳は、出版社のランダムハウス講談社のホームページにおかれていました。
ところが、あいにく、ランダムハウス講談社は、倒産し、ホームページがなくなりましたので、今は、読むことはできません。
また、英語版の出版後、彼は、この本で提案した理論を、ソフトウェアでシミュレーションする方法を開発しつつあります。
興味ある方は、この本のアフターケアのサイト http://www.onintelligence.org/ を訪れてくださいとのことですが、
その最初に、彼が作った Numenta という会社で、この本で記述した大脳新皮質の理論に基づいたHTM技の開発を進めていると、
紹介されます。 http://www.numenta.com
このNumenta のサイトでは、最初の紹介分の最後に、Open Source Community が、http://numenta.org にあることが紹介されますが、
その下の目次リストの、Papers, Videos & More のコーナーに、BAMI (Biological and Machine Intelligence) という本が、現在執筆中ですが、
web site に置かれていて、読むことが出来ます。この本は、公開されていますので、読んでみたい日本人のために、翻訳することにしました。
といっても、和訳ではなく、対比直訳です。http://www.geocities.jp/think_leisurely/BAMI.html
英文のほうも読んで、英文のいいまわしにも、馴れてください。
Numenta のサイトには、ほかにも大量の情報が、公開されていますので、ゆっくりと見たり読んだりして、理解できたところを、
私のこの頁で紹介したいと考えています。
ホーキングのHTM 理論は、階層的時間記憶 Hierachhical Temporal Memory の意味ですが、
人間は、視覚や聴覚などで、外界から得た情報を、記憶して、その記憶から、外界のモデルを作成し、外界を予測することにより、
知的な活動が可能になることに注目した理論です。
脳の中で、この記憶を司る部分は、大脳新皮質 (Cerebral Neocortex) で、爬虫類以上にみられ、
哺乳類では、大脳の殆どを占めるわけですが、層構造をしていることが知られています。
視覚においては、視神経の100万本の繊維によって、まず視床を通り大脳新皮質の第一次視覚野(V1野) に到達します。
V1野のニューロンには、決まった入力パターンだけに反応するという特徴があり、例えば、あるニューロンは、線分、つまり、
何かの端があって、それが30度傾いているときに激しく興奮します。
そして、V1野から、V2野、V3野、IT野と、階層があがっていくにつれ、物体とか顔とかを認識していくことが知られています。
コンピュータで実現しているニューラルネツトワークは、この仕組みを真似ようとしているわけですが、ホーキンスは、
この本の第6章 新皮質の実際の働き で、これから説明する新しい枠組みは、この本ではじめて世に問われると語りながら、
新しいモデルを提案します。
この本が2004年に出版されてから、すでにかなり時間がたっていますので、階層的時間記憶の解明には、
かなりてこずっているのではないかと思われます。
テレビカメラが、四角いエリアを映し出すのと違って、人間の目は、かなり広い視野をもっているので、
網膜に映る映像は、かなり歪んでいます。また、右目と左目は、三次元的に外界を見るので、歪みを直しても、重なりません。
結局、人類は、三次元的な空間を頭の中に構築して、そこに、外界を配置するという能力を開発しました。
頭を動かして、外界を観察するときに、網膜には、カメラを動かしたときと同じように、映像が動いているのですが、
私たちは、外界は固定されていて、自分の頭が動いているという認識をします。
最近急速に発展しているバーチュアルリアリティは、この没入感を大事にします。
人間の眼には、盲点という欠点があります。二つの眼で見て、補い合っているというような説明がされることがありますが、
片目で外界を見ても、盲点は意識されません。両目を閉じていて、新しい景色の前で、片目だけ開けても、
目の前に見える映像に、盲点によって見えないところは、ありません。
人間が、頭の中に構築した三次元空間モデルに、見えないところがあっては不便なので、かなり複雑なことをして補っているのだと思います。
大脳新皮質は、階層構造を持っているのですが、コンピュータのニューラルネットワークが、一方向にしか情報を流さないのに、
脳では、逆方向の流れもありますので、盲点による視覚の欠測は、上手に、補完されるのかもしれません。
音楽を聴くときも、単に、受動的に音楽を聴くのではなく、音楽に関するモデルを持っていて、それと比較することにより、
音楽をきいているのだと思いますし、言葉に関しても、頭の中に、意味の世界を構築していて、耳から聞こえる言葉に対して、
意味の世界が反応することにより、言葉を理解できるというようなことが、起こっているのかもしれません。
コンピュータによる人工知能には、いろんなアプローチがあります。最近急速に発展した、人の顔の認識においては、
人間の顔の特徴点をいくつか定義して、それを画像処理で求めることにより、コンピュータのほうが、人間よりも、
精度高く、顔の認識ができるようになりました。
深層学習によるニューラルネットも、人間よりも上手に学習できるようになると思います。
人間の脳は、これ以外にどんなことをしているのかは、HTM理論の研究からも、浮かび上がってくると期待しますので、
ホーキンスの研究の進展についても、注視していきたいと思っています。
ホームページアドレス: http://www.geocities.jp/think_leisurely/
自分のホームページを作成しようと思っていますか? |
Yahoo!ジオシティーズに参加 |