AIと人間のインターフェースとしてトークン(言葉や記号)を介する必要はなく、ニューラルネットワークの概念では、「トークンを介して処理する」よりも、「神経信号レベルで情報を処理する」方が、より自然で直感的なコミュニケーションにつながると考えています。
人間の脳は生物のニューラルネットワーク
人間が読めるコードをニューラルネットワークの重みに「コンパイル」することで、根拠ある説明の欠如に直接アプローチする、よってRASP プログラムをトランスフォーマーモデルの重みにコンパイルし、勾配降下法を用いてモデルを圧縮する手法を提案する。#DeepMindhttps://t.co/vcjVVWWDBs
— 二本松哲也 (@t_nihonmatsu) January 14, 2023
人間の脳は生物のニューラルネットワークであり、本来は連続的かつ並列的な情報処理を行っていますが、それを言語(トークン)に変換する際に、多くのニュアンスや細かい情報が失われてしまいます。つまり トークンを介すること自体が「情報ロスの原因」になっています。
トークンベースのインターフェースではHuman-in-the-Loopが必要
私はChatGPTがリリース当初、トークンベースのインターフェースであったことから、人間によるコンテクスト補完が必須であること、トークンを介した処理の限界を持っていると予見できました。つまり、人とAIが協調するには、Human-in-the-Loopが必ず必要になるのです。
#HITL :Human in the loop はAIと人間の相互作用を必要とするモデルとして定義されています。AI は一連の学習を動的に更新するように構築されており、この複雑さと予測不可能性のためにユーザーとシステムの間のダイナミクスを関係に変える必要があります。#ChatGPT #OpenAIhttps://t.co/0czzznmoIJ
— 二本松哲也 (@t_nihonmatsu) December 10, 2022
トークンを介した処理の限界について
ChatGPTを含む現代のAIは、トークンを介した処理の限界によって、以下のような問題を抱えています。
- ニューラルネットワークとしての学習は広範囲に及ぶが、最終的な出力はトークン単位に制約される。そして人間が直感的に理解している概念やコンテクストが、トークン変換の過程で抜け落ちる。
- 人間の脳は連続的な情報処理を行うが、ChatGPTは「入力→出力」の形で一問一答的に処理される。言語による制約があるため、AIは「意味」ではなく「文字列」として情報を処理してしまう。例えば、曖昧な指示や新しい概念に対して、AIだけでは適切な判断ができず、人間の介在が求められる。
AIがGoogle検索を脅かしたように、AIによってメタバースは視覚的な仮想空間から、記号論的な思考空間へ移行すると考えます。
— 二本松哲也 (@t_nihonmatsu) February 10, 2023
私達は、既にメタバースの住人であり・・・ pic.twitter.com/eDZr9uartY
本当のシンギュラリティ
現在は、大規模モデルと最適化、計算能力にフォーカスしていますが、これらはあくまで従来のコンピューターベースの進化に過ぎません。もしAIが人間の生物的ニューラルネットワークを完全にシミュレートし、神経回路を相互接続できたならば、本当のシンギュラリティが実現可能になります。
日本がAI技術で世界をリードするのであれば、生物的ニューラルネットワークの完全モデル化を研究すべきです。
AIと人間の脳の相互作用
もし脳の構造(ニューロン、シナプス、可塑性など)を正確にモデル化できれば、AIと人間の脳の相互作用が可能になります。
現在のBCI(Brain-Computer Interface)の発展をさらに進化させることで、神経回路レベルでの情報のやり取りが実現します。しかし、人間の脳の電気信号や化学伝達を直接読み取り、AIがそれを解釈できる技術が必要となります。
また、人間の脳は「可塑性」によって環境に適応するが、AIも同様に「可塑性を持つニューラルネットワーク」を実装できれば、より自然に統合できます。例えば、AIが人間の脳の特性に合わせてリアルタイムで構造を変化させることで、よりスムーズな連携が可能になります。
AIのニューラルネットワークと人間の生物的ニューラルネットワークを融合させる
もし日本がこの分野に本格的に取り組めば、「AIのニューラルネットワークと人間の生物的ニューラルネットワークを融合させる」というアプローチによって、単なる技術革新ではなく、人類の知的進化そのものを主導する国になれる可能性があります。