発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Intuitive physics learning using deep learning models inspired by developmental psychology.

物理世界の理解は、ほとんどの人が自然に行っている重要なスキルです。しかし、これは人工知能にとってまだ課題です。現実世界で安全かつ有用なシステムを展開するためには、これらのモデルが私たちの直感的な物理的感覚を共有することを望みます。しかし、これらのモデルが物理世界を理解する能力をどのように測定するのか、という別の課題があります。つまり、物理世界を理解するとはどういう意味であり、それをどのように定量化することができるのでしょうか。

幸いなことに、発達心理学者たちは数十年にわたり、乳児が物理世界について知っていることを研究してきました。途中で、彼らはぼんやりとした物理的知識の概念を具体的な物理的概念のセットに分割しました。そして、彼らは乳児を対象としたこれらの概念をテストするための「期待違反」(VoE)のパラダイムを開発しました。

本日、私たちの論文がNature Human Behaviorに掲載され、Physical Conceptsデータセットをオープンソース化しました。この合成ビデオデータセットは、VoEパラダイムを使用して以下の5つの物理的概念を評価します:固体性、物体の持続性、連続性、「変化しなさ」、方向性の慣性。

物理的知識のベンチマークを手に入れたことで、物理的世界について学習することができるモデルの構築に取り組みました。再び、私たちは発達心理学者の研究に着想を得ました。研究者たちは、乳児が物理世界について何を知っているかだけでなく、この行動を可能にするメカニズムも提案しました。変動要素があるにもかかわらず、これらの説明では、物理的世界を一連のオブジェクトに分割し、時間経過とともに進化するという概念が中心的な役割を果たしています。

この研究に触発され、私たちはPLATO(Physics Learning through Auto-encoding and Tracking Objects)というシステムを構築しました。PLATOは、世界をオブジェクトのセットとして表現し、そのオブジェクトが過去にどこにあったか、他のオブジェクトとどのように相互作用しているかに基づいて、将来オブジェクトがどこにあるかを予測します。

シンプルな物理的相互作用のビデオを使用してPLATOをトレーニングした後、PLATOは私たちのPhysical Conceptsデータセットのテストに合格しました。さらに、PLATOと同じ大きさ(またはそれ以上)の「フラット」なモデルをトレーニングしましたが、オブジェクトベースの表現を使用しませんでした。これらのモデルをテストしたところ、すべてのテストに合格しなかったことがわかりました。これは、オブジェクトが直感的な物理学の学習に役立つことを示し、発達の文献からの仮説を支持しています。

また、この能力を開発するためにどれだけの経験が必要かを確認したかったです。物理的な知識の証拠は、2か月半の乳児にも示されています。PLATOはどれくらいの経験を積んだのでしょうか?PLATOに使用されるトレーニングデータの量を変えることで、PLATOが28時間の視覚経験で物理的な概念を学ぶことができることがわかりました。私たちのデータセットの限定的で合成的な性質から、乳児が受ける視覚体験の量とPLATOの比較はできません。しかし、この結果は、直感的な物理学は、世界をオブジェクトとして表現するための帰納的なバイアスを持つ支援があれば、比較的少ない経験で学ぶことができることを示唆しています。

最後に、PLATOの汎化能力をテストしたかったです。Physical Conceptsデータセットでは、テストセットのすべてのオブジェクトはトレーニングセットにも存在します。PLATOにこれまで見たことのないオブジェクトでテストを行った場合はどうなるでしょうか?これを行うために、MITの研究者が開発した別の合成データセットの一部を活用しました。このデータセットも物理的な知識を調査していますが、異なるビジュアルの外観とPLATOが以前に見たことのないオブジェクトのセットを持っています。PLATOは、再トレーニングなしで合格しました。これは、完全に新しい刺激に対してテストされているにもかかわらずです。

このデータセットが、研究者にモデルが物理的世界を理解する能力についてより具体的な理解を提供できることを願っています。将来的には、テストされる物理的概念のリストを増やしたり、新しいオブジェクトの形状や現実世界のビデオを含めた、より豊かな視覚刺激を使用して、直感的な物理学のさらなる側面をテストするために拡張することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ChatGPTの使い方:高度なプロンプトエンジニアリングの方法」

「ChatGPTからより良い結果を得たい場合は、より良いChatGPTプロンプトの書き方を学ぶ必要があります以下には7つの実行可能な...

データサイエンス

「AIがあなたの問題を解決できるでしょうか?」

「AIの能力を製品やサービスに組み込むことを目指す製品企業では、AIに詳しくない人々をAIの流れに乗せるという課題が常に存...

機械学習

テキスト生成の評価におけるベクトル化されたBERTScoreのビジュアルガイド

『AIベースのテキスト生成は明らかに主流に入ってきています自動化されたライティングアシスタントから法的文書の生成、マー...

人工知能

あなたの時間を節約するための6つのGmail AI機能

これらの人工知能(AI)によるGmailの機能は、あなたの電子メールの体験をよりスピーディーで整理されたものにすることができ...

AIテクノロジー

6つのGenAIポッドキャスト、聴くべきです

はじめに 急速に進化する 人工知能(AI)の世界において、生成AI(GenAI)の領域は魅力的でダイナミックな分野として注目され...

AI研究

マイクロソフトの研究者たちは、FP8混合精度トレーニングフレームワークを公開しました:大規模な言語モデルのトレーニング効率を超高速化します

大型言語モデルは、言語生成と理解の能力において以前に類を見ない優れた能力を示しており、論理学、数学、物理学、他の領域...