DeepMindのロボキャットに会ってください:複数のロボットを操作するために設計された新しいAIモデル

Meet DeepMind's RoboCat a new AI model designed to operate multiple robots.

ロボットは急速にメインストリーム文化に入りつつありますが、彼らは通常、彼らのプログラミングのために彼らの能力が制限されています。 最近のAIの進歩をロボットの設計に取り入れることの潜在的な利点にもかかわらず、一般的な目的のロボットを開発するための進展は、現実のトレーニングデータを取得するために必要な時間のために遅れています。

多くのタスクを一度に学習し、ヘルパーロボットの実用的な能力に言語モデルの理解を統合する能力を持つロボットの開発は、広範な研究の対象となっています。

DeepMindのRoboCatは、複数のタイプの実際のロボットでさまざまなタスクを解決し適応する最初のエージェントです。 調査結果によると、RoboCatは他の最先端のモデルよりもはるかに速く学習します。 多岐にわたるデータセットから学習するため、100回のデモンストレーションで新しいスキルを習得できます。 この能力は、多目的ロボットを開発するために重要であり、人間の監視されたトレーニング要件を減らすことにより、ロボット工学の研究を加速します。

彼らのマルチモーダルモデルGato(スペイン語で「猫」)は、RoboCatの基盤となっています。仮想世界と現実世界の両方で言葉、視覚、行動を処理できます。 彼らの作品では、何百ものロボットアームがさまざまな仕事をしているビジュアルと動作のデータを含む大規模なトレーニングデータセットとGatoの構造を融合させました。 この初期のトレーニングフェーズの後、チームはRoboCatを新しい活動の「自己改善」トレーニングサイクルに入れました。 各新しい活動は、以下の5つの段階で学習されました。

  • 新しいタスクまたはロボットを人間が制御するロボットアームで100から1000の例を収集する。
  • 新しいタスク/アームのためにRoboCatを微調整して、専門的な能力を持つスピンオフエージェントを生成する。
  • 子のエージェントは、新しいタスク/アームに対して練習を10,000回繰り返し、トレーニングデータプールに追加する。
  • サンプルデータをユーザーの作成物およびデモンストレーションデータと混合して、RoboCatの現在のデータセットに統合する。
  • 更新されたデータセットを使用してRoboCatを再トレーニングする。

RoboCatの最新バージョンは、数百万の軌跡を含むデータセットに基づいています。実際のおよびシミュレートされたロボットアームからのビジョンベースのデータ、および多数のロボットアームを使用して収集されたジョブを描くデータが含まれます。

RoboCatはわずか数時間で複数のロボットアームを使用するようにトレーニングされました。 彼は、二本爪のグリッパーを持つアームで教えられたにもかかわらず、より複雑な三本指のグリッパーを持つアームを使うことを学びました。

RoboCatは、1000人の人間が制御するデモンストレーションを目撃した後、歯車を86%の確率で拾うことができるようになりました。 同じ程度のデモにより、フルーツボウルから正しい果物を選ぶなど、精度と知識の両方が必要なタスクを実行する方法を学びました。

RoboCatのトレーニングは自律的に継続されます。 彼が学ぶほど、彼は学ぶ能力を向上させます。 チームは、各タスクの500のデモから学んだ後、RoboCatの最初のバージョンは、これまで見たことのない活動を実行するために36%しか効果的ではありませんでした。 しかし、最新のRoboCatは、様々な活動にトレーニングされ、2倍の成功を収めました。

チームは、RoboCatが自律的に学習し、スキルを急速に開発できるため、より役立つ汎用ロボットエージェントの新しい世代の道を開くと考えています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

スケッチベースの画像対画像変換:GANを使用して抽象的なスケッチを写実的な画像に変換する

スケッチに長けた人もいれば、他の仕事に才能を持つ人もいます。靴の画像が提示された場合、個人は写真を示す簡単な線を引く...

機械学習

「Jupyter AIに会おう:マジックコマンドとチャットインターフェースでジェネラティブ人工知能をJupyterノートブックにもたらす新しいオープンソースプロジェクト」

Jupyter AIは、Project Jupyterの公式サブプロジェクトであり、Jupyterノートブックに生成型人工知能をもたらします。ユーザ...

コンピュータサイエンス

A.I.が建築家に職場デザインの変革をもたらす方法

より多くのハイブリッド労働者と新しいオフィスのニーズに対応するため、Zaha Hadid Architectsのような企業は解決策として人...

データサイエンス

マシンラーニングに取り組むため、プライベートエクイティはデータサイエンスの才能を採用しています

プライベートエクイティファームは、機械学習とデータ分析を投資プロセスに統合する際、データサイエンスの専門家にデータを...

データサイエンス

「ChatGPTが連邦取引委員会によって潜在的な被害の調査を受ける」

重要な進展として、連邦取引委員会(FTC)が人工知能(AI)スタートアップ企業であるOpenAIの調査を開始しました。OpenAIはAI...