「MITの研究者たちは、人工知能(AI)の技術を開発しましたこの技術により、ロボットは手全体を使ってオブジェクトを操作するための複雑な計画を立てることが可能になります」

MIT researchers developed AI technology that allows robots to create complex plans to manipulate objects using their entire hand.

全身操作は人間の強みですが、ロボットの弱点です。ロボットは、箱とキャリアの指、腕、または胴体の各接触点を、別々の接触イベントとして解釈します。このタスクは、数十億もの可能な接触イベントを考慮すると準備が困難になります。今、MITの研究者は、このテクニックを効率化することができます。つまり、接触豊富な操作計画と呼ばれるものです。AIのアプローチであるスムージングを使用して、接触の発生回数からロボットのための良い操作計画を見つけるために必要な判断の数を減らすことができます。

RLの新たな展開は、モデルベースの手法を使用して以前には実現が困難だった接触豊富なダイナミクスの操作で驚異的な結果を示しました。これらの手法は効果的でしたが、なぜ成功したのかはまだわかっていません。全体的な目標は、モデルベースの観点からこれらの要因を把握し、理解することです。これらの理解に基づいて、科学者たちはRLの経験的な成功をモデルの汎用性と効果性と統合しようと取り組んでいます。

接触ダイナミクスのハイブリッド性質は、モデルベースの観点からタッチを介した計画にとって最大の課題です。次に生じるダイナミクスは非スムーズであり、テイラー展開は局所的には有効ではなく、勾配を使用して構築された線形モデルはすぐに崩壊します。反復的な勾配ベースの最適化とサンプリングベースの計画の両方が局所的な距離指標を使用するため、局所モデルの無効性は両方にとって深刻な困難を引き起こします。これらの問題に対応するために、多くの出版物では接触モードをリストアップしたり、例を提供したりすることで考慮に入れる試みがなされています。これらの計画者は、ダイナミックモードについてモデルベースの理解を持っており、現在の接触モードでの連続状態の計画と次のモードの離散的な探索を切り替えることがあり、ここかしこで数モードのシフトを持つ軌跡につながります。

研究者が追加した最初のものは、基本的なシステムに対して2つのスムージング戦略が理論的に等価であることを証明することです。さらに、このフレームワークを使用して、著者たちはリアルタイムでスムージングされたダイナミクスの局所線形モデル(すなわち、勾配)を効率的に計算する方法を示し、2つのスムージングスキームの定性的な特性と経験的なパフォーマンスがさまざまな複雑な例で比較可能であることを示しています。

2つ目の改善点は、接触ダイナミクスの完全なモデルです。特に、凸である暗黙の時間ステップ接触モデルを提案しています。アニテスクによる摩擦接触の緩和により、凸性が生じます。ただし、それは現実的にはいくつかの非物理的な振る舞いをもたらします。凸性は、標準的な線形補完問題(LCP)の形式に比べて、数値的な利点を提供します。

準動的な仮定は、ロボット操作で一般的に使用されるものであり、長期的な予測可能性を可能にします。準動的モデルでは、速度や減衰を表す変数は不要です。なぜなら、各時間ステップで運動エネルギーが失われるからです。彼らは、ドレイクという高度な2次シミュレータ上で、同じ入力経路をシミュレートして実行することによって、準動的接触モデルを検証しテストしています。考慮されるシステムが減衰が大きく摩擦力に支配されている場合、その結果は、モデルが2次ダイナミクスをより適切に近似できる可能性があることを示唆しています。

さらに、接触モデルを柔軟に緩和するために、対数バリア緩和を使用することができます。凸システムの内部点法で一般的なように、この緩和戦略では対数バリア関数が使用され、ハードな接触制約が柔軟に適用されます。さらに、専門家は、RLが確率論的なグローバル最適化を実行することを目指していることが、その経験的な成功の背後にあるもう一つの主要な要素であると考えています。決定論的モデルを使用した非線形動的計画は通常、非凸最適化問題を生成し、多くの局所最小値の品質が決定的となる可能性があります。

最後の貢献は、RRTのグローバル探索能力とスムージングベースの接触モード抽象化の統合です。ローカルのスムージングされたモデルから導かれた新しい距離測度を使用することで、研究者はRRTが接触ダイナミクスによって課せられる制約範囲内を探索することを可能にしました。

全体的な貢献

科学者たちは、直感的なシステムにおけるランダム化された平滑化技術と解析的な平滑化技術の質的および経験的な同等性を決定します。

彼らは、凸性のある微分可能な準動的接触ダイナミクスと関連する解析的な平滑化の形式化が、接触豊かな操作計画に大いに役立つことを示しています。

研究者たちは、サンプリングベースのモーションプランニングと接触モードの平滑化を統合することで、既存のアプローチのスペクトルにおけるギャップを埋めつつ、効果的なグローバルプランニングを実現しています。

研究者たちは、複雑なシステムにおける関数の平滑化の数学的な意味と、その局所的な近似値を計算するためのいくつかの戦略について説明した後、接触について議論しています。彼らの目標は、平滑化技術とそれらの間の関係を統一的に示すことです。

研究者たちは、モデルベースのアプローチの失敗と多くの人間の接触がある経験的な状況での強力な成功の間に顕著な違いがあることに着想を得て、この研究を行いました。彼らは、既存のモデルベースの計画法の落とし穴を特定し、RLがこのようなトラップを軽減することがどのように可能になったのかを理解し、モデルベースの技術でこれらの問題を解決することで、接触豊かな操作の計画に効果的に取り組むことができることを示しました。1分程度のオンライン計画を可能にし、環境とタスクに対して汎用性を持つことで、既存のRLのツールに比べて数時間または数日にわたる重いオフライン計算に依存することなく、強力な代替手段を提供しています。これを実現するために可能にしたいくつかの要素も検討しています。

要するに、彼らは、実証的な文脈でのRLの成功とモデルベースのアプローチの苦戦との間に大きなギャップがあることに気付いた後、この研究を行うことに着想を得ました。彼らは、既存のモデルベースの計画法の落とし穴を特定し、RLがこのような落とし穴を軽減することがどのように可能になったのかを理解し、モデルベースの技術でこれらの問題を解決することで、接触豊かな操作の計画に効果的に取り組むことができることを示しました。1分程度のオンライン計画を可能にし、環境とタスクに対して汎用性を持つことで、既存のRLのツールに比べて数時間または数日にわたる重いオフライン計算に依存することなく、強力な代替手段を提供しています。これを実現するために可能にしたいくつかの要素も検討しています。

モデルベースのアプローチにおいては、明示的にモードを列挙し、評価する必要があるという欠点が最初に特定されましたが、RLの確率的な平滑化によって緩和されました。次に、モデルベースの技術における別の欠点を取り上げました:二次のトランジェントが長期的な戦略に役立たない短視的な線形化を引き起こす可能性があります。彼らはこの欠点に対処するために、凸性のある微分可能な準動的接触(CQDC)モデルを提案しました。彼らは、数多くの理論的な議論と実験を通じて、タッチモデルの有用性を示しました。また、接触ダイナミクスをモデルの構造の評価を先に行うことで、解析的に緩和させることも示しました。彼らは、ランダム化された平滑化に比べて解析的な平滑化の計算上の利点を示す研究も行いました。

結論として、平滑化ベースのモデルベースの戦略は、局所的な軌道最適化と関連付けられていることがわかりました。グローバルな探索を試みるRLベースの技術と比較して、局所的な最小値に対する感受性のために、困難な問題でより成功していません。ただし、接触豊かなシステムにおけるSBMP技術は、接触モードを明示的に考慮に入れることにより、モード列挙の罠を回避しています。この研究は、接触モードに基づいた滑らかな代替モデルの局所的な近似値に基づいてRRTの探索フェーズをガイドすることで、既存のアプローチのギャップを埋めることにより貢献しています。これらの3つの進歩を組み合わせることで、モデルベースとRLベースのアプローチが非常に接触豊かで高次元なシステムに対して効率的なグローバルモーションプランニングを達成することが可能になりました。将来的には、ポリシーの検索を促進したり、リアルタイムのモーションプランニングを行うために、高度に効率化されたプランナーバージョンを使用する予定です。この改良により、ロボットは計画時間の数秒以内に、以前未踏の領域で接触豊かなデザインをオンラインで見つけることができると予想されます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

SalesForce AIはCodeChainを導入:代表的なサブモジュールによる自己改訂の連鎖を通じたモジュラーコード生成のための革新的な人工知能フレームワーク

“`html 人工知能の研究における重要な目標の一つは、困難な問題に対処するための有用なコンピュータプログラムを提供で...

データサイエンス

「GPTの内部- I:テキスト生成の理解」

「さまざまなドメインの同僚と定期的に関わりながら、データサイエンスの背景をほとんど持たない人々に機械学習の概念を伝え...

データサイエンス

Weaviate入門:ベクトルデータベースを使った検索の初心者ガイド

Weaviateベクトルデータベースを使用することでできることの3つの例には、セマンティック検索、質問応答、OpenAI LLMsを用い...

データサイエンス

テキストデータのチャンキング方法-比較分析

自然言語処理(NLP)における「テキストチャンキング」プロセスは、非構造化テキストデータを意味のある単位に変換することを...

機械学習

M42がMed42を導入:医療知識へのアクセス拡大のためのオープンアクセスクリニカル大規模言語モデル(LLM)

M42ヘルスは、アブダビ、UAEに拠点を置き、有望な新しいオープンアクセスの臨床大規模言語モデルであるMed42を発表しました。...

機械学習

「ベイチュアン2に会おう:7Bおよび13Bのパラメータを持つ大規模な多言語言語モデルのシリーズ、2.6Tトークンでゼロからトレーニングされました」

大規模言語モデルは近年、大きな進展を遂げています。GPT3、PaLM、Switch Transformersなどの言語モデルは、以前のELMoやGPT-...