「GPUの加速なしで大規模なシーンをリアルタイムでマッピングできるのか?このAI論文は、高度なLiDARベースの位置特定とメッシュ作成のために「ImMesh」を紹介します」

「GPUの加速なしで大規模なシーンをリアルタイムでマッピングできるのか?AI論文「ImMesh」が高度なリダーベース位置特定とメッシュ作成を紹介!」

実際の世界にマッチする仮想環境を提供することで、メタバース、VR / AR、ビデオゲーム、物理シミュレータを含む3Dアプリケーションの広範な普及が人間の生活スタイルを向上させ、生産効率を向上させています。これらのプログラムは、実際の環境の複雑なジオメトリーを代表する三角形メッシュに基づいています。現在のほとんどの3Dアプリケーションは、オブジェクトモデリングの基本ツールとして、頂点と三角形の面を集めた三角形メッシュに依存しています。 レンダリングとレイトレーシングの最適化と高速化の能力に無鉄砲であり、センサーシミュレーション、高密度マッピングと測量、剛体力学、衝突検出などでも有用です。しかし、現在のメッシュは、大規模なシーンメッシュの大量生産の能力を妨げるCADソフトウェアを使用して作成された優れた3Dモデラーの出力であることがほとんどです。 そのため、3D再構成コミュニティでは、特に大規模なシーンに対して実時間のシーン再構成が可能な効率的なメッシュアプローチの開発が注目されています。

コンピュータ、ロボット工学、3Dビジョンにおける最も困難な課題の1つは、センサー測定から大規模シーンのリアルタイムメッシュ再構成です。これには、近くにある三角形の面でシーン表面を再作成し、エッジで接続する必要があります。幾何学的なフレームワークを高い精度で構築することは、この困難な課題にとって不可欠であり、実世界の表面で三角形の面を再構築することも重要です。

リアルタイムなメッシュ再構成と同時位置推定の目標を達成するために、香港大学と南方科技大学の最近の研究では、ImMeshというSLAMフレームワークが紹介されています。 ImMeshは、正確で効率的な結果を提供するために協力して作動する4つの相互依存モジュールに依存する、細心の注意を払って開発されたシステムです。 ImMeshは、メッシュ再構成と同時にローケライゼーションを達成するためにLiDARセンサーを使用しています。 ImMeshには、以前の研究で構築された新しいメッシュ再構成アルゴリズムであるVoxelMapが含まれています。具体的には、提案されたメッシングモジュールはボクセルを使用して3次元空間を分割し、新しいスキャンからポイントを含むボクセルを迅速に特定することができます。効率的なメッシングの次のステップは、次元を減少させることであり、これによりボクセルごとの3Dメッシュ化の問題が2Dの問題に変換されます。最後の段階では、ボクセル単位のメッシュのプル、コミット、プッシュプロシージャを使用して三角形面をインクリメンタルに再作成します。 チームは、これが従来のCPUを使用して大規模なシーンの三角形メッシュをオンラインで再作成するための最初の公開努力であると主張しています。

研究者は合成データと実世界のデータを使用して、ImMeshの実行時間のパフォーマンスとメッシュ化の精度を徹底的にテストし、その結果を既知のベースラインと比較してどれだけうまく機能するかを確認しました。まず、まとめてデータを収集することで、データ収集中にメッシュが迅速に再構築されていることを確認するために、メッシュのライブビデオデモを示しました。その後、異なるシナリオで4つの別々のLiDARセンサーによって取得された4つの公開データセットを使用して、ImMeshを徹底的にテストしてシステムのリアルタイム能力を検証しました。最後に、実験3でのImMeshのメッシング性能を既存のメッシングベースラインと比較してベンチマークを確立しました。結果によると、ImMeshはすべてのアプローチの中で最高の実行時間パフォーマンスを維持しながら、高いメッシング精度を達成しています。

彼らはまた、LiDARポイントクラウドの補強にImMeshを使用する方法を実証しています。この方法は、生のLiDARスキャンよりも密集して広い視野(FoV)を持つ規則的なパターンで補強ポイントを生成します。アプリケーション2では、彼らは自分たちの作品をR3LIVE ++およびImMeshと組み合わせることで、シーンのテクスチャ再構築の目標を損なうことなく達成しました。

チームは、空間解像度に関してはスケーラブル性に乏しいという大きな欠点を強調しています。固定された頂点密度のため、ImMeshは大きな平らな表面を扱う際に数多くの小さな面を非効率的に再構築する傾向があります。提案されたシステムにはまだループ補正メカニズムがないため、これが2番目の制限です。これは、再訪問領域での累積ローカリゼーションエラーによる徐々のドリフトの可能性があることを意味します。再訪問の問題が発生すると、再構築結果が一貫していないかもしれません。LiDARポイントクラウドを使用したループ識別の最近の作業をこの作業に取り込むことで、研究者はこの問題を克服するのに役立ちます。ループ検出アプローチを利用することで、リアルタイムでループを識別し、ドリフトの影響を軽減し、再構築結果の信頼性を高めるためにループ補正を実装することが可能になります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

人間とAIの協力

「AIと人間の知能の関係を探求する中で、最近のGenAIの出現は、その人間の知能を超越する能力について疑問を投げかけています」

データサイエンス

ChatGPTが知能的ですか? 科学的なレビュー

約1年前、OpenAIはChatGPTをリリースし、世界中を席巻しましたChatGPTは、コンピュータとの対話を、従来のより制約の少ない、...

機械学習

(Samsung no AI to chippu gijutsu no mirai e no senken no myōyaku)

サムスンエレクトロニクスは、韓国ソウルにあるサムスンの研究開発キャンパスで開催されたサムスンAIフォーラム2023で主役と...

データサイエンス

GPT-4 新しいOpenAIモデル

近年、人工知能に基づく自然言語システムの開発は前例のない進歩を遂げています

AI研究

シンガポール国立大学の研究者たちは、ピクセルベースと潜在ベースのVDMを結びつけたハイブリッド人工知能モデルであるShow-1を提案しますこれはテキストからビデオを生成するものです

シンガポール国立大学の研究者たちは、Show-1というハイブリッドモデルを導入しました。テキストからビデオを生成するための...

機械学習

一緒にAIを学ぶ - Towards AI コミュニティニュースレター第4号

おはようございます、AI愛好者の皆さん! 今号では、Activeloopと共同で取り組んでいる大規模な言語モデル(LLM)のパフォー...