NVIDIAリサーチがCVPRで自律走行チャレンジとイノベーション賞を受賞

'NVIDIA Research wins Autonomous Driving Challenge and Innovation Award at CVPR.'

NVIDIAは、カナダのバンクーバーで開催されるComputer Vision and Pattern Recognition Conference(CVPR)において、自律走行開発の3D占有予測チャレンジで激戦を制し、優勝者として紹介されます。

この競技には、10地域にまたがる約150チームから400以上の投稿がありました。

3D占有予測とは、シーン内の各ボクセルの状態を予測するプロセスであり、つまり3Dバードアイビューグリッド上の各データポイントを指します。ボクセルは、フリー、占有、または不明として識別することができます。

安全で堅牢な自動運転システムの開発に不可欠な3D占有グリッド予測は、NVIDIA DRIVEプラットフォームによって可能になる最新の畳み込みニューラルネットワークやトランスフォーマーモデルを使用して、自律車両(AV)の計画および制御スタックに情報を提供します。

「NVIDIAの優勝ソリューションには、2つの重要なAVの進歩があります」と、NVIDIAの学習と知覚のシニアリサーチサイエンティストであるZhiding Yu氏は述べています。「優れたバードアイビュー認識を生み出す最新のモデル設計を実証することができます。さらに、3D占有予測での10億パラメーターまでのビジュアルファウンデーションモデルの効果と大規模な事前学習の有効性を示しています。」

自動運転の知覚は、画像内のオブジェクトや空きスペースなどの2Dタスクの処理から、複数の入力画像を使用して3Dで世界を理解することに進化しています。

これにより、複雑な交通シーン内のオブジェクトについて柔軟で精密な細かい表現が提供されるようになり、これはNVIDIAのAV応用研究および著名な科学者であるJose Alvarez氏によれば、「自律走行の安全感知要件を達成するために重要です。」

Yu氏は、NVIDIA Researchチームの受賞作品を、6月18日(日)10:20 a.m. PTに開催されるCVPRのEnd-to-End Autonomous Driving Workshopおよび6月19日(月)4:00 p.m. PTに開催されるVision-Centric Autonomous Driving Workshopで発表します。

チャレンジで優勝しただけでなく、NVIDIAはイノベーション賞も受賞し、CVPRワークショップ委員会によれば、「従来のアプローチと比較して、ビュー変換モジュールの開発における新しい洞察を認識し、実際に改善されたパフォーマンスを示しています。」

提出物についてのNVIDIAの技術レポートを読む。

3D占有予測による安全な車両

3D物体検出(物体を検出および表現すること、しばしば3D境界ボックスを使用する)は、AV知覚における中核的なタスクですが、限界があります。たとえば、表現力に欠けるため、境界ボックスは十分な現実世界の情報を表していない可能性があります。また、稀にしか現実世界で見られない道路の危険など、すべての可能なオブジェクトについての分類と基準を定義する必要があります。

それに対して、3D占有予測は、自律走行車両の計画スタックに世界に関する豊富な情報を提供するため、エンドツーエンドの自律走行に必要です。

ソフトウェア定義の車両は、時間をかけて検証された証明済みの新しい開発を継続的に受け取ることができます。CVPRで認められた研究イニシアチブから進化した最新のソフトウェアアップデートにより、新しい機能とより安全な運転能力が提供されるようになっています。

NVIDIA DRIVEプラットフォームは、自動車からデータセンターに至るまで、安全でセキュアなAV開発のためのフルスタックハードウェアおよびソフトウェアを提供する、自動車メーカーにとっての生産への道を提供します。

CVPRチャレンジについて

CVPRの3D占有予測チャレンジでは、推論中にカメラ入力のみを使用するアルゴリズムを開発することが求められました。参加者は、オープンソースのデータセットやモデルを使用することができ、データ駆動型のアルゴリズムや大規模なモデルの探索を容易にすることができます。主催者は、最新の3D占有予測アルゴリズムのベースラインサンドボックスを提供し、実世界のシナリオでのアルゴリズムの性能を評価しました。

NVIDIAのCVPRにおける活躍

NVIDIAは、CVPRで約30の論文やプレゼンテーションを発表しています。自律走行について議論する専門家には、以下が含まれます。

  • 自律走行ワークショップ:Emerging Tasks and Challenges Workshopにおいて、Jose Alvarez氏は、AVの3D知覚に対する新興の課題について説明し、Embedded Vision Workshopにおいて大規模なディープモデルのリアルタイム推論の最適化について説明します。
  • NVIDIAの深層学習ディレクターであるNikolai Smolyanskiy氏は、自律走行ワークショップ:Perception、Prediction、Planning and Simulationにおいて、AVのリアルタイムトラフィック予測について説明します。
  • NVIDIAの著名なエンジニアであるRobin Jenkin氏は、CVPRと併せて開催されるOmniCV Workshopにおいて、魚眼カメラの画像品質について説明します。
  • NVIDIAのAV研究科学者であるXinshuo Weng氏は、Vision-Centric Autonomous Driving Workshopにおいて、自律走行におけるビジョンソリューションについて説明します。

アジェンダの他のトークを見て、6月18日から22日まで開催されるCVPRでNVIDIAについてもっと学びましょう。

注目の画像は、OccNetとOcc3Dによる提供です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

    Discover more

    人工知能

    ChatGPTから独自のプライベートなフランス語チューターを作成する方法

    議論された外国語チューターのコードは、私のGitHubページの同梱リポジトリで見つけることができます非商業利用に限り、自由...

    データサイエンス

    「プロダクションに適したRAGアプリケーションの12のチューニング戦略ガイド」

    「実稼働のための検索増強生成(RAG)アプリケーションのパフォーマンス向上に調整できる戦略とパラメータ」

    機械学習

    「機械学習モデルからの情報漏洩を分析し、制約するための新しいAIの理論的枠組み」

    機械学習アルゴリズムは、複雑で敏感な問題に適用されることから、プライバシーとセキュリティの懸念を引き起こしています。...

    AI研究

    メタAI研究者が生産準備完了の強化学習AIエージェントライブラリ「Pearl」をオープンソース化

    強化学習(RL)は、エージェントが適切なアクションを取り、報酬を最大化するために学習する機械学習のサブフィールドです。...

    データサイエンス

    「Matplotlibのマスタリング:データ可視化の包括的なガイド」

    こんにちは、データ愛好家👋 データはビジュアライゼーションを通じてより理解しやすくなることを知っていますそれは洞察を得...

    AI研究

    このAI研究により、チップデザインに適した言語モデルの独自な手法が紹介されています

    ChipNeMoは、市販のLLMに頼らずに、ドメイン適応技術を用いた産業用チップデザインにおけるLLMの利用を探求しています。これ...