NVIDIAリサーチがCVPRで自律走行チャレンジとイノベーション賞を受賞

'NVIDIA Research wins Autonomous Driving Challenge and Innovation Award at CVPR.'

NVIDIAは、カナダのバンクーバーで開催されるComputer Vision and Pattern Recognition Conference(CVPR)において、自律走行開発の3D占有予測チャレンジで激戦を制し、優勝者として紹介されます。

この競技には、10地域にまたがる約150チームから400以上の投稿がありました。

3D占有予測とは、シーン内の各ボクセルの状態を予測するプロセスであり、つまり3Dバードアイビューグリッド上の各データポイントを指します。ボクセルは、フリー、占有、または不明として識別することができます。

安全で堅牢な自動運転システムの開発に不可欠な3D占有グリッド予測は、NVIDIA DRIVEプラットフォームによって可能になる最新の畳み込みニューラルネットワークやトランスフォーマーモデルを使用して、自律車両(AV)の計画および制御スタックに情報を提供します。

「NVIDIAの優勝ソリューションには、2つの重要なAVの進歩があります」と、NVIDIAの学習と知覚のシニアリサーチサイエンティストであるZhiding Yu氏は述べています。「優れたバードアイビュー認識を生み出す最新のモデル設計を実証することができます。さらに、3D占有予測での10億パラメーターまでのビジュアルファウンデーションモデルの効果と大規模な事前学習の有効性を示しています。」

自動運転の知覚は、画像内のオブジェクトや空きスペースなどの2Dタスクの処理から、複数の入力画像を使用して3Dで世界を理解することに進化しています。

これにより、複雑な交通シーン内のオブジェクトについて柔軟で精密な細かい表現が提供されるようになり、これはNVIDIAのAV応用研究および著名な科学者であるJose Alvarez氏によれば、「自律走行の安全感知要件を達成するために重要です。」

Yu氏は、NVIDIA Researchチームの受賞作品を、6月18日(日)10:20 a.m. PTに開催されるCVPRのEnd-to-End Autonomous Driving Workshopおよび6月19日(月)4:00 p.m. PTに開催されるVision-Centric Autonomous Driving Workshopで発表します。

チャレンジで優勝しただけでなく、NVIDIAはイノベーション賞も受賞し、CVPRワークショップ委員会によれば、「従来のアプローチと比較して、ビュー変換モジュールの開発における新しい洞察を認識し、実際に改善されたパフォーマンスを示しています。」

提出物についてのNVIDIAの技術レポートを読む。

3D占有予測による安全な車両

3D物体検出(物体を検出および表現すること、しばしば3D境界ボックスを使用する)は、AV知覚における中核的なタスクですが、限界があります。たとえば、表現力に欠けるため、境界ボックスは十分な現実世界の情報を表していない可能性があります。また、稀にしか現実世界で見られない道路の危険など、すべての可能なオブジェクトについての分類と基準を定義する必要があります。

それに対して、3D占有予測は、自律走行車両の計画スタックに世界に関する豊富な情報を提供するため、エンドツーエンドの自律走行に必要です。

ソフトウェア定義の車両は、時間をかけて検証された証明済みの新しい開発を継続的に受け取ることができます。CVPRで認められた研究イニシアチブから進化した最新のソフトウェアアップデートにより、新しい機能とより安全な運転能力が提供されるようになっています。

NVIDIA DRIVEプラットフォームは、自動車からデータセンターに至るまで、安全でセキュアなAV開発のためのフルスタックハードウェアおよびソフトウェアを提供する、自動車メーカーにとっての生産への道を提供します。

CVPRチャレンジについて

CVPRの3D占有予測チャレンジでは、推論中にカメラ入力のみを使用するアルゴリズムを開発することが求められました。参加者は、オープンソースのデータセットやモデルを使用することができ、データ駆動型のアルゴリズムや大規模なモデルの探索を容易にすることができます。主催者は、最新の3D占有予測アルゴリズムのベースラインサンドボックスを提供し、実世界のシナリオでのアルゴリズムの性能を評価しました。

NVIDIAのCVPRにおける活躍

NVIDIAは、CVPRで約30の論文やプレゼンテーションを発表しています。自律走行について議論する専門家には、以下が含まれます。

  • 自律走行ワークショップ:Emerging Tasks and Challenges Workshopにおいて、Jose Alvarez氏は、AVの3D知覚に対する新興の課題について説明し、Embedded Vision Workshopにおいて大規模なディープモデルのリアルタイム推論の最適化について説明します。
  • NVIDIAの深層学習ディレクターであるNikolai Smolyanskiy氏は、自律走行ワークショップ:Perception、Prediction、Planning and Simulationにおいて、AVのリアルタイムトラフィック予測について説明します。
  • NVIDIAの著名なエンジニアであるRobin Jenkin氏は、CVPRと併せて開催されるOmniCV Workshopにおいて、魚眼カメラの画像品質について説明します。
  • NVIDIAのAV研究科学者であるXinshuo Weng氏は、Vision-Centric Autonomous Driving Workshopにおいて、自律走行におけるビジョンソリューションについて説明します。

アジェンダの他のトークを見て、6月18日から22日まで開催されるCVPRでNVIDIAについてもっと学びましょう。

注目の画像は、OccNetとOcc3Dによる提供です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

    Discover more

    機械学習

    最終的なDXAネーション

    人工知能(AI)と機械学習(ML)は、医療を革新し、私たちを精密医療の時代に導いていますAI健康モデルを開発する動機は、死...

    機械学習

    このAIニュースレターは、あなたが必要とするすべてです #55

    今週、私たちはついにOpen AIのCode Interpreterをテストすることができ、ChatGPT内のGPT-4の新機能に興奮していましたOpenAI...

    機械学習

    このAIニュースレターは、あなたが必要とするすべてです #56

    今週、オープンソースとクローズドモデルの両方で、LLMの世界にいくつかの新しい競合他社が登場しました印象的な機能を持つに...

    データサイエンス

    『ラグランジュの未定乗数法、KKT条件、そして双対性 - 直感的に説明する』

    この物語では、数理最適化に関連する3つの明確で洞察力のある概念を探求しますこれらの概念は、私が完全に理解するために相当...

    AIニュース

    トップ40+の生成AIツール(2023年10月)

    ChatGPT – GPT-4 GPT-4はOpenAIの最新のLLMであり、これまでの前任者よりも革新的かつ正確で安全です。 また、画像、PDF、CSV...

    AI研究

    「UCLA研究者が「Rephrase and Respond」(RaR)を導入、LLMsの人間の質問理解を向上させる新しい人工知能手法を紹介」

    研究チームは、Rephrase and Respond(RaR)という方法を導入しました。これは、LLMsのパフォーマンスを向上させるために、人...