中国における大量生産自動運転の課題

Challenges of mass production autonomous driving in China.

XPeng Motors社の2023年の最近の進展

このブログ投稿は、バンクーバーで開催されたCVPR 2023のEnd-to-End自動運転ワークショップの基調講演に基づくもので、「中国における量産型自動運転の実践」と題されています。

自動運転は、特に中国での運転が世界でもっとも困難な場所の1つであるため、困難な課題です。動的な交通参加者、静的な道路構造、および交通信号が関与する3つの主要な要因があります。特に、信号の静的な幾何学がありながら、意味が動的であるため、交通信号の制御は独自の課題を提供します。以下では、動的なオブジェクトと静的な環境を簡単に見直し、交通信号という興味深く特別なトピックについて深く掘り下げます。

CVPR 2023自動運転ワークショップ | OpenDriveLab

当社パートナーであるVision-Centricとの協力により、今年4つの新しいチャレンジを発表することを誇りに思っています…

opendrivelab.com

動的および静的な課題

中国の自動車にとって、脆弱な道路利用者(VRU)などの動的な交通参加者は、重要な課題を提供します。VRUは予測不可能であり、さまざまなポーズを取り、ドライバーが最も予期しない場所に現れることがあります。大型動物が農村道路に突然現れることがあり、ペットが都市の通りに迷い込むことがあります。また、完全に荷物の詰まった車両や三輪車は、正確な車両タイプを特定することが困難です。中央列の最後の写真を考えてみると、最初にシーンを認識するのは人間でも非常に困難です。木の枝で満載された車両は、誤って完全にカモフラージュされています。

Various dynamic road users (chart made by author)

静的な道路構造とトポロジーも、自動運転車にとって重大な課題を提供する可能性があります。たとえば、ここに示されている複雑な交差点は、扱う必要のある複雑さのレベルを示しています。SF映画からのスクリーンショットに似ていますが、実際にはGoogle Earthで見ることができる場所です。

Satellite images of an complex intersection (chart made by author)

拡大すると、中国特有かもしれない興味深い道路要素を見つけることができます。左折待ちエリアは、左折交通量のスループットを増やすように設計されており、一度の交通信号サイクル内でより多くの車両が交差点を通過できるようにします。設計には対称性がない場合があり、各方向は交通パターンに応じて個別に設計されます。そして、それに関する学術論文を見つけることができ、その有効性が証明されています。良い意図で提案されたものですが、新しいドライバーや自動運転車にとっては混乱を招く可能性があります。

待ちエリアとの交差点で左折するには、2つの手順が必要です。それぞれが異なる交通信号の組み合わせを必要とします。ここでは、最も一般的な交通信号パターンのみを示しました。交通信号の組み合わせはより複雑で、待ちエリアに専用の交通信号が含まれることがあります。

Left turn waiting areas are backed up by scientific papers (chart made by author)

角落ちケースの王様:交通信号

これで、交通信号のすべての角落ちケースについて深く掘り下げることができます。交通信号は、おそらく最も長いテールの角落ちケースを持つオブジェクトのカテゴリーです。交通信号の知覚は、2つの異なる理由で複雑です。まず、交通信号の場所、タイプ、色を認識する必要があります。また、検出したすべての交通信号の中で、車両が注目すべき信号をどれにすべきかを知る必要があります。この決定を行うには、交通信号と異なる車線の正しいマッチングを取得することが重要です。

中国の典型的な信号機シーン(著者によるチャート)

バス用の信号機は特別なタイプの信号機の1つです。2つの異なる理由で正しく認識する必要があります。まず、自律型車両の計画と制御のために、注意を払う必要がある信号機とは異なる情報を提供する可能性があるため、無視するために正しく認識する必要があります。また、近くのバスがどのように操舵するかを予測するために、その状態を正確に把握する必要があります。

バス用信号機(著者によるチャート)

中国のバス用信号機には、「BRT」「SRT」「バス」または単一の「B」といったラベルの付いたLEDライト、または「公交」(バス)や「有轨电车」(モノレール)などの特定の中国語の文字が表示されることがあり、可愛らしいバスを描いたアイコンが表示されることもあります。これらの特徴に加えて、交通標識の修飾子も含まれる場合があるため、自動運転車両がこれらの機能を検出して正確に対応するためには、それらを正確に検出して認識することが必要です。

マルチバルブ信号機(著者によるチャート)

バス専用信号機に加えて、もう1つの複雑なタイプの信号機がマルチバルブ信号機です。従来の信号機では1つの電球しか点灯しないのに対して、マルチバルブ信号機では同じソケット内で複数の電球が同時に点灯することがあります。したがって、信号機ボックスを検出するだけでは十分ではなく、個々の電球を検出してその意味を正確に解釈することも同様に重要です。

マルチバルブ信号機には、次の色の変更までのカウントダウンタイマーが表示されることがあります。北米では歩行者用のカウントダウンタイマーをよく見かけますが、これらのタイマーは車両用です。この情報が正しく使用されれば、スムーズな走行を改善するための計画に役立つ可能性があります。

カウントダウンタイマー用信号機(著者によるチャート)

カウントダウンタイマーは、さまざまな形式で表示されることがあります。単独のディスプレイであったり、信号機システムに統合されていたりすることがあります。数字の形式は、先頭のゼロの使用または不使用、使用されるフォントの違いなどがあります。さらに、プログレスバーのスタイルで設計された信号機もあります。これには、プログレスバーが徐々に短くなってから別の色の完全なプログレスバーに変わるアニメーションが含まれます。このデザインは最も革新的と考えられるかもしれませんが、知覚エンジニアにとっても課題を提供する可能性があります。

左折待ちエリア用信号機(著者によるチャート)

最後に、待ちエリア専用の信号機があります。アイコンやテキストの形を取ることができます。アイコンの場合、ライトが徐々に点灯して待ちエリアに案内するアニメーションが表示されることが一般的です。テキストの場合、LEDディスプレイや交通標識ボードに表示されることがあります。テキストの場合、標準的なパターンはありません。これには、光学文字認識(OCR)と自然言語処理の少しの取り扱いが必要で、意味を正確に抽出するために必要です。

XNGP:Xpengの自動運転ソリューション

著者による、量産されたXpeng車両が自動的に左折する様子の録画(動画)

著者による、量産されたXpeng車両が自動的に右折する様子の録画(動画)

これらの課題にもかかわらず、Xpengのチームは、2023年時点で中国で最高クラスの自動運転ソリューションを提供することに成功しました。Surround Reality(SR)ディスプレイには、オンボードパーセプションシステムから得られた情報のみが表示されます。左側では、ディスプレイは道路のジオメトリを正確に検出し、右側では、群れをなす歩行者が道路を横断している一般的なシナリオを描写しています。なお、表示される映像は、アフターマーケットの改造なしに、現在市場で入手可能な量産型Xpeng車両の実際の録画映像を表しています。

このことが可能になった背景については、BEV(鳥瞰図)パラダイムのエンドツーエンドパーセプションスタックであるXNetの展開に関する他の記事をご覧ください。これは、上記の量産型自動運転ソリューションの鍵であり、完全なエンドツーエンドの自動運転ソリューションに向けた堅固な基盤を築いています。

量産型自動運転におけるBEVパーセプション

XNet、XpengのBEVパーセプションアーキテクチャのレシピ

VoAGI.com

まとめ

  • 中国での運転は、普遍的な動的オブジェクト、複雑な道路トポロジー、交通信号機のエクストリームなロングテールのコーナーケースなど、課題が多いです。
  • 交通信号機には多くの特殊なタイプがあり、それぞれに多くのコーナーケースが存在します。場合によっては、複数の交通信号機を一緒に考える必要があり、近くのカウントダウンタイマーや交通標識とも考慮する必要があります。
  • Xpeng Motorsは、これらの課題に立ち向かい、2023年時点で中国で最高クラスの量産型自動運転製品を提供しています。

参考文献

  • Ma, Wanjing, et al. “Increasing the capacity of signalized intersections with left-turn waiting areas.” Transportation Research Part A: Policy and Practice 105 (2017): 181–196.

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

デシAIは、DeciDiffusion 1.0を公開しました:820億パラメータのテキストから画像への潜在的拡散モデルで、安定した拡散と比べて3倍の速度です

問題の定義 テキストから画像を生成することは、人工知能において長い間の課題でした。テキストの説明を鮮明でリアルな画像に...

人工知能

Taplio LinkedInの成長に最適なAIツール

Taplioは、LinkedIn上で個人ブランドを成長させるのをサポートするために設計されたAIツールです

AI研究

スタンフォード研究者がGLOWとIVESを使用して、分子ドッキングとリガンド結合位姿の予測を変革しています

ディープラーニングは、スコアリング関数の改善により、分子ドッキングの向上の可能性を持っています。現在のサンプリングプ...

機械学習

「Declarai、FastAPI、およびStreamlitを使用したLLMチャットアプリケーション— パート2 🚀」

前回のVoAGI記事(リンク🔗)の人気を受けて、LLMチャットアプリケーションの展開について詳しく説明しました皆様からのフィ...

人工知能

コード生成のための5つのChatGPTの代替手段:超高速開発へのハイパードライブ

「ChatGPT の代わりにコード生成を強化し、開発を加速させるための 5 つの強力な代替手段を見つけよう最高のツールをいくつか...

データサイエンス

説明可能なAI:ブラックボックスモデルの解明

イントロダクション 現代のデータ駆動型の世界では、機械学習はさまざまな産業でますます重要な役割を果たしています。説明可...