横浜の大学の研究者らが提案した「VirSen1.0:センサーに基づく人間のジェスチャー認識システムの開発を効率化するための仮想環境」

Researchers from a university in Yokohama proposed VirSen1.0 a virtual environment to streamline the development of sensor-based human gesture recognition systems.

ジェスチャー認識技術は、センサーの配置と配置、データの解釈、および機械学習の精度において重大な課題に直面しています。微妙な動きをキャプチャするためのセンサーの効率的な設定、結果のデータの信頼性のある解釈、および意図したジェスチャーを正確に認識するための機械学習アルゴリズムの確実な認識は、持続的な問題となっています。これらの問題は、最適なパフォーマンスを妨げるだけでなく、さまざまなアプリケーションでジェスチャーベースのシステムの広範な採用を制限しています。

横浜の大学の研究者チームは、コンピュータ化された人間のジェスチャー認識のための新しいモデルを発表しました。この研究では、仮想的な光学センサーを仮想空間に対話的に配置してジェスチャー推定システムを設計するためのユーザーインターフェース(UI)であるVirSen 1.0の開発について説明しています。これにより、物理的なセンサーの必要性を排除して、ユーザーはセンサーの配置を実験し、ジェスチャー認識に与える影響を評価することができます。

データは、アバターが所望のジェスチャーを行うことによってトレーニングのために収集されます。研究者たちは、センサー管理のシミュレータに関連する作業について議論し、シミュレータ、データ取得、およびモデル作成を組み合わせたアプローチのユニークさを強調しています。大量のトレーニングデータを収集することが実用的ではないため、サポートベクターマシン(SVM)分類器は、放射基底関数カーネルを使用しています。この研究では、順列特徴重要度(PFI)の貢献指標が高い認識率をもたらすセンサー配置の特定において重要性を強調しています。PFIは、個々の特徴がモデルの予測にどのように影響を与えるかを並べ替えることで測定します。PFIは特徴に関する洞察を提供し、試行錯誤のプロセス中にセンサーの配置を最適化するのに役立ちます。

この研究の光学センサーは、赤外線LEDとフォトディテクタトランジスタで構成されています。データの取得は、センサー値が前のフレームと比較して特定の閾値を超えたときに開始されます。人間のジェスチャーは、イナーシャルセンサをキャプチャするモーションキャプチャツールであるXsensを使用して記録されます。スイーティング、ジャンプ、リーニング、および手を上げるなど、6つの3Dジェスチャーが記録されています。実装には、シミュレータのインターフェースの視覚的な表現が含まれており、ユーザーはオブジェクトを配置し、データを収集し、センサーの値を視覚化し、PFIの貢献指標で精度を評価することができます。

研究チームは、シミュレータを改良する計画であり、過去の配置と結果を確認するための追加機能、PFIの貢献指標に基づいたセンサーの配置を提案する機能を含める予定です。将来の課題として、衣類が認識精度に与える影響を考慮していないこと、センサーノイズとエラーモデリングの欠如、処理速度、および認識対象の制限など、特定の制約を解消する予定です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

情報とエントロピー

1948年、数学者のクロード・E・シャノンが「通信の数学的理論」という記事を発表し、機械学習における重要な概念であるエント...

AI研究

アリババAI研究所が提案する「Composer」は、数十億の(テキスト、画像)ペアで訓練された、巨大な(50億パラメータ)コントロール可能な拡散モデルです

現在、テキストベースの生成画像モデルは、多様な写真のような画像を生成することができるようになりました。最近の多くの取...

機械学習

「AnimateDiffとは モデル特有の調整なしでパーソナライズされたテキストからイメージ(T2I)モデルをアニメーション生成器に拡張するための効果的なAIフレームワーク」

テキストから画像(T2I)生成モデルは、研究コミュニティ内外から前例のない注目を集めており、芸術家やアマチュアなどの非研...

AI研究

「UCLとイギリス帝国大学の研究者が、タスク適応型貯水池コンピューティングを通じてエネルギー効率の高い機械学習を発表」

従来のコンピュータは多くのエネルギーを使用します。世界の電力需要の約10%を占めているのです。これは、従来のコンピュータ...

機械学習

「ファストテキストを使用したシンプルなテキスト分類」となります

自然言語処理は、業務のユースケースに指数関数的に適用されていますビジネスを変革する最もシンプルなAI自動化の一つは、テ...

人工知能

中途の旅行 vs 安定した拡散:AI画像生成器の戦い

「Midjourney vs Stable Diffusion、あなたにとって最適なのはどちら?両方のAI画像生成機の強みと弱みを探ってみましょう」