UCSFとUC Berkeleyの研究者たちは、脳幹の脳卒中による重度の麻痺を持つ女性がデジタルアバターを通じて話すことができるようにする脳-コンピューターインタフェース(BCI)を開発しました

UCSF and UC Berkeley researchers have developed a brain-computer interface (BCI) that enables women with severe paralysis from brainstem stroke to communicate through a digital avatar.

人工知能は今日では音声と顔の認識に重要な役割を果たしています。これらの信号は脳の信号によって記録・合成され、AIの劇的な利用を可能にしています。この技術は、これらの信号をテキストにエンコード・デコードすることも、驚くほどの速度で行うことができます。これにより、システムはさらに強力になります。これらの音声と顔の認識の技術は、自然言語処理という広範なカテゴリに属しています。研究者たちはまだ、麻痺した人々のために音声と顔の認識を可能にするAIを探し続けています。

UCサンフランシスコ大学とUCバークレー大学の研究者たちは、脳-コンピュータインターフェースを開発しました。これは、脳の電気的なインパルスと外部デバイス(おそらくはロボットまたはAIチャットボット)との直接的な通信経路とも呼ばれます。麻痺した女性でさえデジタルアバターと会話できるという結果が示されています。これらの研究者は、他の人との最も自然なコミュニケーション方法である強力なコミュニケーション体を埋め込むことを目指しています。AIは、麻痺や話すことができない患者に対する解決策を提供しました。研究者たちは、音声認識に重要な役割を果たす、女性の体表面に長方形の電極を実装しました。これらの電極は、彼女の体を伝わる脳信号またはインパルスを実装し、彼女の認識を容易に利用できるようにしました。研究者たちは、モデルを訓練し、システムが使用する人工知能アルゴリズムを改善することで、システムの正確性を向上させました。これには、異なるフレーズを何度も繰り返し使用し、システム内のNLPのワードバッグモデルを使用しました。研究者たちはまた、AIモデルをトレーニングして、これらの単語を音素に認識・エンコードすることもできるようにしました。これにより、システムの正確性が向上し、以前よりも速くなりました。

研究者たちは、彼女の結婚式の録音声を使用して彼女の声を生成するためのアルゴリズムを開発しました。生成された音声にはいくつかの欠陥がありましたが、後に研究者たちは以前に生成された声の品質を改善するために取り組みました。これらの研究者はまた、女性の顔認識に役立つデジタルアバターも開発しました。研究者たちはまた、女性の脳信号とアバターを統合する機械学習モデルも作成しました。これにより、彼女の顎、唇、舌、口などのすべての動きが記録されました。

研究者たちは、人体とソフトウェアの間のワイヤレス接続のためのこのセットアップについてまだ取り組んでいます。これは、このモデルの次のバージョンになるでしょう。このモデルの主な利点は、直接的な接触がないことです。さまざまなディープラーニングアルゴリズムが、このワイヤレスモデルでまだ取り組まれています。ハイパーパラメータのテストが行われ、モデルの効率を向上させるための取り組みが行われています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「Google DeepMind ResearchはSODAを紹介しました:表現学習のために設計された自己教師付き拡散モデル」

Google DeepMindの研究者は、画像を効率的な潜在表現にエンコードする問題に取り組むAIモデル「SODA」を開発しました。SODAに...

機械学習

RPDiffと出会ってください:3Dシーン内の6自由度オブジェクト再配置のための拡散モデル

日常のタスクを実行するためのロボットの設計と構築は、コンピュータサイエンスエンジニアリングの最も刺激的で挑戦的な分野...

データサイエンス

ランダムウォークタスクにおける時差0(Temporal-Difference(0))と定数αモンテカルロ法の比較

モンテカルロ(MC)法と時間差分(TD)法は、強化学習の分野での基本的な手法です経験に基づいて予測問題を解決します

機械学習

モジラのコモンボイスでの音声言語認識 — Part I.

「話者の言語を特定することは、後続の音声テキスト変換のために最も困難なAIのタスクの一つですこの問題は、例えば人々が住...

機械学習

「A.I.言語モデルの支援を受けて、Googleのロボットは賢くなっています」

Googleの新しいロボティクスモデル、RT-2へののぞき見これは人工知能技術をロボットと組み合わせたものです

AI研究

メタAIがオーディオジェネレーションに関するディープラーニングの研究のためのPyTorchライブラリであるAudioCraftをオープンソース化しました

研究者や実践者がモデルを訓練し、最先端を推進するために、メタはテキストから音楽を生成するためのソースコードであるAudio...