複数の画像やテキストの解釈 Applications - Section 73

エイントホーフェンとノースウェスタン大学の研究者が、外部のトレーニングを必要としないオンチップ学習が可能な新しいニューロモーフィックバイオセンサーを開発しました

ニューロモーフィックコンピューティングは、人間の脳の構造と機能に触発されています。ニューロモーフィックチップは、物理...

メリーランド大学とMeta AIの研究者は、「OmnimatteRF」という新しいビデオマッティング手法を提案していますこの手法は、動的な2D前景レイヤーと3D背景モデルを組み合わせたものです

ビデオを複数のレイヤーに分割し、それぞれにアルファマットを持たせ、それらのレイヤーを元のビデオに再構成することは、「...

「見えないものを拡大する：この人工知能AIの手法は、3Dで微妙な動きを可視化するためにNeRFを使用します」

私たちは、身体の微妙な動きから地球の大規模な動きまで、動きに満ちた世界に生きています。しかし、これらの動きの多くは肉...

「CMUの研究者たちは、スロット中心のモデル（Slot-TTA）を用いたテスト時の適応を提案していますこれは、シーンを共通してセグメント化し、再構築するスロット中心のボトルネックを備えた半教師付きモデルです」

コンピュータビジョンの最も困難で重要なタスクの1つは、インスタンスセグメンテーションです。画像や3Dポイントクラウド内の...

「トランスフォーマーとサポートベクターマシンの関係は何ですか？トランスフォーマーアーキテクチャにおける暗黙のバイアスと最適化ジオメトリを明らかにする」

自己注意機構により、自然言語処理（NLP）は革新を遂げました。自己注意機構は、入力シーケンス内の複雑な関連を認識するため...

ペンシルバニア大学の研究者が、軽量で柔軟、モデルに依存しないオープンソースのAIフレームワーク「Kani」を導入し、言語モデルアプリケーションの構築を行います

大規模言語モデルの応用は人気が高まっています。その驚異的な能力により、ますます洗練されてきています。ツールの使用追跡...

「言語モデルは放射線科を革新することができるのか？Radiology-Llama2に会ってみてください：指示調整というプロセスを通じて特化した大規模な言語モデル」

トランスフォーマーをベースとした大規模言語モデル（LLM）は、ChatGPTやGPT-4などを含むトランスフォーマーに基づく自然言語...

ウェイブは、LINGO-1という新しいAIモデルを開発しましたこのモデルは、運転シーンにコメントをすることができ、質問に対しても回答することができます

検出と診断は、車両の運用効率、安全性、安定性を改善するために不可欠です。近年、利用可能な車両データを使用して車両診断...

「InstaFlowをご紹介します：オープンソースのStableDiffusion（SD）から派生した革新的なワンステップ生成型AIモデル」

拡散モデルは、テキストから画像を生成する革命をもたらし、驚くべき品質と創造性を提供しています。しかし、彼らの多段階の...

「韓国のAI研究がマギキャプチャを紹介：主題とスタイルの概念を統合して高解像度のポートレート画像を生成するための個人化手法」

人々はよく、履歴書や結婚式などに適した高品質の肖像写真を作成するために、写真スタジオに通ったり、高価で時間のかかる画...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics