複数の画像やテキストの解釈 AI研究 - Section 35
AI 研究とイノベーションの最前線に留まります
メリーランド大学とMeta AIの研究者は、「OmnimatteRF」という新しいビデオマッティング手法を提案していますこの手法は、動的な2D前景レイヤーと3D背景モデルを組み合わせたものです
ビデオを複数のレイヤーに分割し、それぞれにアルファマットを持たせ、それらのレイヤーを元のビデオに再構成することは、「...
「CMUの研究者たちは、スロット中心のモデル(Slot-TTA)を用いたテスト時の適応を提案していますこれは、シーンを共通してセグメント化し、再構築するスロット中心のボトルネックを備えた半教師付きモデルです」
コンピュータビジョンの最も困難で重要なタスクの1つは、インスタンスセグメンテーションです。画像や3Dポイントクラウド内の...
ペンシルバニア大学の研究者が、軽量で柔軟、モデルに依存しないオープンソースのAIフレームワーク「Kani」を導入し、言語モデルアプリケーションの構築を行います
大規模言語モデルの応用は人気が高まっています。その驚異的な能力により、ますます洗練されてきています。ツールの使用追跡...
「Google ResearchがMediaPipe FaceStylizerを紹介:少数のショットでの効率的な顔スタイリゼーションのための設計」
近年、研究者や消費者は、拡張現実(AR)を組み合わせたスマートフォンアプリケーションに対する関心を高めています。これに...
「韓国のAI研究がマギキャプチャを紹介:主題とスタイルの概念を統合して高解像度のポートレート画像を生成するための個人化手法」
人々はよく、履歴書や結婚式などに適した高品質の肖像写真を作成するために、写真スタジオに通ったり、高価で時間のかかる画...
「MITの学者たちは、生成型AIの社会的な影響を探るためのシードグラントを授与されました」
「MITの全学派を代表する27人のファイナリストは、技術の民主主義、教育、持続可能性、コミュニケーションなどへの影響を探求...
「タンパク質設計の次は何か?マイクロソフトの研究者がエボディフ:シーケンスファーストのタンパク質エンジニアリングのための画期的なAIフレームワークを紹介」
ディープ生成モデルは、新規タンパク質のインシリコ創造において、ますます有効なツールとなっています。拡散モデルは、最近...
このAI研究は、AstroLLaMAを紹介しますこれは、ArXivからの30万以上の天文学の要約を使用して、LLaMA-2からファインチューンされた7Bパラメーターモデルです
大規模言語モデル(LLM)の登場は、複数の重要な要素が結集したため、多くの分野から注目を集めています。これらの要素には、...
MITとマイクロソフトの研究者が、DoLaという新しいAIデコーディング戦略を紹介しましたこれは、LLMsにおける幻覚を減らすことを目的としています
大規模言語モデル(LLM)の利用により、多くの自然言語処理(NLP)アプリケーションが大きな恩恵を受けてきました。LLMは性能...
「AIを活用したツールにより、3Dプリント可能なモデルの個別化が容易になります」
Style2Fabを使用することで、メーカーは補助具などの3Dプリンタで作成可能なオブジェクトのモデルを迅速にカスタマイズできま...

- You may be interested
- LLMWareは、複雑なビジネスドキュメントを...
- マシュー・カーニー:AIと哲学を対話させる
- このAIニュースレターは、あなたが必要と...
- 「組織内で責任ある効果的なAI駆動文化を...
- 「NPって何? 最適化問題の複雑性タイプを...
- ChatGPTの初めての記念日:AIインタラクシ...
- 「LangChain、Google Maps API、およびGra...
- 「ロンドン帝国大学チーム、少ないデモン...
- 「Chroma DBガイド | 生成AI LLMのための...
- 「昨年のハイライトでODSC West 2023に向...
- Reka AIは、視覚センサと聴覚センサを備え...
- AWSにおける生成AIとマルチモーダルエージ...
- データサイエンスのためのPython入門
- プロンプトエンジニアリングの芸術:ChatG...
- Amazon SageMakerを使用した生成型AIモデ...
Find your business way
Globalization of Business, We can all achieve our own Success.