複数の画像やテキストの解釈 Tech News - Section 88
ETH ZurichとMax Plankの研究者が提案するHOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して現実的な衣類のダイナミクスを効率的に予測する新しいメソッド
テレプレゼンス、バーチャル試着、ビデオゲームなど、高品質のデジタルヒューマンに依存する多くのアプリケーションでは、魅...
ベストAI画像生成器(2023年7月)
多くのビジネスの景色が人工知能によって変わりつつあり、画像作成もその一つです。 AI画像生成器は、テキストをグラフィック...
複雑なタスクの実行におけるロボットの強化:Meta AIが人間の行動のインターネット動画を使用して視覚的な手がかりモデルを開発する
メタAIは、先進的な人工知能(AI)研究機関であり、最近、ロボティクスの分野を革命的に変えると約束する画期的なアルゴリズ...
新しいZeroscope v2モデルに会ってください:モダンなグラフィックカード上で動作する無料のテキストからビデオへのモデル
前例のない一連の出来事の中で、次世代のオープンソースAIモデルであるZeroscopeが市場に登場しました。このモデルは、比較的...
MITの研究者が、生成プロセスの改善のために「リスタートサンプリング」を導入
微分方程式ベースの深層生成モデルは、最近、画像合成から生物学までのさまざまな分野で、高次元データのモデリングにおいて...
Dropboxが、ゲームチェンジングなAIパワードツールを発表:生産性とコラボレーションの新時代
今日のデジタル世界では、常にデータに圧倒されています。以前に比べて情報がより多く利用可能になっていますが、必要な情報...
Wandaとは:大規模言語モデルに対するシンプルで効果的なプルーニング手法の紹介
大きな言語モデル(LLM)の人気と使用率は絶えず高まっています。生成型人工知能の分野での巨大な成功を受けて、これらのモデ...
マイクロソフトの研究者がKOSMOS-2を紹介:視覚世界に根付くことができるマルチモーダルな大規模言語モデル
マルチモーダル大規模言語モデル(MLLMs)は、言語、ビジョン、ビジョン言語のタスクを含むさまざまな活動で一般的なインター...
ProFusion における AI 非正則化フレームワーク テキストから画像合成における詳細保存に向けて
テキストから画像生成の領域は長年にわたって広範に研究され、最近では大きな進歩がなされています。研究者たちは、大規模な...
銀行向けのGoogleの新しいマネーロンダリング対策AIツールに会いましょう
Google Cloud(アルファベットの部門)は、銀行向けにマネーロンダリングAIを導入しました。提案されたAIソリューションは、...

- You may be interested
- KAIST(韓国科学技術院)からの新しいAI研...
- 「言葉から世界へ:AIマルチモーダルによ...
- 「コーネリスネットワークスのソフトウェ...
- 「フォンダンAIは、クリエイティブ・コモ...
- 「AIプログラムがイスラエルの男性の命を...
- 「Google マップは AI 機能で強化されまし...
- スタビリティAIは、Beluga 1およびStable ...
- サムスンはAIとビッグデータを採用し、チ...
- エンジニアリングリーダーは何を気にして...
- 「シフトのCEOであるクリス・ナーゲル – ...
- AI + No-Code 開発者のイノベーションを再...
- GPT-4の詳細がリークされました!
- UC Berkeleyの研究者たちは、ディープラー...
- 「タイムクリスタルからワームホールまで...
- 「ODSC West 2023で機械学習をより良くす...
Find your business way
Globalization of Business, We can all achieve our own Success.