混沌からの彫刻芸術:拡散モデル — SMLD

「混沌から生まれる芸術の彫刻:拡散モデル — SMLD」

想像力は現実を創り出します…

安定拡散から生成された画像

前の記事では、拡散モデルの一般的な構造と非常に人気のあるカテゴリであるDenoising Diffusion Probabilistic Models(DDPM)について説明しました。今回は、拡散プロセスを定式化する完全に異なるが同等のアプローチを見てみましょう。このクラスのモデルはSMLDsと呼ばれ、後ほどより明確になるでしょう。

さあ、旅を始めましょう!

導入

これらのモデルの核心には、確率密度p(x)の(シュタイン)スコア関数である∇ₓlogp(x)があります。

この量は、高密度領域内のランダムサンプルx₀からサンプルxₙに向かう方向を提供します。このプロセスに使用されるアルゴリズムは、ランジュバンサンプリングアルゴリズムと呼ばれます。

DDPMが熱力学から影響を受けたように、SMLDsの基本的なアイデアは物理学に遡ることができます。特に、物理学ではランジュバンダイナミクスとして知られるランジュバンサンプリングは、フランスの物理学者ポール・ランジュバンによって開発された分子システムのダイナミクスの数学的モデリング手法です。

しかし話はここまでにして、この美しいアイデアの実際の数学を見てみましょう!

Score Matching via Langevin Dynamics

この拡散モデルのこのカテゴリの理論的な基礎は、「データ分布の勾配を推定することによる生成モデリング」という画期的な論文で確立されました。ランジュバンサンプリングアルゴリズムによれば、以下の反復プロセスを得ます:

ここで:

zₜ∼ N (0, I)ε > 0x₀∼ p(x₀)(事前分布)。

数学では、これはランジュバンマルコフチェインモンテカルロ(MCMC)として知られています。このプロセスにより、確率分布p(x)からスコア関数のみを使用してサンプリングが可能になります

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...

人工知能

「コーネリスネットワークスのソフトウェアエンジニアリング担当副社長、ダグ・フラーラー氏 - インタビューシリーズ」

ソフトウェアエンジニアリングの副社長として、DougはCornelis Networksのソフトウェアスタック全体、Omni-Path Architecture...

人工知能

アーティスの創設者兼CEO、ウィリアム・ウーによるインタビューシリーズ

ウィリアム・ウーは、Artisseの創設者兼CEOであり、ユーザーの好みに基づいて写真を精密に変更する技術を提供していますそれ...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...