マイクロソフトAI研究は、分子システムの平衡分布を予測するためにDistributional Graphormer(DiG)という新しいディープラーニングフレームワークを紹介しました

マイクロソフトAI研究は、新しいディープラーニングフレームワークであるDiGを紹介し、平衡分布の予測に使用されます

分子の構造はその性質と機能を決定します。そのため、構造予測は分子科学における重要な問題です。アミノ酸配列からタンパク質の最も確率的な構造を特定するために、AlphaFoldやRoseTTAFoldのような深層学習アプローチのブレークスルー的な精度が分子科学者たちによって絶賛されています。しかし、構造予測はタンパク質の機能の一部のみを提供することができ、この方法は単一のスナップショットのみを提供します。

最近のMicrosoftの研究では、平衡分布に基づくタンパク質の構造予測のための新しい深層学習フレームワークであるDistributional Graphormer(DiG)を提供しています。これにより、この基本的な問題を解決し、分子科学に活力を与えることを目指しています。DiGは、統計力学と熱力学が分子システムを微視的なレベルで制御するため、平衡分布に従って構造のアンサンブルをモデル化する点で大きな進歩です。

DiGは、分子構造を正確に説明できる汎用グラフ変換器であるGraphormerの改良版であり、分布予測への新しいアプローチを提供します。改良版のGraphormerであるDiGは、深層ニューラルネットワークを利用して、基本的な分子記述子から目標分布を直接予測することができるようになりました。

これは、熱力学と最適化の確立された技術である模擬焼きなましの概念に基づいており、近年の人工生成コンテンツ(AIGC)の分野で重要な進展をもたらした拡散モデルの創造をインスピレーションとしています。模擬焼きなましのプロセスをモデリングすることにより、単純な分布が最も確率的な状態に探索し、落ち着くことで、複雑な分布が徐々に洗練されて構築されます。DiGは、この手順をシミュレートする分子システムのための深層学習フレームワークです。AIGCモデルの基礎として、統計力学と熱力学に起源を持つ拡散モデルが頻繁に使用されます。

簡単な分布を複雑な分布に変換するためのGraphormerを使用して、DiGは拡散に基づいています。DiGを訓練するために使用するデータや情報は柔軟です。分子システムのエネルギーベースの確率とDiGによって予測される確率との差を最小化することにより、DiGは分子システムのエネルギー関数を使用して変換を制御することができます。この方法では、DiGに既存の知識を活かすことができます。

チームは、タンパク質、タンパク質-リガンド複合体、触媒-吸着物系など、さまざまな分子系を対象とした分子サンプリングタスクの一連の実験を通じて、DiGの効果と有望さを示しています。その結果、DiGは現実的で多様な分子構造を効率的かつ低コストで生成するだけでなく、統計力学を用いて巨視的な属性を計算するために必要な状態密度の推定値も提供します。

チームは、DiGが微視的な分子を量的に分析し、その巨視的な特徴を予測するための重要な進歩であり、分子科学において多くの魅力的な新しい研究領域への道を開いていると考えています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

TensorRT-LLMとは、NVIDIA Tensor Core GPU上の最新のLLMにおいて推論パフォーマンスを高速化し最適化するためのオープンソースライブラリです

人工知能(AI)の大規模言語モデル(LLM)は、テキストを生成したり、言語を翻訳したり、さまざまな形式の創造的な素材を書い...

AI研究

MITとマイクロソフトの研究者が、DoLaという新しいAIデコーディング戦略を紹介しましたこれは、LLMsにおける幻覚を減らすことを目的としています

大規模言語モデル(LLM)の利用により、多くの自然言語処理(NLP)アプリケーションが大きな恩恵を受けてきました。LLMは性能...

AIニュース

「ChatGPTは画像を生成することができるようになりました」

OpenAIは、ChatGPTオンラインチャットボットにDALL-E画像生成器の新バージョンを統合しました

AI研究

アマゾンの研究者がフォーチュナを紹介:ディープラーニングにおける不確実性量子化のためのAIライブラリ

人工知能と機械学習の最近の発展は、皆の生活をより容易にしてくれています。その信じられない能力により、AIとMLはあらゆる...

機械学習

このAI論文では、一般的なソース分布とターゲット分布の間の連続時間確率生成モデルの学習のための新しいクラスのシミュレーションフリーな目的を紹介しています

複雑な分布を記述できる効果的な生成モデルの一つに、スコアベースの生成モデル(SBGM)があります。これには拡散モデルも含...

データサイエンス

コーディングなしで独自のLLMをトレーニングする

イントロダクション 生成AIは、私たちがテクノロジーとコンテンツの生成方法を革新するという魅力的な分野で、世界中で大きな...