ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました

Researchers at Michigan State University developed a Python library called DANCE to support large-scale single-cell gene expression analysis.

単一モダリティのプロファイリング(RNA、タンパク質、オープンクロマチン)から多モダリティのプロファイリングや空間的トランスクリプトミクスまで、単一細胞の解析技術は近年急速に進化しています。特に機械学習に基づくコンピュータアプローチの急速な拡大により、多くの計算アプローチが生まれました。

現在のアプローチの多様性と複雑さのため、元の論文の結果を再現することは困難です。ハイパーパラメータの調整、プログラミング言語の非互換性、公開されたコードベースの欠如など、多くの障害が存在します。既存の研究のほとんどは限られたデータセットと不十分な方法論との比較でパフォーマンスを報告しているため、方法を完全に評価するためには体系的なベンチマーク手法が必要です。

最近の研究の一環として、ミシガン州立大学、ワシントン大学、浙江工業大学、スタンフォード大学、ジョンソン・エンド・ジョンソンの研究者らは、単一細胞解析の進歩を加速させるために設計されたDANCEというディープラーニングライブラリとベンチマークを紹介しています。

DANCEは、スケールで単一細胞データを分析するための包括的なツールセットを提供し、開発者がより簡単かつ効率的に独自のディープラーニングモデルを作成できるようにします。また、単一細胞解析のさまざまな計算モデルのパフォーマンスを比較するためのベンチマークとして使用することもできます。現在のDANCEには、3つのモジュール、8つのタスク、32のモデル、21のデータセットのサポートが含まれています。

現在、DANCEは以下の機能を提供しています:

  1. 単一モダリティの解析
  2. 多モダリティの解析
  3. 空間的トランスクリプトミクスの解析

オートエンコーダとGNN(グラフニューラルネットワーク)は、幅広く使用されているディープラーニングフレームワークであり、あらゆる場面で活用できます。研究論文によると、DANCEは単一細胞解析のための包括的なベンチマークプラットフォームとして初めて開発されました。

この研究では、研究者らは新しいコンポーネントを使用しました。彼らは、タスク固有の標準ベンチマークデータセットをまとめ、単一のパラメータ調整で簡単に利用できるようにしました。すべてのタスクに対して、基本的なクラシカルなディープラーニングアルゴリズムが実装されています。収集されたすべてのベンチマークデータセットは、元の研究と同様またはそれ以上の結果を得るまで、ベースラインを微調整するために使用されます。エンドユーザーは、事前にすべてのスーパーパラメータをまとめてラップしたコマンドラインを実行するだけで、微調整されたモデルのパフォーマンスを取得することができます。

チームはバックボーンとしてPyTorch Geometric(PSG)フレームワークを使用しました。さらに、ベースラインをフィット-予測-スコアのフレームワークに変換することで、ベースラインを標準化しました。各タスクについて、すべての実装されたアルゴリズムは、グリッドサーチを介して収集されたすべての標準ベンチマークで微調整され、最適なモデルを得るために使用されます。関連するスーパーパラメータは、ユーザーの再現性のために単一のコマンドラインに保存されます。

チームは、自分のデバイスの処理能力とストレージ容量に完全に依存する必要がないようにするため、DANCEをSaaSサービスとして提供する予定です。また、ディープラーニングベースのモデルの高速なトレーニングのために、グラフィックスプロセッシングユニット(GPU)のサポートも提供しています。

現在のDANCEは、前処理とグラフ作成のための統一されたツールセットが不足しています。チームは将来的にこれに取り組む予定です。また、DANCEはSaaSサービスとして提供されるため、ユーザーは自身のデバイスの処理能力とストレージ容量に完全に頼る必要はありません。

この記事は、「DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis」という研究論文をもとにMarkTechPostスタッフがまとめた研究概要記事です。この研究に関するすべてのクレジットはこのプロジェクトの研究者に帰属します。論文、コード、ツールをチェックしてください。
ML Subredditに参加するのを忘れないでください

Michigan State Universityの研究者らが、単一細胞の遺伝子発現を分析するためのディープラーニングモデルをサポートするPythonライブラリ「DANCE」を開発しました。

この記事はMarkTechPostに掲載されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

拡散生成モデルによる医薬品発見の加速化

MITの研究者たちは、DiffDockというモデルを構築しましたこのモデルは、いつか従来の方法よりも速く新しい薬剤を見つけ、副作...

AI研究

「Google DeepMind Researchがニューラルネットワークにおける理解現象の謎を探求:記憶と一般化の相互作用を明らかにする」

ニューラルネットワークが学習し一般化するという従来の理論は、ニューラルネットワークの中でのグロッキングの発生によって...

AI研究

このAI研究では、「RAFA」という、証明可能なサンプル効率を持つ独立型LLMエージェントのための原則的な人工知能フレームワークを紹介します

LLMの推論能力は優れていますが、それらの能力を実践的な状況で適用するためには改善が必要です。特に、外部の世界との最小限...

機械学習

ハリウッドにおけるディズニーの論争:AIが登場し、脚本家と俳優が退場!

ハリウッドの中心地で、AIは分かれる存在になっています。映画業界の創造的本質を守るディズニーの脚本家や俳優たちは、AIが...

機械学習

「ImageReward(イメージリワード)に会ってください:AIの生成能力と人間の価値観を結ぶ革命的なテキストから画像へのモデル」

機械学習において、テキスト入力に基づいて画像を生成できる生成モデルは、さまざまなアプローチが有望な結果を示し、近年著...

機械学習

このAIニュースレターは、あなたが必要なもの全てです#58

今週、私たちはNLPの領域外でAIの2つの新しい進展を見ることに興奮しましたMeta AIの最新の開発では、彼らのOpen Catalystシ...