AudioCraft Metaの音声と音楽のための生成AI

AudioCraft Metaの音声と音楽生成AI

Facebookの親会社であるMetaは、テキストベースのプロンプトから音を生成する新しい生成AIツールを発表しました。同社は投稿で思考実験を始めます。「楽器で一つの音符も奏でずに、プロのミュージシャンが新しい作曲を探求できると想像してください。」

このような重要な言葉が、同社から出てくるということは、新しいAIツールが高品質でリアルなオーディオと音楽をテキストのプロンプトから生成できると主張しているということです。さらに興味深いことに、これは生成AIコンテンツに対するより厳格な監視が行われている時期に発表されました。

投稿によると、新しいAIツールの名前はAudioCraftで、3つのモデルから構成されています。MusicGen、AudioGen、そしてEnCodecです。最初のMusicGenは、Meta自身のライセンス付き音楽を使用してトレーニングされ、テキストのプロンプトから音楽を生成することができます。

公開された音響効果を使用してトレーニングされたAudioGenも、テキストのプロンプトから音を生成することができます。環境音や犬の吠え声、車のクラクション、足音、特定の種類の床など、他の音効を作成することができます。

これら2つのモデルの違いは、音楽の作成と後者に焦点を当てた音効です。そして、Encodecです。同社によれば、このモデルはより少ないアーティファクトを持つ高品質の音楽生成が可能です。

これら3つのモデルはオープンソース化され、研究者や実践者が自身のデータセットでモデルをトレーニングできるようになっています。AIによる音楽と音の生成の世界はまだ幼いため、その結果は非常に興味深いものになるかもしれません。

現時点では、モデルは単にプロンプトを書き込んで魅力的な音が生成されるのを待つだけでは利用できません。複雑な性質を持つため、モデルにはさらなる作業が必要とされています。しかし、チームはAudioCraftモデルの家族が高品質のオーディオを生成できると約束しています。

同社は、AudioCraftモデルの家族がミュージシャンやサウンドデザイナーが自身の技術を探求するための新しいツールとして認識されることを期待しています。また、彼らの仕事にインスピレーションを与えることも期待しています。もし成功し、人気が出れば、これがDJデビッド・ゲッタが音楽の未来においてAIが重要な役割を果たすと述べた未来になるでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

このAI研究は、大規模言語モデル(LLM)における合成的な人格特性を説明しています

個人の人格は、質、特性、思考方法のユニークな組み合わせから成り立ちます。共有の生物学的および環境的な歴史により、最も...

AIニュース

BrainPadがAmazon Kendraを使用して内部の知識共有を促進する方法

この記事では、Amazon KendraとAWS Lambdaを使用した内部知識共有の構造化方法と、Amazon Kendraが多くの企業が直面する知識...

人工知能

「2023年に試してみる必要のある素晴らしい無料LLMプレイグラウンド5選」

「最新のAIモデルを直接体験することができる、ユーザーフレンドリーなトップ5プラットフォームを探索しましょうこれらのプラ...

AI研究

人工知能を使用した3Dモデルのカスタマイズを革新する:MITの研究者が、機能性に影響を与えずに美的な調整を行うためのユーザーフレンドリーなインターフェースを開発しました

3Dプリントとデザインにおいて、オープンソースのオンラインリポジトリから入手した3Dデザインをカスタマイズする能力は、持...

AI研究

ウィスコンシン大学とバイトダンスの研究者は、PanoHeadを紹介しますこれは、単一のビュー画像のみでビュー一貫性のあるフルヘッド画像を合成する、初の3D GANフレームワークです

コンピュータビジョンとグラフィックスでは、写真のような写実的な肖像画像合成が常に強調されており、仮想アバター、テレプ...