スタビリティAIが日本語のStableLMアルファを発表:日本語言語モデルの飛躍的な進化

Stability AI announces Japanese StableLM Alpha significant evolution of Japanese language model

日本の生成型AIの領域を向上させる重要な一歩として、Stability AIは、Stable Diffusionを開発した先駆的な生成型AI企業として、日本語言語モデル(LM)であるJapanese StableLM Alphaを初めて発表しました。この画期的なローンチは、同社のLMが日本語話者向けに提供される最も優れた公開モデルであるという主張によって注目を集めています。この主張は、他の4つの日本語LMとの包括的なベンチマーク評価によって裏付けられています。

この新しく導入されたJapanese StableLM Alphaは、70億のパラメータを持つ印象的なアーキテクチャを誇り、Stability AIの技術進歩への取り組みを証明しています。このモデルは、さまざまな言語タスクに対応できる多目的で高性能なツールです。その優れた性能は、複数のカテゴリーで競合他社を凌駕し、業界のリーダーとしての地位を確立しています。

日本語のStableLM Base Alpha 7Bの商業版は、広く認知されているApache License 2.0の下でリリースされる予定です。この専門モデルは、オンラインリポジトリから入手した日本語と英語のテキストの7500億トークンを網羅した巨大なデータセットによる詳細なトレーニングを通じて精巧に作り上げられました。

この成果の基盤は、協力的な取り組みにも負うところがあります。Stability AIは、EleutherAI Polyglotプロジェクトの日本チームの専門知識を活用し、Stability AIの日本コミュニティによって作成されたデータセットを活用しています。この共同の取り組みは、Stability AIの開発プロセスの基盤となるEleutherAIのGPT-NeoXソフトウェアの拡張バージョンの活用によってさらに促進されています。

並行して行われるイノベーションであるJapanese StableLM Instruct Alpha 7Bもまた、注目すべき重要な節目を示しています。このモデルは主に研究目的に開発され、研究アプリケーションに専用です。これは、複数のオープンデータセットを利用した方法論的なアプローチであるSupervised Fine-tuning(SFT)によって、ユーザーの指示に従う特異な能力を発揮します。

これらのモデルは、EleutherAIのLanguage Model Evaluation Harnessを使用して厳密な評価が行われました。モデルは、文の分類、文のペアの分類、質問応答、文の要約など、さまざまなドメインで検証され、平均スコア54.71%という素晴らしい成績を収めました。Stability AIは、この性能指標が日本語のStableLM Instruct Alpha 7Bを他のモデルよりも優れていることを明確に示し、その優位性を強調しています。

興味深いことに、Stability AIの日本語LMのローンチは、ソフトバンクの最近の発表との関連でさらなる興味を引く要素を持っています。先週、ソフトバンクは、日本市場向けに設計された自社製の大型言語モデル(LLM)への参入を発表しました。同社の取り組みは、今年後半にデビュー予定の生成型AIコンピューティングプラットフォームに約200億円(約1億4000万ドル)を投じることによってさらに強調されています。

風景が展開し続ける中、生成型AIのダイナミックで進化する分野で最終的にどの日本語言語モデルが優位性を確立するかを確認するのは待つしかありません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

セールスフォース・アインシュタイン:あなたは顧客との関係を築きます、AIがそれらを自動的に維持する手助けをします

「顧客関係管理(CRM)」は、現在のハイパーコネクテッドで競争の激しい商業環境において、組織の成功を促進するために極めて...

AI研究

ISTAオーストリアとニューラルマジックの研究者が、トリリオンパラメータの言語モデルの効率的な実行のための革命的な圧縮フレームワークであるQMoEを紹介

複数の専門サブネットワークの出力を組み合わせて予測や意思決定を行うために設計されたニューラルネットワークモデルは、エ...

機械学習

音声合成:進化、倫理、そして法律

ロマン・ガーリン、シニアバイスプレジデント @イノベーション、スポートレーダー この記事では、音声合成の進化を辿り、それ...

AIテクノロジー

世界のトップ10の生成AI企業

イントロダクション 人工知能(AI)は、ビジネスの働き方を変革する力を持つ強力なテクノロジーです。AIの素晴らしい側面の一...

AI研究

MONAI 生成モデル:医療画像の進歩に向けたオープンソースプラットフォーム

最近の生成型人工知能のブレークスルーにより、特に医療画像処理の分野で重要な進展が見られています。しかし、これらの生成...

AIニュース

(sekai no toppu 10 no sōsei AI sutātappu)

はじめに 生成AIは現在、世界中の人々の好奇心を引きつけています。私たちのソーシャルネットワーキングフィード内の仮想キャ...