新しいAIモデル、たった30BパラメーターでGPT-3を凌駕する

New AI model surpasses GPT-3 with just 30B parameters.

世界的に有名なオープンソース言語モデル(LLMs)プロバイダーであるMosaicMLは、最新世代のNVIDIA H100アクセラレータを搭載した画期的なMPT-30Bモデル、すなわちBase、Instruct、Chatを発表しました。これらの最新鋭モデルは、元のGPT-3に比べて品質が大幅に向上しています。

また読む: Large Language Models(LLMs)とは何ですか?

MPT-7Bの前例のない成功とMPT-30Bへの進化

2023年5月のリリース以来、MPT-7Bモデルは、330万ダウンロードという驚異的な数字を叩き出し、業界を席巻しています。この成功を更に広げるため、MosaicMLは、非常に期待されていたMPT-30Bモデルをリリースしました。これにより、様々なアプリケーションで新しい可能性が開け、更なる高みに到達しました。

MPT-30Bの無比な機能

MPT-30Bの最も注目すべき成果の1つは、たった30億のパラメータで、GPT-3の175億のうちの一部を使用して、GPT-3を超える品質を実現することができたことです。この画期的なパラメータ数の削減により、MPT-30Bは、ローカルハードウェアの導入にもよりアクセスしやすくなり、推論のコストも大幅に削減されます。さらに、MPT-30Bをベースにしたカスタムモデルのトレーニングに関連する費用は、オリジナルのGPT-3をトレーニングする見積もりよりも明らかに低くなっており、企業にとって魅力的な選択肢となっています。

もっと詳しく知る:実際のユースケースに向けたGPT3の大規模言語モデルのカスタマイズ

さらに、MPT-30Bのトレーニングには、最大8,000トークンの長いシーケンスが含まれており、データ重視のエンタープライズアプリケーションを処理できるようになっています。これは、NVIDIAのH100 GPUを利用して、優れたスループットと高速なトレーニング時間を実現しています。

また読む:中国の強力なNvidia AIチップの隠された市場

MPT-30Bの無限のアプリケーションを探る

多くのビジョンを持った企業が、MosaicMLのMPTモデルを活用し、AIアプリケーションを革新しています。

  • 先進的なWebベースのIDEであるReplitは、MosaicMLのトレーニングプラットフォームを活用して、優れたコード生成モデルを構築することに成功しました。Replitは、独自のデータを活用することで、コードの品質、スピード、コスト効率を著しく向上させました。
  • チャットボットの開発に特化した革新的なAIスタートアップであるScatter Labは、MosaicMLの技術を活用して独自のMPTモデルをトレーニングしました。その結果、英語と韓国語の両方を理解できる多言語の生成AIモデルが作成され、広範なユーザーベースのチャット体験を大幅に向上させました。
  • 世界的に有名な旅行費用管理ソフトウェア会社であるNavanは、MPTが提供する堅牢な基盤を活用して、バーチャルトラベルエージェントや会話型ビジネスインテリジェンスエージェントなどの最新アプリケーションにカスタマイズされたLLMsを開発しています。Navanの共同創設者兼CTOであるIlan Twig氏は、MosaicMLの基礎モデルが、際立った効率性とスケールでの推論を提供すると同時に、非常に優れた言語能力を提供していると熱狂的に称賛しています。

もっと詳しく知る:AIの力を活用するビジネスリーダーには、DataHack Summit 2023の「AI for Business Leaders」ワークショップが必須です。

MPT-30Bのパワーにアクセスする

開発者は、オープンソースモデルとして利用可能なHuggingFace Hubを介して、MPT-30Bの非凡な能力に簡単にアクセスできます。これにより、開発者は、自分たちのデータを使用してモデルを微調整し、自分たちのインフラストラクチャで推論をシームレスに展開することができます。また、開発者は、MPT-30B-Instructと呼ばれるMosaicMLの管理されたエンドポイントを選択することもできます。これは、同様のエンドポイントと比較して、断然低コストでモデル推論を行うことができます。1,000トークンあたりわずか$0.005の価格で提供されるMPT-30B-Instructは、開発者にとって非常にコスト効果が高い選択肢です。

私たちの見解

MosaicMLがMPT-30Bモデルを画期的にリリースしたことは、大規模言語モデルの領域における歴史的なマイルストーンとなります。これにより、企業は、生成AIの無類の能力を活用しながら、コストを最適化し、データに完全にコントロールを保ちます。最後に、MPT-30Bは、無比の品質とコスト効率を提供する真のゲームチェンジャーであり、より多くの企業がこの変革的なテクノロジーを受け入れ、産業全体に革新をもたらすために活用することで、未来には無限の可能性があります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

シンガポール国立大学の研究者が提案するMind-Video:脳のfMRIデータを使用してビデオイメージを再現する新しいAIツール

人間の認知を理解することは、特に非侵襲的な技術である機能的磁気共鳴画像法(fMRI)を用いた場合、脳プロセスから人間の視...

機械学習

「OpenAI、DALL·E 3を発表:テキストから画像生成における革命的な進展」

OpenAIは、革新的なテキストから画像を生成する技術の最新バージョンであるDALL·E 3の発表を行い、重要な技術的進歩を遂げま...

機械学習

「トランスフォーマーアーキテクチャとBERT、GPT、T5の台頭:初心者向けガイド」

「人工知能(AI)の広大で絶えず進化する領域において、印象を残すだけでなく、その全体の軌道を再定義する革新が存在します...

機械学習

Amazon Personalize Next Best Actionを使用して、ユーザーにアクションを推奨することでブランドの忠誠心を構築します

Amazon Personalizeは、個別のユーザーに提案する最適なアクションを決定し、ブランドのロイヤルティとコンバージョンを向上...

AI研究

人工知能を使用した3Dモデルのカスタマイズを革新する:MITの研究者が、機能性に影響を与えずに美的な調整を行うためのユーザーフレンドリーなインターフェースを開発しました

3Dプリントとデザインにおいて、オープンソースのオンラインリポジトリから入手した3Dデザインをカスタマイズする能力は、持...

AIニュース

「CRISPRツールがウイルスを撃ち破るのに役立つかもしれません」

米国のライス大学の科学者たちは、RNAを断片化または変異させるための最も小さいCRISPR-Cas13システムの3次元構造を特徴付け...