メタは、商用利用に無料のLLaMA 2をリリースしました

META released the free LLaMA 2 for commercial use.

Llama 2、私たちのオープンソースの大規模言語モデルの次世代

これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。

Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。

新機能は何ですか?

事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています

これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。

このモデルは3つのバージョンで提供されます —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。

最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。

  • コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
  • モデルは2兆個のトークンでトレーニングされています。
  • 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
  • モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。

ベンチマーク:

このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。

標準テストの一連のテスト

人間の評価者による評価…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「AIにおける親密な役割:ガールフレンドとセラピスト」

この記事は、感情AIの分野についての簡単な概要と、その技術の親密な役割での潜在的な応用についてです

AI研究

UCバークレーの研究者たちは、「リングアテンション:トランスフォーマーのメモリ要件を削減するためのメモリ効率の良い人工知能アプローチ」という提案を行っています

ディープラーニングモデルアーキテクチャの一種であるTransformerは、多くの最先端のAIモデルの文脈で使われます。これらは人...

機械学習

新しいAIの研究がコンピュータビジョンを通じてリチウムイオン電池の秘密を解き明かす

充電可能なリチウムイオン電池の電極に密に詰められた数十億の微粒子は、エネルギーの貯蔵と供給において重要な役割を果たし...

データサイエンス

AIの進歩を促進するための医療データのラベリングをゲーム化する

MITの卒業生が運営するプラットフォームは、AI企業のために医療データに対してクラウドの知恵を活用してラベルを付けます

AI研究

シャージャ大学の研究者たちは、アラビア語とその方言を自然言語処理に取り入れるための人工知能ソリューションを開発しました

アラビア語は4億2200万人以上の国民の公用語であり、世界で5番目に広く使用されています。しかし、自然言語処理ではほとんど...

AIニュース

このAIニュースレターはあなたが必要なすべてです #72

今週、AIニュースはOpenAIのDevdayと多くの新しいモデルや機能の発売で主導権を握り、それによってエロン・マスクがLLMレース...