「GPT4の8つの小さなモデルはどのように機能するのですか?」

GPT4の8つのモデルの機能方法は?

秘密の「エキスパートのモデル」が明らかになった。なぜGPT4がこんなに優れているのか理解しましょう!

近年、ディープラーニングモデルが話題となっています。すべての企業がそれを開発しています。そして、最も大きくて最も強力なモデルを求める競争が始まりました!私たちはみんな、以下のようなモデルのサイズを示すグラフを見ました。

Source: Ref

私たちはチンチラ、GPT-3、PaLMなどを比較しました。この間、MicrosoftとOpenAIはGPT-4に取り組んでいました。彼らはGPT-4の開発についての緊張感を作り出しました。みんながGPT-4が最初の1兆パラメーターモデルになるだろうと推測しました。GPT-3モデルのパフォーマンスを改善する余地はほとんどありませんでしたが、私たちはGPT-4に多くの期待を寄せました。そして、ニュース/噂が現実のものとなりました。GPT-4は実際には1つのモデルではなく、2200億パラメーターの8つの小さなモデルが協力して1.6兆から1.7兆のパラメーターの巨大なモデルを生成していることが判明しました。

GPT-4:8つのモデルが1つに;秘密が明かされました

GPT4は競争を避けるためにモデルを秘密にしていましたが、今は秘密が明らかになりました!

pub.towardsai.net

8つのモデルはどのように協力しているのか?

この質問に答えるために、私たちは過去にさかのぼる必要があります。33年前の1991年、Robert A. Jacobs、Michael I. Jordan、Steven J. Nowlan、そしてAIの教父であるGeoffrey Hintonは、「Adaptive Mixtures of Local Experts」という論文を書きました。

彼らは次のように書いています。

「私たちは、多くの別々のネットワークからなるシステムのための新しい教師あり学習手法を提案します。各ネットワークは、完全なトレーニングケースのサブセットを処理するように学習します。この新しい手法は、多層の教師ありネットワークのモジュール版としても、競争学習の連想版としても見ることができます。したがって、これら2つの明らかに異なるアプローチの新しいリンクを提供します。私たちは、学習手法が母音識別タスクを適切なサブタスクに分割し、それぞれを非常に単純なエキスパートネットワークによって解決できることを実証します。」

それはどういう意味ですか?確認してみましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

人工知能

ジョシュ・フィースト、CogitoのCEO兼共同創業者 - インタビューシリーズ

ジョシュ・フィーストは、CogitoのCEO兼共同創業者であり、感情と会話AIを組み合わせた革新的なプラットフォームを提供するエ...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...