「Nous-Hermes-Llama2-70bを紹介します:30万以上の命令にファインチューニングされた最先端の言語モデル」

Introducing Nous-Hermes-Llama2-70b a cutting-edge language model fine-tuned on over 300,000 commands.

ハグフェイス・トランスフォーマーは、Pythonで非常に人気のあるライブラリであり、さまざまな自然言語処理タスクに非常に役立つ事前学習済みモデルを提供しています。以前はPyTorchのみをサポートしていましたが、現在はTensorflowもサポートしています。Nous-Hermes-Llama2-70bは、数十万の命令を使用するNLP言語モデルです。このモデルは、モデルのトレーニング中に深刻な変更がないように、古いヘルメスモデルと同じデータセットを使用し、プロセスがさらにスムーズになるようにしています。このモデルにはまだいくつかの欠点があり、幻覚率が低く、OpenAIの検閲がないということです。

モデルのトレーニングは、非常に高いデータ量とスタイルを持つ大規模なデータセットで行われました。データはさまざまなソースから収集され、1つのデータセットに統合されたため、処理されたデータセットには多様な知識があります。データセットはTeknium、Karan4D、Emozilla、Huemin Art、Pygmalion AIなどのさまざまなソースからデータを収集しました。このモデルはアルパカモデルを使用してトレーニングされています。研究チームは、アルパカの評価を行うために、自己指示評価データセットからの入力に対して人間の評価を行いました。研究者はこの評価セットを収集し、ほとんどすべてをカバーする多様なユーザ志向の指示をカバーしています。

研究者はまた、実行されたこのモデルにもプロンプトエンジニアが利益を得ることができると述べています。研究者は、上記の資産を公開することで、学術コミュニティが指示に従う言語モデルに関する制御科学的研究を実施し、最終的にはこのモデル内の既存の欠陥に対処する新しい技術を生み出すことができると信じています。アルパカのインタラクティブなデモの展開には、有害なコンテンツをより広く普及させ、スパムの可能性を低下させるなどの潜在的なリスクがあります。NLPにおけるスパム検出技術もこのモデルで重要な役割を果たします。研究者は、これらの緩和策を達成できると理解しています。モデルの重みを公開するか、ユーザが自分の指示に従ってモデルをトレーニングすることによって。

このプロジェクトの将来の計画には、高品質のデータを反復し、低品質のデータを削除するための技術を適用することも含まれます。研究者はまた、アルパカをより厳密に評価する必要があります。さらに、より生成的な情報を収集できると期待されるHELMモデルから始める予定です。研究者はまた、アルパカのリスクを研究し、その安全性をさらに向上させることを目指します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

ChatGPTのコードインタプリター:知っておくべきすべてのこと

OpenAIは、興奮をもって発表を行っており、最新の発表はChatGPT Plusのユーザーを喜ばせることでしょう。数ヶ月の期待を経て...

AIニュース

「OpenAIがGPT-4の力を持つChatGPT Enterpriseを発表」

AI研究の先駆的な組織であるOpenAIは、人工知能の世界における興奮をもたらす新たな章を紹介しました – ChatGPT Enterp...

人工知能

「AIガバナンスにおけるステークホルダー分析の包括的ガイド(パート2)」

「著者注:本記事はAIガバナンスにおけるステークホルダー分析の包括的なガイドのパート2として書かれていますパート1はこち...

人工知能

ChatGPT Vislaプラグインを使用してビデオを作成する方法

たった一つのプロンプトで、Visla ChatGPTプラグインはわずか数秒でスクリプトとストック画像を使用したビデオを作成します

AI研究

ストリートビューが救いの手を差し伸べる:ディープラーニングが安全な建物への道を開拓

Googleストリートビューなどで使用される画像は、フロリダ大学の人工知能助教授Chaofeng Wang氏の手によって新たな目的を持つ...

機械学習

トゥギャザーアイは、ShortおよびLongコンテキストの評価で最高のオープンソーストランスフォーマーに対抗する、StripedHyena-7Bという代替人工知能モデルを紹介します

AIと共に、シーケンスモデリングアーキテクチャへの大きな貢献を果たし、StripedHyenaモデルを導入しました。従来のトランス...