「Huggingface 🤗を使用したLLMsのためのRLHFトレーニングパイプライン」

「美容とファッションの専門家が活用するRLHFトレーニングパイプライン」

Jongsun LeeさんによるUnsplashでの写真

Pythonハンズオンガイドを使って、独自のドメイン固有のLLMを開発する方法を学びましょう

著者

このブログ記事はMarcello PolitiVijayasri Iyerによって書かれました。

はじめに

現在、誰もが生成型AIと大規模言語モデルについて話しています。ChatGPTやGrokなどのモデルは、今では一般的なネームとなり、多くの人がこれらのテクノロジーに基づいたソリューションを採用してビジネスを改善したいと望んでいます。

しかしながら、これらのモデルの言語能力は素晴らしいものの、まだ完全ではありません。未解決の大きな問題がたくさんあります。

LLM(大規模言語モデル)は、全ての機械学習/ディープラーニングモデルと同様に、データから学習します。したがって、ゴミ入れゴミ出しの法則を回避することはできません。つまり、低品質のデータでモデルを訓練すると、推論時の出力の品質も同じく低くなります

このことが、LLMとの会話中に偏見や先入観のある回答が発生する主な理由です。

しかし、モデルのレスポンスが正確かつ一貫性があり、開発者とユーザーの観点から安全で倫理的かつ望ましいものとなるように、モデルの調整を保証するためのテクニックがあります。最も一般的に使用されるテクニックは、強化学習を使用することです

人間のフィードバックを用いた強化学習

著者によるイメージ

人間のフィードバックを用いた強化学習(RLHF)は、最近注目を集め、特に大規模言語モデル(LLM)のNLP領域でRL技術の新しい革命を始めました。このブログでは、Huggingfaceライブラリを使ったLLMの完全なRLHFトレーニングパイプラインを学びます

RLHFパイプラインは3つのフェーズで構成されます:

  • ドメイン固有の事前トレーニング:Causalを使用して生のテキストに対して事前トレーニングされたLLMを微調整する…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...