「検索補完生成を用いてより能力の高いLLMを構築する」

Building a more capable LLM using search completion generation.

リトリーバル増強生成による知識ベースの統合により、LLMを強化する方法

Image by author: Generated with Midjourney

ChatGPTの制約事項

コード生成以外の実用的なビジネスユースケースでは、ChatGPTには制約があります。この制約は、トレーニングデータとモデルの幻覚傾向から生じます。執筆時点では、Chat-GPTに2021年9月以降のイベントに関する質問をすると、おそらく次のような回答が返ってきます:

Image by author

これは役に立たないので、どのように修正すればよいでしょうか?

オプション1 – 最新のデータでモデルをトレーニングまたはファインチューニングする。

モデルのファインチューニングやトレーニングは実用的ではなく、高額です。コストを置いておいても、データセットを準備するために必要な努力はこのオプションを選ばない理由となります。

オプション2 – リトリーバル増強生成(RAG)メソッドの使用。

RAGメソッドを使用することで、大規模言語モデルに最新の知識ベースへのアクセス権を与えることができます。これは、モデルをゼロからトレーニングするかファインチューニングするよりもはるかに安価で、実装も簡単です。この記事では、OpenAIモデルとRAGを利用する方法を紹介します。Wikipediaの知識ベースから2022年のロシア・ウクライナ紛争に関する質問に対するモデルの能力を短い分析を行うことで試してみます。

注意:このトピックは敏感なものですが、現在のChatGPTモデルには関連知識がないため、選ばれました。

ライブラリと前提条件

OpenAIのAPIキーが必要です。直接ウェブサイトから取得するか、このチュートリアルに従ってください。RAGに使用されるフレームワークはDeepsetのHaystackで、オープンソースです。彼らは大規模言語モデルの上でアプリケーションを構築するためのAPIを提供しています。また、Hugging Faceのsentence transformersとtransformersライブラリも利用しています。

文の埋め込みはモデルがテキストを解釈するのに役立ちます

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「LeanTaaSの創設者兼CEO、モハン・ギリダラダスによるインタビューシリーズ」

モーハン・ギリダラダスは、AIを活用したSaaSベースのキャパシティ管理、スタッフ配置、患者フローのソフトウェアを提供する...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「コーネリスネットワークスのソフトウェアエンジニアリング担当副社長、ダグ・フラーラー氏 - インタビューシリーズ」

ソフトウェアエンジニアリングの副社長として、DougはCornelis Networksのソフトウェアスタック全体、Omni-Path Architecture...

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...