「トランスフォーマベースのLLMがパラメータから知識を抽出する方法」

Method for extracting knowledge from parameters using Transformer-based LLM

近年、トランスフォーマーベースの大規模言語モデル(LLM)が、事実の知識を捉えて保存する能力を持つため非常に人気があります。しかし、これらのモデルが推論中にどのように事実の関連性を抽出するのかは、比較的に未解明のままです。Google DeepMind、テルアビブ大学、Google Researchの研究者による最近の研究は、トランスフォーマーベースのLLMが事実の関連性をどのように保存し抽出するのか、内部のメカニズムを調査することを目的としました。

この研究では、モデルが正しい属性を予測する方法と、内部表現がレイヤーを通じてどのように進化して出力を生成するかを調べるために、情報フローの手法を提案しました。具体的には、研究者はデコーダのみを使用したLLMに焦点を当て、関係と主語の位置に関連する重要な計算ポイントを特定しました。これは、特定のレイヤーで最後の位置が他の位置にアテンションを与えないようにする「ノックアウト」戦略を使用し、推論中の影響を観察することで達成されました。

さらに、属性の抽出が行われる場所を特定するために、研究者はこれらの重要なポイントで情報が伝播する様子と、それに続く表現構築プロセスを分析しました。これは、語彙とモデルのマルチヘッドセルフアテンション(MHSA)およびマルチレイヤーパーセプトロン(MLP)のサブレイヤーとプロジェクションに対する追加の介入を通じて達成されました。

研究者は、主語の豊か化プロセスと属性の抽出操作に基づく属性の抽出の内部メカニズムを特定しました。具体的には、モデルの初期のレイヤーで主語に関する情報が最後の主語トークンに豊かになり、関係は最後のトークンに渡されます。最後のトークンは関係を使用して、主語表現から対応する属性をアテンションヘッドパラメータを介して抽出します。

この研究の結果は、LLM内部で事実の関連性がどのように保存され抽出されるかについての洞察を提供しています。研究者は、これらの結果が知識の特定やモデルの編集の新たな研究方向を開く可能性があると考えています。例えば、この研究の手法は、LLMがバイアスのある情報を獲得し保存する内部メカニズムを特定し、そのようなバイアスを軽減する方法を開発するために使用することができます。

全体的に、この研究は、トランスフォーマーベースのLLMが事実の関連性をどのように保存し抽出するか、内部のメカニズムを調査することの重要性を強調しています。これらのメカニズムを理解することで、研究者はモデルの性能を向上させ、バイアスを減らすためのより効果的な方法を開発することができます。さらに、この研究の手法は、感情分析や言語翻訳などの自然言語処理の他の領域にも適用することができ、これらのモデルが内部でどのように動作するかをよりよく理解することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

このAI論文は、高度な時空間予測のためのニューラルオペレータの自己回帰エラーに対するディープラーニングソリューションを探求しています

この研究は、自己回帰ニューラルオペレーターのドメイン内の重要な課題である予測の範囲拡張の能力の制約について探求してい...

データサイエンス

「クレジットカードの不履行データセットのバイアスの検証と検出」

このセクションでは、クレジットカードのデフォルトデータセットにおけるバイアスについて探求し、若者と高齢者の借り手の間...

AIニュース

「マイクロソフト、Windows上でのCortanaの終了を発表」

マイクロソフトは重要な動きとして、WindowsでのCortanaのサポート終了を宣言しました。この発表は、Windows Centralによって...

機械学習

AIを活用した空中監視:UCSBイニシアチブがNVIDIA RTXを使い、宇宙の脅威を撃退する目的で立ち上がる

数か月ごとに流星群が起こると、観察者は夜空に散らばる流れ星や光の筋が輝く見事な光景を見ることができます。 通常、流星は...

AI研究

「MITのインドの学生が声を必要としない会話デバイスを開発」

魅力的な進展として、名門マサチューセッツ工科大学(MIT)の学生が革新的なAI対応デバイス、AlterEgoを紹介しました。AlterE...

AIテクノロジー

「2023年の最高の声クローニングソフトウェア10選」

はじめに 人工知能を使って人の声をコピーすることができるなんて、すごく驚きませんか?AIを利用した音声クローニングソフト...