バードは論理と推論力においてますます上達しています

Bird's logical and reasoning abilities are improving more and more.

2つのBardの改善が今日発表されました。まず、Bardは数学的なタスク、コーディングの質問、文字列操作においてより優れた性能を発揮するようになりました。そして、Google Sheetsへの新しいエクスポートアクションが追加されました。つまり、Bardが応答で表を生成する場合、例えば「私の動物保護区のボランティア登録のためのテーブルを作成してください」と依頼すると、それを直接Sheetsにエクスポートできるようになりました。

高度な推論と数学的なプロンプトに対する改善された応答

「暗黙のコード実行」と呼ばれる新しい技術により、Bardは計算プロンプトを検出し、バックグラウンドでコードを実行することができます。その結果、数学的なタスク、コーディングの質問、文字列操作プロンプトにより正確に応答できるようになりました。そのため、Bardは以下のようなプロンプトに対する回答が向上します。

  • 15683615の素因数は何ですか?
  • 私の貯蓄の成長率を計算してください
  • 「Lollipop」を逆にしてください

この新しい機能と、それがどのようにBardの応答を改善するのに役立つのかを詳しく見ていきましょう。

改善された論理と推論スキル

大規模言語モデル(LLM)は、プロンプトが与えられると、次に何の単語が出現する可能性が高いかを予測して応答を生成する予測エンジンのようなものです。その結果、言語やクリエイティブなタスクには非常に優れていますが、推論や数学のような分野では弱いです。高度な推論と論理的な能力を持つようにより複雑な問題を解決するためには、LLMの出力だけに頼るのは不十分です。

私たちの新しい方法により、Bardは推論と数学の能力を高めるためにコードを生成して実行することができます。このアプローチは、ダニエル・カーネマンの書籍「思考の整理学」で詳しく説明されている人間の知能のよく研究された二分法から着想を得ています。

  • システム1思考は、速く、直感的で努力を必要としません。ジャズミュージシャンが即興演奏したり、タッチタイピングで単語を考えて画面に表示されるのを見たりするときに、システム1思考を使っています。
  • 対照的に、システム2思考は遅く、緻密で努力が必要です。長い割り算を行ったり、楽器を演奏する方法を学んだりするときに、システム2思考を使っています。

この比喩では、LLMsは純粋にシステム1で動作すると考えることができます。つまり、テキストを速く生成することができますが、深い思考はできません。これにより、いくつかの驚くべき能力が発揮されますが、意外な方法で不十分な場合があります(システム1だけを使って数学の問題を解こうとすると想像してください:算術を止めて考えることができず、最初に思いついた答えを吐き出すしかありません)。従来の計算は、システム2思考に密接に沿っています。それは公式的で柔軟性がないですが、正しい手順のシーケンスで長い割り算の解決策など、印象的な結果を生み出すことができます。

この最新のアップデートにより、LLMs(システム1)と従来のコード(システム2)の機能を組み合わせて、Bardの応答の正確性を向上させることができます。暗黙的なコード実行を通じて、Bardは論理的なコードの恩恵を受ける可能性があるプロンプトを特定し、それを「ボンネットの下に書き込み」、実行し、その結果を使用してより正確な応答を生成します。これまでに、この方法により、内部チャレンジデータセットの計算ベースの単語や数学問題に対するBardの応答の正確性が約30%向上したという結果が出ています。

これらの改善があっても、Bardは常に正しいとは限りません。例えば、Bardはプロンプト応答を助けるためのコードを生成しない場合があります。また、生成されたコードが間違っていたり、実行されたコードが応答に含まれていない場合もあります。それでも、構造化された論理的な能力で応答する能力が向上したことは、Bardをさらに有用にするための重要な一歩です。今後の情報にご期待ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

人工知能

「コーネリスネットワークスのソフトウェアエンジニアリング担当副社長、ダグ・フラーラー氏 - インタビューシリーズ」

ソフトウェアエンジニアリングの副社長として、DougはCornelis Networksのソフトウェアスタック全体、Omni-Path Architecture...