「作者の正体を暴く:AIか人間か?IBMの革新的なテキスト検出ツールを用いたAIフォレンジックスの出現を探る」

AI vs. Human Unmasking the Author - Exploring the Emergence of AI Forensics with IBM's Innovative Text Detection Tool

急速に進化するAIの時代において、注目すべき課題が存在します。それは、生成AIの透明性と信頼性です。IBMの研究者たちは、世界にAI検出と帰属のツールを提供することで、生成AIの認識方法を変えることを目指しています。しかし、複雑なことに、LLMは自分が書いたコンテンツを検出したり、チューニングされたモデルのソースを追跡するのにはあまり優れていません。日常のコミュニケーションを再構築し続ける中で、研究者たちは、生成AIをより説明可能で信頼性のあるものにするための新しいツールに取り組んでいます。

研究者たちは、現代の時代の基盤となる信頼性のあるAIツールキットを適応させることで、これらの進化し続けるテクノロジーに対して責任と信頼性を確保することを目指しています。IBMとハーバードの研究者は、最初のAIテキスト検出器の1つであるGLTRを作成しました。GLTRは単語間の統計的関係を分析したり、生成テキストの特徴的な手がかりを探したりします。IBMの研究者は、AI検出器を欺くためにパラフレーズされたAI生成テキストを特定するのに役立つ画期的なツールであるRADARを開発しました。RADARは、テキストをパラフレーズするモデルとAI生成されたかどうかを判定するモデルとを対決させます。チャットGPTのようなサードパーティモデルへの従業員のアクセスを制限することで、クライアントデータの漏洩を防止するための安全対策が実施されています。

生成AIの世界では、テキストを生成したモデルとそのテキストの起源を特定することが課題となっています。これは帰属として知られる分野を通じて行われます。IBMの研究者たちは、応答を比較し関連するモデルを明らかにするためのマッチングペア分類器を開発しました。機械学習を用いた自動のAI帰属は、特定のモデルの起源や他の数多くの要素を特定するのに研究者たちを支援しています。これらのツールは、モデルの基盤を追跡し、その振る舞いを理解するのに役立ちます。

IBMは、説明可能で信頼性のあるAIの推進者として長年の歴史があります。彼らはバイアスの緩和と説明可能性を製品に取り入れたAI Fairness 360ツールキットを導入しました。そして、Watsonx.governanceの11月リリースにより、彼らはAIワークフローの透明性を向上させています。IBMは、透明性のツールのアクセシビリティを誰にでも提供するという使命に固執しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

AIがセキュリティを向上させる方法

AIはマルウェアの検出、サイバー脅威の特定と対応、機密データの保護、そして重要なインフラストラクチャのセキュリティ向上...

データサイエンス

ビジネス戦略において機械学習を使用する時と使用しない時の選択

それは明らかな質問ではありません初心者のデータサイエンティストにとっては、すぐに機械学習モデルを推進することは間違い...

AI研究

マイクロソフトの研究者が、言語AIを活用してオンライン検索エンジンを革命化するための「大規模検索モデル」フレームワークを紹介しました

現代社会はインターネット上の情報の拡散によって特徴付けられ、検索エンジンは知識を見つけたりまとめたりするために欠かせ...

AIニュース

新しいAIモデル、たった30BパラメーターでGPT-3を凌駕する

世界的に有名なオープンソース言語モデル(LLMs)プロバイダーであるMosaicMLは、最新世代のNVIDIA H100アクセラレータを搭載...

人工知能

「オッペンハイマーからジェネラティブAIへ:今日の企業にとっての貴重な教訓」

先週末、最新の大ヒット作品「オッペンハイマー」を劇場で3時間観ましたストーリー全体と結末はすでに知っていたにも関わらず...

人工知能

「AIがまだすぐには置き換えられない8つの仕事」

皆がAIが代替する仕事について話していますが、私たちはコインの裏側、つまりAIがまもなく置き換えないであろう仕事に目を向...