OpenAIは、GPTBotを導入しましたこれは、インターネット全体からデータを自動的にスクレイピングするために設計されたウェブクローラです

OpenAIは、ウェブクローラのGPTBotを導入しましたこれはインターネット全体からデータを自動的にスクレイピングするために設計されました

OpenAIは、公開ウェブサイトでのデータ収集に起因するプライバシーや知的財産権の懸念に対応するため、GPTBotと呼ばれる新しいウェブクローラーツールを導入しました。この技術は、公開ウェブデータを透明に収集し、OpenAIの規範の下でAIモデルのトレーニングに活用することを目指しています。

GPTBotのユーザーエージェントは、将来のAIモデルの精度向上に貢献するデータを集めることを目指しています。このプロセスでは、支払いが必要なソースは除外されます。ただし、収集されたデータには誤って識別可能な情報やテキストが含まれる場合があり、OpenAIのポリシーに違反する可能性があることに注意が必要です。

OpenAIは、GPTBotのプラットフォームアクセスに関するウェブサイト管理者への選択肢を提供する必要性を認識しています。アクセスの許可は、AIモデルの精度向上における協力と見なされ、最終的にはその能力を向上させ、セキュリティ対策を強化します。一方で、GPTBotのデータ収集の対象としたくないウェブサイトを含めない選択肢を望む人々のために、OpenAIはGPTBotのディレクティブをウェブサイトのrobots.txtファイルに組み込み、特定のコンテンツセグメントへのアクセスを設定する手順を示しています。

OpenAIは、透明性を高めるためにGPTBotの活動に関連するIPアドレス範囲を公開しました。この公開は、ボットのアクションを特定するだけでなく、必要な場合にはアクセスをブロックする手段も提供します。

これらの透明性の取り組みは、明示的な同意なしにデータを収集すると非難されたAIモデルの運営者に対するOpenAIの対応を強調しています。業界の実践が公開ウェブサイトからのコンテンツを適切な承認なしに収集することで、知的財産権やプライバシー保護に対する侵害の可能性があるとする一般的な感情が広がり、AIエンティティにより包括的なオプトインおよびオプトアウトのメカニズムを提供するよう求める声が上がっています。

関連の進展として、クラウドファンディングプラットフォームのKickstarterは最近、AIプロジェクトに関する規制を導入しました。これらの規制の中で、外部データソースを活用するプロジェクトは、適切なライセンス契約とソースウェブサイトからの同意の証拠を提供することを義務付けられています。この義務を果たさないプロジェクトは、Kickstarterのリストに掲載される資格がありません。

今週中に、OpenAIは重要な改革を行う予定であり、基盤となるChatGPTレイヤーをGPT-4に移行することが予想されています。さらに、Code Interpreterプラグインの改良では、複数のファイルをプロンプトにアップロードするサポートが追加され、OpenAIの持続的な改善とイノベーションへの取り組みが反映されます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more