「OpenAIが著者の許可なく彼らの著書を使用してChatGPTをトレーニングするために訴えられる」

OpenAIが著者の許可なくChatGPTをトレーニングするために訴えられる

2人の著者がOpenAIに対して訴訟を起こし、同社が彼らの作品をChatGPTのトレーニングに使用したと主張しています。問題は、彼らの書籍が著作権で保護されていたことであり、著者らはOpenAIがその作品をLLMのトレーニングに使用するための同意を得ていなかったと主張しています。

著者のPaul TremblayとMona Awardは、ChatGPTが彼らの作品に関して「非常に正確な要約」を生成できると主張しています。彼らは、これらの要約が彼らの作品に基づいてトレーニングされたChatGPTでのみ「可能」だったと述べており、これを著作権法の違反と見ています。

訴訟を提起したOpenAIと著者の両方の弁護士はCNBCの質問に対して回答していません。ChatGPTなどのLLMがトレーニングする方法は、通常、インターネットをクロールして収集される大量のテキストデータによって行われます。これには、ウィキペディアやアーカイブされた書籍などのサイトも含まれます。

訴訟はサンフランシスコで提起され、OpenAIのトレーニングデータの「大部分」が著作権で保護された資料に基づいていると主張しています。もちろん、これには2人の著者の書籍も含まれます。しかし、この訴訟の主な問題は、ChatGPTがどのようにしてデータを取得し、トレーニングしたのかを証明することです。

したがって、この情報がないと被害の証拠を示すことは困難な場合があります。現時点では、訴状はChatGPTが生成できた要約の展示物を参照しています。また、LLMが情報を間違えることも指摘しています。しかし、2人の著者は、要約の大部分が正確であり、彼らの主張では「ChatGPTはトレーニングデータセットの特定の作品の知識を保持している」と述べています。

訴状はさらに、「ChatGPTは、原告が公開した作品に含まれる著作権管理情報を一切再生産していない」と述べています。この訴訟は、芸術家の場合と非常に似ています。昨年、Stable DiffusionやDALL-E 2などのAIツールが、同意なしに彼らの作品をトレーニングすると主張する芸術家からの圧力がありました。

訴訟が進展するまでには時間がかかるでしょう。そして、裁判所での判断が将来のLLMのトレーニング方法を変える可能性があります。

編集者注:最新の生成AIについて学びたいですか?1日限りのGenerative AIサミットに参加しましょう。ハイプを超えて、この最先端の技術に深く潜り込みましょう。今すぐ無料で登録し、生成AIの力を解き放ちましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

中国からの新しいAI研究は、機械学習の手法と質問を組み合わせることで、指導者と学生の関係のつながりに新たな次元を明らかにします

学生と指導教員の関係は創造性に深い影響を与えます。調和の取れた学生と指導教員の関係は知識の伝達とイノベーションの基盤...

AIニュース

このAIニュースレターはあなたが必要なすべてです #72

今週、AIニュースはOpenAIのDevdayと多くの新しいモデルや機能の発売で主導権を握り、それによってエロン・マスクがLLMレース...

データサイエンス

スコア! チームNVIDIAが推薦システムでトロフィーを獲得しました

5人の機械学習の専門家が4つの大陸に分散し、最先端のレコメンデーションシステムを構築するための激しい競争で3つのタスク全...

AI研究

「NTUシンガポールの研究者が、3Dポイントクラウドからの正確な人間のポーズと形状の推定のためのAIフレームワークであるPointHPSを提案する」という文です

人工知能の分野でのいくつかの進歩により、最近では人の姿勢と形状の推定(HPS)はますます重要な研究分野となっています。モ...

機械学習

このAIニュースレターは、あなたが必要とするすべてです#62

今週は、METAのコーディングモデルの開発とOpenAIの新しいファインチューニング機能の進展を見てきましたMetaは、Code LLaMA...

コンピュータサイエンス

(Note Since HTML is a markup language, it doesn't have a direct translation. The provided text is a translation of the content.)

140以上のブランドが低品質なコンテンツファームサイトに広告を出しており、この問題は急速に拡大しています