News Media Alliance U.S. Copyright Office White Paper Generative Artificial Intelligence
created at
【速報】AI開発者がニュースの著作権物を不正にスクレイピングし、そのコンテンツをモデルのトレーニングに使用していることが問題視されている
AIモデルのトレーニングにニュースコンテンツが不正に使用されている
ニュース業界団体のNews Media Alliance(NMA)は、ニュースパブリッシャーのコンテンツがAIモデルのトレーニングに不正に使用されていると主張している。NMAは、ニュースパブリッシャーのコンテンツがAIモデルの学習データセットで非常に多く使用されていることを指摘し、「AIがパブリッシャーのコンテンツをコピーし、使用して競合製品を作り出す」とし、著作権侵害であるとの立場を表明している。
AI開発者とニュースパブリッシャーの対立
NMAによれば、ニュースパブリッシャーは投資を行い、リスクを取っている一方で、AI開発者はその成果を「ユーザー、データ、ブランドの創造、広告収益」として享受していると指摘している。これにより、ニュースパブリッシャーは収益減、雇用機会の減少、視聴者との信頼関係の損失などの影響を受けている。
対策としてのライセンスモデルと透明性の確保
NMAは、AIシステムの利用によってニュースパブリッシャーのコンテンツが利益化されることを著作権局に宣言するよう勧告している。また、著作権物の摂取を制限するために、様々なライセンスモデルと透明性の確保策を導入することも求めている。NMAはまた、著作権保護されたコンテンツを第三者のウェブサイトから排除するための措置も推奨している。
AI開発者と著作権侵害に関する問題
NMAは、AIの発展には利点もあるとしつつも、トレーニング方法が問題視されていると指摘している。OpenAIのChatGPT、GoogleのBard、AnthropicのClaudeという3つのAIチャットボットは、過去12カ月間で利用が増加しているが、いずれも著作権侵害の訴えに直面している。AI開発者による著作権侵害問題は、法廷でも争われている。
![【速報】AI開発者がニュースの著作権物を不正にスクレイピングし、そのコンテンツをモデルのトレーニングに使用していることが問題視されている](https://images.cointelegraph.com/cdn-cgi/image/format=auto,onerror=redirect,quality=90,width=840/https://s3.cointelegraph.com/uploads/2023-11/cf805ae3-7025-49cc-8b25-7b265d33deea.jpg)