OpenAI回应“抄袭指控”：纽约时报“捏造证据”

来源：华尔街见闻

被《纽约时报》指控侵权后，OpenAI进行了公开回应。

OpenAI当地时间周一发表博客文章称，《纽约时报》“故意操纵”ChatGPT重复了该报文章中的内容，该报提起的诉讼“没有法律依据”。

据OpenAI称，《纽约时报》举的例子来自许多第三方网站上发表的旧文章。“（《纽约时报》）似乎故意操纵提示，通常包括冗长的文章摘录，以便让我们的模型重复。”

“我们的模型通常不会像《纽约时报》暗示的那样表现，这表明他们要么有意指示模型重复某些内容，要么从很多次尝试中精心选取了一些例子。”

OpenAI还认为，它们利用互联网公开的数据来训练AI模型是合法的，不违反美国版权法。因为根据美国版权法的“合理使用”原则，利用版权作品进行某些传播、研究等目的可以不被视为侵犯版权。

上周，OpenAI的知识产权和内容首席Tom Rubin在媒体采访中表示，公司近期与数十家出版商展开了有关许可协议的谈判：“我们正处于多场谈判中，正在与多家出版商进行讨论。他们十分活跃积极，这些谈判进展良好。”

在12月27日提起的诉讼中，《纽约时报》指责OpenAI和微软“搭便车”，利用该报数百万篇文章训练他们的大语言模型（LLM），损害了其内容创作和内容变现能力，并向两家公司索赔数十亿美元。

《纽约时报》还认为，OpenAI创建了一种基于“大规模侵权版权”的商业模式，通过盗用该报的知识产权获利，要求OpenAI销毁任何使用其受版权保护的材料的训练数据和聊天机器人模型。

随后，两位非小说类作家提出集体诉讼，称OpenAI在他们的作品上训练LLM，侵犯了他们的版权。此前John Grisham和Jodi Picoult等著名小说家也提起过类似的诉讼。

OpenAI还在其博客中表示，它是从该报12月27日发表的一篇新闻文章中首次听说《纽约时报》的诉讼的。在此之前，它已经与该报就合作伙伴关系进行了富有成效的讨论，并达成了合作协议。OpenAI称，《纽约时报》的“内容对我们现有模型的训练没有任何有意义的贡献”。

《纽约时报》声称，ChatGPT抄袭了其文章的全部摘录，但OpenAI将这种现象描述为“无意记忆”，公司明确试图避免这种现象。