【华e生活大唐编译】《纽约时报》对人工智能对新闻业构成的威胁进行了回击,周三(12月27日)对OpenAI和微软提起了联邦诉讼,要求它们停止使用其报道来训练聊天机器人的做法。
《纽约时报》表示,这些公司实际上窃取了该报记者价值数十亿美元的工作成果,威胁到了该报的生计。在某些情况下,这些公司将《纽约时报》的材料逐字逐句地交给那些向OpenAI的ChatGPT等生成式人工智能寻求答案的人。《纽约时报》向曼哈顿联邦法院提起诉讼。
OpenAI和微软没有回应置评请求。
媒体是众多可能被人工智能的快速发展所颠覆的行业之一。媒体机构已经受到了读者向在线平台迁移的打击,虽然许多出版物——最著名的是《纽约时报》——已经成功地开辟了一个数字空间,但人工智能可能成为一个重大威胁。
代表《纽约时报》的苏斯曼·戈弗雷律师事务所(Susman Godfrey)合伙人兼首席律师伊恩·b·克罗斯比(Ian B. Crosby)说,“这些机器人与它们接受训练的内容竞争。”
人工智能公司从网上获取信息,包括新闻机构发表的文章,来训练生成式人工智能聊天机器人。大型语言模型也在大量其他人类书写的材料上进行训练,比如教学手册和电子书。这有助于他们牢固地掌握语言和语法,并正确地回答问题。
但这项技术仍在发展中,而且有很多错误。例如,《纽约时报》在诉讼中称,OpenAI的GPT-4错误地将产品推荐归于该报的产品评论网站Wirecutter,危及其声誉。
OpenAI和其他人工智能公司(包括竞争对手Anthropic)迅速吸引了数十亿美元的投资,因为公众和企业对这项技术的兴趣激增,尤其是今年。
微软与OpenAI建立了合作关系,使其能够利用该公司的人工智能技术。根据诉讼,这家位于华盛顿州雷德蒙德的科技巨头也是OpenAI的最大支持者,自两家公司于2019年开始合作以来,已经向OpenAI投资了至少130亿美元。作为协议的一部分,微软的超级计算机将为OpenAI的人工智能研究提供支持,而这家科技巨头将把这家初创公司的技术整合到自己的产品中。
该报的投诉是在针对OpenAI侵犯版权的诉讼越来越多的情况下提出的。该公司已经被包括喜剧演员莎拉·西尔弗曼在内的几位作家起诉,他们说他们的书在未经许可的情况下被用于训练OpenAI的人工智能模型。
今年6月,4000多名作家联名致信OpenAI、谷歌、微软、Meta和其他人工智能开发商的首席执行官,指责他们在开发聊天机器人时“模仿和反悔”他们的语言、风格和想法。
随着人工智能技术的发展,对其使用的担忧也引发了包括好莱坞在内的其他行业的罢工和诉讼。康奈尔大学科技政策研究所所长萨拉·克雷普斯(Sarah Kreps)说,不同的利益相关者都意识到这项技术可能会颠覆他们的整个商业模式,但问题是如何应对。
克雷普斯表示,她同意《纽约时报》正面临这些聊天机器人的威胁,但她也认为,彻底解决这个问题将是一场艰苦的战斗。
“有很多其他的语言模型也在做同样的事情。”她说。
周三提起的诉讼称,OpenAI和微软开发的生成式人工智能工具密切总结《纽约时报》的内容,模仿其风格,甚至逐字逐句地背诵。该投诉列举了OpenAI的GPT-4发布《纽约时报》大量新闻文章的例子,包括2019年发表的一篇获得普利策奖的关于纽约市出租车行业的调查,该调查耗时18个月才完成。它还引用了必应聊天(现在被称为Copilot)的输出,称其中包括《纽约时报》文章的逐字摘录。
《纽约时报》没有列出它正在寻求的具体损害赔偿,但表示,法律诉讼“旨在让他们为非法复制和使用《纽约时报》独特的有价值的作品而欠下的数十亿美元法定和实际损害赔偿负责”。该公司还要求法院命令科技公司销毁使用其成果的人工智能模型或数据集。
网络流量是该报广告收入的重要组成部分,并有助于推动其在线网站的订阅。《纽约时报》称,人工智能聊天机器人的输出会转移报纸和其他版权所有者的流量,使用户不太可能访问原始来源获取信息。
例如,《纽约时报》Wirecutter文章的访问量减少,意味着点击附属链接的人减少,这反过来又意味着该报产品评论网站的收入减少。
《纽约时报》表示,从未允许任何人将其内容用于生成式人工智能目的。在这起诉讼之前,《纽约时报》与这两家公司之间的谈判似乎也于4月份破裂,这可能是启动有关结束商业纠纷的谈判的一种方式。
代表2200多家新闻机构的行业组织新闻/媒体联盟(News/Media Alliance)对《纽约时报》周三的行动表示赞赏。
联盟总裁兼首席执行官Danielle Coffey说:“如果合作,高质量的新闻和GenAI可以互补。“但未经许可或付费使用新闻报道是非法的,当然也不是合理使用。”
今年7月,OpenAI和美联社(The Associated Press)宣布了一项协议,由这家人工智能公司授权美联社的新闻报道档案。本月,OpenAI还与柏林媒体公司阿克塞尔·斯普林格(Axel Springer)签署了类似的合作协议,该公司拥有《政治》(Politico)和《商业内幕》(Business Insider)。根据协议,OpenAI ChatGPT的用户将收到阿克塞尔·施普林格(Axel Springer)旗下媒体品牌的“精选全球新闻内容”摘要。两家公司表示,查询的答案将包括原创文章的出处和链接。
《纽约时报》将此次行动与20多年前针对Napster的版权诉讼相提并论,当时唱片公司起诉这家文件共享服务公司非法使用他们的材料。唱片公司赢了,Napster很快就消失了,但它对唱片业产生了重大影响。业界认可的流媒体如今主导了音乐行业。