英伟达:与安妮图书馆的联系并不能证明侵犯版权

编辑:      文章来源:中国保护知识产权网      日期:26-03-04      点击:16

英伟达(NVIDIA)已向美国联邦地区法院提交动议,要求驳回一起扩大的版权侵权集体诉讼,主张原告作者未能证明其书籍实际被用于训练人工智能模型。这家芯片巨头表示,仅与安妮图书馆(Anna’s Archive)进行联系并不构成侵权,并对修订后诉状中的几乎所有新指控提出质疑。

上个月,媒体曾报道过这起扩大的集体诉讼:多名作者指控英伟达利用数百万本盗版书籍训练其人工智能模型。诉状引用了内部邮件,显示英伟达曾联系安妮图书馆,寻求对这家影子图书馆海量藏书的“高速访问”。在被告知材料的非法性质后,英伟达高管据称仍给予了“绿灯”放行。

如今,英伟达作出全面回应,提交了一份详尽的驳回动议,称原告的指控充满推测、模糊不清,且在法律上不成立。

联系安妮图书馆不等于侵权‌

在加州联邦法院,英伟达辩称,原告的指控建立在推测而非事实之上。

尽管诉状显示有证据表明英伟达曾就获取“数百万盗版资料”一事与安妮图书馆接触,但英伟达指出一个关键漏洞:原告从未明确指控英伟达从该影子图书馆下载了他们‌具体的书籍作品‌。

动议中指出:“诉状中关于安妮图书馆的唯一可成立事实,仅是英伟达‘联系过安妮图书馆’、对方提出确认请求,以及英伟达同意‘继续推进’。”

“仅仅与安妮图书馆代表有过接触,并不意味着英伟达获取了原告的作品。同样合理的情况是,英伟达并未获取。”

英伟达强调,原告严重依赖“基于信息与信念”(upon information and belief)的指控方式——这一法律用语本质上意味着这是一种有根据的猜测,而非能够以证据支持的陈述。。

‌安妮图书馆“支持”英伟达立场‌

值得注意的是,在此前报道发布后,安妮图书馆在Reddit上回应称,其团队从未与英伟达直接接触,暗示对方可能通过中间方操作。

该代表表示:“我们从未直接与英伟达直接打交道,所以他们很可能用了中间方来规避法律风险。但如果英伟达直接联系我们,我们很乐意以捐赠为交换提供高速访问。”

这一澄清是否有利于原告尚不明确,但英伟达在驳回动议中并未提及此事。

"撒网式"钓鱼取证‌

除了对安妮图书馆问题的反驳外,英伟达将修正诉状描述为一场钓鱼取证,包含"不当兜底指控",针对该公司几乎所有曾涉及的人工智能模型和数据集。。

原诉状仅聚焦于NeMoMegatron模型家族和Books3数据集。但修正版本现提及未指明的"NVIDIA LLMs"、未命名的"内部模型"、未定义的"NextLargeLLM"模型,以及未具体说明的"其他影子图书馆"。

在提交更新诉状后不久,作者发出了新的证据开示请求,针对这些新增模型和数据集。

"原告对无限证据开示的追求,通过其提交后送达的大量证据开示请求得到证实,"英伟达写道,作为所谓钓鱼取证的进一步证据。

原告未能证明其书籍被实际使用

除安妮图书馆外,修订后的诉状还新增了多个影子图书馆,包括Bibliotik、LibGen、Sci-Hub、Z-Library和Pirate Library Mirror。

然而,英伟达指出,该诉状缺乏证据证明公司曾下载过原告作者的书籍。同样,也无证据表明这些特定书籍或数据集被用于训练大语言模型(LLMs)。

例如,针对Nemotron-4系列模型,原告仅推测由于训练数据量庞大且包含书籍,就必然涵盖了他们的作品。英伟达驳回了这一推论,强调推测不能替代事实。

驳回动议中明确写道:“缺乏事实性指控证明用于训练Nemotron-4 15B和Nemotron-4 340B的数据包含原告作品,因此针对这些模型的指控应予驳回。”

辅助侵权主张缺乏法律依据

修订后的诉状新增了两项法律主张:辅助性版权侵权(contributory infringement)和替代性版权侵权(vicarious infringement),指控英伟达通过提供工具协助客户下载“The Pile”数据集而构成间接侵权。

英伟达认为,这两项主张从一开始就无法成立。因为无论是帮助侵权还是替代侵权,都必须以第三方存在直接侵权行为为前提。但原告仅“基于信息与信念”推测其客户下载并使用了ThePile数据集,未能指明任何具体客户实施了侵权行为。

驳回动议中指出:“诉状虽列出了三名所谓英伟达客户,但并未指出其中任何一人被指控下载或使用了The Pile。”

即便假设第三方存在侵权行为,原告也未能证明英伟达明知具体的侵权行为发生,或对这些行为提供了实质性帮助。英伟达强调,其NeMo框架提供的工具是可选的,客户可自主决定将其用于任何数据集——包括合法授权或公共领域的数据。

“NeMo框架具备大量非侵权用途”,英伟达在文件中援引判例指出,当一项技术产品具有合法且重要的使用场景时,不应因此承担侵权责任。

英伟达请求驳回相关主张

总体而言,英伟达请求法院驳回所有扩展主张,包括新增模型、新增影子图书馆以及与安妮图书馆的所谓联系。

该公司进一步主张,应完全驳回辅助性版权侵权及替代性版权侵权主张,理由是并无证据证明特定书籍系盗版所得。

值得注意的是,直接版权侵权主张——即指控英伟达使用Books3数据库训练其NeMo模型——并未被纳入本次动议。英伟达计划在庭审或简易判决阶段予以反驳,其抗辩可能主要依赖合理使用原则。