1.OpenAI指控DeepSeek使用其专有模型训练自己的开源模型,称这是一种“盗窃”知识产权的行为。
2.DeepSeek推出的R1推理模型在多个排行榜上表现优异,可与领先的美国模型媲美。
3.专家表示,蒸馏技术在行业内是一种常见做法,OpenAI提供官方途径让开发者进行类似操作。
4.然而,有人认为DeepSeek可能通过蒸馏技术吸收了OpenAI模型的知识,违反了OpenAI的服务条款。
5.与此同时,OpenAI正面临自身的版权诉讼,指控其在未经授权的情况下使用内容创作者的文章和书籍训练AI模型。
以上内容由腾讯混元大模型生成,仅供参考
图片来源:DeepSeek
根据金融时报报道,OpenAI称它发现 DeepSeek 使用了 OpenAI 的专有模型来训练自己的开源模型的证据。
OpenAI 向金融时报透露,它掌握了一些关于“蒸馏”(distillation)技术的证据。蒸馏是一种开发者用来优化小型模型性能的方法,该技术通过使用更大、更强大模型的输出,使得小型模型能够在特定任务上以更低的成本取得类似的效果。
OpenAI 拒绝进一步透露其证据的细节。该公司的服务条款规定,用户不得“复制”其任何服务,也不得“利用输出数据来开发与 OpenAI 竞争的模型”。
DeepSeek 推出的 R1 推理模型因其在认知任务上的卓越表现,让市场、投资者和硅谷科技公司感到意外。其模型在多个排行榜上取得了较高排名,表现可与领先的美国模型媲美。
一位接近 OpenAI 的人士表示,蒸馏在行业内是一种常见做法,并指出 OpenAI 提供了一种官方途径,让开发者在其平台上进行类似操作。但该人士补充道:“问题在于,当你利用它来创建自己的模型并用于自身目的时,就会存在争议。”
据另一位知情人士透露,微软和 OpenAI 在去年秋天对一些被认为属于 DeepSeek 的账户展开调查,这些账户曾使用 OpenAI 的应用程序接口(API),并因涉嫌违反服务条款的蒸馏行为而被封禁。
此前,美国前总统特朗普的人工智能与加密货币顾问大卫·萨克斯(David Sacks)表示,“有可能”发生了知识产权盗窃行为。萨克斯在周二接受福克斯新闻采访时表示:“在 AI 领域有一种技术叫蒸馏……一个模型可以从另一个模型学习,并且在一定程度上吸取‘母模型’的知识。”
“有大量证据表明,DeepSeek 的确通过蒸馏技术吸收了 OpenAI 模型的知识,我认为 OpenAI 对此并不高兴。”萨克斯补充道,但他未提供具体证据。
DeepSeek 方面表示,其 V3 模型(拥有 6710 亿参数)仅使用了 2,048 张 Nvidia H800 显卡,花费 560 万美元进行训练,而 OpenAI 和谷歌在训练同等规模模型时的成本远远高于这一数值。一些专家指出,DeepSeek 生成的部分回答表明,它可能曾基于 OpenAI 的 GPT-4 输出进行训练,这将违反 OpenAI 的服务条款。
业内人士表示,实际上,无论是在中国还是在美国,AI 实验室普遍会使用 OpenAI 等领先公司的输出数据进行训练。
OpenAI 等行业巨头投入大量资源,雇佣人员教导其模型如何生成更具人类自然表达的回答,这一过程既昂贵又费时。因此,业内人士认为,较小的 AI 公司利用这些数据来改进自己的模型是一种常见做法。
加州大学伯克利分校人工智能博士生 Ritwik Gupta 解释道:“初创公司和学术机构使用像 ChatGPT 这样具有人类反馈优化的商业 LLM(大型语言模型)输出数据来训练自己的模型,是一种非常普遍的做法。”
“这意味着他们可以免费获得人类反馈优化的成果。我并不惊讶 DeepSeek 可能也在这样做。如果确实如此,阻止这种做法可能会非常困难。”他补充道。
这一现象也暴露出前沿 AI 公司在尖端研究中的一个经济难题——如何在其他团队“搭便车”利用其模型的情况下,维护自身的技术领先地位。
与此同时,中国公司不仅迅速吸收了美国同行的经验,还创新出优化有限算力资源的方式,从而降低了训练和运行模型的成本。
OpenAI 在声明中表示:“我们知道,其他公司一直在试图蒸馏美国领先 AI 公司的模型。我们采取了一系列反制措施来保护我们的知识产权,包括谨慎选择哪些前沿能力会被纳入发布模型。展望未来,我们认为,与美国政府密切合作以保护最先进模型免受对手和竞争者的窃取至关重要。”
与此同时,OpenAI 也正面临自身的版权诉讼,包括《纽约时报》和多位知名作家在内的内容创作者指控 OpenAI 在未经授权的情况下,使用其文章和书籍训练 AI 模型。
今年9月,中国的阿里巴巴发布了100多款新开源AI模型,作为Qwen 2.5系列的一部分,支持29种语言。中国搜索巨头百度有Ernie系列,智谱AI有GLM系列,MiniMax则推出了MiniMax-01系列,这些模型在性能上与美国领先的模型相比具备显著的竞争力,并且成本大大降低。
参考资料:
---------END--------
致力于为年轻人提供高质量的科技和财经内容。