第九届三知论坛实录 | 主旨发言及闭幕式

图片


图片


为更详实呈现第九届三知论坛上各位嘉宾的精彩发言内容,本期知产力特别整理主旨发言及闭幕式实录,以飨读者。


整理/编辑 | Tammie



2024年11月7日至8日,第九届三知论坛在风景如画的浙江省嘉兴市海盐县成功举办。本届三知论坛由中国法学会知识产权法学研究会指导,浙江省高级人民法院知识产权审判庭、知产力、知产宝主办,嘉兴市中级人民法院承办,嘉兴市南湖区人民法院、海盐县人民法院共同协办。本届论坛以“人工智能发展与知识产权保护”为主题,来自司法机关、高等院校、研究机构与创新企业的代表围绕人工智能生成物的客体性质及权利归属、人工智能数据训练中的著作权问题、人工智能生成物的知识产权侵权责任等主题进行分享,精彩内容吸引了来自全国各地数百名知识产权从业者参会。


李明德:数字时代著作权保护的三大问题


图片
▲李明德  中国法学会知识产权法学研究会学术委员会主任、中国社会科学院大学教授

李明德教授结合版权制度演进历史分享关于数字时代著作权保护三大问题的看法与思考:

我国的造纸术和印刷术以及西方的活字印刷术都推动了版权保护的需求,形成了两种作品保护制度。英美法系的版权制度注重作品的商业性利用,基本不涉及作者的精神权利。而大陆法系的作品保护制定则强调以人为本,例如法国于1791年颁布了《表演权法》,于1793年颁布了《复制权法》,并在后来演变为《作者权法》。

著作权法并非作品权利法,而是作者的权利法。版权制度随着造纸和印刷技术的出现而产生,并随着作品传播技术的发展而不断演变。就作品保护而言,在计算机技术和互联网络技术下,突出了数字化、技术措施和权利管理信息的保护,以及网络服务商的责任。

1.作品的数字化

在计算机技术的条件下,所有的作品(包括受保护的作品,不受保护的作品,公有领域中的作品)都可以数字化。数字化并未改变作品的性质。按照1996年缔结的《世界知识产权组织版权条约》第1条第4款的议定声明:不言而喻,在电子媒体中以数字形式储存受保护的作品,构成《伯尔尼公约》第9条意义上的复制。

著作权制度的起点是作品,作品具有独创性表达。其中第一个要件是表达,而保护表达就意味着应当排除被表达的思想观念和客观事实等等。其中的第二个要件是独创性,也即相关的表达是来自于作者,而非来自于抄袭。按照英美法系的标准,相关的表达只要来自于作者就可以构成作品。而依据大陆法系的标准,作品还应当体现作者的精神、情感和人格。

李教授特别强调,我们在谈论人工智能生成物的时候,必须明确只有有血有肉的自然人才可以创作作品,才是作者。例如美国法院曾经判决,猴子的自拍照不是版权法意义上的作品,因为猴子不是人,不可能成为作者,也不可能委托动物保护组织提起诉讼。1997年美国法院在一个关于计算机生成材料的判决中有一句话,“如果让这个世界上一个有血有肉的自然人承担侵犯版权的责任,被侵犯的作品也一定是有血有肉的自然人创造出来的,不可能是机器创作。”2022年8月美国联邦巡回上诉法院判决裁定AI不是发明人,不能获得权利。按照同样的道理,人工智能也不可能成为作者,不可能获得版权保护。

2.技术措施和权利管理信息

传统的版权制度是在作品上设定版权,使用他人作品应当获得授权并支付一定的报酬。然而在计算机技术和互联网络技术的条件下,仅仅在作品上设定版权还不够,权利人需要设定一些技术措施,例如门禁、密码、扰频、只读、电子水印等。显然,这些技术措施又可能被他人破解和规避,因而需要采取措施予以保护。

在传统条件下,权利管理信息出现在报刊和书籍的版权页上,很难篡改和移除。但是在数字条件下,版权管理信息很容易被篡改和移除,因而需要予以保护。在这方面,世界知识产权组织《版权条约》和《表演与录音条约》都明确规定,成员国负有保护技术措施和权利管理信息的义务。但是值得注意的是,这是成员国的义务,而非作者拥有的新的权利。

3.网络服务商的责任

在传统的作品传播技术下,权利人可追究诸如出版商、广播公司等组织的间接或帮助侵权责任。然而,直接将这种做法应用于网络环境,将会导致网络服务难以存续。为此,美国发展了“避风港”制度,在一定条件下免除网络服务商的侵权责任。然而,当这一制度引入我国之后,却出现了一些不利于著作权人的结果。具体说来,各种网络服务商充分利用这一制度,规避自己的侵权责任。例如,通过格式合同要求网络用户不得侵犯他人的权利,包括著作权。又如,在接到权利人的投诉后,则删除侵权内容或断开侵权链接。这样一来,著作权人的利益就很难实现了。相比之下,日本法院依据民法的相关规定,提出了网络服务商“视同侵权”的规则,即网络服务商与非法上传者承担相同的责任。至于欧盟,由于著作权集体管理组织非常发达,能够提起各种诉讼来维护作者的权利。

总结起来,面对数字化技术和网络技术对于作品保护制度的挑战,我国的专家学者和司法实务人员,过多地关注了作品的数字化,以至于提出了“人工智能作品”“数据知识产权”的命题。而在另一方面,对于网络服务商应当承担的责任则没有成为研究的重点。显然,加强有关网络服务商责任的研究,规范网络服务商的行为,将有助于强化著作权的保护,保障著作权人获得应有的利益。

王业全:大模型基本原理与前沿进展


图片
▲王业全  北京智源人工智能研究院研究员,国家“新一代人工智能国家科技重大专项”负责人

北京智源人工智能研究院是国家科学技术部和北京市人民政府共同支持的第一个人工智能领域的新型研发机构,智源研究院的愿景和目标是聚焦原始创新和核心技术,建立目标导向与自由探索相结合的科研体制,营造全球最佳的学术和技术创新生态,推动北京成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头,率先成为国际领先的人工智能创新中心,推动人工智能产业发展和深度应用改变人类社会生活,促进人类、环境和智能的可持续发展。

王业全先生以专业视角,结合丰富的实践经验对大模型的基本原理和前沿进展进行了介绍:

实际上,人工智能领域的研究与技术发展已历经多年,但在大模型技术崭露头角之前,大多是业界人士参与该领域的讨论,公众参与相对较少。根据能力,人工智能可被划分为弱人工智能与强人工智能两大类,大模型之前的人工智能以弱人工智能为主;2022年以GPT系列为代表的人工智能技术兴起,促使人们重新审视人工智能领域,目前学术界普遍认为大模型是实现通用人工智能最有可能的一条技术路线。

1.大模型的技术原理

以大家都熟悉的ChatGPT为例,其能力来源于背后强大的语言模型,语言模型的本质是通过三驾马车(大数据、大算力、强算法)共同协力实现智能目标。大模型的基本原理,即语言模型的本质是“用前K个单词预测第K+1个单词”,以the、cat、sat三个单词为例,给定“the”,预测下一个单词“cat”,给定“the cat”,预测下一个单词“sat”,给定“the cat sat”,预测“on”,以此类推。

尽管GPT系列模型展现出强大的能力,但其在语言理解、逻辑、生成可信度等方面仍然存在不足,并带来了“一本正经地胡说八道”等现象,在业内被称为AI幻觉,这也目前尚未攻克的难题。此外,大模型安全领域也是亟需发展的重要方向。

大模型能力探索最重要的定律是Scaling Law,即规模定律:在相同的条件下,模型的参数规模越大,模型的能力越强,这也是目前大模型领域最重要的发展方向之一,OpenAI仍然坚持这条信仰,迄今为止还在对模型参数规模的边界进行探索,但受限于计算能力,探索过程只能逐步进行。

为什么语言模型现在发展起来了,而过去没有发展起来,算力是重要的制约因素。从语言模型的发展历史来看,第一代One-Hot方法,每个单词/字用非常高维的稀疏向量表示(只有一个值为1,其他均为0),比如10万维度。因此,早期的第一个缺陷是语义相似度难以计算,例如北京和巴黎这两个单词,它们既是大国首都也是大城市,但在此方法下两者的相似度却为0,此外,由于每个单词的表示为高维表示,第二个缺陷便是计算复杂度高;第二代语言模型的表示方法word2vec,每个单词/字用低维稠密向量表示,比如128维度,这样相较于第一代好很多,每个单词的表示具备相似度,并且降低了计算复杂度,因此成为深度学习时代的NLP的基石;第三代语言大模型的出现便顺其自然。

大模型与深度学习时代模型的重要区别在于:①深度学习时代会舍弃训练词向量语言模型的其他参数,仅保留词向量,而大模型是将整个神经网络都保留下来;②大模型的参数量远远大于小模型的参数量;③第二代向量技术中会舍弃其他模型参数,而第三代语言模型的所有参数都可以保留,智力更强,这也符合模型参数量越大,智能能力越强的定律。

这些技术背后的重要推动力之一是算力的发展,上世纪算力非常弱,直到第三代大模型时,出现的超大规模GPU并行集群使得超大规模的大模型训练成为可能。

关于语言模型的研发步骤基本为以下4步:第一步是采用大量无监督数据训练基础模型;第二步是采用SFT方法进行对齐,使大模型的交互方式更像人类;第三步是Reward Model,给下一步模型训练提供监督信号,例如在模型做坏事时给予惩罚,在做好事情时给予奖励;最后一步是强化学习模型,使用Reward Model提供的监督信号对模型进行进一步优化。

大模型的能力非常强,它的知识空间可以覆盖绝大部分的语言空间,总体而言,当参数规模达到数百亿后,会出现复杂系统涌现现象。

2.大模型的前沿进展

大模型最重要的特点是规模大,具有涌现性(当规模扩大到一定程度时便可产生预料之外的新能力)以及通用性,不限于专门问题或领域。

首先需要缓解语言模型训练中的幻觉问题,关键在于对模型进行正确的反馈引导。在训练过程中,指出哪些输出是合理的,如符合常识、逻辑清晰的表述给予正面反馈,指出哪些是不合理的,如“林黛玉倒拔垂杨柳”这类荒谬内容给予负面反馈。

其次是降低算力成本,基础模型或大模型的训练成本非常高,动辄数百亿或数千亿人民币,通过采用生长技术的方法来实现降低成本。

智源研究院和中国电信联合研发出世界最大的大模型Tele-FLM-1T,是首个单体万亿语言模型,也是进一步探索模型参数规模边界的研究工作。

3.总结和展望

未来两年人工智能领域将迎来多行业真实需求的爆发,其中有两个关键问题需要解决:首先是幻觉问题,如果幻觉持续降低至可接受程度,那么大模型技术将会继续加大应用规模。其次,人工智能的发展可能会带来下一代工业革命,目前大模型处于赚钱能力较弱但投入极大的阶段,一旦解决这个问题将会进入飞跃式发展阶段。我们相信,大模型将为我们的日常生活和各行各业带来深刻且广泛的变革。

闭幕式


图片
▲何鹏  最高人民法院民事审判第三庭审判长、二级高级法官
何鹏法官从法律思维的逻辑和方法层面分享关于AI工具知识产权法属性的个人感想:

总的理念,对待市场新生事物,包括司法权在内的公权力应保持一定的谦抑,尽量交给市场自身解决。

人工智能技术出现后带来两个基本法律问题:相关主体的利益要不要保护,怎么保护。

第一个问题,在价值追求层面,要不要保护。法律调整的是人与人之间的权利义务关系,归根结底是利益分配的问题。AI技术涉及哪几个方面主体的利益?主要包括AI工具的开发者、使用者以及AI生成物的消费者。对于AI工具的开发者,大众期望工具多样化以满足需求,为促进社会福祉,开发者的利益应当保护;AI工具的使用者,在使用过程中有付出,其权益也应受到保护;AI生成物的消费者,享有识别AI生成物的利益,享有选择的自由,需要保护。

第二个问题,用什么途径保护。借用李琛老师的一句话“技术有变,法理有常”,法律概念、制度、原则具有抽象性、概括性,能够适应多变的现实生活。目前来看,AI工具开发者的利益,市场自身解决的不错,不少开发者通过与用户签订合同收取会员会费的方式获取收益。AI生成物的消费者可以通过知情权获得保护。在现有法律框架下,主要是如何保护AI工具使用者的利益,存在分歧。

对于AI工具使用者,现有保护途径有赋权、反不正当竞争、不当得利。首选是赋权,如果可以套用现有权利体系,那么规则最为完善,保护最为全面。现在,最核心的问题是,能不能用著作权保护,AI工具使用者是不是作者,涉及两个基础性问题,什么是作品?什么是创作?

按照德国学者拉德布鲁赫的观点,法律概念分为两类:一是“法律中的重要概念”,如“物”“抢夺”;二是“真正的法律概念”,如“权利”“义务”“善意取得”。这两类概念的形成都依赖于“前科学概念”,不能脱离现实生活原本的概念的内涵,在这个基础上再基于公平、正义的价值目标进行目的性变形,赋予一些额外的含义。

以“戏剧作品”为例,百度百科上是指将人的连续动作同人的说唱表演和表白有机的编排在一起,并通过表演来反映某一事物变化过程的作品;而著作权法实施细则给戏剧作品下的定义,落脚点却是“剧本”,显然,在家读剧本和去戏院观赏戏剧,这是两码事,这就是法理偏离了事理。

人工智能领域会不会存在类似问题?在著作权法领域,我们的共识是,不能因为成果具有可观赏性就认定为作品,不能因为成果精美具有市场价值就认定为作品。是不是创作,与技艺高超与否无关,临摹不是创作。创作,追求的是标新立异,是求异。虽然人工智能给出的结果可能很精美,可能具有市场价值,但往往具有一定的稳定性和趋同性,导致同质化问题。如何解读对AI工具的使用,AI确实是工具,但,AI是创作工具吗?它的作用和我们使用的毛笔、钢笔、键盘、录音笔一样吗?工具是可以替换的,AI工具可以替换吗?使用AI工具时,是谁在控制或者决定最终的表达,AI工具是不是反客为主了?工具这一概念本身表明,在创作过程中,它应当是辅助性的,不起实质性作用,也应该是可替换的,这就体现了作者对作品的所谓“控制力”。所以,我个人倾向认为,AI是工具,但不属于创作工具。

此外,如果认为AI工具的使用者是作者,那么,当AI生成物侵害他人著作权时,使用者是不是可以通过合法来源抗辩,又或者通过“偶合”理论抗辩,因为著作权法上允许偶合,这会产生连锁反应,带来一系列问题。

AI从性质上说,更像是一种高级检索工具,而非创作工具,这个工具可以对被检索的素材进行加工,给定不同检索条件和参数,可能会得到不同结果,但检索结果趋于稳定,最重要的是,使用人不能决定最终的检索结果,有别于将“胸中之竹”外化为“笔下之竹”的创作。AI工具的使用人,和作品的消费者一样,对最终呈现在眼前的“作品”,都充满了期待。

然而,制度的设计、选择是多方面因素综合决定的。在文学艺术领域,不会有人认为计算机软件是作品,只不过基于当时伯尔尼公约参与国较多、著作权无需行政审批等因素,软件借道“文字作品”成为著作权保护的对象。所以,尽管从文学艺术领域的“前科学概念”来看,AI工具使用者的行为不属于“创作”,相关生成物也不属于“作品”,但是,在现有法律框架下最终选择什么路径保护AI工具使用者的利益,可以不着急下结论,让子弹再飞一会儿。

图片
▲郭禾  中国法学会知识产权法学研究会常务副会长,中国人民大学知识产权学院副院长、教授

郭禾教授认为本次第九届三知论坛相较于过去有几个特点:一是参会嘉宾的多样性,包括法官、学者、律师以及企业代表;二是讨论主题的前沿性,涉及人工智能和知识产权,都是人类在创新领域里最前沿的话题;三是讨论内容的全面性,所探讨的三个主题涵盖了人工智能与知识产权交融的相关问题。

不同于创作过程中的求异,研讨是为了求同。本次论坛的研讨在某些层面上达成一致,例如大家普遍认同人工智能是一种工具,而非法律意义上的主体,部分发言嘉宾认可让人工智能再发展一段时间,但目前对人工智能生成相关内容的事实研讨并未完全达成一致,此外,在数据问题上也存在多种不同观点,例如关于数据是赋权,还是应将其视为一种行为模式来考量等。人工智能领域虽道阻且长,但仍有时间逐步解决,同时,期待第十届三知论坛的到来。