恒生电子董事长刘曙峰:金融行业大模型应用观察与未来建议

近日,国民财富发展研究合作平台“AI+金融”峰会成功举办。恒生电子董事长刘曙峰在会上发表主题演讲。

他表示,大模型的技术和大模型推动的产业发展现在还处于方兴未艾的阶段。产业方面,投资热度出现变化,2024年从基础模型的投融资逐渐向应用转变。目前最成熟的应用是对话,也是通用大模型的原生应用。在垂域的应用方面,国内外情况较为相似。行业方面,从国内视角来看,行业的应用有加速的迹象。在使用情况上,以内部赋能为主。此外,大模型带来了全方位的效率提升。

对未来,提出了三点建议:一是对金融机构而言,大模型是降本增效的利器;二是大模型可能是影响用户流量的入口;三是大模型可能是一个弯道超车的机会。


今天大家对人工智能,尤其是大模型技术突破后的人工智能,在各行业的发展有了一个较为充分的、可能是前所未有的共识。从产业的角度来看,恒生这两年持续追踪了从大模型视角看AI对产业发展的影响。第一个观察是大模型的技术和大模型推动的产业发展现在还处于方兴未艾的阶段。从o1到刚刚发布的o3,上下文更长,现在达到了128k,已经进入了商业应用。o3拥有更多的模态,在解决了“慢思考”的尝试方面取得了长足的进步。数学领域达到了数学家的水平,物理、化学则达到了博士生的水平。更重要的是在AGI领域中的测试是87.5%,超过了人类的85%.这是否意味着在AGI领域,有可能取得突破,并且技术的不断突破,暂时还没有看到放缓的迹象。另外,近期谷歌发布的Gemini,在视频多模态方面,掀起了一个新的浪潮。
数据用尽是大家普遍关注的问题,此外还有治理以及破坏性等问题,可能会引发越来越多的关注。总体而言,更长的上下文,更多的模态,更深的推理思考过程,还在推动大模型能力的不断提升。
从国际来看,目前国际领先于国内,闭源领先于开源。另外,有一个很重要的迹象,在基础模型竞争格局方面,呈现寡头收敛的态势。基础模型研发需要顶尖的人才,而训练需要极大的数据和算力集成,这些都需要巨大的投入,每年几千亿美金,未来几年还需要投入1-2万亿美金,基本上很难有公司能负担起。因此,这种基础模型是否会形成有限几家寡头收敛,不论是从应用的选择角度还是从投资角度,是我们需要关注的。
大不一定就强,尤其是在大模型领域。OpenAI也不是一开始就有现在这样的规模。顶尖人才能否起到关键作用是值得关注的。
大约2、3个月,大模型的性能就能翻一倍,并且成本还在不断下降的过程中,尽管算力现在下降得相对慢一点,但也值得期待,算力的成本会进入一个迅速的下降过程中。每一代模型的性能和所消耗的单位Token的算力成本处于急剧下降的过程中,可能需要越来越大的参数和越来越大的训练。暂时在总投资的规模上还保持在一个量度上。
在收入上,今年OpenAI收益大概37亿美金,增长了110%,明年估计能够增长2倍,达到100多亿美金。2029年可能能够达到1000亿美金,但距离盈利还很遥远。因此,在收入快速增长的过程中,盈利仍然有待观察。尽管是基础模型,盈利仍然有一定困难,在推动社会进步方面的价值更明显。


一.

对大模型发展的几个观察

(一)产业观察

产业观察方面,从去年全球的IT支出统计来看,全球IT支出大概5.6%的增长率,AI实现了33%的增长率,大模型是144%,国内的情况差不多。未来几年,大模型领域在支出方面有望以非常快的速度增长。
2024年国内大模型的支出大概30多亿,大模型领域的软件支出只占16%,算力的支出还占多数,并且呈现更快的增长态势。
很重要的一点是投资热度的变化。2024年,投资热度开始收敛,从基础模型的投融资逐渐向应用转变。基础模型在大量场景下的应用能力已经得到了印证,而且可能已经过了易用这个临界点,后续的突破仍在继续。
目前最成熟的应用是对话,这是通用大模型的原生应用。比如,ChatGPT是达到亿级用户最快的一个APP,国内几个领先的头部企业也都超过一千万用户,并且就在短短几个月内实现。这一增长速度看起来没有减缓的迹象,正在形成一个新的超级流量入口。
在垂域的应用方面,国内和国外比较相似。总体上还在发展初期。在美国,生产效率的提高是企业级应用主要的一个应用形态。
在其他领域,比如科学、教育、政府、金融,其中金融方面较为广泛,但整体投入占比相对较小,处于初期阶段。

(二)行业观察

我们行业之前也做了很多预训练的工作,包括精调等,消耗的资源和算力很多,同时基础模型也在不断地实现突破,包括对行业数据的训练。基础模型迭代的速度超过行业模型的迭代速度,这与训练投入的资源强度有关,更多会转向智能体,包括RAG,很大程度上依然依赖行业Know-How应用、智能体、增强技术的开发,这些都需要投入,也能够发挥行业优势,边际上会发生一些新的变化。
从国内视角来看,行业的应用有加速的迹象。今年1-11月份,公开招标金额总共两个亿,前三季度一个亿,10、11月份一个亿。从全行业来看,两百多个项目招标,多为十万级、百万级,千万级和亿级的项目较少,基本上都集中在政府采购招标上。以金融行业两个亿的招标,乘以5、6倍,整个行业算力的投入也就十个亿左右。主要是实验性的,真正投入生产的有效活跃用户数量不多。最高的活跃用户大概在百万级。比如To C领域,蚂蚁的蚂小财达到千万级用户,但活跃度还偏低。
图片
从使用情况来看,以内部赋能为主。直接面向客户的服务因为涉及合规问题,推进较为审慎。内部赋能,包括To B的服务,比如恒生的维护服务,上线之后用户使用频率很高。大模型应用的一个很重要的地方在于几乎没有进入门槛,因为自然语言对话不需要学习。伴随能力加强,学习成本很低,甚至是负的成本。内部赋能的效果很明显,但直接赋能相对较为审慎。
金融如果体系性来看的话,基本上可以从提升效率到价值创造、深度决策。提升效率体现在流程自动化、价值创造更多体现在用户交互,如何更好地触达用户、理解用户。具体场景方面,比如投顾助手、营销助手、个性化资产配置方案生成等。

从效率提升来看,o3的代码能力已经达到了全球最顶尖的代码工程师的水平,超过了99.9%的程序员。在代码生成工作方面,效率的提升是数量级的。对于软件开发而言,coding大概占30%的工作量。对于金融机构而言,这是个好消息,因为不用雇很多外部工程师,coding可以用机器来生成。
大模型在效率提升方面是全方位的,比如系统运维的工作。原本一个礼拜的工作,现在两到三个小时就能完成。原本需要很多助理完成的工作,现在机器人可以比助理做的更好、更有效率,而且是秒级的响应。比如派机器人去开会,开完会立刻就能生成摘要,过程数据可以形成有价值的私域数据。
用户交互方面,从参与到价值创造过程都还处于一个相对较为审慎的状态,但在深度决策、运营、客服、研究、交易、投行、审核等领域,从各个机构发布的案例来看,大模型对效率的辅助都得到了明确的验证。
价值创造被证明是有效的,但是仍然面临合规等问题,还在不断的实验和发展过程中。国内外都有一些好的案例,比如摩根士丹利的NBA (Next Best Action),在和OpenAI直接合作的模式下,他们把大模型作为投顾助手引进,在内容生成方面,起到了一定的效果,至于这种效果是不是直接的,还有待进一步观察。
在深度决策方面,大模型可以提高传统模型的效率。传统模型最典型的案例是风险计算和深度决策,属于对数据的筛选。相比小模型,大模型在数据筛选方面更为方便。未来如果真正使用大模型做决策,还有待于类似o3这种应用的多层推理能力进一步提高。目前也有不少在探索的案例。
总体而言,大模型在行业的应用处于初级阶段,基础模型开始向较大范围的应用转换。期待2025年各个场景下的大模型应用会有长足的发展。未来两三年是否会对行业的应用产生较大的影响?大模型原生应用是否会在金融行业出现?通用大模型的原生应用今年实现了大发展,大模型原生金融APP是否能在未来一两年内出现?值得期待。


二.

对未来的三个建议

(一)对金融机构而言,大模型是降本增效的利器

集中体现在对数字员工的广泛采用上。各个岗位都可以用大模型来提高效率,数字员工将全面加入我们的工作之中。这不是对我们现有工作的简单替代,金融机构,包括金融科技领域存在大量的高级人才,有更多有价值的工作等待我们去创造,辅助的一些流程性工作确实可以交给大模型更有效率、更低成本地完成。在过紧日子的当下,降本增效是一个非常大的主题,在这方面大模型可以发挥很大作用。
(二)大模型可能是影响用户流量的入口
集中体现在客户交互部分APP的一些变化上,不管是嵌入的大模型还是原生的入口,都值得尝试和推进。
(三)大模型可能是一个弯道超车的机会
大模型的训练需要投入大量资源,但应用起来非常实惠。大模型的技术发展,对于使用者而言,是一个非常普惠的技术,会把不同的机构重新拉回同一个起跑线,无论是大、中、小型金融机构还是大型或创业型金融科技公司。后续使用大模型的成本还会不断地下降,行业的Know-How仍然是一个关键的竞争力来源。