预计于今年10月正式发布金融大模型2.0版本的度小满,被马上消费“截了胡”。
8月28日,马上消费高调发布了金融大模型“天镜”,邀请了包括中国工程院院士倪光南在内的4名院士为其站台,抢下了首个“零售金融大模型”的名号。
财经众议院注意到,零售金融大模型,不仅超出了消费金融的范畴,也一下子把度小满所在的领域也包括进来。
尽管度小满在今年5月推出了“首个千亿级中文金融大模型”——轩辕1.0版本,但远没有马上消费会造势,“天镜”抢了“轩辕”的风头。
本是同根生,相煎何太急。总部同在重庆的两家金融公司,由于马上金融“天镜”的横空出世,关系一下子变得微妙起来。
但这同时也说明,金融大模型在各家机构来看,都是炙手可热。
其实,不止马上消费和度小满,目前已经宣称推出金融大模型的公司,总数已达十余家。
金融大模型,是否会重蹈通用大模型的“百模大战”?
“天镜”:首个零售金融大模型
8月28日,马上消费在重庆举行金融大模型发展论坛,会上发布了国内首个零售金融大模型“天镜”。
据马上消费金融人工智能研究院院长陆全透露,该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升;客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均57%的水平。
在“天镜”大模型发布会上,马上消费首席信息官蒋宁表示,马上消费已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性的飞跃。
蒋宁表示,马上消费已经在金融领域跑出了“马上速度”,未来已来,马上消费将持续拓展虚实共生,做可信开放的数字融合体。
“轩辕”:首个千亿级中文金融大模型
在金融大模型上,度小满被认为有点“起了个大早,赶了个晚集”。
5月下旬,度小满就推出国内首个千亿级中文金融大模型“轩辕”。当时,马上消费的“天镜”还未公布正式推出时间。
据悉,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,聚焦于金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务。
度小满CTO许冬亮表示,轩辕大模型基于度小满实际业务场景积累的海量金融数据进行训练,保证在提升金融能力的同时,不会损失通用能力。
今年8月23日,在北大光华-度小满金融大模型技术与应用论坛上,度小满数据智能部总经理杨青透露,度小满轩辕大模型2.0版本将在10月份发布。
但最终却被马上消费抢先发布了首个零售金融大模型。不过,度小满的“轩辕”赢得了“国内首个千亿级中文金融大模型”名号。
据悉,轩辕大模型2.0版本相较1.0版本,在金融理解、对话能力等多方面迎来了全方位提升。在增量预训练和指令微调阶段,加入了大量的金融相关数据,使其能够对金融问题提供更加专业、准确的答案,金融理解能力提升明显;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能够处理更长的金融报告、研究和分析。研究人员尝试利用轩辕大模型2.0版本详解某银行的非利息收入增长趋势,收获了令人满意的效果。
金融大模型乱斗
金融大模型炙手可热,多家公司都纷纷推出金融大模型。
今年3月底,全球最大的财经资讯公司彭博社发布拥有500亿参数的大型语言模型——BloombergGPT,标志着全球首个金融大模型的诞生,也掀起了国内金融大模型的浪潮。
5月,大数据基础软件供应商星环科技推出第一款面向金融量化领域的生成式大语言模型“无涯Infinity”。据其介绍,无涯Transwarp Infinity支持股票、债券、基金、商品等市场事件的全面复盘、总结及演绎推理,以及政策研报的深度分析,为基金经理提供决策辅助。
6月,恒生电子发布金融行业大模型LightGPT。LightGPT使用了超4000亿tokens的金融领域数据(包括资讯、公告、研报、结构化数据等)和超过400亿tokens的语种强化数据(包括金融教材、金融百科、政府报告、法规条例等),并以之作为大模型的二次预训练语料,支持超过80+金融专属任务指令微调。
6月29日,拓尔思发布拓天大模型,并面向媒体、金融、政务领域推出了三大行业大模型。该模型基于自有的110亿+金融主题数据、百亿级产业指标数据、30亿+产业要素明细数据、2亿+产业动态本体、500+以上标引维度、10000+知识标引规则、10万+产业标签作为专业训练数据。
8月9日,奇富科技宣布与360智脑达成在大模型方向与落地应用等多个层面的战略合作。
科大讯飞发布的大模型产品“讯飞星火智能客服”,以帮助金融机构提高客户服务效率和质量,提升用户体验为主旨。讯飞星火智能客服产品在意图理解能力、专业知识应用能力、对话设计与交互能力、个性化表达能力四个层面取得了全面提升,未来还会进行迭代升级,探索与金融场景更贴近、更有价值的技术服务。
文因互联公布了基于“文因大模型”联通多个金融场景的解决方案。根据介绍,该解决方案覆盖债权发行、IPO、ESG评级评价、智能投研、智能投顾、信贷评估、债券评级、合规审计、新闻写作、工业维修等多个场景,定位是“为金融人提供安全高效副驾驶”。
在金融大模型浪潮中,海通证券、申万宏源、广发证券、兴业证券、长江证券、西南证券、国海证券、国盛证券、华福证券、财达证券10家券商宣布成为百度“文心一言”首批生态合作伙伴,以同花顺、东方财富为代表的财富管理运营商也公告称将重点打造AI投顾平台,深入AIGC、交互式AI等领域的研究,完善内容生态构建,增强智能运营能力。
走向合作
尽管金融大模型炙手可热,但学界对此却保持冷静。
中国工程院院士、复旦大学金融科技研究院院长柴洪峰认为,目前大模型在金融垂直领域仍未挖掘出涌现效应。
他认为,一方面,由于金融数据及知识的私密性导致难以共享,无法构建一个庞大的数据集,对此可以增强产学研的联动性,共同构建更强的金融垂直领域基座模型;另一方面由于金融数据模态更多,难以进行统一的处理建模,而如今的大模型对此种多模态的表达能力仍有待加强。
度小满CTO许冬亮认为,现阶段,如何在金融领域发挥大模型的能力,还有三个挑战需要解决:第一个挑战是通用模型能力不能满足金融场景需要;第二个挑战是大模型如何高效植入现有业务场景;第三个挑战是大模型应用于金融业中产生的安全合规和隐私保护问题。
如何解决大模型在金融行业落地应用的这些难题,许冬亮认为,每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要。
“科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域的训练,然后做私有化的部署和应用。”许冬亮认为。
金融大模型合作实际上已经开启。据悉,在“天镜”大模型发布会上,中国信通院、重庆国家应用数学中心和马上消费牵头,阿里云、百行征信、北京火山引擎科技有限公司、中关村科金、毕马威、复旦大学金融科技研究院、朴道征信、腾讯云、中国科学院自动化研究所等联合倡议,发起了“金融大模型可信安全验证与联合创新行动计划”,以推动金融大模型更好落地。