冲刺“千亿级” 金融AI大模型再破局

中国经营报

2024-11-09 02:23发布于北京中国经营报官方账号

本报记者王柯瑾北京报道

随着人工智能（AI）技术的飞速发展，大模型正成为全球关注的焦点，预示着未来科技的重大变革。

就金融领域的应用来看，短短两年时间，从百亿级别参数到千亿级别参数，以银行为主要代表的金融机构从布局到破局，试图不断解锁AI在金融业的潜力和应用边界。

苏商银行相关人士在接受《中国经营报》记者采访时表示，金融业广泛应用的千亿级大模型将向多模态和智能体发展。一方面，向多模态大模型发展，能够处理文本、图像、音频、视频等多维数据，将在智能客服、风控等场景深度应用。另一方面，智能体技术将使模型更灵活地适应不同任务需求，实现业务流程自动化。此外，大模型的可解释性、合规性管理将日益重要，以确保模型透明、安全，符合金融监管的严格要求。

中国银行（601988.SH）研究院研究员马天娇在接受记者采访时表示，千亿级大模型表现出更强的通用性和全面性，但构建千亿级大模型耗资巨大，对金融业而言将面临技术和成本两方面的挑战。

服务数字经济需求

日前，浙江农商联合银行官网发布关于企业级基础大模型采购公开招标公告，招标内容包括采购企业级基础大模型，采购内容主要包含千亿级参数基础大模型及模型升级、定制化人天服务。

此前，招商银行（600036.SH）曾披露过“预训练基础大语言模型（千亿级）采购项目”结果。中信银行（601998.SH）也在其采购需求调研征集公告中表示，为支撑该行大模型平台信创算力集群建设，具备千亿级大模型的微调训练和推理能力，开展大模型信创算力服务器采购项目。

所谓千亿级大模型是指参数数量达到千亿级别的大型深度学习模型，这些模型因其庞大的参数规模能够捕捉和学习极其复杂的数据特征和模式，从而在自然语言处理、图像识别等人工智能领域展现出卓越的性能和泛化能力，但也需要巨大的计算资源和存储空间来支持其训练和推理过程。

当前金融机构在大模型的应用上，百亿级和千亿级都有涉及。

以银行业为例，工商银行（601398.SH）率先建成全栈自主可控的千亿级参数规模AI大模型技术体系，领跑行业创新应用。从该行的实践看，其打造的全栈自主可控的千亿级AI大模型技术体系，由“三大技术支撑”“八大业务领域创新应用”“五大应用范式”共同组成。在2024年半年报中，工商银行曾披露，该行深化千亿级大模型技术建设与赋能，已在金融市场、信贷风控、网络金融等领域数十个业务场景落地应用，新动能新优势加快培育。

交通银行（601328.SH）方面披露，该行与科大讯飞、华为等头部科技企业合作，成立了人工智能联合创新实验室。经过一年的时间，通过联创共建机制，持续打磨企业级AI能力整合平台，逐步实现对算力、算法、数据服务运营的统一管理，搭建千卡异构算力集群，构建出多层次、多能力、多形态的千亿级金融大模型。

谈及金融业对于千亿级大模型的布局，中央财经大学证券期货研究所研究员杨海平表示：“一是数字经济加快发展，政务场景、生产场景、生活场景数字化升级进展明显，包括大型银行在内的金融机构布局千亿级大模型是服务数字化场景，提供有效金融解决方案的现实需要。二是随着AI+的展开，数字经济将进入新阶段，金融机构发展千亿级大模型，构建基于大模型的服务生态，也是针对AI+的超前布局。参数量是影响大模型基础能力的重要因素之一，相较而言，千亿级大模型的通用性更突出，数据处理、分析能力更强。”

布局与破局的路径

自2023年年初至今，从布局到破局，大模型重塑了金融业多个业务领域。

在客户营销、运营助手、智能客服等场景金融大模型应用不断涌现的同时，也有金融机构独辟蹊径，利用大模型与自然语言处理技术赋能合规风控。如兴业银行（601166.SH）聚焦反洗钱这一细分领域，自主研发推出AML-GPT模型，该模型是金融业首个在反洗钱可疑报告智能生成领域运用的大模型。

“此前在没有智能辅助工具的情况下，我们每天需要处理约30份可疑交易报告，每份报告都需要经历从开展调查、分析交易流水与行为特征到撰写报告的过程，每份报告处理时长为20～60分钟。”兴业银行某分行一位基层反洗钱员工表示。由此，AI大模型对金融业务的赋能可见一斑。

实际上，金融与AI有天然的契合点。中国银行业协会发布的《2024年度中国银行业发展报告》指出，AI大模型技术能够充分挖掘银行业的海量数据，而银行业具有适用AI大模型技术的丰富场景。当前，AI大模型正推进我国银行业服务、营销、产品等领域的全面革新，催化“未来银行”加速到来。在2023年年报中，近20家上市银行披露了大模型领域的技术研发和应用进展。银行业不断完善关于AI的战略布局，探索形成“AI+金融”的中长期规划布局，加强AI人才梯队建设；重视数据和算力，做强AI基础技术底座，提升数据治理能力，打破数据壁垒，构建开放共享的数据生态，深化与产业界各方合作，促进双向融合互促，增强技术能力和应用能力；围绕价值创造，着眼于解决金融业务发展中的痛点难点，把握好方向和节奏，从风险可控的场景出发稳步推进，打造适宜的AI应用生态；坚持底线思维，加强大模型安全风险管理，将AI相关风险纳入全面风险管理框架之中。

兴业研究公司分析认为，自2023年以来，已有多家境内银行探索生成式人工智能在银行业务中的应用。当前，各银行引入、研发和运用大模型出现了一些共性特征：一是“引入千亿级大模型”辅以“自研百亿级大模型”成为金融机构大模型来源的主流趋势。二是大模型应用场景重点集中在内部办公质效的提升，而面向客户的场景则主要为智能客服。

“千亿级大模型表现出更强的通用性和全面性，能够应对各种任务，开发定制化服务，在多元金融业务场景中实现创新性应用，助力金融机构达到降本增效、提升竞争力等目标。但构建千亿级大模型耗资巨大，对模型调试和打磨需要更高的技术能力，尤其是在大模型与专业场景结合这一方面，如何发挥千亿级大模型的价值，打造符合金融机构特定需求的垂直领域和专业场景，对金融机构来说是技术和成本两方面的挑战。”马天娇分析认为，“未来，大型金融机构或投入更多资金自主研发千亿级大模型，中小金融机构则通过采购或从外部引入大模型，实现成本效益最大化。”

对于多数中小金融机构而言，如何平衡大模型的投入与产出，实现成本效益最大化十分重要。

对此，苏商银行相关人士表示：“一是做好规划。从场景、算力、数据等方面提前规划并做好价值评估，避免低效投入。二是拥抱开源。中小金融机构可以充分利用开源的成本优势，加快大模型应用的探索和应用。三是构建专业化人才团队。坚持‘以我为主’，外部合作为补充，稳步积累核心能力。四是高效利用算力资源。以苏商银行为例，我行自建的算力平台初具规模，融合了容器云、异构算力虚拟化、高性能计算专网、智能化资源调度和管理等技术，可满足行内千亿级大模型推理和微调需求。五是应用场景控制。优先在关键业务场景应用，聚焦提升业务成效，避免非核心领域的过度投入。”

对于中小金融机构布局AI大模型而言，杨海平提示，应用大模型还是要坚持量力而行，不要盲目追求参数规模。“一方面，可以在充分分析场景需求的基础上，确定恰当的模型参数量级；另一方面，如提供服务方案确实需要，可以探索多家金融机构联合共建的模式。”