摘要
本报告构建了中国大模型发展指数,旨在量化评估中国大模型发展现状和趋势。指数涵盖大模型支撑、大模型研究和大模型企业运营三个维度,共8个二级指标、17个三级指标,以2023年8月到2024年10月期间的数据为基础进行分析。
指数背景
(一)国外人工智能战略动向
1. 美国
美国对人工智能和大模型的态度体现了其在推动技术创新和维护国家安全之间的平衡。
2. 其他国家或组织
欧盟、G20、联合国以及G7等国际组织在人工智能领域展现出了明确的政策和监管动向,体现了全球对人工智能技术发展的共同关注和治理需求。国际社会正努力构建一个公平、透明、安全和可靠的人工智能发展环境,旨在促进技术创新的同时,确保人权、民主价值观和全球安全不受威胁。
2024年8月1日,欧盟《人工智能法案》正式生效,标志着全球人工智能监管领域的一个重要里程碑。该法案基于风险分类为人工智能系统提供合规义务框架,旨在规范人工智能的开发和使用,并确保其与欧洲价值观和基本权利相一致。法案涵盖了从市场准入、运营责任到透明度要求的全链条规则,对在欧盟境内或影响欧盟市场的AI系统和活动产生约束力。
通过为安全、透明度和问责制设定标准,欧盟不仅促进了创新,还培养了对人工智能的信任。同时,该法案的域外适用原则意味着其影响将超出欧盟,对全球人工智能治理方法产生重要影响
9月13日,G20数字经济部长会议审议通过了《G20数字经济部长宣言》,成员国就人工智能的发展达成了一致,提出要“伦理、透明和负责任地使用人工智能”。9月22日,联合国未来峰会通过《全球数字契约》,讨论了包括人工智能在内的新兴技术带来的机遇与风险,要求各国政府承诺建立一个独立的人工智能国际科学小组,并在联合国内就人工智能治理问题开展全球对话。
10月4日,G7发布公报,强调了对基于AI技术引发的全球竞争问题的关注,并寻求在全球范围内促进合作对话。公报中提出了几个关键指导原则,旨在实现人工智能市场的公平竞争并促进创新,包括公平竞争、开放准入、丰富选择、互操作性、鼓励创新及透明度等。
这表明G7成员国认识到了AI技术发展带来的竞争挑战,并致力于通过国际合作和协调来确保技术的健康发展,同时保护消费者权益和促进市场的公平竞争。
(二)我国大模型政策动向
我国将人工智能视为国家战略,在人工智能和大模型领域展现出了明确的支持态度,旨在通过政策引导和监管规范,促进人工智能技术的健康发展和应用。
早在2017年发布的《新一代人工智能发展规划》就明确提出“三步走”战略目标,第二步是“到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平”。
目前,我国人工智能部分技术与应用已经达到世界领先水平。具体来看,我国在AI技术助力航天探索、赋能工业智能制造、医疗领域的突破等方面取得了重要进展;在工业领域,已建成近万家数字化车间和智能工厂,AI与制造业深度融合,推动了生产效率的显著提升。
我国人工智能产业体系更加全面,截至2024年6月,相关企业超过4500家,核心产业规模已接近6000亿元,产业链覆盖芯片、算法、数据、平台、应用等上下游关键环节(注1)。
2024年5—10月,国家和省级政府层面相续出台了一系列人工智能和大模型相关的战略和政策,具体如下:
资料来源:公开渠道,零壹智库
评价体系
(一)指标体系
实现技术创新与社会价值的接轨是大模型发展的核心驱动力。这一愿景的达成离不开人力、算力以及创新环境等多方面的支撑。从大模型发展的视角来看,支撑体系是基础,研究工作是创新的源泉,而企业运营实践则是成果落地的关键环节。
因此,本期大模型发展指数在原有基础上进行了更新调整和完善,构建了包含大模型支撑、大模型研究、大模型企业运营3个一级指标,8个二级指标,以及17个末级指标的全面评价体系。具体指标体系变动如表2-1所示。
具体来看,此次指标体系与上期相比有如下异同:
1.丰富了大模型支撑指标
算力基础指标,由超算中心数量、数据中心数量、智能计算中心数量三大指标取代原算力中心数量,更全面地评估大模型发展的算力基础。算力基础指标的细化可以更好反映我国在算力资源建设上投入情况,其数据来源为企业预警通。人才支撑上,在原有相关专业的基础上,增加了相关高校数量。
2.大模型企业运营指标代替原大模型实践指标
其中大模型初创企业与上期基本保持一致,为了提升数据准确性去掉了创业企业后续融资金额。
大模型备案指标取代原大模型应用指标。原大模型应用指标数据均来自github,更新时效性不足。2023年5月通过了《生成式人工智能服务管理暂行办法》(以下简称《管理办法》),同年8月开始,网信部门会同相关部门按照《管理办法》要求,有序开展生成式人工智能服务备案工作,并定期将已备案信息予以公告。
本次大模型备案指标选取自国家网信办《生成式人工智能服务已备案信息》。根据大模型备案信息,整理大模型备案数量、所属公司注册资本、员工数量及知识产权数量,数据来源为天眼查。由于该信息自2023年8月更新,故在研究周期上,选择该月作为报告的时间起点。
此外,大模型应用场景也是大模型企业运营的落脚点,故选择大模型相关的招投标次数表征其应用场景,数据来源中国招标投标公共服务平台。
3.大模型研究指标保持不变
模型研究指标与上期保持一致,用以反映学术界和技术界在大模型领域的持续关注和投入。
(二)指标权重
指标权重的确定有客观赋权和主观赋权两类方法。客观赋权法可排除主观干扰,应用相对广泛。
熵权法、标准离差法和CRITIC法是主要的客观赋权法,三种方法均用变量的变异确定权重。其中,CRITIC法考虑了变量之间的冲突,确定的权重更为精准(Chen et al.,2021;Chen et al.,2022;许涤龙和陈双莲,2015)。本报告首先对各指标数据进行离差标准化处理,以避免量纲的差异对测算结果的影响。
本报告选择CRITIC法确定各指标的权重。第i个指标的权重:
根据上述计算公式,计算各一级指标权重。
(三)数据来源
本指数所涉数据来源于国家统计局、网信办、教育部、中国知网、中国日报网、智慧芽、企业预警通、零壹智库等。
中国大模型指数总体情况
(一)大模型指数月复合增长7.07%
总体来看,大模型指数呈徘徊增长趋势。报告期内,大模型指数增长了1.60倍,月复合增长7.07%。其中2023年9月增速最快,达24.50%。而2023年12月却下降了3.87%。从2024年5月以来,大模型指数增速保持相对平稳。
数据来源:零壹智库
大模型指数增速平稳的主要原因:
大模型研究指数、大模型企业运营指数、大模型支撑指数都增速放缓。2024 年5 月至2024 年10 月,大模型研究指数由214.74 上升至299.21,增长39.34%,月复合增长率为6.86%。
大模型企业运营指数由204.02 上升至242.95,上升了19.08%,月复合增长3.55%。大模型支撑指数由256.96 下降至235.55,下降了8.33%。
(二)大模型研究指数月复合增长8.96%
大模型研究指数是由学术研究和技术研究两个二级指标所构成,从计算得出大模型研究指数从2023 年8 月89.99 增长到2024 年10 月299.21,增长了209.23 点,月复合8.96%。大模型研究指数增长率从14.99%下降到3.05%。
数据来源:零壹智库
大模型研究指数逐月上升的原因,主要是因为学术成果和技术研发水平不断提高所导致。
1. 大模型学术研究指数增长率先上升再下降
大模型研发二级指数学术研究指数从32.86 增长到302.84,学术研究指数增长率从21.84%增长到2024 年7 月30.73%后再下降到2024 年10 月6.08%;技术研究指数从144.12增长到295.76,技术研究指数增长率从13.52%下降到2024 年7月-1.03%后再增长到2024 年10 月0.27%。
学术研究论文数量从412 篇增加到3801 篇,技术研究(专利数量)数量23615 件上升到48462 件,都在稳步增加。
数据来源:零壹智库
大模型学术研究指数增长率先下降再上升的主要原因包括创新边际递减效应、论文选题方向边际递减效应等。
2. 大模型技术研究指数增长率逐渐增加
大模型技术研究指数增长率从2023 年8 月13.52%下降到2024 年10 月0.27%,呈现出逐渐降低。具体原因包括市场竞争日益激烈,大模型的应用场景有限等,大模型的高成本和技术难题也是制约其增速的重要因素。
(三)大模型企业运营指数月复合增长率10.91%
总体来看,大模型企业运营指数呈现递增态势,从2023 年8 月56.99 增长至2024 年10 月242.95,复合增长率10.91%。
其年度增长率呈现非常明显的周期性波动,大致以三个月为一个波动周期,即持续增长三个月后会出现短暂的下降,且增长率下降幅度逐步缩小。从大模型企业运营指数的下级指数表现来看,大模型初创企业指数大于备案大模型指数。
数据来源:零壹智库
1.大模型初创创业指数月度复合增长率-0.4%
大模型初创创业指数总体上呈现周期性波动,年度复合增长率-0.4%。从2023 年8 月135.10 点波动上升至2024 年4月285.24 后逐步下降至2024 年10 月127.64,这也导致了大模型企业运营指数的周期性变化。
通过追溯下级指标可以发现,大模型创业企业数量及其注册资本的波动变化导致了大模型初创创业指数的周期性波动。2024 年7 月开始实施的《公司法》要求公司5 年内实缴注册资金,这一要求并未阻挡大模型创业热情,大模型初创企业数量和注册资本均未出现明显下降,甚至在后续时期内出现增长。
2024 年6 月大模型初创企业数量284 家,平均注册资本450.70 万元,7 月下降至269 家,平均注册资本增长至1787.74 万元,随后上升研究期内最高值,达328家,平均注册资本为754.75 万元。
2.备案大模型指数年度复合增长率23.14%
备案大模型指数呈现良好的增长势头,由2023 年8 月16.42 增长至2024年10月302.85,复合增长率23.14%。从增长率来看,2023 年9月增长率达到172.85%。
数据来源:零壹智库
可能是因为在《管理办法》出台初期,已备案企业总量较少,备案企业数量的增加会带来显著的增幅。大模型备案企业数量由2023年8 月8 家增长至9 月14 家,增幅达75%,10 月保持为14 家。随后,大模型企业有序备案,使得备案大模型指数有序增长。
备案企业数量及其注册资本,呈现上升特征,员工数量也表现出同样的特征。就其平均注册资本来看,并非直线上升,而是呈现出一定的波动性,即使在其“低谷”期,平均注册资本也远高于创业企业注册资本,这也符合备案大模型所属企业规模远大于初创企业规模这一实际情况。就大模型备案企业所属公司知识产权数量来看,整体仍然呈现增长趋势,由257 件增长至7135 件,且专利数量多于软著数量。
就其应用场景来看,呈现波动上升趋势,大模型相关招投标数量由2023 年8 月25 件波动上升至2024 年10 月211 件。随着大模型技术的不断发展,其应用场景也在不断拓展,涵盖了文本生成、图像识别、自然语言处理等多个领域。
这些应用场景的拓展,为相关招投标活动提供了更多的机会和空间。同时,国家网信部门出台《生成式人工智能服务管理暂行办法》政策,要求有序开展生成式人工智能服务备案工作,也为大模型的应用提供了更加规范和有力的支持,促进了相关招投标活动的增加。
(四)大模型支撑指数呈周期性波动
报告期内,大模型支撑指数周期性上下波动,保持相对平稳,复合增长0.29%。大模型支撑指数增速最快的是2024 年5 月达19.96%;增速下降最快的是2024年1 月为-15.93%。
数据来源:零壹智库
大模型支撑指数上下波动的原因:一是大模型算力基础指数呈周期性波动,二是社会创新热情呈周期性。
1.大模型算力基础指数呈周期性变化
报告周期内,大模型算力指数呈现出明显的周期性。2023 年10-11月、2024年5-6 月、2024 年10 月大模型算力指数较高,增速较快。如2023 年10 月、2024年5 月、2024 年10 月增速分别达50.89%、1241.15%、1841.97%。
数据来源:零壹智库
大模型算力基础指数呈周期性的原因是,算力基础中的超算中心和智能计算中心建设一般建成时间在5-6 月、10-11 月,导致这几个月的支撑指数增长较快。如2023 年10、11 月和2024 年5、6 月各有一个超算中心建成;同时2023年11月、2024 年5 月各有一个智能计算中心建成。
2.大模型社会创新热情指数呈周期性波动
报告期内,大模型社会创新热情指数呈周期性波动趋势。2024 年7 月社会创新热情指数最高达302.85,2024 年2 月社会创新热情指数最低为99.71。
社会创新热情指数呈周期性,这与第I 期报告存在不同。原因是指数数据选取不同。第I 期报告从2023 年8 月开始到各月的社会创新热情累计值,而本报告则是当月之内社会创新热情实际值。选取实际值的原因是,社会创新热情随时间推移可能会减弱,这可能意味着随着时间的推移,如果没有持续的刺激或推动,人们对于社会创新的兴趣和参与度可能会降低,因此采用实际值更合理。
社会创新热情指数呈周期性的主要原因是:一般过年过节时社会创新热情降低,如2023 年10 月正值国庆节,社会创新热情指数明显下降,降幅达41.48%;2024 年1-2 月正值春节,社会创新热情指数大幅度下降-24.64%、-41.35%。
数据来源:零壹智库
3.大模型政策支撑指数月复合增速22.13%
报告期内,大模型政策支撑指数一直呈增长趋势,从18.44 增长到302.85,月复合增速22.13%。政策支撑指数先增长慢后增长慢主要原因是,我国大模型政策集中在2024年7 月以前出台发布。
如2024 年5 月网信办、市场监管总局、工信部出台《信息化标准建设行动计划(2024—2027 年)》、国家发改委等部门出台《推动文化和旅游领域设备更新实施方案》、工信部发布《工业互联网专项工作组2024 年工作计划》。
数据来源:零壹智库
典型案例分析
(一)马上消费“天镜”大模型
马上消费金融股份有限公司(以下简称“马上消费”)自主研发的“天镜”大模型,是国内首个金融领域大模型,于2023年8月正式推出,并于2024年11月升级迭代到2.0版本,新版本在模型技术创新、标准制定、科研转化成果、具体应用等核心领域取得了突破性进展。
“天镜”大模型已实现智能营销交互、数据决策支持、防伪安全等八大应用场景,1.0版本人机交互模型完成100亿交易额,全面服务了超2亿用户,扩大了金融服务的覆盖面和惠益度。
此外,马上消费还在探索让大模型在金融服务中更有温度,通过与多所高校合作,将心理学理论与大模型结合,使大模型能感知人的情绪,并据此调整交互方式。
1.“天镜”大模型技术应用创新与亮点
对抗学习技术:以金融安全为例,大模型生成式AI在辅助内容生产的同时,也给金融安全带来了巨大挑战,假单据、假人脸、假数据等现象频出。针对这一问题,“天镜”2.0深度融合多模态技术,整合声音、文字、视频等多维度信息,构建全新的对抗学习防伪新体系,全方位、多层次地有效提升金融安全防护能力。
泛化能力提升:针对大模型的“黑箱”特性,“天镜”2.0积极探索逻辑能力与数据知识分离处理的技术,大幅降低了模型更新数据需求,仅需千分之一数据即可完成模型更新,有效提升模型在线学习能力,使其能够与时俱进,灵活适应动态环境变化,显著降低更新成本和时间。支持跨场景应用,通过迁移学习技术实现高效适配,特别在对话领域具备数据驱动大模型的能力。
安全合规保障:天镜大模型在技术设计中高度重视安全与合规: 1)合规能力:严格遵守金融监管要求,提供合规的结果; 2)幻觉检测:降低生成式AI可能产生的误导性内容风险; 3)动态评价机制:通过实时监控和优化模型性能,确保在不可预测情况下的稳定性; 4)行业领先评级:通过中国信通院金融大模型专项评测,获得场景丰富度、能力发挥度和应用成熟度的最高评级4+。 八大应用场景:“天镜”大模型针对金融行业的特殊需求进行了深度优化,应用包括: 1)金融安全:利用多模态数据构建防伪体系,提升安全防护能力; 2)大数据决策支持:提供精准数据分析与决策支持; 3)人机交互:调整交互方式,提升客户服务体验; 4)消费者权益保护:确保金融服务的合规性与稳定性; 5)逻辑推理与泛化:适应多种业务需求,支持跨场景推理; 6)智能营销交互:优化营销流程,提高效率; 7)风险控制:动态监测与分析,提供实时风控能力; 8)知识汇集与数据唤醒:提升数据价值利用率。 情感感知与交互:通过与高校合作将心理学理论与大模型结合,使大模型能感知人的情绪,并据此调整交互方式。这一技术已经在马上消费养老机器人项目中得到应用,展现数字化服务中的人文关怀。
2.引领金融大模型技术创新与标准制定
天镜大模型的背后是马上消费长期的技术积累和资源投入。
数据基础上,拥有2亿用户数据、10万+变量和近50PB多模态高质量数据,为模型提供了强大的训练支持;在技术团队上,公司研发团队超过2500人,自主研发了1000多套系统,涉及人工智能、区块链、大数据、云计算等领域。
同时,公司累计投入超40亿元进行研发,每年持续加大技术投入。目前,公司已申请超2300项发明专利,在智能语音识别、AI心理学等多个技术领域达到了国际领先水平。
此外,“天镜”大模型积极参与学术交流和标准制定,在国际顶级期刊发表五十余篇论文,主导制定了三个国际标准与七个国家标准,并参与工信部牵头的大模型民生领域重大项目,同时与21所高校开展深度合作研究,全面提升金融大模型的技术创新能力与学术影响力。
升级后的“天镜”大模型深入探索合规可信安全体系建设,将马上消费的人工智能成果转化为行业标准实践,积极引领全球金融大模型标准制定工作,参与制定国内外标准近100项,推动行业规范化、体系化发展。
(二)中科金财金融大模型应用平台
中科金财作为国内领先的AI技术应用服务商,以其在人工智能领域的深厚底蕴和持续创新,始终走在行业技术应用前沿。公司自主研发的金融行业电子验印系统,是国内AI人工智能科技应用最早的业务之一,彰显了其在技术创新方面的敏锐洞察力。
中科金财在人工智能、大模型应用、AI算力、区块链、隐私计算等领域取得了多项重要创新成果,其多场景多基座大模型引擎、智能客服系统、报告生成等大模型应用在金融场景中的表现尤为突出。
中科金财建立了最适配金融场景应用的大模型测评能力,定期测评近50款国内外最新开源闭源大模型产品,结合中科金财20余年服务银行业务场景的专业行业经验,在最熟悉、最懂银行业务场景应用的基础上,对不同模型进行选型和场景应用适配。
这一独特优势,使得中科金财能够解决金融机构客户在大模型应用实施过程中面临的诸多问题和挑战,确保金融银行业大模型应用构建的最佳实施路径。
1.大模型技术应用创新与亮点
面对日益复杂多变的业务需求,中科金财深刻洞察到传统技术模式的局限性,于是推动完成多场景多基座大模型引擎平台的研发。该平台集创新技术、灵活架构与高效应用于一体,旨在通过大模型文档数据处理与模式识别能力等智能化手段全面提升金融机构的业务效率与服务质量。
核心设计理念:平台的核心在于其“多场景、多基座”的设计理念。所谓“多场景”,是指平台能够覆盖金融行业的众多业务场景,包括但不限于智能客服、授信报告生成、智能投顾、反洗钱报告生成、智能写作、智能问数ChatBI、智能合同审核、合规报告助手、智能营销助手、智能消保等,为金融机构提供全方位、一站式的智能化解决方案。而“多基座”则意味着平台支持国内外主流的多厂商大模型能力,包括开源与闭源模型,能够满足不同金融机构的定制化需求。
灵活可扩展的分层架构:中科金财多场景多基座大模型平台采用灵活可扩展的分层架构设计,将大模型引擎层、智能路由层和Agent开发运行层有机结合。这种架构不仅提升了系统的稳定性和可扩展性,还使得平台能够轻松应对不断变化的业务需求和技术挑战。
智能模型选型与适配:平台内置了智能模型选型与适配机制,能够根据具体业务场景和需求,自动选择最合适的大模型进行处理。这一功能不仅提高了系统的适应性和灵活性,还大大减少了人工干预和模型调优的成本。
全面覆盖的模型管理链路:中科金财大模型平台覆盖了模型的“评”、“选”、“用”全生命周期管理。通过自动化评测打分算法、智能路由算法和效果调优工具,平台能够对模型进行精准评估、快速部署和持续优化,确保金融机构能够始终获得最佳的应用效果。
2.金融领域业务专家级应用及银行场景实践
中科金财基于过去20余年服务超过600家银行机构的业务场景经验,在集中作业平台、影像作业、电子验印系统、柜面系统、智能客服等银行业务领域拥有深厚的业务专长。公司将大模型应用在10余家银行的信贷报告、风险管理、客户服务、合规审查等业务场景中,实现了业务效率与服务质量的显著提升。
授信报告生成:在公司业务部的授信尽调场景,中科金财应用大模型技术基于银行内外部多源异构数据,自动进行定量与定性分析,生成尽职调查和授信报告。同时,对报告生成内容自动审核校对勾稽关系,并针对财务问题、信用风险进行自动识别。 这一应用实现了近百个指标项的定量定性分析,报告撰写时间从原来的3-5天缩短至1天,准确率提升至97%,信贷审批流程效率与时效性提升70%以上。 银行智能客服辅助:在某城商行的客服场景中,引入中科金财大模型智能客服辅助能力后,实现了针对客户需求、语气的自动判断意图,并推荐相关知识与话术。这不仅提高了坐席人员的专业度与工作效率,还能够预警可能构成客诉的情况。客户平均等待时间由3分钟降至15秒,工单闭环周期下降60%,客服坐席工作效率提升20%以上,客户满意度大幅提升。
此外,中科金财大模型平台还在智能投研投顾、智能写作、智能合同审核、智能问数ChatBI、智能合同审核、智能消保等领域展现出了强大的技术应用能力。通过引入先进的自然语言处理技术和算法模型,平台能够为银行提供专家级的大模型应用咨询和解决方案,为金融机构提供与业务场景再匹配、最高效的大模型场景应用服务。
3.中科金财金融大模型应用赋能银行经营破局
在低息差时代,银行面临着诸多挑战,如海量金融数据利用率低、授信流程繁琐耗时、风险管理精度不足、客户服务响应慢、合规审查压力大等。中科金财金融大模型围绕这些问题,结合大模型新技术能力,帮助银行实现业务流程的智能化升级。
通过大模型在数据分析、意图理解及信息抽取方面的技术优势,中科金财助力银行提升业务效率、削减运营成本,并推动产品服务创新。相比同行业竞争对手,中科金财具有显著的技术创新领先优势、解决方案优势和客户资源优势。
公司拥有600多项核心技术和专利,与阿里、智谱、百度、科大讯飞、华为、百川、快手、谷歌、微软等国内外知名大模型厂商均达成长期合作。同时,上述国内外大模型厂商也深度参与了由中科金财董事长朱烨东任主编、智谱AI首席科学家唐杰教授及清华大学人工智能研究院副院长朱军教授共同担任副主编的首部《中国通用人工智能发展报告》蓝皮书。
此外,中科金财还获得了国家网信办大模型方面的多项备案,并在2024年中国人工智能大会上入选“人工智能全景赋能典型案例”。这些荣誉和认可,充分证明了中科金财在金融大模型应用领域的领先地位和卓越贡献。
结论
中国的大模型发展在多个层面上取得了积极进展。报告期内,大模型指数显著增长,尤其是研究指数和技术研究指数的增长,反映了学术界和技术界对大模型领域的持续关注和投入。企业运营指数的增长表明市场对大模型技术的应用和商业化进程正在加速。
但中国大模型发展也存在着挑战。大模型面临着技术创新难度的增加,以及受社会创新热情波动性影响,还有美国对中国AI 领域的限制性法案,对中国AI技术和大模型的发展构成了显著挑战。
从产业端来看,天镜大模型和中科金财大模型引擎分别代表了金融科技在智能化服务和技术创新方面的重要进展。
天镜大模型通过其先进的技术和广泛的应用,为金融行业提供了强大的智能化支持,尤其在提升金融安全和营销效率方面表现突出。中科金财的大模型引擎则以其独特的全链条服务模式,为银行业务的智能化升级提供了有力保障,显著提高了业务处理效率和风险控制能力。
这两个大模型的成功应用,不仅展示了金融科技的创新力量,也为整个金融行业的未来发展指明了方向。