李飞飞团队2025AI指数报告:AI和计算机科学教育普及程度仍不够

AI划重点 · 全文约1688字,阅读需5分钟

1.斯坦福大学以人为本人工智能研究所发布《2025年人工智能指数报告》,深入剖析全球人工智能行业发展态势。

2.报告显示,2023年AI基准测试成绩大幅提升,MMMU、GPQA和SWE-bench得分分别上升18.8%、48.9%和67.3%。

3.与此同时,人工智能商业应用加速,78%的组织报告称2024年使用人工智能,高于前一年的55%。

4.中国大模型发展迅速,与美国差距缩小,2024年值得关注AI模型数量为中国15个,欧洲3个。

5.然而,AI教育普及程度仍不够,2/3的国家提供或计划提供K-12计算机科学教育,但普及程度仍不够。

以上内容由腾讯混元大模型生成,仅供参考

教育从业者年度必读丨《教育科技这一年:教育+AI新纪元》正式发售,点击文末小程序购买!

由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布《2025年人工智能指数报告》(Artificial Intelligence Index Report 2025)。这份长达456页的报告,深入剖析了2024年全球人工智能行业的发展态势,揭示了12大关键趋势。


李飞飞被誉为“AI教母”,现为斯坦福大学计算机科学教授,美国工程院院士,美国国家医学院院士。她的专业领域是计算机视觉和认知神经科学。李飞飞倡导以人为本的AI理念。其团队汇聚了来自多学科领域的顶尖专家,长期专注于跟踪、研究AI发展动态。


最新报告的12大趋势中,涉及AI基准测试成绩的变化、AI应用加速与投资增长、中美AI模型差距、公众对AI的态度转变、AI硬件发展状况分析等内容。


报告提到,人工智能在高要求基准测试中的表现持续提升。2023 年,研究人员推出了新的基准——MMMU、GPQA 和 SWE-bench——来测试高级 AI 系统的极限。仅仅一年后,性能就大幅提升:MMMU、GPQA 和 SWE-bench 上的得分分别上升了 18.8、48.9 和 67.3 个百分点。除了基准之外,AI 系统在生成高质量视频方面取得了重大进展,在某些情况下,语言模型代理甚至在时间预算有限的编程任务中胜过人类。


人工智能商业应用在加速78% 的组织报告称 2024 年使用人工智能,高于前一年的 55%。与此同时,越来越多的研究证实,人工智能可以提高生产力,并且在大多数情况下有助于缩小劳动力队伍的技能差距。


美国私营部门对AI的资金投入依然占据领先地位。2024年,美国私营部门对AI的投资增长到1091亿美元,生成式AI吸引全球私营投资339亿美元,比2023年增长18.7%。78%的组织报告称在使用AI,比前一年增长55%。


中国大模型正在加速发展,与美国的差距缩小。2024 年,美国机构开发了 40 个值得关注的 AI 模型,远远超过中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先,但中国模型已迅速缩小质量差距,在MMLU和HumanEval等主要基准上的性能差异从2023年的两位数缩小到2024年的接近相等。与此同时,中国在 AI 出版物和专利方面继续保持领先地位。


图片


各国政府正在加强对AI的监管和投资2024年,美国联邦机构出台了59项与AI相关的法规,是2023年的两倍多。全球范围内,自2023年以来,75个国家的AI立法提及率上升了21.3%,自2016年以来增长了9倍。各国政府也在进行大规模投资,如加拿大承诺投资24亿美元,中国启动了475亿美元的半导体基金。


图片


全球AI乐观情绪上升,但地区间有所差异在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为人工智能产品和服务是利大于弊的。相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪较低。不过,自2022年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)在内的几个先前持怀疑态度的国家,乐观情绪有所提升。


图片


人工智能变得更加高效、经济实惠且易于获取。由越来越强大的小型模型驱动,在达到GPT-3.5水平上的系统推理成本在2022年11月到2024年10月间下降了280倍。在硬件层面,成本每年下降30%,而能效每年提高40%。开放权重模型也在缩小与封闭模型的差距。


在AI教育方面,AI和计算机科学教育正在扩大,但普及程度仍不够。如今,已有2/3的国家提供或计划提供K-12计算机科学教育,是2019年的两倍,其中非洲和拉丁美洲取得的进展最大。在美国,拥有计算机学士学位的毕业生人数在过去10年中增加了22%。然而,在许多非洲国家,由于电力等基础设施的不足,获得计算机学位的机会仍然有限。


工业界依然是研发AI最重要的领域2024年,近90%的著名人工智能模型来自工业界,高于2023年的60%,而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每5个月翻一番,数据集每8个月翻一番,耗电量每年翻一番。


AI对科学界的影响与日俱增两项诺贝尔奖表彰了AI在深度学习(物理学)和蛋白质折叠(化学)中的应用,图灵奖则表彰了AI在强化学习方面的开创性贡献。


复杂推理依然存在挑战。人工智能模型擅长解决国际数学奥林匹克等问题,但在 PlanBench 等复杂推理基准测试中仍举步维艰。即使存在可证明的正确解决方案,它们也常常无法可靠地解决逻辑任务,这限制了它们在精度至关重要的高风险环境中的有效性。