飞速发展,向新而生——2024年中国十大AI大模型 | 2024读特AI盘点

2024年,是AI不断上“新”的一年。

这一年,以大模型为代表的人工智能技术已成为引领新一代产业变革的核心动力。2024年政府工作报告首次提出“人工智能+”,要求“大力推进现代化产业体系建设,加快发展新质生产力”“深化大数据、人工智能等研发应用”。当前,AI正以前所未有的速度掀起一场创造力革命。

2024年,到底有哪些亮眼的中国大模型呢?读特客户端联合深圳大学传播学院选出了这些“明星”AI大模型。

让我们通过

“2024年中国十大AI大模型”盘点

回顾AI高速发展的这一年


图片

图片

豆包快速迭代崛起,月活跃用户近6000万

豆包是一款由字节跳动开发的AI大模型,能提供聊天机器人、写作助手以及英语学习助手等功能,能够回答各种问题并进行对话,帮助人们获取信息。简单来说,它就是一个具有多种能力的AI助手。

2023年8月,豆包大模型正式亮相。2024年5月,字节跳动宣布豆包大模型正式开启对外服务,计划开启商业化。在2024年11月的全球月活跃排行榜上,豆包的月活跃用户达到了5998万,仅次于OpenAI的ChatGPT,位列全球第二。

豆包大模型的背后,是字节跳动强大的技术储备。它在以下几个方面表现突出:一是图像理解,能精准识别和分析图片内容;二是多模态融合,可以同时处理文字、图像、声音等多种信息;三是教育领域,开发了专门的教育模型,在学习辅导方面表现出色。

从市场和数据表现来看,自 2023 年 8 月推出后,豆包的影响力不断扩大。截至2024年1月,豆包的安装量已经飙升至2500万,最高访问量超1700万,成为当之无愧的新晋AI应用顶流。2024 年 5 月,豆包已经与超过 500 家企业达成合作意向,这些企业涵盖教育科技、智能硬件、内容创作等多个领域,它们看中的正是豆包大模型的强大功能和广泛适用性。

2024年,豆包大模型通过接入自家豆包 Ola Friend 智能体耳机、第三方的 FILL AI 耳机、AI 玩具和手机等硬件,尝试潜移默化地进入家庭、学习和情感陪伴的各个角落。

“卷技术”的文心大模型,正打通商业化变现“高速路”


文心大模型是基于飞桨平台研制的知识增强大模型,从万亿级数据和千亿级知识中融合学习,具备知识增强、检索增强和对话增强等核心技术。自2023年3月16日发布文心一言以来,百度文心大模型不断升级,各项技术也在不断进化。文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。同时,文心大模型在C端始终保持着断层领先,根据《生成式人工智能应用发展报告(2024)》显示,文心一言在生成式人工智能典型产品网民使用率中位居第一。


2024年11月21日,百度发布了2024年的第三季度业绩。财报显示,百度总营收336亿元,百度核心营收265亿元,超出市场预期。同时报告显示,文心大模型日均调用量已达15亿次,一年内增长30倍。新一代文心大模型的推出,无疑将进一步巩固百度的领先优势。


在这些数字的背后,百度正在形成以AI为长期战略、以应用驱动为主要路径的核心打法。百度主要聚焦于AI技术的深度应用和商业化,通过技术创新、生态构建、免费策略以及闭源模式等手段,推动文心大模型的商业化进程,并在多个领域实现AI技术的应用和扩展。


Kimi在A股市场引发热潮,长文本处理“遥遥领先”

诞生于2023年10月的 Kimi智能助手,主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”6项功能,是全球首个支持输入20万汉字的国产大模型。2024 年,Kimi 智能助手在 A 股市场引发热潮,其作为国产 AI 产品,被网友称之为 “国产大模型之光”,刺激了相关概念股的大爆发。2024年3月18日,Kimi智能助手已支持200万字超长无损上下文,其长文本处理能力在 AI 领域领先,且应用场景正逐步从长文章分析往 AI 陪伴、AI agent 等方向发展。2024年10月,月之暗面正式上线具备AI自主搜索能力的Kimi探索版,一次搜索即可精读500个页面。

目前,Kimi智能助手正在筹措首批新智能生态合作伙伴联盟,搭建toC(面向消费者)、toB(面向企业)全矩阵多行业垂直大模型,进一步拓展其在各行业的应用。

清华系AI智谱清言,解锁国内首个视频通话功能

2023年8月31日,智谱清言是由北京智谱华章科技有限公司开发的千亿参数对话模型,基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,能为用户实时提供通用问答、虚拟对话、代码生成、创意写作等多方面服务。

2024年1月16日,智谱发布新一代基座大模型GLM-4,与上一代相比GLM-4性能全面提升60%,达到比肩GPT-4的水平。升级之后的大模型,能够根据用户意图理解、规划复杂指令,单次处理的文本达300页。

2024年8月30日,“智谱清言”APP上线了国内首个面向客户端开放的视频通话功能,用户只需打开视频通话界面,便能享受到,如同与AI“面对面”的交流体验。

覆盖超300个应用场景,讯飞星火认知斩获多项第一

2023年5月6日,科大讯飞正式发布讯飞星火认知大模型,并展示了其在多个领域的卓越核心能力。

在2024 年,讯飞星火成绩斐然。2024年前三季度,其安卓端的下载量超过2亿次,在国内工具类通用大模型APP中排名第一。2024年9月,讯飞星火成为首批通过国家标准认证的大模型之一,彰显了技术实力与市场认可度。2024年10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕会上,发布了讯飞星火4.0 Turbo,经国内外中英文14项主流测试集中实现了9项第一,创造“AI+教育”的无限可能。

目前,讯飞星火支持多语种语音识别、智能标点预测、高度拟人化的语音合成能力、多语言多风格语音合成、个性化参数调节、丰富的调用方式、极速多模交互、情绪感知等。此外,讯飞星火还具有较强的语言理解能力,可以帮助人们更好地理解和处理自然语言。

此外,科大讯飞与各行业头部企业合作共建了20多个行业大模型,覆盖超过300个应用场景,包括医疗、教育、工业、金融、汽车和政务等多个领域,进一步巩固了讯飞星火在AI技术应用和行业合作方面的领先地位。

中文性能排名第一!超大规模语言模型通义再升级

通义千问是阿里云推出的超大规模语言模型,具备文本创作、代码编写、语言翻译和角色扮演对话等功能。它支持多轮交互,理解多模态知识,并能进行文案创作,如续写小说、编写邮件等。此外,通义千问还具备强大的逻辑推理能力,能解决复杂问题。

2024年5月9日,阿里云发布了性能大幅提升的通义千问2.5,在中文能力上更是领先业界,在OpenCompass基准测试中得分追平了GPT-4 Turbo,成为国产大模型中首个达到此成就的模型。同时大模型更名为“通义”,集成通义大模型全栈能力。这一版本在实际应用中的潜力得到了广泛认可,已服务超过9万家企业,覆盖PC、手机、汽车、航空等多个领域。

截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过7.43万个,成为世界最大的生成式语言模型族群。此外,通义千问与小米达成深度合作,计划将其AI能力整合到小米的智能设备中,提升智能交互功能。

130亿参数助力 “导演” 梦,混元用想象开启视觉盛宴

在2023年9月6日,腾讯正式上线发布混元大模型。在2024年4月,腾讯混元大模型技术架构已升级为混合专家模型(MoE)架构,参数规模达万亿,擅长处理复杂场景和多任务场景。在2024年6月,腾讯发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,生图时间缩短75%。

12月3日,腾讯混元大模型正式上线视频生成功能并实现开源,参数量达130亿,并在综合评测中呈领先趋势,被称为“腾讯版Sora”。根据现场生成视频显示,无论是在水里冲浪,还是在阁楼里跳舞,只要你的想象力“够用”,输入精确提示词后都能一键生成。目前腾讯混元生成视频大模型可以实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形,一键当“导演”不是梦。

双千亿级大语言模型天工,个性化定制用户需求

昆仑万维自研的双千亿级大语言模型“天工1.0”于2023年4月17日发布。同年8月23日,公司推出了国内首款融合大语言模型的搜索引擎——“天工AI搜索”,这标志着智能搜索进入了一个新的时代。无论是职场人士、学生还是AI技术爱好者,天工AI都能为他们提供全方位的智能服务。

到了2024年5月27日,昆仑万维集团宣布“天工AI”的每日活跃用户已超过100万。根据11月量子位智库的报告,截至11月底,“天工AI”的下载量已超过1500万。

11月20日,昆仑万维宣布正式推出国内首款具备中文逻辑推理能力的天工大模型4.04o版(Skywork 4o),具有高效响应速度、支持实时打断、情感理解与个性化记忆、可定制的声音风格、有能力支持多语言的功能。

打造“AI医生”,百川大模型发力医疗领域

百川大模型(Baichuan大模型)是百川智能推出的大模型产品,融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,在知识问答、文本创作领域表现突出。

作为国内唯一一家专注医疗的头部大模型公司,百川智能在AI医疗技术和应用上均取得了阶段性进展。目前,百川智能希望用大模型打造出足以赋能基层的“AI医生”,为解决当下医疗领域存在的诸多难题提供助力。

2024年1月29日,超千亿参数的大语言模型 Baichuan 3 发布,在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中展现了较强的能力 。它在对逻辑推理能力及专业性要求极高的权威医疗评测上的中文效果超过了 GPT-4,成为中文医疗任务表现最佳的大模型自研的通用医疗增强大模型。5月22日,百川智能基于最新一代基座大模型 Baichuan 4,推出首款 AI 助手“百小应”。

12 月 23 日,百川智能发布全链路领域增强大模型 Baichuan4-Finance,极大提高了金融场景的整体可用性。

即梦AI加速布局短剧,用AI为热门IP插上翅膀

今年年初,Sora的横空出世开启了“AI视频生成创作的新热潮”,作为短视频巨头的字节跳动推出了生成视频模型即梦AI,它也被视为国内最具赶超可能性的选手之一。在2024年,即梦AI取得了技术与市场的双重突破。特别是2.1版本的推出,实现了AI绘画直接生成中文字的能力,极大提升了用户体验。截至2024年10月15日,即梦AI的累计下载量为79.14万。2024年11月,即梦AIAPP位列国内AIApp增速榜第一,月活达125万,环比增长62.81%。

同时,在2024年即梦AI试水AIGC短剧,在上海国际电影节上亮相的《三星堆:未来启示录》,展示了AI技术在影视制作中的新机遇。在行业评选中排名第二,即梦AI的商业化步伐也显著加快,在中国GenAI消费应用人气评选中排名第二,处在国内AI前列。在2024年,即梦AI的商业化能力也得到了显著提升,通过落地AIGC能力,助力业务创新和加速发展。2024年10月,即梦AI平台发起了“即梦AI英雄帖——竖屏限时创作挑战”项目,优质作品都会上线至即梦AI App向所有用户展示。只需要简单的提示词,就能通过AI作图、AI视频、AI音乐的相应工具,将用户脑海里的创意变为现实。目前,即梦AI平台正在抓紧布局竖屏视频,让想象为视频赋能。

今年,AI大模型不仅在技术上秀出了新高度,还在商业化和行业融合上玩出了新花样。

首先,AI大模型的技术迭代速度令人瞩目。例如,字节跳动的豆包AI大模型,图像理解、多模态融合和教育领域的应用表现突出,堪称AI界的“学霸”。科大讯飞的讯飞星火大模型在多语种语音识别和语言理解方面取得了多项第一,成为国内工具类通用大模型APP中的“能手”。其次,AI大模型今年在商业化和行业融合上也是“多面手”。例如,即梦AI开始在短剧领域布局,百度文心大模型在商业化变现上的成功,都让AI大模型看到了更多的发展前景。

2024年《政府工作报告》中提出开展“人工智能+”行动,标志着我国对于人工智能技术的重视达到了新的高度。这一行动不仅体现了国家对于科技创新的坚定支持,也预示着未来经济社会将迎来更深层次的变革。

AI的未来究竟在何方?这个答案,或许就藏在每个AI大模型的一个个突破里。从去年的前瞻布局,到如今各行各业的AI大模型的蓬勃生长;从思考模型创新,到人工智能赋能万千企业的实践。未来,人类与AI还将创造出什么成绩?我们拭目以待。


资料来源:人民网、人民日报、科大讯飞、澎湃新闻、制造前沿、字节跳动、中国新闻出版研究院元宇宙出版与阅读实验室、AI产品榜、AI洞见研究院、讯飞开放平台、《生成式人工智能应用发展报告(2024)》《开启智能新时代:2024年中国AI大模型产业发展报告》、《开启智能新时代:2024年中国AI大模型产业发展报告》《国产AI产品“卷”向全球》、《“人工智能+”引爆新质生产力革命》、《2024人工智能时代的创意、商业和社会》、《2024人工智能大语言模型发展技术研究报告》、《2024人工智能算力高质量发展评估体系报告》、《2024年中国人工智能人才发展报告》

文案 张铃佳

长图 平安琪

视频 王茜垚

编辑 谢小蕾

审核 伊诺

二审 徐雅乔

三审 袁斯茹


(作者:读特客户端)