科大讯飞大模型落地的“阳谋”

“AI一天,人间一年。”业内常用这句话来形容大模型行业的变化速度。

今年初Sora引发文生视频热潮,年中大模型价格战打响,其间时有融资消息释放,商业化问题也被摆到台前,多重情绪裹挟下,国内大模型企业逐渐从争相想成为“中国的OpenAI”,到更关注应用场景落地。

10月24日,在科大讯飞1024全球开发者节上,科大讯飞董事长刘庆峰展示了星火大模型在教育、汽车、医疗等不同领域的应用场景是如何落地的,并公布了一年来取得的成绩:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件第一、赋能科研应用第一。

图片

与此同时,讯飞星火4.0 Turbo正式发布,首发多模AIUI交互标准等11项技术和产品应用。发布会后,在超拟人数字人交互的展台前,吸引了众多观众让大模型用海绵宝宝的风格讲故事、创建属于自己的虚拟人角色等。

在大模型这股浪潮中,OpenAI依然占据技术领先优势,科大讯飞则始终以追赶者姿势向世界顶级技术对标。今年9月OpenAI的o1系列发布后,超长思维链、树搜索及自我反思评价等能力引发业界高度关注,刘庆峰表示,科大讯飞已完成相关算法验证,预计今年底可实现类o1的高难度数学能力显著提升。

基于底座模型的能力不断提升,科大讯飞应用生态持续繁荣,截至2024年10月,与各头部企业共建20多个行业大模型,覆盖300+应用场景。并坚持以长期主义打造真正自主可控的算力平台——“飞星二号”正式启动。

图片

讯飞版《her》升级

今年5月,OpenAI推出集文本、图像、音频、视频于一身的GPT-4o,并演示了堪比电影Her中的人机交互体验,但是如Sora一样,OpenAI的Her仍是期货。

在8月中旬讯飞版《Her》发布后,本次发布会,科大讯飞重新定义了多模AIUI交互标准:在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。其中超拟人数字人首次亮相,科大讯飞研究院院长刘聪和“她”在现场进行了生动的交流。

“看样子,孙悟空和奥特曼一起打败了怪兽。”“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽。”给数字人打视频通话时,刘聪不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,数字人则发挥想象力,看图创造出不同情节的大戏,有网友评价:数字人是妥妥的“预备导演”。

移动看图说话的能力还能应用到更实用的场景中,比如旅游购物时,当摄像头转向印有外文的化妆品及酒类产品时,“她”会对画面中产品的品牌、功能等信息进行“秒回”,成为用户“跨语言”购物的好帮手。

目前,讯飞星火还支持用户创建自己的个性化数字人,打造每个人的数字分身。操作十分简单,只要在后台编辑、定义,就能快速生成自己的卡通形象,随时随地与自己对话,有1300多种人设可供选择。而且,只需一句话,数字分身就可以马上复刻声线。

刘聪在现场就与20年前的自己进行了对话,“我是20年后的你,你有什么问题想问我?”,随后“数字分身”刘小聪问:“我天天追的女生追到了吗?我变有钱了吗?我的发际线还好吗?”引起现场笑声阵阵。

据了解,讯飞超拟人数字人的声音自然度可以达到4.2分,最好的播音员是5.0分,真人水平一般为4.0分左右,可见超拟人数字人惟妙惟肖的程度。

超拟人数字人背后的底座大模型,也迎来了升级。最新发布的讯飞星火4.0 Turbo,七大核心能力超过GPT-4 Turbo,数学和代码能力超越GPT-4o,在国内外中英文14项主流测试集中,还实现了对美国三大主流大模型的9项超越,效率相对提升50%。

从比底座到拼落地 

OpenAI在2022年11月30日正式推出ChatGPT后,追赶或超越OpenAI成为一众大模型厂商的目标,彼时聚光灯一直打在大模型底座上。进入2024年,不少大模型厂商开始踏上与实体产业相融合的新赛道,资本市场的热钱也从大模型底座转向应用。

在人工智能领域深耕25年的科大讯飞,积累了教育、金融、医疗等领域的众多经验,并逐渐转化为大模型落地的优势。同时不断发挥飞轮效应,向其他行业辐射,打造出多个行业大模型。

发布会上,科大讯飞首次发布星火多语言大模型,可支持中、英、法、日等8个语种,多语言能力上,首次实现全国地级市方言全覆盖,这些都将全面赋能汽车产业,科大讯飞还首发了汽车端侧星火大模型。

据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。目前中国出海TOP 10的车企中,有8家都与科大讯飞达成了合作。

面向教育、医疗、司法、政务服务、企业办公等多个行业场景,科大讯飞发布了最新的产品应用和解决方案。比如医疗领域的医学影像大模型,它能根据影像照片,帮助医生快速生成诊断报告;教育方面首次发布AI作业过滤器,将题目分出“必做题”“选做题”“建议不做题”三类,用科学的方法为孩子们减负。

图片

AI浪潮下,拥抱大模型几乎是各行各业的确定性动作,公开数据显示,今年前三季度,中国大模型市场中标项目的已披露金额,比去年全年增长超过160%,其中,央国企单位成为采购客群的主力。

在一众大模型厂商中,科大讯飞逐渐成为央国企的首选。据智能超参数统计,2024年前三季度,科大讯飞累计中标项目38个,披露的中标金额为2.16亿元,位居大模型厂商中标排行榜中标项目和中标金额“双第一”,且部分央国企持续复购科大讯飞的AI产品,中国移动、中国电信等合作次数均超3次。

大规模的落地也带动了科大讯飞营收和净利润的双增长,科大讯飞发布的最新财报显示,三季度实现营业收入55.25亿元,同比增长15.77%,毛利22.6亿元,同比增长16.68%;净利润5696.14万元,同比增长120.87%。

将技术落到实处,这是科大讯飞正在做的事;生态繁荣、自主可控则是科大讯飞的长期目标。 

强强联合实现自主可控

在谈及国内大模型行业的未来时,刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。

同时他提到了两个观点:一是只有生态的繁荣,才有人工智能的未来;二是只有在真正自主可控的平台上,才有真正的中国人工智能大未来。实际上,科大讯飞一直在用实际行动推动这一目标的实现。

去年10月24日,首个集计算、存储、网络三位一体的国产万卡算力集群“飞星一号”平台上线,可支持万亿级参数规模的大模型训练,大幅提升训练效率,以实现模型能力的快速迭代升级。

据刘庆峰介绍,一年以来“飞星一号”攻克了很多‘疑难杂症’,解决了500多次的基础软硬件问题和模型适配问题。一年后,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。

“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展。

图片

近日,有多名开发者称已收到邮件,其使用的微软Azure OpenAI服务将于2024年10月21日终止。回头来看,科大讯飞和华为的强强联合,不仅基于国产算力打造自主可靠通用大模型底座的路径是可行的,也体现了科大讯飞的前瞻性,减少对外部技术的依赖,增强国内产业的自主创新能力。

在行业落地中,科大讯飞与央国企、教科院等强强联合,为自主可控奠基。比如昆仑大模型就是由中国石油、中国移动、华为和科大讯飞共同打造的能源行业大模型,其中讯飞星火大模型为“员工助手”“行业大家”等研发成果提供了核心技术支持。

“今天是一个全面共创的时代,不仅仅是专业团队,每一个用户的每一次提问都是大模型进步非常重要的基石。”刘庆峰说到“你们对AI的愿望,就是我们未来努力的方向,期待着我们携手努力,解放生产力,释放想象力,在中国用人工智能建设美好世界,并且给世界提供第二种选择。”