智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 心缘
智东西10月24日报道,今天,2024科大讯飞全球1024开发者节上,科大讯飞星火大模型再次重磅升级,星火4.0 Turbo多项能力全面超过GPT-4 Turbo。
讯飞星火大模型4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力七大能力中全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o,星火4.0 Turbo效率相对提升50%。
此外科大讯飞还首发了星火超拟人数字人、星火多语言大模型、汽车端侧星火大模型。面向医疗、教育、工业等场景,科大讯飞首发基于“问题链”的高中数学智能教师助手,以及实现了讯飞星火医疗大模型2.0的六大核心场景能力升级,同时发布讯飞星火医学影像大模型。
基础设施层面,科大讯飞董事长刘庆峰宣布科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
刘庆峰公布了科大讯飞亮相星火大模型一年来的应用落地成绩单:讯飞星火央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、工业大模型第一、赋能科研应用第一、大模型开发者生态第一。
具体的一些数据指标为,2024年1-9月,讯飞星火智能硬件GMV同比提升50%,截至10月23日,双十一大促全渠道GMV同比增长280%;讯飞星火App安卓平台累计下载量2亿。
一开场,刘庆峰就展示了几个科大讯飞应用落地的典型案例。
科大讯飞和华为联合研发了小艺声音修复,能让特殊人群的发音更加清晰,实现正常交流。
硬件方面,科大讯飞基于翻译技术打造的多语种AI翻译透明屏,能帮助用户通过这块透明显示屏实现无障碍交流。
从检测空调到检测智能汽车,科大讯飞的VIAS智能座舱人机交互效果评测机器人,目前在测试场景能覆盖车控、导航等1383个功能点,达到了人工检测的90%以上,测试提效10倍。
一、七大能力超GPT-4 Turbo,首发超拟人数字人
讯飞星火4.0 Turbo实现了七大能力全面超过GPT-4 Turbo,其中数学能力、代码能力超过GPT-4o,星火4.0 Turbo效率相对提升50%。同时,在国内外中英文14项主流测试集中,星火4.0 Turbo拿下9项第一。
在数学能力中,星火4.0 Turbo的标准考试任务能力、实用数学任务均超过GPT-4o。刘庆峰介绍,该模型已经完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可以实现类o1的高难度数学能力显著提升。
代码能力层面,在HumanEval测试集上,星火4.0 Turbo性能已超越GPT-4o,并且针对个人开发者,科大讯飞还推出7B版本,支持大模型在本地运行。
科大讯飞将万物互联时代的多模AIUI交互标准进一步扩展,从此前的远场高噪、全双工、多语种多方言、多模态,延伸到了超拟人、个性化。
基于星火大模型,科大讯飞的语音交互拓展到了音视频流的实时多模交互。
首次发布的星火超拟人数字人,可以实现口唇、表情、动作的语义贯穿,用大模型自动生成,并保持语义一致性。
科大讯飞副总裁、研究院院长刘聪现场进行了真机演示,超拟人数字人可以展现出目瞪口呆、卖萌的表情,实时与用户实现交流。
并且,超拟人数字人还拥有实时视频流的动态交互能力。用户只要打开摄像头,将其对准想要询问的画面就能对动态画面进行实时交互提问。
刘聪演示过程中,在桌子上摆了孙悟空、奥特曼、怪兽的玩偶,超拟人数字人直接根据玩偶的站位变化,讲述了一个生动的故事。
旅游场景中,超拟人数字人还能帮你快速了解挑选的化妆品、礼品的信息,同时也能快速识别花草,以及种植花草的注意点。
用户还能一张照片生成自己的虚拟人,一句话创建发音。在虚拟人的编辑页面,用户可以自主选择声音或者读一句话创建自己的拟人发音,也可以调整自己的人像照片、性格等。
下面就是演示过程中,刘聪创建的数字人。
超拟人数字人的声音自然度达到4.2分,刘庆峰称,最好的播音员可以达到5.0分左右,真人水平一般为4.0分左右。
此外,在远场高噪场景,今年9月,科大讯飞在语音识别领域的赛事CHiME-8夺冠,并拿下连续五连冠。当下,科大讯飞的语音识别也首次实现全国地级市方言全覆盖,包括288个地市202种方言。
二、首发八个语种多语言大模型,1.3B汽车端侧大模型
基于全新发布的星火4.0 Turbo,科大讯飞首发了星火多语言大模型、汽车端侧星火大模型。
星火多语言大模型首批可以支持中文、英语之外的八个语种,其能力整体达到GPT-4o 96%的水平,多行业任务场景效果超过GPT-4o。
与此同时,多语言的交互也为汽车的智能交互提供了工具。
基于大模型能力,用户与汽车的交互已经从导航、命令控制等基础应用交互,提升到包括用车助手、旅行家等应用层面,使得活跃用户的日均交互从7次提升到了18次。
为了让大模型直接在汽车部署,科大讯飞发布了参数规模为1.3B的汽车端侧星火大模型,相比于参数规模更大的模型,其效果损失≤1%,端侧首响40ms,端云融合交互低至1.3s。
2024年第四季度,该模型将会在奇瑞、广汽、长城将有多款车型陆续上市开售。
在交互之外,科大讯飞正在与开发伙伴一起为车企构建丰富智能体生态,包括汽车内的支付、影视等。
三、深入教育、医疗、法律场景,用AI过滤作业、诊断医疗影像
讯飞星火大模型的软硬件已经在教育、医疗等场景实现了深入应用。
1、教育:高中数学教师助手,用AI过滤作业必答题、选做题
在教育领域,科大讯飞首发了基于“问题链”的高中数学智能教师助手,并邀请12个区域的50多位数学教研员、400多位教师人员共创。这一教师助手可以帮助老师定位孩子薄弱环节,进行启发式讲解。明天,科大讯飞还将发布带有智能教师助手的星火智慧黑板2.0。
面向家庭学习,科大讯飞发布了搭载到学习机上的AI作业过滤器,能够帮助学生对作业、考题筛选,基于其对学生的知识习得能力等进行判断,选出学生的分为必答题、选做题和可不做题。这一功能预计在11月中旬上线。
2、医疗:医疗大模型六大核心场景升级,发布医学影像大模型
讯飞星火医疗大模型此前发布的功能包括智医助理、智慧医院、讯飞晓医等。
其中智医助理已经在611个区县,完成了8.6亿辅助诊断次数,8100万不合理处方提示;智慧医院完成了5000万次AI患者服务,完成6亿次疾病随访;讯飞晓医的下载量达到1500万次,完成了1.1亿次AI咨询。
在此基础上,讯飞星火医疗大模型2.0实现了六大核心场景能力升级,包括医疗海量知识问答、医疗复杂语言理解、医疗诊断治疗推荐、医疗专业文书生成、医疗多轮交互、医疗多模态交互。
在细分的医学影像方面,目前围绕医学影像的诊断治疗,存在影像科医生数量相对不足、拍片质量参差不齐、重复影像检查发生率达到41.82%的问题。
在此背景下,安徽省实现了全国应用规模最大的影像云平台,实现了一次检查全省互通互认。
科大讯飞发布讯飞星火医学影像大模型,能完成智能智控、智能诊断、智能读片。影像助手可以帮助医师进行解释溯源,找到对应的判断标准,还能对比患者之前的影像CT。
3、法律、企业、科研:用户工作效率翻倍提升,政务场景审核时间缩短80%
星火大模型赋能法律和政务,法律大模型的场景应用包括AI书记员、AI文书助理、AI法律检索助手;政务场景的星火智办一体机,使得用户递交材料的审核时间缩短80%,登记效率提升5倍,
面向企业,科大讯飞为企业大模型构建提供顶层规划到执行落地的全套解决方案,包括数据工具请洗脸、SFT数据工具链、场景优化工具链、多模态知识零采编系统,提升“理数据、训模型”的效率。
在科研方面,星火科研助手2.0已经中国科学院下属116个院所使用,同时,科大讯飞已经联合团队开展了AI+生物科技、AI+科学装置的科研攻关。
结语:大模型生态繁荣,AI正改变科研范式
讯飞星火大模型从发布至今,都在强调基座模型升级与行业应用的紧密结合,目前其已经发布20多个行业大模型,打造了300多个智能体应用,这些形成了可以相互借鉴和复用的规模化效应。
如今,以大模型为代表的通用人工智能发展迅猛,今年诺贝尔奖、物理学奖、化学奖都与AI强相关,AI改变科研范式已经成为科技界的共识。以科大讯飞为代表的国内大模型厂商,正在其中扮演着愈加重要的角色。