讯飞星火4.0 Turbo发布,首发语音视觉虚拟人交互“三合一”

潮新闻客户端 记者 甘居鹏

图片

科大讯飞董事长刘庆峰

10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰发布讯飞星火4.0 Turbo,并公布讯飞星火大模型应用成绩单:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。

与此同时,国产超大规模智算平台“飞星二号”正式启动。

艾伦人工智能研究所、OpenAI等国内外权威单位发布的,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。

刘庆峰特别提到“硬碰硬”的数学能力和代码能力,讯飞星火大模型4.0 Turbo在数学能力、代码能力上超过了GPT-4o。

在语音识别领域,科大讯飞首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说;多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。

发布会上,科大讯飞在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。

科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看图说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽 ”,和刘聪畅聊不同角度的所见。

刘聪还演示了更实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能对画面中产品的品牌、功能等信息进行“秒回”,超拟人数字人已成为“跨语言”购物的好帮手。

截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300多个应用场景。

“转载请注明出处”