两行代码让AI开口说话,对话式AI能力加速普及

只需两行代码,15分钟就能让AI(人工智能)开口说话——AI能力的普惠应用正在加速推进。3月6日,实时互动云行业美股上市企业声网发布对话式AI引擎,该引擎具备650毫秒的低延时响应、逼近真人对话节奏的智能打断等能力,并支持包含 DeepSeek、ChatGPT等在内的全球几乎所有大模型厂商。借助这个收费为0.098元/分钟的对话式AI引擎,开发者可以以较低成本快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式AI场景,大幅降低开发门槛。

生成式AI的浪潮下,行业普遍认为多模态大模型是实现通用人工智能的必经之路,知名投资机构a16z关于Voice(语音) AI的最新报告提出,随着大模型的不断进步,语音将成为一种关键的切入点。

声网AI RTE产品线负责人姚光华表示,据统计,用户与AI 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1秒,单次成本3分钱。如果每月对话次数15次,那么月成本不到5毛钱,年成本也只需5元。

据了解,借助其AI引擎,开发者能够快速搭建起具有对话式AI场景的AI应用,例如在智能助手场景中,人们可以通过自然语言式的交流让智能助手帮助其进行日程管理、信息查询和任务执行,提升生活便利性与工作效率。

智能硬件场景也是当下非常火热的AI场景,通过嵌入对话式AI引擎,可实现语音控制、智能看护、智能陪伴和个性化服务,将智能设备升级为智能硬件体。适用于 AI 玩具、AI 教育硬件、AI 陪伴设备、家居语音助手、穿戴设备个人助手等多种应用场景。

来源:北京日报客户端

记者:孙奇茹