再逐硬件梦 字节跳动入局AI耳机

全文3469字,阅读约需10分钟,帮我划重点

划重点

01字节跳动推出首款AI智能体耳机Ola Friend,接入豆包大模型,与豆包App深度结合。

02Ola Friend耳机在旅游、英语学习、聊天等场景中体验不错,具备通用智能功能。

03除此之外,Ola Friend耳机采用Seed-ASR技术模型,可高精度识别中英文、口音等。

04目前,Ola Friend耳机在京东平台销量已有500多,天猫平台销量已有1000多。

05专家表示,大模型和硬件的结合仍面临挑战,需要较高的体积和人体工学设计要求。

以上内容由腾讯混元大模型生成,仅供参考

本报记者 李静 北京报道

字节跳动借力大模型,正式杀入AI智能硬件市场。

近日,字节跳动旗下豆包发布了首款 AI 智能体耳机 Ola Friend。介绍显示,该款耳机接入豆包大模型,并与豆包App深度结合。用户戴上耳机后,无须打开手机,便能通过语音唤起豆包进行对话。

自ChatGPT于2022年11月30日正式发布后,国内大模型市场在近两年也是风起云涌,众多企业纷纷投入研发,力求在这个新兴市场中占据一席之地。目前,国内已经有很多基础大模型、垂类大模型,在B端市场,大模型逐步融入日常业务和工作流程中,加速赋能医疗、金融、制造等各个行业;在C端市场,聊天机器人、搜索、内容生成类应用逐渐普及。

其实,大模型除了在软件应用方面快速发展之外,不少企业也在探索大模型和硬件的结合。

一些PC厂商已经推出了AI PC产品,手机厂商们也在研发AI手机,还有不少企业在探索AI和可穿戴设备的结合。去年年底,Meta发布内置Llama大模型的智能眼镜Ray-Ban Meta。苹果、Midjourney等公司也在探索头显与AI的结合。国内市场,科大讯飞已经发布了几款AI耳机。

对于此次发布的首款AI智能体耳机Ola Friend,豆包相关负责人表示:“这款耳机是豆包在AI场景的一个探索和尝试,希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后续持续迭代,为用户在生活中各个场景提供帮助。”

耳机如何AI?

从启动耳机的AI功能来看,传统的大模型AI对话产品,用户往往需要借助手机或者电脑进行输入。而字节跳动此次发布的AI智能体耳机Ola Friend,用户在佩戴Ola Friend耳机后,只需直接触摸耳机或者说出唤醒词“豆包豆包”,就能够通过语音,调用手机上的豆包App进行交流。

豆包相关负责人介绍,在耳机用户测试中,不少用户反馈,由于Ola Friend非常轻便,佩戴舒适,在接入豆包后又拥有了通用智能,因此在旅游、英语学习、聊天等场景中体验不错。比如游览博物馆、艺术馆时,用户可以向它询问展品、艺术品的由来及背景,它还能延展至朝代变迁、艺术家理念等话题,一定程度上充当了导游角色,非常便捷。此外,针对一些“突发奇想”的闲聊和情绪表达,比如“有个重要的演讲,我有点紧张怎么办?”“刚吃到了八宝饭,好像回到了小时候”,它的回复也非常亲切。

此外,Ola Friend还做了一些优化,让用户能够像和朋友聊天一样与AI交流。耳机里,豆包说话的语气能够表现出高兴、意外等情绪。并且,用户在沟通时可以“边听边说、随时打断”,还能随时切换话题。

据介绍,相比智能音箱等产品,耳机的使用环境更加复杂。为做好语音识别,Ola Friend耳机接入了字节豆包大模型的Seed-ASR(语音识别)技术模型,该模型可以高精度识别中英文、口音,甚至能通过上下文,“聪明”地识别各类信息。

从Ola Friend耳机整体的AI功能来看,更偏向于消费者个人生活场景下进行使用。今年4月,智能声学品牌Cleer也发布了全球首款开放式AI耳机CleerARC3音弧,面向的也是消费者的个人生活场景,耳机中内置了AI运动算法,可帮助用户实时监控运动生理数据;在交互上集成了出门问问的语音控制技术,升级了AI语音控制,无须提示词唤醒语音助手,使用“下一首”“接听电话”等快捷口令即可进行相应操作;另外还实现了AI降噪效果。

科大讯飞近两年推出的AI耳机,则主要面向个人消费者的办公场景。在2023年和2024年,科大讯飞连续推出了具备实时转录、多语言转写、文本处理的数款AI会议耳机。

从价格上来看,无论是字节跳动的Ola Friend耳机,还是Cleer ARC3,以及科大讯飞的AI耳机,定价都在1000元以上,属于中高端产品。

IDC中国研究总监潘雪菲对记者表示:“AI大模型和耳机的结合目前主要带动的是蓝牙耳机的中高端市场发展,如果通过具体场景的有效切入,是能够找到并且触达目标用户人群和解决一定痛点的。”

为什么从耳机入局?

随着AI大模型的发展,加上AMD、英特尔、高通、联发科等陆续发布终端AI芯片,AI的发展转向硬件+软件并行驱动,众多厂商纷纷探索AI与硬件设备的结合。

在PC侧,联想、惠普、戴尔等品牌的AI PC正在陆续出货。在手机侧,三星Galaxy S24系列和小米14等旗舰机型都集成了AI功能,如通话即时翻译、AI拍照等。在可穿戴硬件设备侧,去年年底,Meta发布内置Llama大模型的智能眼镜Ray-Ban Meta,不久前,美国智能眼镜公司Solos称将推出全球首款集成GPT-4o的智能眼镜AirGo Vision,苹果、Midjourney等公司也在探索头显与AI的结合;另外还有前文提到的AI耳机等。

从产品上可以看到,生产AI PC和AI手机的主力军仍然是传统的PC厂商和手机厂商,而像Meta、字节跳动等互联网厂商则更多地集中在AI可穿戴设备领域。

为什么字节跳动豆包大模型会选择以AI耳机作为切入口?

西南证券研究发展中心的报告中指出,相较于PC、手机和VR/AR头显等端侧设备,耳机在边缘侧AI终端中的便携性优势明显。目前耳机主要通过蓝牙连接,需要借助手机或PC连接至云端进行交互。在未来,耳机可能会向Wi-Fi连接发展,将可以随时随地地访问边缘侧AI大模型。

从增量市场的角度来看,蓝牙耳机的增量市场较PC和手机相对也多一些。华鑫证券报告指出,2023年智能手机出货量同比下滑3.3%,分季度来看,全球智能手机出货量在2023年前三季度同降幅逐季收窄,2023年四季度同比变动转正。背后的原因来自两个方面,一方面是手机硬件缺乏创新,发达经济体以及中国5G周期结束后,消费者换机周期拉长;另一方面,2022年之后,消费者需求疲软。

而无线耳机方面,根据海关出口数据显示,2023年以来呈现复苏趋势,全年自2023年2月以来,无线耳机月度出货量同比增幅持续为正,且自2023年9月以来同比增幅持续扩大。

“因为无线耳机技术已经充分成熟,相对于手机消费,无线耳机普及还有空间,随着无线耳机传感器的增多,产品体验感会更加出色,叠加价值量相对手机较小,换机周期会显著快于手机。”华鑫证券认为,随着国内的开放和经济复苏,继续看好无线耳机类可穿戴设备的成长。

“随着消费者对智能化服务的需求不断增加,AI耳机作为一种新兴的智能硬件产品,市场需求旺盛。国内大模型厂商通过推出AI耳机,可以满足市场需求并拓展新的市场空间。”北京社科院副研究员王鹏还对记者指出,相对于其他可穿戴设备或硬件设备而言,我国在耳机上的技术成熟度较高、产业链完整。国内大模型厂商在AI技术方面积累了丰富的经验,可以将AI技术与耳机硬件相结合,打造出具有竞争力的AI耳机产品。

字节跳动的硬件梦

互联网大厂或多或少都有一些做硬件的梦想,字节跳动也不例外。虽然字节跳动旗下已经有今日头条、抖音、飞书等知名软件产品,但至今还没有比较有市场占有率的硬件产品。

2018年年底,字节跳动以上亿元的价格收购锤子科技手机业务和部分专利使用权,并组建了新石实验室,由锤子科技坚果前手机负责人吴德周担任总裁。收购后,新石实验室发布了两代坚果手机、TNT显示器新品以及音箱等周边产品。

2020年,字节跳动成立“大力教育”品牌,开始布局教育场景下的台灯产品。到了2021年1月,新石实验室被并入教育硬件团队,放弃手机业务,聚集教育硬件。这背后的原因,一方面是当时手机市场的集中度进一步提高,另一方面是受疫情和在线教育爆发影响,教育硬件的市场规模正在扩大。当时据多鲸资本教育研究院预测,到2022年,仅K12智能教育硬件的市场规模就可能达到570亿元。

可惜的是,2022年8月,由于受到国家“双减”政策和“三孩”政策的影响,大力教育开始裁员,部分人员转岗或投入新项目。字节跳动的教育硬件产品也被搁置了下来。

2021 年9月,字节跳动还以90亿元的价格收购头显厂商Pico。尽管字节跳动对Pico寄予厚望,并为其投入了大量资金,但Pico的市场表现并未达到预期。2023年,字节跳动对Pico进行了组织架构调整,大幅裁员,并下调了销售预期。Pico仍在继续推出新产品,例如2024年发布的PICO 4 Ultra MR混合现实一体机。但整体来看,Pico在字节跳动的战略中已经逐渐边缘化。

如今,字节跳动在硬件上的探索,更多地放在了AI领域。据了解,字节跳动AI硬件方向的探索,在内部分为两条产品线:一条产品线代号为“D线”,重点偏向带有AI能力的可穿戴设备;另一条产品线为“O线”,重点是研究手持类AI硬件设备。手持类设备还没有成型的形态出来。

目前,定位于中高端市场的Ola Friend智能体耳机已经上线各大电商平台,从10月17日开始正式发货,售价为1199元。目前,在京东平台,Ola Friend京东自营旗舰店的耳机销量已经有500多;在天猫平台,Ola Friend智能体耳机销量已经有1000多,且位于天猫榜单300元以上骨传导耳机热销榜第2名。未来能否获得更多消费者的喜欢,仍然有待观察。

潘雪菲对记者指出:“目前大模型和硬件的结合,仍然以接入形式为主,如果要做到端侧,一方面在体积和人体工学设计上对芯片体积和空间设计要求较高,另一方面对电池体积和续航能力要求也极高,目前这些方面仍然面临较大的挑战。”

(编辑:张靖超 审核:李正豪 校对:翟军)