“卷”入AI手机11个月后,vivo又抛出了“王炸”

全文4181字,阅读约需12分钟,帮我划重点

划重点

01vivo在深圳举办2024年度开发者大会,公布全新AI战略蓝心智能,包括全新蓝心大模型矩阵、OriginOS 5等。

02蓝心智能将大模型技术与手机操作系统深度融合,为用户带来更自然、符合直觉的交互体验。

03除此之外,vivo发布全新30亿参数的蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上越级比肩行业7B-9B模型。

04同时,vivo自研蓝心语音大模型、图像大模型以及多模态大模型,提升AI能力。

05未来,vivo将陆续对行业开放全模态大模型端侧化相关能力,助力开发者高效、便捷地实现智能体的开发及流量转化。

以上内容由腾讯混元大模型生成,仅供参考

本文来源:时代周报 作者:唐洛

10月10日,vivo在深圳举办2024年度开发者大会。会上,vivo公布了全新AI战略蓝心智能,全新蓝心大模型矩阵、OriginOS 5,以及自研蓝河内核和蓝河操作系统2。

图片

“过去11个月,vivo在AI领域核心做了三件事。其一,用AI赋能传统的产品功能,使其变得更强大;其二,构建一系列系统的公共能力,不仅是自用,还要开放给行业第三方;其三,打造一些小的具有样板性的智能体,让行业都来用。”vivo副总裁、OS产品副总裁周围表示。

竞速AI手机,vivo的野心不止于单纯在手机设备中集成大模型,而是要做AI系统的构建者。

今年上半年,vivo的市场份额已稳据国内第一名。据Counterpoin数据,2024年上半年,vivo手机销量同比增长5%,高于行业平均水平。在实现销量增长的同时,vivo在高端市场的占比也有了明显提升,vivo X100系列在4000-6000元价格段表现优异。二季度,vivo X Fold3在中国折叠屏市场销量排名第二。

同时,vivo蝉联了今年三季度的销量冠军。这意味着,vivo 已经连续3年登顶国产手机销量第一,向着“四连冠”冲击。

随着全新AI策略的发布,vivo或将再一次站在行业前沿顶峰。

11个月,升维与重构

2023年11月,vivo首次对外公布其自研的蓝心大模型其矩阵,包含十亿、百亿、千亿三个参数量级,共5款大模型。同时,全平台自研蓝河BlueOS、OriginOS 4也正式亮相。

这是vivo首次全面秀出自己的AI硬实力。

之后,vivo并未频繁对外公布在AI上的最新进展。沉默的11个月里面,周围坦言他们“非常忙”。

他提到,大模型从去年火爆之后,中间沉寂了一段时间。“大家对它的预期很高,但它目前只是做一些知识供给,没有很好的逻辑推理,各行各业也没卷进来,导致实际上体验和产品是跟不上的。”

何为AI手机?这个疑问一直萦绕在周围和他的团队心头。

去年AI手机的功能普遍停留在“去路人”、能有一个大模型的助理等方面。而今年的定义则可能是智能体和有一点记忆,每年的内涵都是在变迁的。

在此次大会上,vivo正式发布了全新的AI战略——蓝心智能。

图片

蓝心智能是将大模型技术与手机操作系统深度融合后的个人智能。vivo将大模型技术与手机操作系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验,未来将在3个方向上进行实践:重构人与设备的交互体验、重构人与数字世界的服务体验、重构人与物理世界的沟通体验。

重构人与设备的交互体验是将AI能力与OS交互深入融合,支持以圈选、拖放为代表的自然手势,和支持多种语言互译、更情感化的人机自然对话。

例如,vivo升级了全新的声音大模型,它首先能够听懂口音各异的话语,还能说得出非常真实的带气息的声音,而非原来机械的声音。

又如“小V圈搜”功能,用户可以通过长按导航条将它呼出,也可以直接将图片、文件、文字直接以向下拖拽的方式交给他处理。除了支持已有的语音和文字指令输入之外,用户还可以用最自然的指尖圈选的方式,把想要了解的内容发送给小V。此外,通过小V圈搜还能快速找到用户所需的本地文档或服务,点击预览列表即可打开。

人与设备更自然的交互能够重构人与数字世界的服务体验,让智能更加个人化。

这其中分为三步:首先,vivo依托 AI 技术对手机的基础功能进行全面升级,让输入法、电话、笔记、扫描等15项刚需功能焕然一新,还构建了平台化的AI公共能力;其次,搭建连接服务的框架和平台,包括为开发者搭建的集合开发和分发于一体的智能体平台,以及针对轻量化和原子化的服务构建的完整的意图框架体系,让人找服务的同时,服务也主动匹配人的需求;最后,构建个人智能系统框架,让手机成为专属个人助理。典型应用如vivo推出的“原子实况岛”“小V建议”和“小V记忆”等功能。

最后是让人与物理世界的沟通体验得到重构。vivo希望通过AI 技术跨越沟通的鸿沟,“vivo看见蓝心升级版”利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。

至此,vivo勾勒出了对未来智能手机的全面构想。

打造智能体的“样板”,底层能力全面升级

在全新的AI战略背景下,vivo带来了全新蓝心大模型矩阵,全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。

升级后的语言大模型拥有千亿级蓝心大模型云端能力,重点优化意图理解与分发、任务规划能力。相比去年,整体能力提升30%,并在CMMLU和SuperCLUE的榜单上继续领跑国内第一梯队。

同时,vivo发布全新30亿参数的蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上可以越级比肩行业7B-9B模型。相比蓝心7B性能提升300%,平衡模式下功耗优化46%,出词速度可以达到80字/s,系统功耗仅450mA ,内存仅占用1.4GB,打破了“模型小 能力强 功耗低“的不可能三角定律。

此外,vivo自研蓝心语音大模型可以准确理解自然语义,可以感知情绪,模拟人声,而且支持中英日韩泰同声传译,以及超过15种语言互译。

当前,大模型正从“单模态”向“多模态”演进。vivo此次也发布了蓝心图像大模型,强化中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一。蓝心多模态大模型在今年升级了上下文理解和记忆能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。

大模型的茁壮成长,需要底层的土壤滋养。

vivo自研的蓝河内核提供了底层的技术基础,蓝河操作系统2则在此基础上构建了一个开放的、模块化的操作系统,最终面向消费者推出。

据了解,蓝河操作系统2拥有更智慧的系统架构,分为三层:最底层是由vivo自研的蓝心大模型,和VCAP推理计算加速平台,共同构成的底座。在这个底座之上,带来了全新的服务引擎,它包含数据服务、意图的感知和决策服务等,为意图框架提供了能力支撑。vivo还创新性地把意图框架和应用框架融合,帮助开发者更低成本地接入意图框架。 通过这个系统架构,蓝河操作系统2从底层构建AI能力,天生更智慧。

同时,蓝河操作系统2深度还融合了蓝心智能强大的AI 能力。在生态方面,蓝河兼容了开放原子开源基金会孵化的hapjs快应用标准,随着快应用升级到2.0,也将为用户带来更加智慧的服务生态。

在完成了已有功能的AI化、系统公共能力的打造后,vivo还尝试打造出一些智能样板。

图片

基于OriginOS 5的手机智能体PhoneGPT就是案例之一,这也是vivo对于未来的又一次技术探索,它可以基于用户意图拆解需求,主动规划路径,并实时环境识别和动态反馈决策的多模态助理。无论是对于屏幕界面进行识别和操作,还是通过接管音频进行自主对话,PhoneGPT都能完成用户交代的任务。

如其中的“小V订餐助手”,用户只需要和小V说出想要预订的餐厅类型、时间,以及人数,甚至是需不需要包间,小V都能理解并基于用户需求寻找合适的餐厅,拨打电话,利用语音大模型跟店员预约。

周围表示,之所以做“订餐厅”的功能,是因为它能够把vivo要构建的能力全部包含在里面。“我们故意选了一个很长的链路,包括打电话的应对,包括‘对方说没听清,你再说一下’各种问题。而为了完成最长链路,我们已经做到识别意图、形成记忆,并打造出了PhoneGPT。”

vivo的AI愿景:更智能、更温暖

2024年上半年,手机市场企稳回暖。各大手机厂商正卯足了劲儿在其新型号手机中增加AI新功能,以图进一步刺激用户的换机需求。

据市场分析机构Canalys发布的相关数据,2024年二季度,全球智能手机出货量约为2.889 亿台,其中AI手机销量约为3500万台,占所有手机比例为12%左右。

另外,Canalys预测,2024年全球16%的智能手机出货为AI手机,到2028年,这一比例将激增至54%。受消费者对AI助手和端侧处理等增强功能需求的推动,2023年至2028年间,AI手机市场以63%的年均复合增长率(CAGR)增长。预计这一转变将先出现在高端机型上,然后逐渐为中端智能手机所采用,反映出端侧生成式AI作为更普适性的先进技术渗透整体手机市场的趋势。

可以说,谁真正把住了AI的风口,谁就能握住智能手机市场竞争的一大“制胜法宝”。

vivo在上半年已经坐稳了市场份额第一的位置。vivo副总裁、中国区总裁程刚此前曾谈到vivo在这背后下的功夫:满足并超预期满足用户的需求、让用户Happy是一切结果的因,是vivo工作的原点,也是闭环的终点。

沿着这个思路,vivo做AI ,不是为了炫技,也不是为了打败竞争对手,更多是从用户满意度出发的。

在vivo对于AI手机的定义中,最重要的一点就是,真的能帮助人们在生活工作中提高效率,解决一些痛点问题,去连接社会,管理自我。

这点从vivo新公布的蓝心智能AI战略和配套的一系列AI应用中,便能窥见一二。从让交互更自然更符合直觉,到让智能更加个人化,再到让沟通更顺畅和温暖,vivo致力于建设大模型时代的个人化AI。以用户导向为驱动,vivo深入探索AI在手机、Pad等终端设备上的用户使用场景,与用户数据、用户行为偏好相结合,努力给用户提供更懂你、更智能、更安全的个人化AI体验。

图片

此外,针对用户关切的大模型的隐私和安全问题,vivo制定了一个全面的管控体系和管控的标准,包含10个大类,66个二级维度,195个三级类别。

对于AI用在手机上面的愿景,vivo团队研究过之后给的愿景是两个词,智能、温暖。将“智能”一词做拆解,早期vivo把智能拆成两个字:简单、高效,现在还补了一个词,叫主动。

主动,指AI能想人所想、虑人所虑,先人一步给出预测和建议,但要做到这一点,背后也离不开vivo技术团队的“主动”。

在过去11个月里,vivo花了四五个月进行AI手机的用户调研,这也是vivo过去10年做产品所遵循的方法论。然而,在传统的用户调研无法得到具体的答案后,周围又带领着团队尝试创新方法论,重新思考vivo需要做什么样的AI手机,最后才有了这一次的呈现。

长期主义、本分文化等vivo一直以来坚持的企业文化,贯穿了其发展的思路。例如,更流畅的体验、蓝海续航系统更长的续航和网络上更强的通信,这些一直以来都是vivo重视的板块。而在全面升级AI的同时,vivo并没有忘记这些看似普通实则刚需的功能,并随着OriginOS 5的推出一一升级。

目前,vivo正联合上下游伙伴,致力于构建一个全面、智能、开放的AI生态系统。

vivo将陆续对行业开放全模态大模型端侧化相关能力,包括两大类大模型能力:第一层是vivo成熟的算法能力,第二层是端侧高效部署的加速能力,让行业各类开发者都能在自己的场景中应用大模型。

同时,vivo正在打造一站式智能体开发、分发、运营平台——蓝心智能体开放平台,助力开发者高效、便捷地实现智能体的开发及流量转化。

未来,基于智能体平台开发的智能体应用,经过安全审核后,可以直接上线到蓝心千询APP及PC,同时也支持发布到三方应用,比如微信、飞书、美团等。

对于vivo而言,AI战略不仅仅是技术的革新,更是一场与行业上下游的共鸣协奏。通过开放大模型端侧化能力,vivo正以一种拥抱的姿态,携手合作伙伴,构建一个充满活力的AI生态系统。