客户端
游戏
无障碍

1

评论

2

2

手机看

微信扫一扫,随时随地看

百度文心4.5与X1登场后,大模型第一梯队的竞争再升级?

AI划重点 · 全文约2316字,阅读需7分钟

1.3月16日,百度发布文心大模型4.5和文心大模型X1,具备原生多模态等能力,性能优于GPT4.5、DeepSeek-V3等。

2.文心4.5支持上传的视频文件大小不超过20M,具备跨模态理解能力,如理解梗图、漫画、歌曲、电影等。

3.除此之外,文心X1具备更强的理解、规划、反思、进化能力,支持多模态,是首个自主运动工具的深度思考模型。

4.百度后续还将推出文心4.5系列模型,以及更先进的下一代模型5.0版本。

以上内容由腾讯混元大模型生成,仅供参考

图片
  Tech星球(微信ID:tech618

 任雪芸

封面来源 | 图虫创意



比预想中更快一步,3月16日,百度正式发布文心大模型4.5(以下简称文心4.5)及文心大模型X1(以下简称文心X1),在文心一言官网即可免费使用。

文心4.5不仅在基础能力上有大幅度提升,且具备原生多模态等能力,其多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并且平均分达到79.6分,高于GPT4.5的79.14。文心X1不仅在性能上对标DeepSeek-R1,且具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运动工具的深度思考模型。

和DeepSeek横空出世一样,文心4.5和文心X1不仅点燃了国内用户的热情,更让外网沸腾。在推特上,不少人纷纷在求百度测试账号,他们为两大模型优异的性能和超低的价格感到不可思议,不少人觉得百度的股价被低估了。甚至有人在百度推特账号下@萨姆·奥尔特曼,他们表示游戏结束了。

图片


在看到文心新模型的表现后,在推特上拥有70万粉丝的美国投资人Bill Gurley感慨道,美国人工智能公司应将100%的时间用于开发和创新,而不是在华盛顿特区游说寻求保护以躲避竞争。这种情况很糟糕,明显暴露出缺乏自信。

图片


两大模型的优异能力,是对过去3月外界对于“百度大模型掉队了”最有效的回应,也再一次证明了百度对AI战略贯彻到底的决心。毕竟,大模型竞技是一场持久战,拼的是耐力、技术、资本。从Transformer到OpenAI-o1和DeepSeek-R1,技术的更新时刻在发生,没有人可以保证永远领先,但关键的是敢拼的勇气。

所有玩家从来没有放弃和停止在大模型领域的努力,百度也是如此。开年以来,百度在大模型领域动作频频——文心一言完全免费、文心4.5将于6月30日正式开源;百度核心业务搜索接入DeepSeek;很快百度还会发布4.5系列模型,以及更前沿的下一代模型5.0版本。

动作频频的背后,透露出百度依然想留在牌桌上的决心,它也确实做到了。但百度并不能掉以轻心。因为,大模型的终局远未到来,包括百度在内,所有的玩家都必须全力以赴。这也是百度坚持不懈的根源。


图片

百度加速变革:一场必要的战略纠偏


半个月之前,OpenAI举办了一场线上发布会,正式发布了其最新一代基础模型GPT-4.5。3月16日,百度并没有任何发布动作,而是直接上线了文心4.5与文心X1。


这场上线发生得悄无声息。有百度内部人士称,无论是文心4.5全面免费,还是PC和移动两端直接上线,百度管理层都是在半天之内做出的决策。


这似乎是现在的百度与过去的百度,以及行业的一场赛跑。


这一次的百度越来越快了。据百度方面透露,此次文心4.5和X1大模型发布之后,百度后续还会推出文心4.5系列模型,以及在下半年推出更先进的下一代模型5.0版本。


其实,此次模型迭代进程明显加快,并非偶然。这一现象背后,其实是百度对过往策略选择的反思与积极纠偏。


过去半年间,DeepSeek等新兴公司凭借开源、低成本的模式,给OpenAI、百度这类传统大模型巨头带来了不小的压力。如今,全球AI企业中,无论是OpenAI,还是百度,都逐渐意识到,大模型领域未来走向依旧充满变数,尚无定论。


激烈竞争的大模型领域,保持竞争力的关键在于果敢地 “求变”。于是,就在今年2月,比OpenAI更快一步,百度决定及时转变策略。


随后,百度创始人李彦宏就快速且坚决地推动了一系列动作:文心一言免费、核心业务搜索接入DeepSeek、文心大模型4.5系列将在6月30日正式开源等。


这次纠偏是文心一言对当下市场竞争的直接回应。从悄然上线文心4.5与X1,以及后续透露的一系列迭代计划,无一不彰显出百度谋求变革的坚定决心。


不过,百度突然加快脚步,让外界有人质疑它可能会迷失方向。但目前来看,百度的“变快”建立在对自身技术实力与市场趋势的研判上,每一次模型的迭代都伴随着技术架构的深度优化,以及性能的飞跃提升。


从百度自有业务来看,百度旗下多款用大模型重构后的AI应用,包括百度App、百度地图、百度网盘、百度文库等体验感都在持续提升。在此次文心4.5与文心X1上线后,这些应用也在迎来全方位升级。



图片

让大模型产品,植入“原生技术内核”


作为百度重回牌桌的阶段性产品,原生多模态大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面实现了蜕变与升级?

据了解,文心4.5是百度自主研发的新一代原生多模态大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。

而文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型,兼备准确、创意和文采。

基于文心大模型4.5和文心大模型X1,Tech星球分别实测了一些应用场景。

我们上传了一段“体重管理年”的新闻视频,要求文心4.5概括新闻内容,可以看到其给出了准确的回答,证明了其跨模态的能力。目前,文心4.5支持上传的视频文件,兼容常见的格式,单个视频文件大小不超过20M。

图片


在图片理解上,通过这个问题也能够看出在图形推理、图表分析的“高智商”以外,文心4.5还具备了理解梗图、漫画、歌曲、电影等多模态内容的“高情商”。

图片


此外,文心4.5的能力也在图片生成、RAG(Retrieval Augmented Generation检索生成增强)测试、逻辑测试、文本创作等方面得到了很好地体现。

在文心X1的测试中能够看到,作为一个能力更全面的深度思考模型,其在逻辑问题中展现了周密的思考过程,且在答案的输出上更为明确、直接。

图片


图片


在文本创作类的问题中,也能够看出文心X1擅长写“锐评”,避免“端水”,回答尖锐有态度。

图片


图片


Tech星球获悉,文心X1在技术层面颇具创新,主要运用递进式强化学习训练方法,以思维链和行动链为依托开展端到端训练,还构建起统一的奖励系统,融入多元奖励机制。

凭借这些技术,文心X1能够在诸多场景中大显身手,包括中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算等。

此外,多工具调用是文心X1的特色之一。目前,X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询、词云生成等多款工具。


图片

技术+场景,大模型的生态战

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部