讯飞X1的“快慢”之间

AI划重点 · 全文约1286字,阅读需4分钟

1.讯飞发布首个基于全国产算力的深度推理大模型X1,其解题过程更接近人类“慢思考”的方式。

2.与通用大模型相比,讯飞星火X1在解答难题时,能够更清晰地判断事物本质,展现出深度推理模型的特点。

3.除此之外,讯飞星火在“快思考”方面的能力也不断提升,如扫描文档解析速度提升10倍以上,语音同传时延最快实现5秒以内。

4.讯飞星火X1在多项“考试”中表现出色,如小初高、大学、AIME、MATH 500等,多项指标居国内第一。

5.讯飞星火X1通过不断挑战自我,提升自身综合能力,为各行业带来更高效、智能的解决方案。

以上内容由腾讯混元大模型生成,仅供参考

心理学家丹尼尔·卡内曼在其著作《思考,快与慢》中提出“快思考”与“慢思考”。“快思考”,顾名思义,指的是自动的、快速的 、直觉式的思考方式。而“慢思考”,则是深思熟虑的、逻辑的、分析式的思考方式,两种思考模式都各有价值。

如今,AI大模型在生产和生活中正以“狂飙猛进”的速度落地。当大模型厂商们都在比拼谁更“快”时,却有人主动“慢”了下来。最近,科大讯飞发布了首个基于全国产算力的深度推理大模型X1,总体的感觉就是讯飞星火的速度更“快”了,思维方式却变“慢”了,而“慢”,也就是它有了自己“深度思考”的能力。

比如一道难题如何解得漂亮?发布会现场,讯飞星火X1在解答高考题、AIME竞赛题以及高中奥赛题过程中的表现给了大家“惊喜”——它不仅能够准确给出这些题目的答案,还对解题思路和步骤进行了详细拆解,整个解题流程和节奏更像人,而不是像机器。与通用大模型相比,其解题过程近乎人类“慢思考”的方式。

图片

人类通过“慢思考”,能够更为沉淀,更为清晰判断事物的本质,而大模型有了“慢思考”,不仅能在当下通用大模型市场中脱颖而出,更是一次对自身综合能力“质”的飞越,讯飞星火X1通过不断地挑战自我,展现出深度推理模型“化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练”的三大典型特征。

“能更加注重事实和证据,能够进行详细的分析和评估。”这是讯飞星火X1在解题过程中带给笔者的感受变化,这样的“慢思考”模式,也的确帮助大模型完成更好的自我监控和决策优化。通过数据和事实证明,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标居国内第一。

图片

大模型“慢思考”发展带来的进步,也在现实世界得到映射——“X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色。”使用X1的体验老师有这样的直观感受;“专科辅助诊断和复杂病历内涵质控的准确率均达90%。”讯飞星火X1的模型策略在医疗领域取得初步验证成效。

而不仅仅是“慢思考”,讯飞星火在“快思考”方面的“造诣”和不断突破,也为受众群体带来不一样的体验。

如果说“慢思考”是更为沉淀,更加“深思熟虑”,那么此次基于讯飞星火4.0 Turbo底座能力再次级,不断变“快”,则为受众带来了更高的办事效率和更强的功能体验,成为更懂行业的大模型,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。

图片

为什么说讯飞星火的办事效率更加高效了?

笔者观察发现,科大讯飞此次发布扫描文档解析的极速版本,文档理解速度提升了10倍以上,对于一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。

再比如,科大讯飞发布的国内首个具备端到端语音同传能力的大模型,最快实现5秒以内的同传时延,让游客可以一边看风景,一边听中文介绍。技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅5秒的同传时延,达到人类专家译员的水平。

图片

越来越高效,是科大讯飞在国内外大模型竞争中的底气,也使得讯飞星火在大模型赛道的竞争中“游刃有余”,而讯飞星火也让大模型变得更“深思熟虑”。“快慢之间”,高效与智慧的展现,都是讯飞星火在大模型道路上不断探索的一步步脚印……

上游新闻 马亮