带科大讯飞走“弯曲的直线”,刘庆峰不怕“复杂”

图片

文/王慧莹 

编辑/子夜 

2016年10月份的一个晚上,在上海梅赛德斯-奔驰中心,罗永浩正忙着发布锤子手机,没想到这场发布会却让讯飞输入法深入人心。

一夜之间,讯飞输入法迅速蹿升到AppStore工具榜第三位,并成为排名最高的第三方输入法,讯飞输入法背后的科大讯飞也随之受到热捧。

科大讯飞不是一家年轻的创业公司,创始人刘庆峰也不是“无名之辈”。

1990年,刘庆峰放弃清华大学汽车工程系的保送名额,转而以高于清华录取分数线40分的成绩考入中国科技大学的电子工程系;

1999年,26岁的刘庆峰拒绝了万元美金奖学金的海外读博机会,拒绝了微软奖学金,转而创立科大讯飞。

图片

刘庆峰和科大讯飞早期员工,图源科大讯飞微信公众号 

20多年来,从18个人的创业团队到上市公司,科大讯飞是国内最大人工智能技术厂商之一,也是国内科技企业的标杆。

随着AI在行业中角色的不断变化,刘庆峰带着科大讯飞走过了漫长的路。这条路上,有高光和低谷,有对手和战友,也有质疑和审视。

科大讯飞创业第二年,IDG资本合伙人林栋梁曾有意投资科大讯飞,但董事长熊晓鸽留下了一句“看起来很热闹就是不挣钱”的评判,双方合作告吹。

但最终,科大讯飞证明了自己,成为中国人工智能的龙头企业,刘庆峰提到,科大讯飞走出了一条“弯曲的直线”:弯曲,是指具体的路径非常曲折;直线,是指目标和战略明确且清晰。

2022年底,ChatGPT的出现引领生成式人工智能的爆发,刘庆峰也决定大干一场。

过去一年多时间,从讯飞星火1.0版本到讯飞星火4.0 Turbo,从技术到多模态交互再到落地场景,科大讯飞高歌猛进,成为国产“百模大战”的先锋。

尤其是今年,大模型商业化落地迎来加速期,行业进入深水区,淘汰赛加剧的同时,科大讯飞的投入有了效果。今年第三季度,科大讯飞营收同比增长,净利实现转正。

“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。2001年科大讯飞生死攸关的“半汤会议”上,刘庆峰如此说道。

这两年,刘庆峰有了新的思考,“唯有自主可控的生态,才有生生不息的未来。”

对技术坚持多年的原动力,是刘庆峰对AI行业热爱与初心,而对技术坚持多年的结果,是刘庆峰带领科大讯飞迈入复杂深水区的底气。

1、大模型应用落地,刘庆峰要带科大讯飞迈入“深水区”

公司14周年庆典当天,刘庆峰请全体员工看了《中国合伙人》。

他希望这些平均年龄不到30岁,和他当年创业一样的年轻人们,从影片中看到两点:远见和坚持。

就像当年自己坚持做语音一样。

2001年,成立不到两年的科大讯飞举步维艰,而彼时房地产、游戏等行业风生水起,相比之下语音技术门槛高、难挣钱,因此有人建议科大讯飞也去布局相关产业。

在当年的“半汤会议”上,刘庆峰却直言:讯飞应该做讯飞该做的事,“凡不看好语音的,请你离开。”

图片

2001年讯飞年度计划总结会,图源科大讯飞微信公众号

也是这个会议,让科大讯飞确定了战略方向——不仅要做好智能语音、做好人工智能,还要代表中国参与全球竞争。

这条路不好走。科大讯飞的布局之路并不顺利,营收规模也一直在百亿左右。

难得的是,科大讯飞在AI这条路走下去的决心没有变。

2023年ChatGPT掀起的大模型风口,科大讯飞的机会来了。

当时,刘庆峰借了一个账号体验了ChatGPT,立刻决定All in。科大讯飞的研究院抽调了最强大的团队,研究科大讯飞版大模型,同时同步推进应用落地。

自去年5月6日首次发布以来,讯飞星火大模型经历了多次迭代,到今年10月24日科大讯飞全球1024开发者节上,讯飞星火已更新至4.0 Turbo版本。

据科大讯飞方面介绍,根据真实数据背靠背的测试,讯飞星火4.0 Turbo七大能力全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o,国内外中英文14项主流测试集中实现9项第一。

图片

图源科大讯飞微信公众号

从全球的行业发展来看,经历了快两年的“百模大战”,资本进入冷静期,行业迈入深水区,单纯的技术参数和空泛概念都不足以支撑大模型产业进入下一阶段,规模化的应用落地成为玩家们新一轮比拼的关键。

换言之,再高的技术门槛和算力水平,也要以满足大模型规模化落地为基本需求。

“未来AI技术的探索,必须大规模产业化,必须在场景中进入到真正的深水区,所有玩‘概念’的都不会有大未来。”刘庆峰在今年1024科大讯飞全球开发者节的演讲中表示。

今年10月24日,科大讯飞发布了10项基于讯飞星火底座能力的硬核产品与创新应用,又在科博展上集中展示了200多项大模型落地应用产品,涵盖教育、医疗、汽车、金融、工业、企业、个人助手等数百个场景。

比如,在办公领域,继讯飞翻译机后,科大讯飞正式发布多语种AI翻译透明屏;在工业领域,VIAS智能座舱人机交互效果测评机器人可以用AI助力汽车的整车检测;在教育领域,阿尔法蛋围棋机器人可以更灵活应对儿童在围棋教育中的个性化反应……

落地不是一朝一夕的事。作为国产大模型厂商,科大讯飞技术的先发优势毋庸置疑,但伴随行业进入场景化落地的深水区,想要在这场战役之中取得优势,还要回归到商业落地和本身。

2、走到这一步,刘庆峰带科大讯飞跨过多少槛?

一路走来,刘庆峰很清楚自己从事的行业面临的激烈竞争,喜欢并享受竞争的感觉。

20多年前,做语音技术时,他的对手是微软、谷歌等公司,如今昔日的对手成长为巨头,刘庆峰又迎来了新的对手。

2022年底,ChatGPT的出现,让刘庆峰有了更清晰的目标——全面对标ChatGPT,但要带科大讯飞做出自主可控的模型。

这场“百模大战”,国内科技公司都带着自己的产品参赛,模仿ChatGPT已经不是难事,谁能做出更好的“中国大模型”才是这场竞赛的焦点。

图片

刘庆峰的思路很清晰:技术上对标,科大讯飞在第一次大模型发布会时就给出最详细的技术进步时间表,并如期兑现。

去年5月6日,科大讯飞发布了星火大模型的1.0版本,当时刘庆峰放话,星火大模型要在10月份对标ChatGPT(GPT 3.5)。

刘庆峰给出了详细的时间表,预计2023年内会进行三次升级,分批次增强数学能力、补足代码能力,不仅要在中文上超越,还要在英文上达到和ChatGPT一样的水平。

五个月后,科大讯飞发布“讯飞星火”认知大模型V3.0,刘庆峰激动地表示“我们如期兑现了自己给大家的时刻表。”

到了今年上半年,科大讯飞对标GPT-4。“6个月内,我们可以达到现在全世界最好的GPT-4最优的水平”,刘庆峰又给出了新的目标。

6月27日,科大讯飞发布星火大模型V4.0,模型能力有了巨大的提升,其在底座能力上已全面对标GPT-4 Turbo。

前不久的10月24日,刘庆峰再次更新科大讯飞的成绩单。

一次次升级的背后,离不开各种参数的较量,但其他厂商不一样,从一开始刘庆峰就认为大模型的落地化应用比较重要。即便是百模大战初期,科大讯飞除了列举参数外,还将重点放在了大模型在自家产品的应用中。

像学习场景下,讯飞旗下多款AI学习机也搭载了大模型,实景对话、写作高阶批改等能力均有提升;办公场景下,对传统语音转写业务做进一步升级,通过大模型的自然语言处理能力实现自动会议纪要、语篇规整、一键生成文稿等功能。

摆在大模型科技公司面前的问题是,产品从走出实验室到面向市场规模化生产需要时间和成本训练,最终会有多少用户为此买单也是未知数,但真金白银的投入不能停。

图片

这对科大讯飞来说无疑是压力。过去一年,由于不断加大对大模型的投入,科大讯飞仍在亏损。

今年上半年,科大讯飞实现营业收入93.25亿元,同比增长18.91%,归属于上市公司股东的净利润亏损4.01亿元,上年同期净利润为7357.2万元,同比由盈转亏。

科大讯飞在公告中表示,亏损是由于上半年在大模型研发、核心技术自主可控和产业链可控,以及产业落地拓展等方面新增投入超6.5亿元,同时投资收益及公允价值和其他收益同比减少,计提坏账准备同比有所增加。公告显示,科大讯飞上半年研发投入21.9亿元,同比增加32.23%。

在刘庆峰看来,加大研发投入是出于对大模型未来的信心。“如果我们选择保守,把这些投入都省掉,好像利润马上就出来了。我们不是不了解,我们数学都好得很,这么多年创业我们又都是公司股东,凭什么不这么干?为什么我们在很多地方要去探索?就是因为我们不想错失这次重大的革命机遇,跟所有的顶尖玩家站在同一个平台上。”

今年三季度,刘庆峰口中对未来的信心就初现曙光。科大讯飞第三季度财报显示,2024年第三季度实现营业收入55.25亿元,同比增长15.77%;归属于上市公司股东的净利润5696.14万元,同比增长120.87%,单季度净利转正。

科大讯飞走到现在这一步,离不开刘庆峰的思考。面临和对手的差距时,刘庆峰会“迎头赶上,我们知道怎么做”;面临市场对其科技投入的质疑时,刘庆峰说,“过去半年把大模型的脾气摸透以后,是我们今天最有底气的地方。”

自大模型风起,一改往日幕后操盘手的低调,科大讯飞每一次大模型发布会都有刘庆峰的身影。这个AI界的“三好学生”又像年轻时候做语音技术那样,甩开膀子,大干一场。

3、五个关键词,刘庆峰要带科大讯飞走到哪?

如果拆解刘庆峰这类理工学霸们的创业之路,会发现他们是敢想敢干、有远大抱负的人。

尤其是在创业热潮的年代,在学校里做成绩卓越的优等生往往满足不了他们,学霸们心中都住着一个“比尔盖茨”“乔布斯”。

时间追溯到1992年。数理成绩优异的刘庆峰还在读大二,被导师王仁华教授挑选到中国科学技术大学人机语音通信实验室。在这里,机器人可以开口说话,刘庆峰内心也种下了语音产业理想的种子。

时至今日,谈及科大讯飞语音技术能做到全国乃至全球顶尖,刘庆峰仍归功于当年对语音及AI产业的信任。

刘庆峰直言这是企业家精神。“因为相信所以看见”,而不是“因为看见所以相信”,心中有一团火,相信产业的未来,所以看得见路怎么走,看得见未来的希望。

刘庆峰心中的这团火不曾熄灭。科大讯飞全球1024开发者节开幕式上,刘庆峰在演讲结尾强调,未来 AI 产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。

图片

图源科大讯飞微信公众号

细分这五个关键词,更多的是刘庆峰对AI产业落地的思考。

所谓顶天立地,即从源头技术创新,要国际领先对标全球最好的底座模型,对标全球最好的专业模型,做到全球第一;

立地,必须大规模产业化,必须在场景中进入到真正的深水区;

自主可控,所有玩概念的都不会有大未来,只有自主可控才有大未来;

通专结合,通用模型和专用模型的结合,让它效率更高,专业领域效果更好;

端云联动、软硬件一体,真正解放生产力,释放想象力。

五个关键词的背后,是一个务实主义者的坚持。

首先,从技术上看,科大讯飞有自己的坚持。

过去两年,大模型行业有两个重要的时间节点,一个是ChatGPT的出现,另一个是Sora的出现。

前者出现时,科大讯飞立下全面对标的“军令状”,当Sora推出生成视频能力时,刘庆峰并不着急跟进。刘庆峰认为,对于大模型的多模态能力,生成视频只是娱乐,更优先级的是进入工业场景、生活场景、家庭陪伴机器人等具身智能。

接受《中国企业家》采访时,刘庆峰表示,“大模型的多模态理解能力比多模态生成更重要,我们也有推出Sora的类似计划,但这个计划要排在通用大模型后面一点。”

从大模型核心底层技术“预训练模型”来看,进入2024年,多方面因素的限制之下,不少大模型公司传出放弃预训练模型的消息。科大讯飞是少有坚持做预训练模型的厂商。

图片

预训练模型是个技术活,对人才、技术、成本要求都很高。像零一万物CEO李开复提到,预训练模型需要有懂芯片的人、懂推理的人、懂基础架构的人、懂模型的人以及懂算法的人,大家一起做才行。

这也意味着,不是每家公司都有能力做这件事。2019年开始做预训练模型的科大讯飞,至今仍在不断迭代。科大讯飞研究院院长刘聪在接受36氪采访时表示,讯飞的大语言模型会坚持迭代,在类似于o1大模型、多模态交互、语音端到端等方面持续布局。

此前,刘庆峰曾在多个场合强调,在中美科技人工智能博弈的背景下,国产大模型底座的能力和支撑,决定了能否在这一波人工智能浪潮中享受更多红利。

这一思路下,讯飞星火是国内第一个、也是唯一一个基于全国产算力底座训练出的大模型。此次开发者大会上,科大讯飞还推出了与华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”。

科大讯飞表示,去年的“飞星一号”解决了500次以上的基础软硬件问题和模型适配问题,今年的“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁。

其次,从规模化落地来看,和很多大模型厂商一样,科大讯飞也在B端、C端两条腿走路。

B端层面,截至目前,已有41.5万余家企业客户使用科大讯飞星火创新应用。“讯飞星火已成为央国企大模型的第一选择。”刘庆峰表示。

据刘庆峰介绍,科大讯飞有领先的工具链,可大幅提升“理数据、训模型”的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应。”

C端层面,在讯飞星火大模型赋能下,C端硬件销量增长。今年前三季度,科大讯飞学习机销量、消费者与开发平台业务、智能汽车业务分别增长超100%、44%以及49%,较好地抵消了G端业务如智慧城市信息工程收入下降的影响。

在整体生态上,2024年前三季度,讯飞星火大模型新增开发者数量达177.7万。七麦数据显示,讯飞星火App在安卓端的下载量超过1.9亿次。

2019年科大讯飞成立20周年时,刘庆峰在《20周年给全体讯飞人的一封信》中对人工智能未来十年做了展望,指出了三大趋势:语音将成为最重要的人机交互方式、人类语言巴别塔将在十年内最终建成、人工智能将为各行业赋能。

到今天,刘庆峰的想法依旧没变,ChatGPT时刻的出现让他对AI产业的未来更有信心。他想带科大讯飞走过的不仅是技术和场景落地,更是用人工智能技术满足人们对未来的向往。

不过,实现这些的前提需要一个更有战斗力的科大讯飞。距离科大讯飞未来五年要达到“十亿用户、实现千亿收入、带动万亿产业生态”的目标还有两年,走进“深水区”,刘庆峰注定要关关难过、关关过。

(本文头图来源于科大讯飞微信公众号。)