对话金山办公CEO章庆元:AI加持的办公软件将脱胎换骨

风口。赛道。周期。

浪潮。革命。战役。

当一件件大事件发生,每个人会给它不同的命名,也会在其中看到不同的景象、感受到迥异的情绪。对金山办公来说,ChatGPT的发布,更像一记枪响:开启了办公软件新一轮的竞争,除非甘愿出局,否则,除了立刻起跑、上场、加入竞赛之外,别无选择。哪怕眼前尚有很多混沌不明。

但是,无论恐惧驱动或者兴奋驱动,仅有上场的激情和勇气显然不够。从听到振聋发聩的枪响、迅速起跑上场、到沉浸式All in AI,金山办公在不到两年多的时间里,似乎已经在这场喧闹激烈的新竞技场上,日渐找到了自己的位置、策略和为之努力的方向。

图片

金山办公CEO

章庆元

2024年底,金山办公CEO章庆元先生对《哈佛商业评论》中文版细致讲述了他们从看到ChatGPT发布,到随后推出生成式AI技术加持的WPS AI 1.0、2.0版本的全过程。其中既贯穿他们对基于大语言模型的AI技术的理解,对公司过往经验教训的领悟与借鉴,也包含他们对生成式AI究竟如何落地到产品体验、用户价值的探索和不断迭代的思考,以及,他们对办公软件未来的崭新界面与存在方式的想象。章庆元对金山办公的战略选择的清晰解释,对生成式AI加持下WPS产品逻辑与演进方向的诸多绝妙比喻,足以让所有打工人期待,在不远的未来能真正拥有一个简单、强大又听话的“智能办公助手”。

刚刚获得《时代》杂志2024年度CEO的AMD CEO苏姿丰说,“这一轮AI会是一个5-10年的长周期,现在它还在很早期。”微软CEO萨提亚则在2024年12月的一次最新专访中说:“2025年,将是生成式AI的决胜之年。”

两人的观点其实并不矛盾,他们统一在章庆元的判断中:这一轮AI战事刚刚开启,输赢终局尚且遥远,但如果起步晚、行动慢、策略有误、资源和能力的用力点错配,你很可能在第一轮就被淘汰,从而错失一个时代。就像无数在技术浪潮中消失的公司。

章庆元复盘金山办公过去两年多生成式AI战事初体验,让我们看到,想在这场漫长又激烈的战事中走得足够远,除了激情澎湃地满怀拥抱新技术,企业还需要一颗极度冷静清醒的头脑,谦卑且耐心地沉潜到用户需求与自己产品的功能价值之中。

生成式AI时代的赢家,最终赢得的不是技术皇冠、也不是竞争对手,而是最多的用户/客户。


HBR中文版:ChatGPT发布后,你和团队当时是怎样的感受和判断?

章庆元:当时我们非常非常的震惊。我自己是技术出身,金山办公也一直强调技术立业,我们都没有想到,当参数量扩展到千亿甚至万亿级别的时候,真的量变引起质变,它表现出的智能,第一次让我们觉得AI离我们这么近了。
这一次跟以往两次AI浪潮很不一样。之前无论基于神经网络的算法,还是Alphago带来的人工智能热潮,说实话都没有对整个行业有特别大的影响。而这一次,虽然我们还看不清它未来会发展到什么程度,但是就当时的表现来看,我们很快下了结论,这次极有可能是离真正的人工智能最接近的一次。所以我们当时就决定,我们应该All in AI。那段时间,基本上没有什么事情比思考AI战略更重要了,商业化等等都不重要。我们内部密集地开了很多会,就是想我们怎么抓住这次浪潮,怎么投入生成式AI。我们的结论很简单,金山办公一定要All in AI。

HBR中文版:坚定All in AI的战略之后,下一步做了什么事?

章庆元:All in AI的战略确定之后,第一个决定就是,我们自己不做大模型,而是做AI的应用,跟所有大模型厂家合作。就是说,别人做发动机,我们造车。
我开玩笑说,训练大模型就像养小孩,不是每个人都能培养出一个非常好的小孩,说实话它有点运气在里面,你的基因、你的实力,它甚至不是有钱就能做成的,谷歌和苹果也很有钱,微软也很有钱,都没有自己做成这件事。而金山办公最大的优势是,我们的月活设备数超过6亿,所以,我们聚焦在怎么把AI在办公软件里用好,这是对我们的用户、对社会更有价值的事。当时,我们还做了另外一个决定,跟小米、顺为资本一起成立了一个基金,我们用这个基金投资了国内很多独立的大模型厂家。
从今天来看我们这个决定是很正确的,我们开放地跟行业内最好的大模型厂家合作,然后思考在自己的产品里怎么做AI的应用。





虽然我们还看不清它未来会发展到什么程度,但是就当时的表现来看,我们很快下了结论,这次极有可能是离真正的人工智能最接近的一次。




HBR中文版:之后金山办公连续发布了WPS AI的1.0、2.0版本,其中包含了你们哪些思考和做法?

章庆元:2023年4月WPS AI 1.0上线,我们把AI的能力划分为三个作用。
第一个是AIGC就是大家用得最多的AI生成内容,包括文本、图片,甚至写文章、写书,这是AI最擅长的,超越了绝大部分人类,这是它目前最成熟的一个能力。
第二个是Insight,就是阅读理解,它能够理解非结构化的数据了。以前计算机只能理解结构化数据,它对人类语言这种非结构化数据的理解是很糟糕的。但是大语言模型,它真的能够几乎完全理解人类的表达,它带来的是人机交互方式的颠覆。之前的人机对话,比如智能音箱等等,其实挺傻的,人类稍微说复杂点它就听不懂,今天它完全能听得懂你在说什么。
第三就是Copilot,就是AI写代码的能力,这是最可怕、最让我们震撼的一件事。我们从前认为人类的能力是创造,能够创新写程序,现在发现AI写的代码很不错。
拆分它的这三个具体能力之后,我们就思考怎么用在WPS里面。第一个AIGC的能力,我们在产品里加入了帮你起草提纲、润色和改写文章、生成图片、给文章配图等等的功能。第二个Insight的能力,因为它能理解人类的语言了,我就可以直接问它,比如
《哈佛商业评论》采访我的提纲,主要想了解什么问题,帮我总结出来;甚至它可以帮我判断,你的问题对我是善意的还是恶意的。这种情绪判断的能力,我们也用在自己的客服上,整理客户反馈。以前需要人工去看每一封用户邮件,今天AI都帮我们做了。





乔布斯也说过,用户永远不知道自己想要什么。很多时候需要对用户有引导、提示,他才能把自己的问题和需求精准地表达出来。



第三个Copilot在办公软件里的应用,一个很重要的领域就是数据分析,自动生成很多图表、做出数据透视表、分析数据。比如,一个公司在珠海门店的经营情况,就可以跟它说,你把昨天珠海市门店某个商品的经营数据给我列出来,或者分析过去一个月某个商品的销售趋势等等,它就帮你做出图表。这极大地提升了用户对办公软件的使用和操作。以前办公软件的每个功能都是很抽象的,需要去学习使用这个软件,对用户的要求挺高的。现在,就像我刚才说的,这次的AI带来了人机交互模式的颠覆,未来用户只要表达需求就好了,你就说你想要干嘛,剩下的事情就交给AI加持的办公软件去做了,这会导致整个软件业的交互方式发生颠覆式的变化。

那么1.0版本,我们经过备案、上线,到今天已经有几百万用户在用WPS AI的产品了。经过一年的运营,2024年7月我们推出2.0版本,主要是因为我们发现了几个很重要的问题。

第一个,我们发现用户很多时候很难表达清楚自己的需求是什么。我们之前以为用户上来就直接问问题,但发现很多用户并不会直接问问题,尤其是复杂的事情问不清楚。所以,生成式AI要跟现有的办公软件做非常好的整合。我们这一年的一个思想变化就是,GUI(图形用户界面)还有存在的价值,并不是我们之前以为的,所有软件未来的趋势都是LUI(语言用户界面)。这一年下来,我们认为GUI要跟LUI做一个整合,才能帮助用户更好地表达自己的需求。乔布斯也说过,用户永远不知道自己想要什么。很多时候需要对用户有引导、提示,他才能把自己的问题和需求精准地表达出来。
我们的第二个发现是,AIGC在生成内容的时候,它用的是世界知识,它把整个互联网的文章都看了一遍,然后它写出的文章,可能好一点、差一点,但都是来自通用知识,用户无论是企业还是个人,但凡要求高一点,就发现基于通用知识写出来的文章没啥用,就像我们都痛恨没有内容的PPT,它不是生产力。这个社会需要生产力。而生产力,一定来自私域知识。就像今天的采访,一定是基于你的背景、我的背景、我们企业的情况、我们各自的人生,这样的内容才是有意义的。但是去年我们所有产业做的AIGC都是基于公域知识、通用知识,它产出的东西价值不是特别大。所以,推出2.0版本第二个重要的点,就是我们觉得未来的发展方向,AI应该从通用的世界知识,转向个人的和企业的私域知识去发展和生成内容。我们的产品也进展到面向企业去做AI应用,帮企业做它的企业大脑,帮政务办公去做公文的AI处理等等。
这就是我们从1.0到2.0的进展,可能过一年我们又会有新的想法。整个AI领域会持续发展,我们在应用端也会随着它与时俱进的发展。

HBR中文版:我是做文字工作的,我试用国内大厂和初创大模型公司的新产品后,说实话挺失望,试来试去,结果都很一般,花费好多时间,还不如回到我的老方法去完成工作,比如收集采访对象和公司的背景资料、列提纲等等。所以我的结论是,得让子弹再飞一会儿,AIGC的产品成为趁手工具还很远。我不知道我的状况是不是很多用户的体验?

章庆元:导致这种用户体验,有好几个原因。首先我觉得目前的产品形态有点问题,无论国内大厂的产品还是ChatGPT、Claude也好,它给用户一个完全开放性的产品形态,而且没有管理好用户的预期。就造成你使用前对它的预期特别高,用了之后发现它只是中学生水平,就很失望。
所以我们的做法是,拆分用户行为,每一个环节都有对应的AI能力,比如“AI润色”的功能,你写完一篇文章不满意,其中一段文字你想要更好的风格,更活泼或者更严肃或者党政风等等,就可以提要求,它提供的版本就会给你一些启发,WPS这个功能用户就挺喜欢的。现在的AI就像是孙悟空,它有强大的通用的能力,但是它不可控,那我们就给它戴上几个紧箍咒,每个孙悟空就给我做一件事情,不管润色或者生成图片,做这个任务的时候不许做别的,不要太发散,这样子让用户也有确定的预期。我们会把用户的需求拆解到原子化,把AI的能力在我们的产品里化整为零,然后生成尽可能多的方案,让用户只做选择就好了。可以说,现在所有AI产品产出内容的一次性满意度都是很低的,那么我们就在产品交互上去尽量解决这个问题,就是给用户更多的选择。打个比方,我自己不是厨师,但我是个吃货,我知道哪些餐馆好吃,我就多推荐几个方案给用户做选择。这个图片不满意,就再多生成几张,一直往对的方向走。
另一方面,WPS的用户基数很大,对其中很多用户来说,他的日常工作有大量繁琐的报告和公文处理,AIGC的功能就能帮他完成很多工作,节省很多时间。就是说,AI的很多功能对非专业人士是有极大帮助,满足需求的,但是对于专业内的人,还达不到要求。
所以,解决你说的问题,首先要管理好用户的预期,不要吹牛说自己产品多厉害,结果用户用了一两次之后很失望,就不会再用了。就是我常说的笑话,你吹牛说你的AI有多厉害,用户用了之后发现:“哦,你的AI产品只有两个不会,这也不会,那也不会。”AI应用一定要考虑好用户的需求,回到现阶段AI应用能做的事情。金山内部做产品研发的思路很简单,今天我们只思考一个问题,我们产品的每一个功能都要考虑怎么用AI去重构它。
我觉得未来最好的AI应用,应该让用户感受不到你的产品背后是AI。其实用户根本不关心你的产品是怎么做的,用户只关心一件事,好不好用,能不能帮我更好地完成工作,从前我做一个表格要1小时,现在10分钟就做好了,那就是最牛的产品!用户不在乎你的产品背后在用什么技术。这是我们过去一年多在AI应用的产品探索上,最重要的一个想法。

HBR中文版:所以AI产品未来的形态可能会有很大变化,使用门槛大幅降低?


章庆元:从过去这么多年科技的发展来看,一个新技术出来一开始一定是门槛很高,只有少部分用户在用,慢慢积累、优化,之后用户的成本、技术的成本都会越来越低,使用门槛也会越来越低,从而进入千家万户。现在的AI,就像10年前的移动互联网,当时人们都说移动互联网会替代PC,但那时手机能做的事情非常有限,到今天我们才知道,原来Mobile native(移动原生)的应用应该是这个样子的。今天的AI是一样的,我们所有人都还在摸索,思考一个问题,什么是AI native application(AI原生应用)?我们还没有答案,还在进化中,今天所有的应用都不够好用。
但是我们坚信这条路能走出来。理由很简单,现在全世界最多的钱、最聪明的人都在做这件事,投入在AI应用。WPS AI现在是2.0,可能要到5.0、6.0的版本,我们才能说,差不多了,AI原生的办公软件应该就是这种东西了。技术的变革和发展,它最后的成功会是润物细无声的存在。





现阶段说谁好、谁会胜出,都太早了。对任何企业来说,在今天的AI浪潮中,都是逆水行舟,不进则退。




HBR中文版:ChatGPT出来后,国内迅速跟进了所谓“百模大战”。你们选择接入所有大模型,而不是自研。就你们的使用来看,国内大模型公司目前的竞争力、进化速度,包括未来会如何发展?你们的产品功能是不是也会受制于大模型的能力?


章庆元:国内大模型过去一年进步非常大。今天国内大模型厂商如果说,他们赶上了ChatGPT 3.5或者4.0,很大程度上不是在吹牛了。特别在文科领域,都已经赶上来了。这个行业的发展,很难一家企业获得独家秘笈,人类的知识一定会传播的。但是模型跟模型之间还是会有差距。有的模型可能问答能力更好,尤其在某些细分领域,比如医疗类的问题,有些可能数学能力特别好。就像我前面的比喻,各家训练大模型多多少少有点像厨师炒菜,同样一道菜,这家辣一点、那家咸一点,各有千秋。但是它们的完善程度、智能程度,不会像是博士生和小学生之间的差别那么大。未来大模型的发展,我认为,因为各家的训练数据与训练方法不一样,应用场景不一样,可能大家会在不同领域有各自的优势与弱点。所有的应用肯定会受制于大模型,但是因为我们十分开放,接入所有大模型,我们可以在不同场景下使用不同的模型去解决用户的问题。今天某个模型发布了新版本,我们看它在哪个能力上做得特别好,就可以切换模型。所以自己不做大模型也是我们解决用户需求的一个好方法。我估计大模型的进化周期可能需要3-5年,在这个周期中,我们就专注于利用各种各样的模型帮用户解决问题。

HBR中文版:生成式AI,会改变办公软件的竞争格局吗?


章庆元:我觉得AI已经成为办公软件下一步竞争最大的一个变量。一个行业的竞争格局形成之后,没有特别的事情发生,竞争格局一般是很难打破的。金山办公过去有过成功的经验,也有失败的经验。WPS一开始是国内领先,但是到了Windows时代,GUI的技术革命,我们当时犯了错,没有跟进“所见即所得”,导致有十年时间WPS几乎快没了。然后移动互联网时代,我们抓住了机会,比较早开始做移动互联网的产品。微软则错过了移动互联网的时代,我们才重新回到市场中间。因为在移动互联网时代的成功,今天我们在移动设备办公软件的份额占了90%多。
这些经历让我们对任何一次技术变革或者大的环境变革都特别敏感。我们觉得这一次不管它是对是错,都得先上车,万一它成了,你没跟进,公司就挂了。其实对任何企业、任何行业都是这样,当一个新的技术浪潮到来,或者新的商业革命发生,你不变,企业可能就没了。而且我们认为这一次的AI浪潮,很可能比之前GUI、移动互联网的影响更大、更深远、更颠覆。所以这块一定要去争,AI现在仍然是个变量,才刚刚开始,我认为谁能够把AI用好,谁就可能在未来胜出。

HBR中文版:在这个新的变量之下,你觉得金山办公和同行,包括老对手微软office、以及飞书、钉钉这些国内大厂新秀,会有怎样的未来?

章庆元:微软仍然是一个非常值得尊敬的公司,它在各个方面的科技都非常领先。金山办公做了这么多年办公软件,之前追赶微软,但是从移动互联网开始,我们已经在走自己的路了,我们更多聚焦国内用户,一直在思考怎么用好新技术,挖掘用户新的需求、更好地解决用户的需求。所以这几年下来,我们跟微软已经很不同了。微软还是一个面向全球的办公软件,面对不同市场和文化,它一定是一个高度通用、高度抽象的办公软件,而我们更加聚焦中国用户的习惯。这些年来WPS的很多创新点,比如PDF编辑功能等等,用户都是愿意为此付费的,国内用户特别喜欢这些小功能。所以,可以说从移动互联网开始,我们已经和微软分道扬镳,各自走各自的路,金山办公开始了自己的创新之路。
我觉得AI会强化这种差异。今天我们看到微软把Copilot放在右边一个任务窗格,就是Copilot的原意,它是个副驾的角色,相当于用户请了个教练坐在旁边,指导我踩刹车、转方向盘。但是WPS很不一样,我们的方式是把油门、刹车、发动机都拆掉重新做一个。我们认为有了AI加持以后,办公软件应该越来越简单,而不是叠加那么多复杂的功能。虽然未来会怎样我还不知道,但是今天已经能看到,从移动互联网到AI时代,我们和微软的思路差异蛮大的,AI会成为我们之间更大的一个分水岭。
和飞书和钉钉相比,WPS不输出管理理念,也不是平台,而是一个通用的办公软件,我们尊重每一个客户自己的管理方式,我们给企业提供各种基础组件,组合成它需要的管理平台。这是我们跟他们最大的不同。
我觉得未来的办公软件会发生脱胎换骨的变化,办公软件会成为每一个人的智能办公助手。用户未来面对的不会是一个复杂的办公软件,而是一个非常简单的办公软件,用户最关注的是怎样把自己的问题和需求说清楚,这会是办公软件一个质的变化。AI对办公软件的改变,也让办公软件不仅仅是个工具,它其实是个云服务。所以我们跟亚马逊云科技合作多年了。我认为AI其实是云的延展,因为数据最好跟云在一起,云在哪,AI就在哪。WPS出海很早,我们出海时就选择了亚马逊云科技,这么多年,亚马逊云科技给我们提供了非常稳定可靠的支撑,它有非常成熟的运营体系,包括模型部署等等,极大地减轻了我们的工作量,让我们的进度快很多。

HBR中文版:金山办公在生成式AI的时代,会有更大的优势和胜算吗?

章庆元:竞争才刚刚开始。今天我们还是如履薄冰。就像10多年前,移动互联网早期,手机上有哪些App你还记得吗?比如汤姆猫,还有人记得吗?移动互联网早期的很多公司今天都没了。所以,起个大早也可能赶个晚集。现阶段说谁好、谁会胜出,都太早了。对任何企业来说,在今天的AI浪潮中,都是逆水行舟,不进则退。只有坚持到最后仍然在市场上领先的企业,才是真正的赢。

程明霞|访、撰文  廖琦菁|编辑

程明霞是《哈佛商业评论》中文版执行主编。


《哈佛商业评论》中文版 联系方式