昆仑万维方汉:AI 技术进化放缓,产品经理的春天来了!

Scaling Law 正在放缓,AI 技术红利的维持越来越短,产品经理的春天要来了!

图片

其中,昆仑万维董事长兼CEO 方汉围绕 AI 模型、数据、产品创新、商业模式创新,进行了主题为《AI技术驱动多元化应用创新:用户体验的全新变革》的分享。
李榜主曾在今年 5 月 19 日采访了方汉,当时方汉做出的 6 个判断,半年过去了,即使经过号称 AI 一天人间一年的高速发展,这些判断被逐一验证,都是正确的。我们来看看这次方汉在 AI产品榜·年度大会上,发表了哪些洞见。
方汉指出,虽然所有的大厂都说 Scaling Law 没有放缓,但是从实际结果上来看 Scaling Law 肯定是放缓的,主要原因是数据量不足。随着 OpenAI o1 的推出,基于慢思考的推理 Scaling Law 展现出潜力,但预计也将很快到顶。至于是否会存在一种永恒的 Scaling Law,他持观望态度。
方汉进一步谈到 SOTA 红利期变短,发展过程跟互联网的整个发展过程非常相似,产品跟运营将变得越来越重要。
GPT-3.5 维持了至少一年半以上的红利,GPT-4 红利也非常长,但是 Sora 发出来之后(2024 年 2 月 16 日发布 Demo,2024 年 12 月 10 日正式对 C 端用户可用),期间 8 个月,市面上竞品至少有 3 到 4 个,中国有 2 到 3 个跟它的水平相当。也就是说,Sota 红利的维持将越来越短。
到今天你可以看到,所有互联网企业,产品和运营的重要性其实是超过技术的。没有一家互联网企业,靠技术打败别人,但产品跟运营模式可以。方汉说。
言外之意,AI 技术进化放缓了,产品经理的春天要来了
方汉称,由于禁运,中国 AI 企业能够得到的算力还是远远落后于美国同行。同时,中国 AI 企业拿到的投资总规模,可能是美国同行的十分之一。
在算力、资金的双重挑战下,这将使得中国 AI 企业对于利润的渴望远超美国同行。这反过来会促使中国 AI 创业企业,必须在商业模式和产品模式上进行突破性创新,以弥补算力、资金上的巨大差距
谈及出海,中国互联网企业最初出海时,都是以工具产品为主,这些产品甚至引起了谷歌的关注,把中国所有工具产品学习了一遍。
对于 AI 领域,在方汉看来,目前最易于打入全球市场的依然是 AI 工具。现在美国的 AI 同行们也是以做工具为主,像Midjourney、Runway、Suno,都是做 AI 工具。
但是 “工具只是短暂的过程,最终一定是你在产品模式上的创新,用新的产品来吸引 C 端用户,才能成为一个真正的平台型巨头。”方汉说。
昆仑万维就是一个例证,很少单纯做工具,即便是音乐产品,也是面向 B 端创作者的工具。
此外,据方汉观察,对于非英语语种地区而言,文化平权和多语言会带来一个极大的蓝海“他们的数据建设能力是非常落后的,都需要我们中国企业去建,这会带来产品和市场上的一个极大红利。”方汉说。

以下是 昆仑万维董事长兼CEO方汉 演讲全文:
各位尊敬的来宾,非常感谢李榜主这次给我们一个机会,跟大家分享一下我们公司(昆仑万维)在 AI 技术驱动多元化的应用创新,用户体验的全新变革。
其实大家都知道,在 2023 年和今年上半年,大多数的会大家都是在不断的讲技术,讲模型。像今天这个以产品为主题的会,其实还是蛮少见的,但我觉得是星星之火可以燎原。我相信到明年 2025 年、2026 年有更多 AI 主题的会是以讲产品为主。
为什么会这样呢?下面我会以我们公司自己的经验以及我们的思考来跟大家分享一下。
首先,简单给大家介绍一下我们公司。

天工大模型驱动,昆仑万维布局 AI 全产业链

昆仑万维是一家 A 股上市公司,2008 年成立。在上市之前,我们一直做网络游戏的研发。在上市之后,我们转型为出海平台型的互联网企业。
我们在海外主要的商业模式是,通过收购和经营互联网厂牌,然后把它们做大做强。其中包括全世界的第三大浏览器 Opera,也包括现在海外最流行的音乐社交产品 StarMaker,还有原来的交友平台 Grindr 等多种产品。

图片

在 2020 年,我们开始布局 AIGC。当前公司的策略是 All in AIGC,在 AI 搜索、AI 游戏、AI 音乐以及 AI 视频方面我们都有布局,主要的业务是面向海外。
我们现在有三大业务板块
首先是 AGI 与 AIGC 业务,这个是以天工大模型为基础的一系列的产品。
第二个是信息分发与元宇宙业务,发展战略是基于 Opera 的。
最后是投资业务,我们投资业务做的还可以,刚刚我们投资的小马智行在美国纳斯达克刚刚上市。
我们现在在海外大概有 4 亿月活用户,然后近 90% 的收入来自于海外。我们业务覆盖了 100 多个国家和地区,在 20 多个国家有海外的办公室。
昆仑万维在 AI 产业链布局包括:
在硬件和算力层,除了自己采购了大量的计算资源以外,我们也投资了国产芯片。我们完成了算力、算法、AI 应用的一个全产业链布局。
在模型层,我们有自己的语言大模型,有多模态的图文大模型,还有我们的 3D 大模型、视觉大模型和音乐大模型。其中,音乐大模型应该是我们在全球取得 SOTA 的一个大模型,跟 Suno 都是处在同一个水平线上
在应用层,我们在国内发布的 AI 助手,在海外发布了AI 游戏、AI 社交、AI 视频和 AI 音乐。

图片

这是我们天工大模型 1.0 到 4.0 的一个发布过程。大家可以看到 2022 年 12 月我们首次开源了一个大模型,然后在去年我们发布了天工1.0。今年 9 月份,昆仑万维发布并开源了奖励模型,在全球的 RewardBench 排行榜上位列第一名和第三名
在 2024 年的 11 月 20 号和 11 月 27 号,我们发布了端到端的 Skywork 4o实时语音助手 Skyo,在 11 月 27 号我们发布 Skywork o1,是当前最热门的推理大模型。
我们发布的 Skywork 4o 版本,现在已经支持端到端的实时语音对话。这个对于做 AI 产品来说是非常重要的,大家都知道原来的 AI 产品要外挂语音的话,基本上它是采用前端 ASR,然后中间拼一个语言大模型,最后再拼一个 TTS 上去。这样的话它的时延大概在 400 毫秒以上,这个对于用户来说体感上是有延迟的。一旦采用 Skywork 4o 这种端到端的大语言模型,它的时延基本上可以达到 100 毫秒以下,用户基本无感。
目前在全球能够进入商用的这种端到端的语言大模型并不多,这也是为我们公司的全系列产品提供了一个坚实的基础。
我们 11 月也推出了 Skywork o1 版本,这个是具有慢思考推理能力的系列模型,也是国内最早一批开源的慢思考推理能力的大模型

AI 应用业务矩阵:AI 搜索、AI 游戏、AI 音乐、AI 短剧、AI 社交

AI 搜索这是在国内推出的。AI 游戏、AI 音乐、AI 短剧和 AI 社交,这些产品都已经在海外逐步推出。
AI 搜索,我们的天工AI 已经升级了高级搜索功能、彩页和宝典。天工AI 高级搜索功能,专注于做最懂金融投资、科研学术的 AI 搜索。在这两个方向上我们相信在国内能够做到前沿的位置,能够给大家带来实用的搜索结果。

AI 短剧,是我们一个很重头的一个产品,是全球首个集成视频大模型与 3D 大模型的 AI 短剧平台

我们为什么要把 3D 大模型和视频生成大模型结合在一起呢?
非常简单,我们只要解决视频大模型对于实际生产应用中最关键的一个问题,就是可控性。
为什么会有可控性的这个问题呢?可能大家都知道,我们中国到现在为止已经办了几届的 AI 视频生成大赛。我们观察过前两届视频大赛的前十名里面,真正是纯视频生成的、用视频生成模型生成的只有两个,平均只有两个获奖者,另外八九个基本上都是用转绘模式。也就是说先生成一个一段视频,然后用转绘模式生成视频。
为什么这样呢?因为对于所有的视频创作者来说,他们最关注的是可控性。
我们所有的视频生成都是一次成片。也就是说我先用 3D 大模型给你用 3D 引擎生成一个原片,再通过我的视频大模型转换成最终的结果,这样我就不用进行多次抽卡。
这里面包括了很多的一些很细节的技术。比如说我们自研的剧本大模型 SkyScript、自研分镜大模型 StoryboardGen、自研 3D 生成大模型 Sky3DGen,以及业界首个将 AI 3D 引擎与视频大模型深度融合的创新平台 WorldEngine。

图片

AI音乐,我们做了一个 AI 流媒体音乐平台 Melodio,以及 AI 音乐商用创作平台 Mureka。我们的这个音乐大模型也一直在迭代。目前已经可以开始生成六分钟以上的一个非常长的歌曲,而且在多语言上也有一个明显的提升。

AI 社交, Linky日活跃用户已经突破 50 万,展现了极强的用户粘性,我们主要是做欧美地区,目前在欧洲地区成绩也非常好。
下面跟大家分享一下我们公司,在做模型和产品研发上的一些商业思考

训练 Scaling Law 放缓,慢思考的推理 Scaling Law 涌现但也很快见顶

图片

模型侧很明显的一点是,训练的 Scaling Law 放缓,虽然所有的大厂都说没有放缓,但是从实际结果上来看 Scaling Law 肯定是放缓的。

为什么 Scaling Law 肯定是放缓的?我觉得还是数据量不够的问题。我曾多次讲过,在数据量不够的领域,训练 Scaling Law 会非常快的放缓。

现在数据量最多的肯定是文本领域,有将近亿亿 Token 这个量级;图片领域大概是万亿量级;视频领域就变成百亿量级了;再到音乐领域是千万量级,然后再到 3D 生成领域是一千万量级。

在数据量不够的领域,除了文本大模型以外,所有其他的视频模型、音乐模型、3D 模型,在我们算力严重不足的中国,都能够推出世界水平的大模型。说明了训练的 Scaling Law 在数据量不够的领域,已经严重放缓
OpenAI o1 出来之后,基于慢思考的推理 Scaling Law 又开始涌现。慢思考的推理 Scaling Law 是说对一个大模型进行反复的推理,通过消耗比原来高几十倍的 Token,仍然能得到一个非常好的结果。譬如所有的数学题现在基本上都可解了,那么说明推理的 Scaling Law 现在开始涌现。
但是,我认为推理的 Scaling Law 在袁老师他们的努力下也会很快到顶。
会不会有一个永远的 Scaling Law 出现,我持观察态度。

SOTA 红利的维持将越来越短,产品经理的春天来了

SOTA 这个词本来是学术界专用的( 注:SOTA 是 “State-of-the-Art” 的缩写,意为 “当前最优”“最先进的”“顶尖的” 等)AI 大模型出之后,所有人都要说自己是 SOTA(最先进的)

图片

SOTA 的红利,原来一直是非常长的。举个例子,GPT-3.5 它维持了至少一年半以上的红利,GPT-4 红利也非常长。

但是 Sora 发布 Demo 之后,现在 Sora 自己本身的产品还没有出来,市面上的竞品至少有 3 到 4 个,中国有 2 到 3 个跟它的水平相当的,也就是说 SOTA 红利的维持,将越来越短(方汉曾在 2024 年 5 月 19 日,就预测国内下半年,出现一大批可以媲美 Sora 级别的视频生成模型)。

注:演讲当天为 2024 年 12 月 4 日,在 12 月 10 日 OpenAI 正式向用户开放 AI 视频生成模型 Sora。

代表技术上的护城河,不再那么高不可攀,接下来大家要拼产品模式了

这一点趋势的变化,对于在座关注产品的 AI 从业人员来说,其实是一个好消息。

AI 技术的演变,跟互联网的整个发展过程是非常相似的。

我从 1995 年开始做互联网,1996 年的时候在北京只要你会写 HTML,那时候给一个企业做一个网站的报价是一辆奥迪,那时候技术肯定是最优先的。

到今天你可以看到,在所有的互联网企业里面,产品和运营的重要性其实是超过技术的。就没有一家公司的技术可以打败别人,但是,你的产品跟运营模式是一定可以打败别人的。

中国 AI 企业要用产品创新、商业模式创新,弥补算力不足

图片

由于禁运,我们中国企业能够得到的算力,其实还远远落后于美国同行。同时由于投资的问题,中国 AI 企业拿到的投资,可能总规模是美国同行的十分之一。

中国 AI 企业拿不到更多的资金的前提下,就会倒逼着中国的 AI 创业企业,对于利润的渴望是远远超过美国同行的。

那利润怎么来呢?就会倒逼我们中国 AI 企业,必须在商业模式上和产品模式上做出极大的创新,才能弥补我们在资金、算力上的巨大差距。

这是:中国 AI 企业的 以软补硬 和 模式倒逼

产品创新、商业模式创新,我觉得中国人在历史上是有优势的。

前面介绍,我们昆仑万维是做游戏行业起家的,游戏行业可以说在黑神话悟空出来之前,中国的游戏产业在 4A,也就是最高品质的游戏的制作上,一直是落后于国外同行的。

但是,中国人发明了 free to play 这种免费氪金模式,并且用这种商业模式,把国外的所有同行打得溃不成军。

举个例子,4A 巨头育碧现在被腾讯投资,而腾讯就是靠这个免费的 free to play 商业模式,在全世界大杀四方,然后再去大量收购。

所以说,中国 AI 企业现在缺钱、缺算力,这个事实使得中国 AI 企业对于产品模式创新、商业模式创新的饥渴程度,也是全世界第一的

出海吧,尤其是非英语国家,那里有一片蓝海

图片

我们在出海的时候,观察到一个现象:文化平权和多语言,会带来一个极大的蓝海

为什么这么说呢?大家都知道,所有训练语料里面英语是最多的,这样导致了英语模型质量现在肯定是最好的。然后是中文,由于中国这么多的 AI 企业去做,这么多的聪明人,这么多的工程师去做,我觉得中文的语料现在质量也非常高。

但是,我们到海外去做业务的时候会发现,像欧洲的一些语言,除了法国有 Mistral 以外,像德语、意大利语、葡萄牙语、西班牙语,东亚地区的韩语、日语,这些都是 GDP 非常高的地区,他们的数据建设能力其实是非常落后的,都需要我们中国的企业帮他们去建数据。

这样会导致一个非常大的一个蓝海空间,结果是,中国人做的 AI 产品可能比日本人还懂日本人。

AIGC 本质上是降低了所有人创作内容和的门槛。

比如说,我从小没有学过音乐,五音不全,但现在照样能够有我们自己的 SkyMusic 这种音乐大模型,天天做歌,在各种微信群里发着玩儿。

这就是降低了门槛,同时还降低了成本。

原来我们做网游的时候,外包一首音乐大概平均是 10 万块钱一首曲子。现在我用我们自己的音乐生成模型,单个模型的生成成本可能是几分钱。

这样巨大的成本差距,会导致全世界创作内容的人群和作品量,会有几百倍以上的增长。

这里面就会带来,所有的小语言都会做自己的作品,而不会用强势语言的作品,来填充自己的这个内容空白。

所以,这是非常大的一个蓝海。

最容易打入全球市场的仍然是 AI 工具

下面再给大家分享一个用户需求:对于最终用户来说,他不关心你的内容是不是 AI 的,这对他来说没有区别,他只关心一点,你,要么新、要么好。
娱乐至死的用户需要的是新和好,而不是 AIGC。
什么叫好?这个比较容易理解,你就把传统的内容做到极致,那么用户就会买单。例如,像黑神话,他就是把游戏的质量做到最好,这样大家就会买单。

图片

但是对于我们初创企业来说,你如果做不到好,因为好是需要大量资金的,那你就必须新,你必须在商业模式上或者产品模式上有极大的创新。
举个例子,重庆有一对夫妇创作了一款游戏,总共这个游戏团队只有五个人,卖了八个亿。就是因为他在新上面做了功夫,这个产品叫戴森球计划。
对于我们 AI 的初创企业也一样,你不要觉得你是个 AI 产品,用户就会用。对于用户来说,他只关心你的内容形式是不是新的,是不是好的,而并不是你是不是 AI 做的。
为什么 AI 聊天现在全世界这么流行?我认为根本原因是,在大模型出现之前,是没有聊天类的这种产品。
AI 聊天出来之后,它是一个新的产品,这样用户才去追捧。其他类型产品,用户为什么会用你,我觉得还是要在模式创新上下功夫。

图片

工具为先,模式为王。

我们中国的互联网企业出海,一开始全是做工具,各种工具产品,甚至谷歌都专门为了这个事情,把中国的所有工具产品给学习了一遍。
我觉得现在对于 AI 也一样,我们现在最容易打入全球市场的仍然是 AI 工具。大家可以看到现在美国的 AI 同行们现在也是以做工具为主,像Midjourney、runway、Suno,都是做AI工具。
但是,我认为工具只是短暂的一个过程,最终一定是你在产品模式上的创新,用新的产品来吸引 C 端用户,才能成为一个真正的平台型巨头。
这也是所有 AI 创业公司的机会,你可以通过做工具先获取早期的用户、早期的 KOL,以及赚取早期的利润。但长期来,你要想长得更大,你只有在产品模式和商业模式上创新,才能让你的企业真正成长起来。
所以,我们昆仑万维基本上做工具做的非常少,包括我们的音乐,其实也只是做了一个面向 B 端创作者的工具
我们更多把注意力还是放在 C 端,我们希望在 C 端能够让更多的用户享受到新的产品模式新的商业模式,这样才有可能变得更大。
谢谢大家!
--- 演讲全文完,编辑略有删减---

2024 中国 AI 年度产品 正式公布

关注AI产品榜,在 AI 时代,不落后,不挨打。

12 月 4 日在北京举办的 2024 AI产品榜·年度大会 上正式公布了 2024 中国 AI 年度产品 ,来看看哪些产品获奖了。

2024 中国 AI 年度产品 增长奖AI助手|通义、海螺AI;AI搜索|夸克;AI效率|WPS AI、美图设计室、Tripo、神采PromeAI;AI Agent|CodeGeeX、联想小天;AI出海|Vizard.ai、Cutout Pro。

图片

图片