Scaling Law 正在放缓,AI 技术红利的维持越来越短,产品经理的春天要来了!其中,昆仑万维董事长兼CEO 方汉围绕 AI 模型、数据、产品创新、商业模式创新,进行了主题为《AI技术驱动多元化应用创新:用户体验的全新变革》的分享。李榜主曾在今年 5 月 19 日采访了方汉,当时方汉做出的 6 个判断,半年过去了,即使经过号称 AI 一天人间一年的高速发展,这些判断被逐一验证,都是正确的。我们来看看这次方汉在 AI产品榜·年度大会上,发表了哪些洞见。方汉指出,虽然所有的大厂都说 Scaling Law 没有放缓,但是从实际结果上来看 Scaling Law 肯定是放缓的,主要原因是数据量不足。随着 OpenAI o1 的推出,基于慢思考的推理 Scaling Law 展现出潜力,但预计也将很快到顶。至于是否会存在一种永恒的 Scaling Law,他持观望态度。方汉进一步谈到 SOTA 红利期变短,发展过程跟互联网的整个发展过程非常相似,产品跟运营将变得越来越重要。GPT-3.5 维持了至少一年半以上的红利,GPT-4 红利也非常长,但是 Sora 发出来之后(2024 年 2 月 16 日发布 Demo,2024 年 12 月 10 日正式对 C 端用户可用),期间 8 个月,市面上竞品至少有 3 到 4 个,中国有 2 到 3 个跟它的水平相当。也就是说,Sota 红利的维持将越来越短。“到今天你可以看到,所有互联网企业,产品和运营的重要性其实是超过技术的。没有一家互联网企业,靠技术打败别人,但产品跟运营模式可以。”方汉说。言外之意,AI 技术进化放缓了,产品经理的春天要来了。方汉称,由于禁运,中国 AI 企业能够得到的算力还是远远落后于美国同行。同时,中国 AI 企业拿到的投资总规模,可能是美国同行的十分之一。在算力、资金的双重挑战下,这将使得中国 AI 企业对于利润的渴望远超美国同行。这反过来会促使中国 AI 创业企业,必须在商业模式和产品模式上进行突破性创新,以弥补算力、资金上的巨大差距。谈及出海,中国互联网企业最初出海时,都是以工具产品为主,这些产品甚至引起了谷歌的关注,把中国所有工具产品学习了一遍。对于 AI 领域,在方汉看来,目前最易于打入全球市场的依然是 AI 工具。现在美国的 AI 同行们也是以做工具为主,像Midjourney、Runway、Suno,都是做 AI 工具。但是 “工具只是短暂的过程,最终一定是你在产品模式上的创新,用新的产品来吸引 C 端用户,才能成为一个真正的平台型巨头。”方汉说。昆仑万维就是一个例证,很少单纯做工具,即便是音乐产品,也是面向 B 端创作者的工具。此外,据方汉观察,对于非英语语种地区而言,文化平权和多语言会带来一个极大的蓝海。“他们的数据建设能力是非常落后的,都需要我们中国企业去建,这会带来产品和市场上的一个极大红利。”方汉说。各位尊敬的来宾,非常感谢李榜主这次给我们一个机会,跟大家分享一下我们公司(昆仑万维)在 AI 技术驱动多元化的应用创新,用户体验的全新变革。其实大家都知道,在 2023 年和今年上半年,大多数的会大家都是在不断的讲技术,讲模型。像今天这个以产品为主题的会,其实还是蛮少见的,但我觉得是星星之火可以燎原。我相信到明年 2025 年、2026 年有更多 AI 主题的会是以讲产品为主。为什么会这样呢?下面我会以我们公司自己的经验以及我们的思考来跟大家分享一下。昆仑万维是一家 A 股上市公司,2008 年成立。在上市之前,我们一直做网络游戏的研发。在上市之后,我们转型为出海平台型的互联网企业。我们在海外主要的商业模式是,通过收购和经营互联网厂牌,然后把它们做大做强。其中包括全世界的第三大浏览器 Opera,也包括现在海外最流行的音乐社交产品 StarMaker,还有原来的交友平台 Grindr 等多种产品。在 2020 年,我们开始布局 AIGC。当前公司的策略是 All in AIGC,在 AI 搜索、AI 游戏、AI 音乐以及 AI 视频方面我们都有布局,主要的业务是面向海外。首先是 AGI 与 AIGC 业务,这个是以天工大模型为基础的一系列的产品。第二个是信息分发与元宇宙业务,发展战略是基于 Opera 的。最后是投资业务,我们投资业务做的还可以,刚刚我们投资的小马智行在美国纳斯达克刚刚上市。我们现在在海外大概有 4 亿月活用户,然后近 90% 的收入来自于海外。我们业务覆盖了 100 多个国家和地区,在 20 多个国家有海外的办公室。在硬件和算力层,除了自己采购了大量的计算资源以外,我们也投资了国产芯片。我们完成了算力、算法、AI 应用的一个全产业链布局。在模型层,我们有自己的语言大模型,有多模态的图文大模型,还有我们的 3D 大模型、视觉大模型和音乐大模型。其中,音乐大模型应该是我们在全球取得 SOTA 的一个大模型,跟 Suno 都是处在同一个水平线上。在应用层,我们在国内发布的 AI 助手,在海外发布了AI 游戏、AI 社交、AI 视频和 AI 音乐。这是我们天工大模型 1.0 到 4.0 的一个发布过程。大家可以看到 2022 年 12 月我们首次开源了一个大模型,然后在去年我们发布了天工1.0。今年 9 月份,昆仑万维发布并开源了奖励模型,在全球的 RewardBench 排行榜上位列第一名和第三名。在 2024 年的 11 月 20 号和 11 月 27 号,我们发布了端到端的 Skywork 4o、实时语音助手 Skyo,在 11 月 27 号我们发布 Skywork o1,是当前最热门的推理大模型。我们发布的 Skywork 4o 版本,现在已经支持端到端的实时语音对话。这个对于做 AI 产品来说是非常重要的,大家都知道原来的 AI 产品要外挂语音的话,基本上它是采用前端 ASR,然后中间拼一个语言大模型,最后再拼一个 TTS 上去。这样的话它的时延大概在 400 毫秒以上,这个对于用户来说体感上是有延迟的。一旦采用 Skywork 4o 这种端到端的大语言模型,它的时延基本上可以达到 100 毫秒以下,用户基本无感。目前在全球能够进入商用的这种端到端的语言大模型并不多,这也是为我们公司的全系列产品提供了一个坚实的基础。我们 11 月也推出了 Skywork o1 版本,这个是具有慢思考推理能力的系列模型,也是国内最早一批开源的慢思考推理能力的大模型。AI 应用业务矩阵:AI 搜索、AI 游戏、AI 音乐、AI 短剧、AI 社交
AI 搜索这是在国内推出的。AI 游戏、AI 音乐、AI 短剧和 AI 社交,这些产品都已经在海外逐步推出。AI 搜索,我们的天工AI 已经升级了高级搜索功能、彩页和宝典。天工AI 高级搜索功能,专注于做最懂金融投资、科研学术的 AI 搜索。在这两个方向上我们相信在国内能够做到前沿的位置,能够给大家带来实用的搜索结果。AI 短剧,是我们一个很重头的一个产品,是全球首个集成视频大模型与 3D 大模型的 AI 短剧平台。
我们为什么要把 3D 大模型和视频生成大模型结合在一起呢?非常简单,我们只要解决视频大模型对于实际生产应用中最关键的一个问题,就是可控性。为什么会有可控性的这个问题呢?可能大家都知道,我们中国到现在为止已经办了几届的 AI 视频生成大赛。我们观察过前两届视频大赛的前十名里面,真正是纯视频生成的、用视频生成模型生成的只有两个,平均只有两个获奖者,另外八九个基本上都是用转绘模式。也就是说先生成一个一段视频,然后用转绘模式生成视频。为什么这样呢?因为对于所有的视频创作者来说,他们最关注的是可控性。我们所有的视频生成都是一次成片。也就是说我先用 3D 大模型给你用 3D 引擎生成一个原片,再通过我的视频大模型转换成最终的结果,这样我就不用进行多次抽卡。这里面包括了很多的一些很细节的技术。比如说我们自研的剧本大模型 SkyScript、自研分镜大模型 StoryboardGen、自研 3D 生成大模型 Sky3DGen,以及业界首个将 AI 3D 引擎与视频大模型深度融合的创新平台 WorldEngine。AI音乐,我们做了一个 AI 流媒体音乐平台 Melodio,以及 AI 音乐商用创作平台 Mureka。我们的这个音乐大模型也一直在迭代。目前已经可以开始生成六分钟以上的一个非常长的歌曲,而且在多语言上也有一个明显的提升。
AI 社交, Linky日活跃用户已经突破 50 万,展现了极强的用户粘性,我们主要是做欧美地区,目前在欧洲地区成绩也非常好。下面跟大家分享一下我们公司,在做模型和产品研发上的一些商业思考。训练 Scaling Law 放缓,慢思考的推理 Scaling Law 涌现但也很快见顶
模型侧很明显的一点是,训练的 Scaling Law 放缓,虽然所有的大厂都说没有放缓,但是从实际结果上来看 Scaling Law 肯定是放缓的。
为什么 Scaling Law 肯定是放缓的?我觉得还是数据量不够的问题。我曾多次讲过,在数据量不够的领域,训练 Scaling Law 会非常快的放缓。
现在数据量最多的肯定是文本领域,有将近亿亿 Token 这个量级;图片领域大概是万亿量级;视频领域就变成百亿量级了;再到音乐领域是千万量级,然后再到 3D 生成领域是一千万量级。
在数据量不够的领域,除了文本大模型以外,所有其他的视频模型、音乐模型、3D 模型,在我们算力严重不足的中国,都能够推出世界水平的大模型。说明了训练的 Scaling Law 在数据量不够的领域,已经严重放缓。在 OpenAI o1 出来之后,基于慢思考的推理 Scaling Law 又开始涌现。慢思考的推理 Scaling Law 是说对一个大模型进行反复的推理,通过消耗比原来高几十倍的 Token,仍然能得到一个非常好的结果。譬如所有的数学题现在基本上都可解了,那么说明推理的 Scaling Law 现在开始涌现。但是,我认为推理的 Scaling Law 在袁老师他们的努力下也会很快到顶。会不会有一个永远的 Scaling Law 出现,我持观察态度。SOTA 红利的维持将越来越短,产品经理的春天来了
SOTA 这个词本来是学术界专用的( 注:SOTA 是 “State-of-the-Art” 的缩写,意为 “当前最优”“最先进的”“顶尖的” 等)AI 大模型出之后,所有人都要说自己是 SOTA(最先进的)。
SOTA 的红利,原来一直是非常长的。举个例子,GPT-3.5 它维持了至少一年半以上的红利,GPT-4 红利也非常长。
但是 Sora 发布 Demo 之后,现在 Sora 自己本身的产品还没有出来,市面上的竞品至少有 3 到 4 个,中国有 2 到 3 个跟它的水平相当的,也就是说 SOTA 红利的维持,将越来越短(方汉曾在 2024 年 5 月 19 日,就预测国内下半年,出现一大批可以媲美 Sora 级别的视频生成模型)。
注:演讲当天为 2024 年 12 月 4 日,在 12 月 10 日 OpenAI 正式向用户开放 AI 视频生成模型 Sora。
这代表技术上的护城河,不再那么高不可攀,接下来大家要拼产品模式了。
这一点趋势的变化,对于在座关注产品的 AI 从业人员来说,其实是一个好消息。
AI 技术的演变,跟互联网的整个发展过程是非常相似的。
我从 1995 年开始做互联网,1996 年的时候在北京只要你会写 HTML,那时候给一个企业做一个网站的报价是一辆奥迪,那时候技术肯定是最优先的。
到今天你可以看到,在所有的互联网企业里面,产品和运营的重要性其实是超过技术的。就没有一家公司的技术可以打败别人,但是,你的产品跟运营模式是一定可以打败别人的。
中国 AI 企业要用产品创新、商业模式创新,弥补算力不足
由于禁运,我们中国企业能够得到的算力,其实还远远落后于美国同行。同时由于投资的问题,中国 AI 企业拿到的投资,可能总规模是美国同行的十分之一。
中国 AI 企业拿不到更多的资金的前提下,就会倒逼着中国的 AI 创业企业,对于利润的渴望是远远超过美国同行的。
那利润怎么来呢?就会倒逼我们中国 AI 企业,必须在商业模式上和产品模式上做出极大的创新,才能弥补我们在资金、算力上的巨大差距。
这是:中国 AI 企业的 以软补硬 和 模式倒逼。
产品创新、商业模式创新,我觉得中国人在历史上是有优势的。
前面介绍,我们昆仑万维是做游戏行业起家的,游戏行业可以说在黑神话悟空出来之前,中国的游戏产业在 4A,也就是最高品质的游戏的制作上,一直是落后于国外同行的。
但是,中国人发明了 free to play 这种免费氪金模式,并且用这种商业模式,把国外的所有同行打得溃不成军。
举个例子,4A 巨头育碧现在被腾讯投资,而腾讯就是靠这个免费的 free to play 商业模式,在全世界大杀四方,然后再去大量收购。
所以说,中国 AI 企业现在缺钱、缺算力,这个事实使得中国 AI 企业对于产品模式创新、商业模式创新的饥渴程度,也是全世界第一的。
我们在出海的时候,观察到一个现象:文化平权和多语言,会带来一个极大的蓝海。
为什么这么说呢?大家都知道,所有训练语料里面英语是最多的,这样导致了英语模型质量现在肯定是最好的。然后是中文,由于中国这么多的 AI 企业去做,这么多的聪明人,这么多的工程师去做,我觉得中文的语料现在质量也非常高。
但是,我们到海外去做业务的时候会发现,像欧洲的一些语言,除了法国有 Mistral 以外,像德语、意大利语、葡萄牙语、西班牙语,东亚地区的韩语、日语,这些都是 GDP 非常高的地区,他们的数据建设能力其实是非常落后的,都需要我们中国的企业帮他们去建数据。
这样会导致一个非常大的一个蓝海空间,结果是,中国人做的 AI 产品可能比日本人还懂日本人。
AIGC 本质上是降低了所有人创作内容和的门槛。
比如说,我从小没有学过音乐,五音不全,但现在照样能够有我们自己的 SkyMusic 这种音乐大模型,天天做歌,在各种微信群里发着玩儿。
这就是降低了门槛,同时还降低了成本。
原来我们做网游的时候,外包一首音乐大概平均是 10 万块钱一首曲子。现在我用我们自己的音乐生成模型,单个模型的生成成本可能是几分钱。
这样巨大的成本差距,会导致全世界创作内容的人群和作品量,会有几百倍以上的增长。
这里面就会带来,所有的小语言都会做自己的作品,而不会用强势语言的作品,来填充自己的这个内容空白。
所以,这是非常大的一个蓝海。
下面再给大家分享一个用户需求:对于最终用户来说,他不关心你的内容是不是 AI 的,这对他来说没有区别,他只关心一点,你,要么新、要么好。什么叫好?这个比较容易理解,你就把传统的内容做到极致,那么用户就会买单。例如,像黑神话,他就是把游戏的质量做到最好,这样大家就会买单。但是对于我们初创企业来说,你如果做不到好,因为好是需要大量资金的,那你就必须新,你必须在商业模式上或者产品模式上有极大的创新。举个例子,重庆有一对夫妇创作了一款游戏,总共这个游戏团队只有五个人,卖了八个亿。就是因为他在新上面做了功夫,这个产品叫戴森球计划。对于我们 AI 的初创企业也一样,你不要觉得你是个 AI 产品,用户就会用。对于用户来说,他只关心你的内容形式是不是新的,是不是好的,而并不是你是不是 AI 做的。
为什么 AI 聊天现在全世界这么流行?我认为根本原因是,在大模型出现之前,是没有聊天类的这种产品。AI 聊天出来之后,它是一个新的产品,这样用户才去追捧。其他类型产品,用户为什么会用你,我觉得还是要在模式创新上下功夫。
工具为先,模式为王。
我们中国的互联网企业出海,一开始全是做工具,各种工具产品,甚至谷歌都专门为了这个事情,把中国的所有工具产品给学习了一遍。我觉得现在对于 AI 也一样,我们现在最容易打入全球市场的仍然是 AI 工具。大家可以看到现在美国的 AI 同行们现在也是以做工具为主,像Midjourney、runway、Suno,都是做AI工具。
但是,我认为工具只是短暂的一个过程,最终一定是你在产品模式上的创新,用新的产品来吸引 C 端用户,才能成为一个真正的平台型巨头。
这也是所有 AI 创业公司的机会,你可以通过做工具先获取早期的用户、早期的 KOL,以及赚取早期的利润。但长期来,你要想长得更大,你只有在产品模式和商业模式上创新,才能让你的企业真正成长起来。
所以,我们昆仑万维基本上做工具做的非常少,包括我们的音乐,其实也只是做了一个面向 B 端创作者的工具。我们更多把注意力还是放在 C 端,我们希望在 C 端能够让更多的用户享受到新的产品模式,新的商业模式,这样才有可能变得更大。
关注AI产品榜,在 AI 时代,不落后,不挨打。
12 月 4 日在北京举办的 2024 AI产品榜·年度大会 上正式公布了 2024 中国 AI 年度产品 ,来看看哪些产品获奖了。
2024 中国 AI 年度产品 增长奖:AI助手|通义、海螺AI;AI搜索|夸克;AI效率|WPS AI、美图设计室、Tripo、神采PromeAI;AI Agent|CodeGeeX、联想小天;AI出海|Vizard.ai、Cutout Pro。