九派新闻记者 李青杨 发自北京
再过几天,我们将迎来新的一年,2025年。
过去一年里,我们持续见证了一系列变革的发生:股市、楼市政策调控发力,人工智能等新质生产力茁壮生长,中国经济回升向好势头持续增强。面对新的时间开启,我们对未来有着更多的憧憬和期待。九派新闻“九派智库”和光谷实验室“稻香湖智库”推出“猜想2025”年终策划,关注它们的发展趋势,希望在新的一年里给公众提供专业意见。
回顾2024,生成式AI产业成为全球创新、投资和应用的热点领域。Sora引领了视频生成的新潮流,多模态世界模型的研究备受关注。更具革命性的推理模型o1横空出世,使得基座大语言模型不再一枝独秀。
2025年,生成式AI究竟会有怎样的发展?
我们邀请到华中科技大学教授、国家实验室首席战略研究科学家房超,硅基智能创始人、CEO司马华鹏,深蓝互联创始人、CEO王得金共同发起“生成式AI将向何处去”的讨论。
以下是本期节目内容摘录,由于篇幅较长,特拆成两篇发布,这是第二篇:
AI能同时做到100万个直播间,AIGC一定会干过UGC
房超(华中科技大学教授、国家实验室首席战略研究科学家):很多大厂都在做人工智能,这个赛道需要巨额投资,资金和资源的不平等,对创业到底影响大不大?靠AI新技术的创业团队到底该怎么超车?有人说,创业公司应该找大厂看不上的方向,做小众产品。
司马华鹏(硅基智能创始人、CEO):开源大模型已经给我们这种体量的创业公司,包括很多更小的公司,提供了充足弹药,现在大家在做基础大模型的建设和应用。
对于中小企业创业者而言,这是个非常好的机会。现在的大模型非常便宜,大家可以做出一些非常酷的产品,这些非常容易产生现金流和盈利,不用在基础上研究很多深度的事。
大模型有点像蒸汽机,蒸汽机本身的价值,不如蒸汽机加纺织机,蒸汽机加轮船,蒸汽机加火车,蒸汽机加印刷机。它的核心,还是加某个产业。所以我们一定要在某个产业上面深耕,再加上大模型助力。而不是围绕着蒸汽机本身的改进来回做一些工作。
大模型技术,今天大部分的创业公司都已经基本掌握了,只是说能不能训练和预训练的问题。所以大家要抓紧找到自己的产业落地,冲上去干这个产业。
房超(华中科技大学教授、国家实验室首席战略研究科学家):媒体也报道了字节阿里实际上在AI赛道上,走了两条不一样的道路,前者是自己做业务,后者靠投资公司。这两种路线会有什么不同?在这种格局下,比如我们熟知的六小龙,是不是最后也会被大厂收购或者挤压?
王得金(深蓝互联创始人、CEO):阿里和字节这两家企业非常具有代表性。
以字节的豆包代表,他们现在内部要求工业大模型所有垂直的各条线,无论是后还是中台运营等,全用大模型重做一遍。这样会对他们年度财务报表,包括各种数据产生一些影响。相对字节来讲,阿里已经到了一个成熟阶段。它从1997年创立就经历了很多次的整改变革,我认为它可能更加追求稳定。
这两类做法没有对错。但如果用商业的眼光去判断价值取向,我觉得是要“菩萨心肠,雷霆手段”。当发现一个重大战略机遇,必须要拿出所有的杠杆跟上,这场仗必是一个遭遇战,需要all in进去,把它打成对自己有利的。
房超(华中科技大学教授、国家实验室首席战略研究科学家):很多人说现在的大模型行业是半熟技术,遇上半新市场。那什么是半熟技术?半新市场到底缺什么?大模型要达到怎么样的成熟度,才能够跟现在的市场完美匹配?
司马华鹏(硅基智能创始人、CEO):我觉得现在的大模型技术已经趋近能大规模做了,现在已经接近于成熟的技术。
不成熟的市场,可能是这些巨头,不管字节还是阿里,他们在守着辫子不舍得剪。我们去年,多的时候,有十万个直播间在抖音上播。如果它要全放开的话,我能干到100万个直播间,AI来干,每天生成一个短视频,非常快。
但是字节也在努力防守,因为原来它是作为UGC打败了PGC,但AIGC一定会干过UGC ,它的生产效率太高了,成本太低了。我觉得接下来最大的受害者就是字节公司,因为像 sora 、还有很多全世界创业者做的工具,会大规模充斥到它的平台上,挡不住的。它all in的那些东西,本质上是一种恐惧。
现在有很多人用AI生成美女在only fans上赚钱,有很多这样的中国企业一个月赚几万到几十万美金不等。它从头到尾造出一个假人,在推特、youtube 上发,跟真人抢市场,这是很可怕的。
所以我说,这个世界AIGC已经打败了以前所有的内容生产。我觉得字节这么激动,因为它是内容生态在这一次冲击里应该是最大的。
房超(华中科技大学教授、国家实验室首席战略研究科学家):硅基智能在2025年有什么布局?有没有跟别的机构比起来不一样的特色布局?
司马华鹏(硅基智能创始人、CEO):我们做了三个产业。2017年做了一个产品,后来变成一个行业,就是AI打电话。我们当时想的是,只要感受不到电话一端是AI,就可以正常去我沟通,这其实是基于电话的漏洞,它是一个非常好的图灵测试环境。
后来我们又做了数字人的克隆,大概克隆了50多万人,现在每天在抖音、视频号发短视频。这也是个系统级漏洞。用摄像头拍出来的内容如果和AI生成的一样,那何必要专门拍出来?
房超(华中科技大学教授、国家实验室首席战略研究科学家):你现在不是数字人吧?(笑)
司马华鹏(硅基智能创始人、CEO):我现在是真人。当然,我也有我的数字人,也可以参会。
我们第三个产业也比较边缘,叫AI无人直播。去年我们爆发了这个产业,现在抖音上还有几万个直播间在播。不管是电话、短视频,还是直播,我们从一个边缘产业做到了舞台中央。我们现在有很多直播间,一天就能赚到100万。现在中国的哪家AI敢说能给客户赚这么多钱?
今年,我们开始又推数字永生。我把自己也克隆了,用大模型给自己做了一个分身,你可以跟他实时聊天沟通,可以视频电话。我给自己写了300多万字的思想内容,把它变成了一个大模型。
11月开始,我们会重点推这样的产品。你只要有自己独到的思想,就可以变成一个产品,大家跟你沟通交流,然后收费。我经常开玩笑说,知识分子的only fans就是可以用思想来赚钱。
房超(华中科技大学教授、国家实验室首席战略研究科学家):进行训练以后,它能不能达到你的水平,说出六大门派和光明顶这类级别的话?
司马华鹏(硅基智能创始人、CEO):它在迭代,我给它足够多的时间让它走到那一步。
这玩意,我倒腾两年多,现在终于做出来了。我接了大概有一两千个订单来克隆,这件事情是非常酷的,我们想在2025年把这个产业继续做大做强。因为我觉得永生这件事情是最大的消费品和奢侈品,而死亡是最大的场景,也是一个永远存在的场景。(笑)
我是82年的,刚好99年上大学,我们那年高考题目就是:假如记忆可以移植。(笑)这个高考题非常有名。那年我的作文接近满分。我说这刚好是历史给我的一个使命。“假如记忆可以移植”,从99年到现在,我用了25年来完成这么一个高考题目。
房超(华中科技大学教授、国家实验室首席战略研究科学家):对于数字人,特别是高质量的数字人,社会上的需求非常多。作为一个老师,我每天上课的工作量非常大,我有时候想,能不能有人完全替我来讲课?专业人士说,技术上攻关一下,没有难度,但你的课时费应该不够他的电费。让你来讲,不是机器人水平比你低,是你比较便宜。
王得金(深蓝互联创始人、CEO):这个成本肯定比电费要贵。(笑)
我觉得数字劳动力已经提了好多年。之前它们都不能帮助你去干一些具体的事,物理空间也暂时不能做,现在它确实替代了“脖子以上的大脑”。
并且,我觉得世界非常需要科技平权。科技每次的发展,不应该让贫富差距更大,而应该让一些财富较少的人通过科技浪潮获得更多的社会财富。数字人当然会有效解决这个问题,比如让很多人接触到以前难以接触的优质知识。
其实,世界上有一批人长期致力于科技知识的分发和平权。但是像之前的慕课,是非常生硬死板、没有交互的,或者说它没有灵魂。但是数字人,它针对你的问题,会有定制化交互,非常有人文关怀,学起来也更加有趣。你给他出一道题,它可能用十几秒钟,就能用博士级别的专业模式给你一个逻辑性回答。想象一下,这样的教学能力给到边远山区,他们就有更多的机会去点亮思想。
我认为它也是一个双刃剑。技术的前进会带来一定的人员失业,但这个失业本质上会带来新业态。这是一个伦理问题,或者是社会问题,难以避免。
机器人与人类手触全球虚拟网络连接未来接口。图源:视觉中国
现在有几千万人在跟 AI 谈恋爱
房超(华中科技大学教授、国家实验室首席战略研究科学家):这也是我最担心的。对于被替代的人,人工智能可能会抢占岗位。现在我们认为数字人或人工智能不是人,认为它做的东西不能满足需求。比如一个机器人给你敬酒,可能没有人给你敬酒的尊重感。如果一个数字人给我授课,讲得跟人一样好,我们会不会依然不适应?
司马华鹏(硅基智能创始人、CEO):什么叫科技?凯文凯利有个很有名的说法,自我出生以来发明的新东西叫科技。
我们父母一代,电饭锅、剃须刀都是高科技;大模型时代,我们认为大模型是高科技。但所谓的Z世代、现在和AI谈恋爱的那批人,根本不是我们这个年龄的人,所以我们会认为它不真实。就像我们当年看武侠小说,上一代说我们要被毁了。
房超(华中科技大学教授、国家实验室首席战略研究科学家):我们理解不了跟 AI 谈恋爱,主要是没谈过,可能谈了就不一样了。
司马华鹏(硅基智能创始人、CEO):现在有几千万人在跟 AI 谈恋爱。在现实中容易获得的东西,你不会觉得它很珍稀。而现实中,很多人根本没有人给他敬酒,我觉得会爱上AI、喜欢上AI的,不是咱们三个。
AI发展其实是一个从边缘向舞台中央不断扩展的过程。每个人对这个事情的感受不一样,是因为我们在不同位置。像地震的时候,震中不在我们。(笑声)但真正在震中的那一批,比如美国人、年轻人,他们对AI的认知和认可程度远远高于我们。他们是直接拥抱这件事情的,而我们是带着批判的。
这次AI革命,是全面的革命,各行各业都会爆发,有非常多的东西还没有形成,没有被大家关注到,这也是很多大厂接下来要焦虑的。我甚至认为,AI不存在平台性的机会,而是全面性的机会。
房超(华中科技大学教授、国家实验室首席战略研究科学家):拼多多也是商学院经常讲的营销案例。发链接砍一刀,当时很多人都觉得,这样的事我们不会做。实际上对于刚开始使用手机、文化程度不高、或者每天事情不多的人,真的会做,只不过这些消费群体不是淘宝的消费群体,可能是我们完全没有考虑到的一类人,而真正攻击光明顶的往往就是这一类人。
王得金(深蓝互联创始人、CEO): 硅基智能的愿景是解决什么样的问题?
司马华鹏(硅基智能创始人、CEO):我2007年就提出来了硅基生命崛起。我上大学的时候,给自己立了20个问题,关于人类的进化,包括我们的记忆存储在哪里。我在大学搞完这20个问题后,就离开学校创业了。
我们很早就认为地球的进化不会止于人类,会继续往下走。在我们之前其实没有人把人类分为碳基和硅基。我们也是带火了这个词。我们一直坚持的理念就是,这是一种文明升级。他们说我是“降临派”,欢迎硅基降临(笑)。
我花了很多时间在思考人类的未来。做数字永生这件事是我在17年就定下的目标,要为人类造一亿个国际劳动力,当时这个目标还是比较震撼的。今天来看的话,一亿个agent其实也不算什么。(笑)接下来人类可能会面临1000亿个agent。
房超(华中科技大学教授、国家实验室首席战略研究科学家):感觉硅基智能特别像终结者。你在2007年就想到这个,像是穿越回来的。因为当时没有硅基、碳基的划分;第二,你怎么精准预测到后来会有大模型?
司马华鹏(硅基智能创始人、CEO):凯文凯利有一本书叫《科技想要什么》,讲的就是科技是世界上第七种生命。这个思想在中国比较少见,但在欧洲、美国的很多大学里有这个流派,甚至有基于赛博空间去理解人类未来发展的很多预判。
我们基于中国的传统文化,把它深度融合,提出来这个理念。有一本书叫《life3.0》,讲人类是2.0版本。在人类之前,硬件、软件都有上限。而硅基生命的软件和硬件都没有上限。它会持续进化、持续迭代,我们的存在目的就是为了造出来它。
王得金(深蓝互联创始人、CEO):深蓝互联也是做了一个开放数据的平台。按照马斯洛的理论,物质极大丰富之后,人类的需求达到了精神层面。传统的知识传播载体是图书、期刊、论文,但现在知识迭代非常快,我们就提出了一个新的词叫“开放数据”。
什么是开放数据?就是一个信息数据非常有价值,但它又没有经历传统意义上的发行流程。举个例子,OpenAI产生的经典论文、期刊、专利等并不会很多。但是全世界几千几万家企业在研究AI大模型技术,中间产生了大量的高价值文档,但他们并不会去出版发行。所以我们基于这个知识消费的需求,做了一个开放的数据平台。
会出现专有算力来训练并达到同等效果,成本会大幅下降
房超(华中科技大学教授、国家实验室首席战略研究科学家):关于2025年,AI 有什么新突破?有没有什么更大的 surprise呢?
司马华鹏(硅基智能创始人、CEO): 我认为AI 可能会和web3结合起来,比特币叫挖矿1.0时代, AI 叫挖矿2.0时代。其他都是用 GPU 来产生有价值的东西,web 3是一种生产关系,AI 属于劳动力,劳动力结合生产关系的变化,很可能是 AI 发展非常重要的一步。如果有两个自动驾驶汽车,它们今天都在外面拉滴滴,想获得一些报酬,报酬有高有低,车能升级自己,同时要求其他人给它提供更好的服务来完善自己,更有助于车的进化,否则这辆车就会选择原地不动。今天看到 AI 的一些瓶颈,背后可能还是因为生产关系没有形成多劳多得的要素聚集。2025年会有非常大的变化。
房超(华中科技大学教授、国家实验室首席战略研究科学家):现在生成式人工智能很多时候我们觉得不好用,核心的问题是,作为新质生产力,我们还用一些旧的生产关系去使用,当然就会觉得不好使,2025年有没有可能产生一些新的业态?
王得金(深蓝互联创始人、CEO):我举个例子,视频短剧就是人工智能算法新质生产力集中体现的产品。拍摄分散,剪辑、传输可以分散,最后做定向推送,就不用像过去一个剧组工作很长时间才能杀青,而是一种更新的方式合作拍摄,这就是一个很好的业态。互联网账号优化了信息传输效率,这个叫模式创新,而这次本质上是一次生产力提升,给千行百业赋能。
原有电商产业链的模式里,一个几十人的团队可能要看几百万个SKU,有了大模型,它就能把这个工作做成智能闭环。我身边有一些创业者正在做,他们颠覆了传统的电商业态,每月向不同的电商提供工具,使得原本需要50人维护1000个店铺和2万个SKU的团队,在不增加人力的情况下,效率提高了几十倍。他们目前的月流水能达到三四千万,而背后只需要大约15名运营人员。这是追求极致效率的商业平台,因为归根结底,大家都需要考虑投入产出比。
房超(华中科技大学教授、国家实验室首席战略研究科学家):当前AI 技术路线分为两种,一种是大模型,通过大规模参数和复杂计算机构的机器学习模型,马斯克称,其回答取最大概率出现的“结果”。一种是神经符号-人工智能,即基于人工神经网络的机器学习与计算AI符号相结合的技术,能实现可解释的推理、决策。在你们看来,哪一种路线更优秀?为什么?为什么现在火的是大模型路线?
王得金(深蓝互联创始人、CEO):大模型一旦用在攻略上,比如大家熟知的像IBM、沃森把它用在医学,厂家是要负责任的,包括FSB开车也是要承担责任的。它的可解释性就非常重要。
但是现在传统的大模型是很难给出解释或溯源的,它是个黑盒子。但是从另一个角度看,这可能恰恰是它的魅力所在。很多人都知道粟裕打的是神仙战,他经常被大家赞美,是因为没人知道他怎么想,每次都有不可解释性,但能够产出非常多出神入化的战例。这是第一点。
第二点是视频网络可解除符号两个赛道的选择。这就可以追溯到2017年的那篇paper。在此之前,特别是2012年,李飞飞教授给出来数据集的测试比赛,都是建构在基础神经网络上的。我认为2017年的paper 核心是解决了工程化的两个限制,把两个马的缰绳放开了。
这篇论文中的核心卷积模型,尤其是大型模型,最重要的贡献在于,解决了数据处理的两个关键问题。首先它实现了数据的并行处理能力,sequence to sequence的处理方式,使得分析不再是串行的,而是变成了并行的。这种转变催生了针对GPU这种浮点并行运算架构的优化。
第二就是它经过大量的实验,验证了无监督的学习。因为一旦你的数据量和算力是匹配的,有海量、天量的数据要进来,虽然可以放开并行化运算,但是如果按照传统有监督的分析,进行这么大量数据分析,肯定会吃不消的。它在这两个领域,解开了潘多拉魔盒。
房超(华中科技大学教授、国家实验室首席战略研究科学家):我认为你提到了另一条路,如果说他能够解开两个规模化的一些限制,其实完全是一个可尝试的赛道,因为这都是来自于一个大规模的量变到质变的不确定性。国内是不是有着眼于人工神经网络机器学习与计算机符号相结合的公司呢?
司马华鹏(硅基智能创始人、CEO):我也见过很多团队,就是包括像RWKV这些团队,他们从底层上做一些创新,因为现在大模型的框架算力要求太高了。有点像美国设了个局,训练上非英伟达不可,使得大家都必须走这条路。
现在国内,我看到大家在用比较少的算力来做这样的训练,线路也在跳过目前的一些方式。微软最近处理一个框架,就是能够在CPU上跑大模型。这些事情有可能是皇帝的新衣,会带来一些新变化。一开始挖矿,大家都用英伟达,后来大家都出现了专用的挖矿机,当时对英伟达的股票打击很大。
所以,接下来肯定会出现一些专有算力、专有的其他路径来做这件事,达到同等效果,有成本大幅下降的可能。openai有个团队写了本书叫《为什么伟大不能被规划》,这本书很火。我觉得伟大的东西是不可能被规划出来的,也不能被计划出来。我们可以拭目以待,看看大家如何朝这个方向去走。
【来源:九派新闻】
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com