1.Manus智能体展示了AI在简历筛选和面试过程中的应用,引发对人工智能替代人类工作的讨论。
2.然而,专家表示,尽管AI技术不断发展,但在目前阶段,它仍难以替代人类完成所有工作。
3.未来通用智能体可能采用多智能体协同驱动的决策,以提高效率和准确性。
4.此外,AI领域的投资方和manus智能体已达成合作,预示着其在行业内的应用前景。
以上内容由腾讯混元大模型生成,仅供参考
文|王鸿(信安数据高级副总裁)
本文由作者参加九派新闻直播九派圆桌《manus爆火,套壳还是创新》讨论时的发言整理而成,发布前经作者审阅
【1】manus更多是个营销事件
manus向普通的非专业人士很好的解释了什么是 AI 智能体,虽然人工智能比较火爆,但走入平常家庭有点远的。普通人一定关心的就是,你跟我的实际生活有什么关系。
它谈到说我可以看简历、筛简历,在很多企业里面,员工需要写简历, HR 需要看简历,经理层需要招人。大家一下子就能够理解到,原来一个智能体能做简历工作;以后我在面试的时候,过的第一关可能不是人,是 AI,让 AI 挑选,而不是人类挑选。如果 AI 这关都过不去,就没机会见到真人了。
另外,这个名字也挺好的,解释了智能体是什么,就是脑袋和手的关系。它是手的延伸,这个类比不一定准确,学术上经不起推敲,但不妨碍普通大众理解:你就是替我干活的,你就是替代我的双手的。
我们用的很多软件,不管是豆包,还是通义千问、智谱等AI 工具,都有一个界面叫智能体,你点开那个智能体,他跟你互动还是问答机器人,并不是完成一个任务,manus 告诉大家,智能体不是一个问答机器人,是帮你完成一件工作。
另外,它还卖了一个概念,叫全球第一个通用智能体,事实上,它离通用还差太远,实现 AGI还很远很远,但它把概念宣传出来,占了一个很好的身位,这样就引起了很多人的好奇,通用的人工智能来了,那我是不是被替代掉了?
它的爆火与 deep seek 是完全不一样的。DS是我拿任何产品过来,你来用,你觉得好,就推荐给别人。大家一起来用,它成了全球互联网产品用户增长最快的一个APP。manus 是反其道的,它知道如果硬搞,可能经不起太多的人来质疑、使用、破解,于是采用了一个邀请码的方法,设了一道饥饿营销的门槛,调取了很多人的好奇心。
一句话,我觉得更多是个营销事件。
从媒体报道来看,已经有投资方和manus接洽,我们也看到了阿里和它达成了合作。这是一件好事情,关于AI领域的投资,从投资人的角度来看,投资偏好不存在说技术崇拜或者是应用落地,只看投资回报。投技术,它就意味着投资大,风险大,受益大,投应用,他可能就会看,应用的门槛有多高?TO B 还是 TO C 的?二者的投资逻辑不太一样。
manus说他是一个应用落地的故事,非技术,一旦要谈 AI 的技术,就一定要谈三件事情:算力、算法、数据,如果这三个都跟你没关系,大概率技术跟你无关, manus 很少提到它在算力方面的优势,算法和数据的突破几乎都没有。更多是怎么去多场景的技术实现:做了大量的交互体验和公式化动作,这里的投资逻辑自然就是应用了。
manus自己的宣传是偏 to C 的,看起来的应该是个 C 端消费者的AI 助理 、AI 助手的角色。
不同的基金,不同的投资人,选择不太一样,朱啸虎比较坚定,投应用,他觉得在中国能够把应用做好是比较有把握的。但我们也知道,目前 AI 领域,中国最有价值的投资公司,肯定是深度求索。投资人不会因为说意识到热点,去改变太多投资逻辑。他会看领域里的方向,投资回报和能看得懂的商业模式。
很多人关心,机器会不会替代人,图灵奖获得者杨立昆教授,认为基于现在的 transformer 架构,不可能走向真正的通用人工智能,普通人也不要那么焦虑、紧张。虽然 ai 发展很快,但替代人,目前从技术底层上来说,做不到,没这个可能性,不要去信很多的那种博流量的言语,纯粹是贩卖焦虑。
但从工作的角度来说,我们很多人会感到恐惧,会不会被人工智能所替代,这里我的答案非常肯定:yes,而且已经发生、正在发生,有些工种会因为 AI 的出现消失掉,比如客服和接线员, 你接电话的那个对方是一个人还是一个人工智能,大部分人已经分不清楚了。
当然,AI 的出现也会创造出大量新的岗位。美国有个非常著名的公司,叫 salesforce,全球排第一的 crm saas 软件公司,市值大概是3000多亿美金,公司的CEO 2024年底宣布2025年不再招聘软件工程师,为什么呢?因为平台 agent force 已经提高了30%的工作效率,大部分工作, AI 就能完成。
但需要大量的招聘销售人员帮他卖agent force ,普通的大众要相信,如果不用 AI,就好像蒸汽机出现,大马路上已经有了奔驰车,你还当一个马车夫,干嘛不学一下开车?AI 带来的就是智力劳动效率的提升。
我们知道汽车工厂有汽车流水线,牛奶工厂有牛奶流水线。这些流水线核心是机器,人类属于配套,未来智力流水线如果出现了,工作的人可能就是 AI 的配套。但这并不意味着,人就没有工作了。还是有人要做汽车设计、规划、宣传。
【2】将来大概就是多智能体协同
AI 驱动的决策与之前系统驱动的决策有个不一样,就是端到端的能力。
什么叫端到端的能力?我举个例子,2016年, AlphaGo 打败了李世石之后,人类下棋再也下不过人工智能了。围棋有361个落点,每个落点的可能性是个天文数字,AI 来做决策,并没有说规划、理解,只把图案和规则告诉它,它就能告诉我们下一步,这就是端到端的能力。
未来通用智能体提供端到端的解决方案才是主流。我认为现在理解意图,再规划,再做执行的方案,这是一个经典的人类线性解决问题的方法,反应速度非常慢,而我们大脑解决问题是并发计算的,好多神经元连一块儿构成了认知体系。现在的智能体应用,靠网络并行计算,完了还得用线性方法再解释一遍,再接着处理,这就好比把本来运行得挺高效、像大海一样的网络体系,弄成了一条小水沟,效率显然不高,不经济,不划算。
最好的方法是多个大模型协同,一个综合的大脑决定哪些参数起作用,几个大模型协同给决策,将来大概就是多智能体协同。一个智能体把一切都搞定、很难,人类都有不同的专业分工,我们根据自己的能力都会有不同的擅长领域,未来的智能体也会如此,这里面就牵扯到多智能体协同,比如标准在哪里、如何定义标准,如何规范。
这是 manus 给我们提出的很重要的问题,一个系统智能的问题,不是单一智能的问题,针对人、机、环境三个环节,如果协同标准只是某一个,比方说纯粹的 AI 标准,不考虑人、不考虑环境,大概率不行,将来 AI 应用发展,这个越早确立,会越早地把资源优势发挥出来。
manus被说套壳,我觉得不是问题,核心问题是用了别人的基础大模型之后,做了什么?举个例子,有些人说我做行业大模型,需要另外提供一些数据集,根据我的场景需要,在别人的基础上再进行训练,从而调整为比较适合行业场景的大模型。它是一种微调技术,我不知道manus有没有做。目前公开数据没有,也没有宣传,如果没有做这件事情,纯粹用基模再加上提示词工程,再加上 python 的开发代码环境,就完成了工程化,坦率来讲,门槛太低。它关于意图识别任务、规划、执行的监督、价值观对齐,如果都只是用提示式工程来做,那大概率稍微复杂一点的任务就会协同不了。
当然,公众也不要小看 manus干的工作,工程化这件事情很难,有个测试基准GAIA(通用人工智能助手的测试标准),manus 的考试成绩不错,比 OpenAI的operator、 deepresearch要强,说明工程量做得很不错,至少提示词、工程技术,其他的小工具做的很好,这里折射出了另外一个创业的机会或者挣钱的机会。你挑一两个非常熟悉的领域,用现在的 AI 大模型,再加上提示工程和写代码的技术,你很可能做出一个非常好用的 AI 助手出来。
有人会问,测试基准的目的是什么?建立一个评测标准来评测 AI 的系统工具,测试智能体的,参与者有 meta。标准比较权威、严肃,但仅仅是一个标准而已。大家可以看一下 deepseek v3模型和 r1模型亮出自己考过的标准,你会发现他们的测试集可能有几十上百个,其中有个很重要的标准GPQA——博士研究生水平的基准测试,deep seek R1 模型考了70多分,人类相关领域的博士平均分数65分。如果不是相关领域的,可能只能拿到30多分,反过来看manus,它能拿出来 PK 的测试集特别少。
这就好比说我们去考试,有一个人说,全世界所有的考卷都来一遍。有人会说我就会一科。作为一个通用agent ,就给人感觉有点单薄。
从全球的角度来说,开源生态比较繁荣的往往都偏技术,不偏应用。比方说linux 开源社区,很厉害的,还有 java 开源社区、app ,这些都偏技术、太偏底层,但一旦到了应用层,往往很少开源。举个例子,我们说开源的 ERP、开源的办公协同软件,开源的 CRM 软件,这些在整个业界生态的声音很小。
linux一定是个很重要的主流操作系统之一,大量的人做贡献, AI 领域大概会遵循同样的逻辑,如果偏技术,开源会是一个不错的选择,如果智能体框架开源,我持保守的态度,智能体偏应用,这种产品闭源能够走得更远一点。
开源往往意味着程序员做贡献。程序员对于业务很多场景不那么了解,甚至不那么在乎,更愿意炫技,说算法多好,问题解决的可复用性、通用性多好、效率多高,这些东西在应用环节里,可能不是最重要的,好的客户体验才最重要。
【3】transformer 架构的能力已经压榨到顶点
AI 最先的哪个地方落地,得看投资回报,哪个地方投资回报最大,落地就最快。现在看,回报排第一的是金融,deepseek 的母公司就是幻方量化,做金融投资的私募股权基金。事实上很多基金公司,很早就大量使用机器学习、人工智能,在大语言模型还没有出来之前,当初的卷积神经网络或者说机器学习应用就非常多。
股票就是涨和跌。卷积神经网络根据大量的数据采集来做预测,预测明天是涨还是跌,第二个领域是生物制药、医疗。很多 AI 专家,实验室背后都跟制药、生物有关系, AI 教母李飞飞在斯坦福的实验室,就跟很多医疗机构有合作。她是三院院士,有个院士头衔就跟医疗有关,2024年诺贝尔奖获得者用deepfolder 发现了蛋白质折叠,本质就是生物医药的问题。
一个 agent要能够很好地完成任务,是挺耗算力的,需要烧很多 token 。我们知道某一个企业部署了一套deepseek,就希望通过它去卖钱,一个月亏了四个多亿。他发现这个账怎么算不明白了,这里意味着好东西是有代价的。
不知道大家有没有注意到,以前OpenAI每次发布产品,全球轰动,但最近上线了一个产品GPT4.5,热度实在不高。不如 manus。GPT4以后,transformer 架构的能力可以说已经压榨到了顶点了,4.5出来之后没有产生轰动效应、GPT5的难产,说明了一件事情,如果底层架构没有新的变化,将来后续的版本都不会发生量变,可能是一个微调的概念,不会产生数量级变化。
另外我想多说一两句,在AI时代,家长对于小孩的培养,首先,填鸭式的应试教育大概率是不行的,如果小孩被教育得没有童年、没有乐趣,厌学,您可以停手了,再教育下去这个孩子到高中阶段,会突然间一脚踏空,第二,让年轻人有想象力、有创造力,比他懂什么更重要,哪怕他调皮一点、捣蛋一下,不要去责怪他。乖孩子在 AI 时代,可能就是个没用的人,当然调皮下不是去危害社会。最后,让他有一个自己的爱好,有一个自己喜欢的事情,愿意长期干的事情。未来,人类的工作状态会是什么样子,我们真的无从知晓,但是我们知道,如果一个人干着他爱的事情,不管是工作还是生活,能够开心快乐,这也许是一种非常好的生活状态。
【来源:九派新闻】
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com