熊迪:揪出那些“会提问题”的人,他们才掌握AI时代的未来

随着AI大模型技术的不断成熟和普及,一个全民“淘金”的新时代已经到来。在这个时代里,每个人、每个团队都有机会成为AI领域的淘金者。然而,机遇总是伴随着挑战。“小作坊”如何在这场AI竞赛中脱颖而出?如何保持持续的创新能力?如何确保技术的安全可控?这些都是摆在所有淘金者面前的问题。

带着这些问题,8月16日,未来图灵与前华为AI产品经理、现行智科技创始人熊迪进行了一次对话。作为跨界AI创业者,熊迪与团队开发了一款AI集合体软件,目前接入各功能类型软件数量多达500多个。在此次对话中,熊迪认为AI大模型的发展趋势是通用大模型与垂直类大模型并存,“小作坊”可以在特定领域深耕,发挥灵活性和专业性。并表示人们不需要在学习和掌握技术方面过于执着,AI大模型能够提供更加高效和个性化的学习体验。

对于AI大模型的商业化潜力,他认为,目前大模型在商业闭环方面的能力仍有待提升,其在数字直播等多个领域的应用已经展现出了巨大的商业价值。

图片

行智科技创始人熊迪

打破“死磕”学习的传统观念

未来图灵:大模型是不是在逐渐替代一些搜索引擎?

熊迪:我认为这是未来的发展趋势。使用搜索引擎时,我们需要筛选和甄别答案,可能受广告影响。若用大模型搜索问题,它会基于提问和输入词给出少量答案,可能三五个选项。实际上,这些答案是经过分析的。从用户体验看,大模型替代搜索引擎能提升体验。从商业角度看,若普遍使用大模型搜索,广告植入将减少。大模型和搜索引擎将是用户体验与商业模式间的博弈。

未来图灵:随着提问和获取答案变得更加容易和方便,这是否会影响人们对知识的看法,导致人们在获取知识时变得更加依赖于他人提供的答案,从而可能变得懒惰?

熊迪:一定会的,人们的行为模式或将随技术发展而有所变化。知识积累常需长时间投入,如我们长期致力于孩子的全面教育,未来这种模式的价值或将重新评估。未来教育更可能聚焦于培养专长,即索罗斯所言的“特定领域超越”,鼓励广泛探索不同行业,而非“死磕”一个技能。

未来,评价能力的标准或将多元化,学历不再是唯一,提问技巧、产品构思能力及跨学科知识将占据重要地位。有效提问基于深厚的知识底蕴与跨领域理解,而产品思维则强调精准捕捉市场需求与持续的产品优化。

人文知识如人性洞察、审美鉴赏与同理心,对于创造贴近人心的产品至关重要。跨学科学习不仅拓宽视野,更激发创新思维,为解决复杂问题提供新路径。在技术进步的同时,我们亦需强调多领域学习的价值,确保技术服务于人类福祉,而非单纯追求效率与速度。

未来图灵:设计AI算法和创造AI的人会影响AI的看法么?

熊迪:这个是一定会的。目前世界上最强的AI编曲工具Suno,其创始人和创始团队都是物理学家,同时也拥有自己的乐队。AI创作艺术作品,工作原理本质上是学习已有的作品。若要建立一个音乐大模型,AI需要全面学习并聆听过往的优秀作品,理解其中的编曲结构、音色运用等要素。

机器学习的内容直接由创作者或系统开发者设定。若AI被训练于低质量、垃圾或同质化的作品,其产出也必然受限。在绘画和视频等大模型的构建中,同样遵循学习过往作品的原则。选择高质量的作品作为AI的训练材料至关重要。这样做不仅能提升AI的创作水平,还能确保最终作品在观点上具备多样性,反映人类主观想法的丰富性。

图片

AI领域有巨大“钱”力

未来图灵:我们了解到您在AI这个行业从业了五年了,那您具体在这五年里做了什么呢?

熊迪:在过去的五年中,我首先在华为担任产品经理,专注于音频领域的技术研发,包括虚拟环绕声、自动曲目分类以及听唱识别等。期间,我参与设计了一个唱歌评分系统,类似于唱吧,为用户提供即时的反馈。

随后,我加入了一家MCN公司,这家公司专注于孵化本地生活和电商直播领域的客户。我负责帮助他们提升直播能力,包括探店和团购圈的直播内容制作。这段经历让我积累了丰富的行业知识和客户资源。

我选择在AI行业创业,主要基于一个核心判断:人工智能在未来几年,甚至更长时间内,将像互联网一样,成为推动社会进步的重要力量,其影响力可能达到第四次工业革命的级别。作为一个喜欢尝试新事物、热衷于创业的人,我认为这个领域仍然是一个具有巨大潜力的市场。

另一方面受我的父亲影响,他是一位人工智能领域教授,让我对AI也有一定了解,并从中汲取了宝贵的知识和经验。

我创建了MCN公司,专注于人工智能创业领域。“数字直播”板块具有显著的便捷性,能替代真人主播,实现24小时持续直播。结合行业资源与人工智能技术,我选择了这一领域进行创业。

未来图灵:您方才对AI数字人、直播以及与大模型融合的工作领域进行了阐述。那么,在您看来,这个行业是否正引领着大模型垂直应用领域的财富浪潮,成为最具“钱”途的领域之一呢?

熊迪:称为最有“钱”途还是为时过早。这个领域更贴近商业变现的实际,在众多应用领域中,不仅是大模型厂商的深耕之地,还有各行业大模型、垂直类大模型的探索,它们所指向的,是一个更长远、更富潜力的方向。

数字人变现场景的技术门槛并非高不可攀,关键在于如何与商业化运作巧妙融合。像华为、谷歌等巨头所构建的千亿级大模型,以及国内众多中小公司针对特定场景如医药、保险、法律等打造的垂直类大模型,这些短期内或许难以显现巨大经济效益,它们无疑是未来的趋势所向,也是行业发展的常态。

未来图灵:您在AI领域深耕五年之久,必然对大模型这一前沿概念有着独到的见解。作为一位创业者,您能否分享一下,大模型究竟是什么?

熊迪:大模型是我们信息化系统的大脑。在20年前,第三次革命叫做信息技术革命。为什么人工智能会被称为第四次工业革命,我觉得人工智能给我们之前的这些所有的电子化、系统化、信息化都赋予了一个新的大脑。大模型实际上就像一个系统的一个发动机,或者整个汽车的发动机。我们其他的所有的操作页面,其他的一些应用场景,其他的一些工具组合来构成这辆汽车的轮胎或者说它的底盘。这辆汽车的性能最终能走多远,能走多远能达到多高的高度,我觉得更多还是由这个发动机来决定的。

大模型也可以理解成是一个知识库。它不同于我们以往的这种被动式的或者是死板的知识库。它是具有交互,持续更新能力,持续学习,持续进步的能力。它是能够对周围世界有感知的一个知识库,它是一个持续进化知识库。一旦我们掌握了与AI的交互技巧,特别是与大模型的交互,我们就能利用这个世界上最庞大的知识库来理解和执行我们的指令,从而完成各种复杂的工作任务。

图片

有收益就有争议?

未来图灵:大模型是否具有感知环境变化、自我意识和自主学习的能力,以及人类在其学习和决策过程中扮演的角色是什么?您认为未来会不会有更多的工作被大模型替代?

熊迪:从我的角度来看,目前的人工智能尚未达到通用人工智能水平。现在的大模型的能力,包括自我提升、自我进化和自我更新,主要来源于我们人类赋予它的算法。

我认为,随着通用人工智能的发展,人工智能将能够实现完全脱离人类算法的自我净化和自我提升。大模型,无论是文本类、图片类,还是音频视频类,最终都将能掌握目前世界上所有的优秀作品及文献资料和知识。它们一定能够取代一些重复性的、有规律的工作。

未来图灵:您认为大模型所产出的作品版权归属于谁?

熊迪:举个例子,Adobe公司开发了Photoshop(简称PS)软件,这款软件是设计师们的创作工具。设计师们通过PS能够创作出各式各样的作品。对于这些作品,Adobe公司并不主张版权,作品的版权完全归创作者所有。

当涉及到人工智能创作的作品时,情况就变得复杂了。虽说人工智能创作依靠我们提供的指令、提示词和前置内容,但最终生成的作品常常带有不确定性,这背后的原因是因为人工智能生成的成果并非完全由创作者的意愿决定。人工智能的创作过程,更多的是受到其背后的大模型公司或技术提供商所提供的算法影响。

因此,关于人工智能创作内容的版权归属问题,是一个复杂且尚未定论的议题。若这类作品产生显著的经济效益,那么版权归属问题可能需要进一步探讨。若这类作品仅限于个人娱乐或在小范围内传播,版权归属或许可倾向于创意提示的提供者。

什么才是大模型的未来?

未来图灵:国内大模型的发展是在ChatGPT3.5出现之后。您认为未来大模型趋势是怎样的?

熊迪:千亿级别的大模型例如,ChatGPT、通义千问、文心一言这种实际上是属于通用大模型,或者叫泛类大模型。它的参数量是千亿级别。大模型未来的发展会持续很长时间。这些大模型将会得到商业化的投入,并获得国家层面的资金支持。

一些中小公司或行业的龙头公司,未来会投入大量时间研发行业大模型或垂直类大模型,规模可能达到百亿级别或十亿级别以下。针对特定的医疗场景、法律领域、企业内部数据的大模型,或针对餐饮业、连锁企业的小而美的大模型。这些小而美的大模型将成为未来的发展趋势。

未来图灵:有一个观点认为,OpenAI已经掌握了人工智能行业的一把关键钥匙,而其他大模型公司还在门外观望。是否OpenAI真的已经领先于行业,拿到了进入新阶段的钥匙?其他公司是否还在寻找自己的钥匙,或者他们已经准备好加入这场竞争?您认为现在的情况是怎样的?

熊迪:OpenAI在数据量、算力和算法上具备先发优势,相较于其他公司更有优势。其英文数据库规模庞大,且拥有领先的人工智能科学家团队。微软等公司的投资也进一步提升了其算力水平。但认为只有OpenAI能打开大门,其他公司仍在门外,这一说法或许过于绝对。

我认为现在每个人都有机会,无论是构建大型模型还是垂直类模型。从大型模型的角度来看,包括谷歌和国内的一些大型模型,我们的国家在数据资源上具备优势。在计算力方面,我们面临芯片的限制。算法方面,人才有所不足。在数据上,优势也很明显。我国产业链完善,涵盖多种类型的数据,人口数量庞大,提供了丰富的数据量。我们拥有独特的中文数据库。断言OpenAI已与我们拉开差距的说法,我认为不够准确,需进一步观察。

图片

使用大模型的门槛并不低

未来图灵:您发布的视频中提到“未来属于能提出好问题的人。”那您觉得提示词会影响大模型的答案吗?普通人应该怎么掌握提示词?

熊迪:提示词确实会影响大模型的答案。目前的人工智能技术尚未达到通用智能的层次,它本质上仍然是一个依赖数据输入与输出来运作的系统。了解这一系统的运作机制后,我们可以清晰地认识到,输入数据的质量直接影响到处理结果的优劣。

现在的大型模型并非通过单一问题即可得到完整答案,它们需要逻辑上的变化、持续的角度区分等多种因素的综合作用才能产生满意的回答。在推动人工智能技术的发展过程中,我们不仅需要关注技术的先进性,还需要注重如何更好地利用这些技术,以及如何通过改进输入数据的质量来提升模型的性能。

由于我们从小接受的教育模式,主张被动输入、尊重权威和努力读书,所以我们缺乏提问和解决问题的能力。如果我们想要利用好人工智能或AI工具,就需要打开思维,多思考别人可能想不到的问题,并通过AI给出的答案进行下一轮思考,持续追求变化的角度。因为只有这样,才能得到相对准确的答案。

未来图灵:可以理解为使用大模型是有门槛的吗?

熊迪:我认为存在门槛。之前有观点认为:在人工智能时代,我们无需再学习。我认为这是错误的。我们并非无需学习,而是不必拘泥于死板知识的积累。一个人的思维能力,关键在于能否提出好的问题,这要求他仍需掌握较为丰富的知识。这些知识不应局限于特定领域或行业,而应广泛涉猎,甚至包括休闲娱乐。只有这样,才能提出好问题,保持持续的思考。

英文的重要性同样不容忽视。目前,大模型如ChatGPT、谷歌Gemma等,其知识库主要基于英文。若以中文与之交流,可能无法获得所需答案。充分利用大模型的关键在于两点:一是提出恰当的问题,二是学好英文。

未来图灵:周宇老师提到了提示词将成为一门学科。未来,提示词可能会像我们使用电脑打字一样成为一种工作方式。您认为呢?

熊迪:我认同他的观点。运用提示词,就像使用手机扫码购买早餐或电脑打字那样,已成为一种自然而然的基本操作。不论人工智能发展到何种程度,我们都需要掌握其背后的思维逻辑。这不仅仅是学习如何编排内容或包含哪些信息,更关键的是,我们要明确人工智能的能力范围,理解其如何运作、如何解析问题以及它的思考方式。只有这样,我们才能提出直指核心、无需过多修饰的问题。

“AI”时期=“互联网”时期?

未来图灵:您公司目前产品定位是什么?您公司的发展路径是怎样的?

熊迪:我公司的首款产品,是一款针对B端市场的数字人直播产品。它不仅具备数字人直播的功能,还能实现真人克隆。在初期推广阶段,该产品主要聚焦于企业直播间,作为真人主播的有效替代方案。考虑到一些企业资源有限,尤其是当它们拥有一个主直播间但还需管理多个矩阵直播间时,往往难以配备充足的主播团队。我们的AI数字人技术,则能够灵活填补这一空缺,确保直播活动的顺利进行。

进一步地,我们观察到众多创作者群体,尤其是名人、企业家等忙碌的个体,他们渴望在忙碌之余仍能打造属于自己的短视频或直播账号。为此,我们推出了数字人克隆技术,为他们提供了一个高效、便捷的解决方案。作为我创业初期的核心项目,该方案主要面向B端市场,致力于服务明星、名人和各类IP。

为了进一步拓展市场,我们也尝试涉足C端领域。通过将原有的底层模型和公模技术迁移至手机端小程序,我们为那些希望创作短视频但缺乏模特资源的用户提供了有力支持。我们的目标在于帮助他们轻松实现口播梦想,让创意得以自由展现。

我与一家位于杭州的知名企业携手合作,共同打造了一个名为“馨桐bot”的AI工具合集。该工具集全面整合了普通人在日常生活中可能需要的多种工具,包括但不限于大模型、文本处理、绘图、思维导图以及PPT和视频制作相关的辅助工具。这一创新成果不仅丰富了我的产品线,也为我探索未来市场、实现技术革新奠定了坚实基础。

未来图灵:您也提到了馨桐bot是合作研发的成果。那您认为这种合作的模式,对于开发产品有哪些优势?您觉得这是未来中小企业现在生存的一种方式么?

熊迪:鉴于各企业在专业领域与资源基础的不同,有的可能在底层大模型构建方面有所建树,有的则可能更专注于底层技术的构建,如大模型的构建、算法的开发或数据的处理。有些公司可能在市场开发或应用场景构建上表现出色,而有些则擅长商业化运营。

当前人工智能的发展仍处于初级阶段。回顾互联网发展的初期,也并未有众多巨头企业的存在。每家企业都拥有自己独特的方向和擅长的领域。我认为这是一个中小企业有机会联合起来,共同开发出具有影响力的应用的时期。随着时间推移,未来可能会看到更多巨头企业进入市场,进行资源整合。

图片

AI是否会成为继手机支付之后的新一代技术浪潮?

未来图灵:您认为AI大模型的普及重要吗?是否有必要让每个人都学习AI呢?

熊迪:AI未来可能会变得非常普及,就像现在的手机支付一样,即使在十几年前你不会使用手机支付也没关系,现在还没有明确的规定,但随着越来越多的商家不再接受现金,这种情况可能会越来越普遍。

只要你的工作、行业或自己能胜任的事情可以与AI结合,那么都应该学习和了解人工智能。

未来一定会是一个不断提升的状态,所有方面,包括内容创作、工作效率和岗位要求,都将不断进步。人工智能可以提高创作效率,打破行业壁垒。例如,以前制作音乐需要系统学习多年,需要科班出身才能成为作曲家或钢琴家。现在,只要拥有天赋、灵感和热情,任何人都可以尝试创作音乐。

所有行业都会不断提升,无论是内容数量还是质量都会比以前更高。这会淘汰那些不学习的人,他们必须跟上时代并学习。如果你的行业能够被AI影响,你就必须了解和学习,因为你也需要不断进步。

未来图灵:有观点认为,投资人对于大模型行业的热情可能只维持到3到5年,大模型最后可能留下的只有2到3个,您怎么看?

熊迪:有人认为这个问题可以参考元宇宙。元宇宙曾短暂风靡,但伴随着泡沫和投资热潮减退使其影响力在五年内逐渐减弱。我认为,元宇宙与人工智能是两个不同的概念范畴。人工智能在提升生产力方面展现出了巨大潜力,其影响渗透到社会的各个层面,甚至可能引发某些行业的变革。人工智能在未来的发展潜力和热度可能会超过元宇宙,持续更长时间。

对于大模型领域,我认为最终可能留下2到3个主要参与者,这与互联网行业的某些领域发展趋势相似。回顾过去十年的互联网发展,我们可以看到在搜索引擎、即时通信等领域,最初存在众多竞争者,但最终只有少数几家公司脱颖而出。大模型,特别是千亿级的大模型,需要巨大的资金、人力资源和政策支持。我认为大模型领域可能也会经历类似的整合过程,最终留下几家领先的公司。这并不意味着垂直大模型没有发展空间,我预计垂直大模型领域将呈现多样化的竞争格局。

图片

AI在个人IP中的运营角色

未来图灵:您认为在个人IP运营中,AI扮演了哪些角色?

熊迪:我认为个人IP的全流程都可以有AI参与。我一直持有一个观点,即每个人或大多数人都能做好个人IP,但成功的只是少数。做好个人IP是一个常见且艰难的过程,要求持续输出有价值的内容。

在个人IP创作者的日常挑战中,如何在繁忙的工作之余继续创作内容,常常是一个令人头疼的问题。人工智能的出现,为我们提供了一个提高工作效率、在空余时间进行创作的解决方案。例如,通过将选题、文案和剪辑等工作交给AI或固定的工作流程,我们可以更有效地利用时间。一些大IP,如江南春、陆奇、“罗胖”(罗永浩),已经开始使用AI数字人来管理矩阵账号和进行直播,这些都充分展示了AI的潜力。

对于个人IP创作者来说,AI能够提高创作效率,让我们在领域中更持久地生存。许多创作者因为时间不足而不得不放弃创作,我认为AI的出现解决了这个问题。做IP的过程中我们经常会感受到焦虑,原因来自于作品反馈的波动,或者作品内容是否需要迎合粉丝等。这种焦虑与个人IP的全商业流程有关。打造个人IP需要我们具备抗压能力、个人魅力和内容创作能力。AI的介入,可以帮助我们在这些方面取得更好的平衡,让我们在竞争激烈的市场中保持活力和创新。