中国DeepSeek冲击,美科技股正被抛售

AI划重点 · 全文约2808字,阅读需8分钟

1.中国人工智能初创公司DeepSeek凭借低成本优势,引发美国科技股大跌。

2.DeepSeek最新模型R1在性能上比肩OpenAI的o1模型,一度因高流量宕机并限制注册。

3.由于DeepSeek的成功,美国科技企业可能面临融资困境,包括OpenAI和Anthropic等。

4.与此同时,部分能源相关股票也在27日大幅下跌,投资者担忧新技术能耗降低可能导致科技行业对能源需求下降。

5.DeepSeek创始人梁文锋表示,公司目标是打造中国的人工智能模型,参与全球创新浪潮。

以上内容由腾讯混元大模型生成,仅供参考

近日,DeepSeek全球爆火。这家中国小型人工智能初创公司称,它能以极低的成本与ChatGPT和其他美国人工智能模型竞争,这让金融市场大跌眼镜,美国科技股随之大跌。此前人们普遍认为,未来人工智能的发展将需要更多的电力和能源,而DeepSeek的出现似乎与这种观点形成了鲜明的对比。硅谷风险投资家马克·安德森(Marc Andreessen)称DeepSeek是“人工智能的斯普特尼克时刻”(1957年,苏联击败美国,成功将第一颗人造卫星“斯普特尼克”送入太空)。特朗普则表示,中国人工智能应用DeepSeek的突然崛起“应该为美国科技公司敲响警钟”


DeepSeek最新模型迅速爆火

图片

DeepSeek由人工智能驱动的量化对冲基金幻方量化的负责人梁文锋于2023年创立。该公司开发的人工智能模型是开源的,这意味着广大开发者社区可以审查和改进其软件。与OpenAI的ChatGPT等其他聊天机器人不同的是,DeepSeek在对提示做出回应之前会阐明自己的理由。
DeepSeek的热度从上周开始迅速扩散,当时这家中国公司发布了最新的R1模型,据称在性能上比肩Open AI的o1模型。27日,DeepSeek一度因为高流量出现宕机,并因遭受网络攻击而暂时限制了注册。尽管如此,DeepSeek还是在当天超越ChatGPT成为美国和世界其他地区苹果应用商店下载量最大的免费应用。DeepSeek成为了最近几周在美国大受欢迎的一系列中国应用程序中的最新一款。当Tiktok前不久在美国被短暂禁用时,不少“Tiktok难民”涌向了另一款中国应用程序——小红书(RedNote)。

图片

为了限制中国在人工智能领域的发展,美国在过去几年一直在禁止向中国出口芯片等高端技术。但DeepSeek的进展表明,中国的工程师们似乎已经找到了应对限制的方法,在有限资源下专注提升效率。
据了解,DeepSeek采用了一种不同的内部架构,降低了内存使用量,从而大幅减少每次搜索或与聊天机器人系统交互的计算成本。DeepSeek表示,该模型的开发仅耗时两个月,成本不到600万美元。尽管一些观察人士认为这一数字可能被低估,但即便如此,这一成本仍远低于硅谷科技公司动辄几十亿美元的投资。

美国科技企业股票受重创

图片

DeepSeek的成功可能会促使OpenAI和美国其他人工智能供应商降低定价,以保持其既有的领先优势。研究机构PitchBook数据显示,2024年风险投资者向AI初创企业注资1320亿美元,较上年增长超50%。随着DeepSeek证明"少花钱多办事"的可能性,包括OpenAI和Anthropic在内持续烧钱的模型开发商可能面临融资困境。Groq、Cerebras两家AI芯片制造商,以及AI云计算公司CoreWeave等其他风投支持企业也可能遭遇麻烦。这也让人们对目前火热的AI领域产生了疑问:不断增长的天价融资和数十亿美元的估值是否真的有必要?AI行业是否正处于泡沫即将破裂的边缘?
就在DeepSeek最新应用发布前几天,美国总统特朗普刚刚宣布与Chat GPT的开发公司OpenAI、软银(SoftBank)和甲骨文(Oracle)合作推出一项名为“Stargate”的新项目,他称这项价值5000亿美元的项目将“确保美国的技术未来”。24日,Meta首席执行官扎克伯格表示,他计划今年在人工智能基础设施上投入多达650亿美元。

图片

据美媒报道,人工智能相关股票在27日遭遇重挫,英伟达(Nvidia)股价暴跌17%,市值蒸发6000亿美元,创下股市历史上单日最大市值损失纪录。光刻机巨头阿斯麦(ASML)的股价下跌6%,另一家半导体公司(Broadcom)也暴跌17%。与此同时,部分能源相关股票也在27日大幅下跌,投资者担忧新技术所需要的能耗降低,可能会导致科技行业对能源的需求下降。

梁文锋:打造中国的人工智能模型

图片

DeepSeek的创始人梁文锋1985年出生于广东湛江市。浙江大学毕业,拥有信息与电子工程学系本科和硕士学位。2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2019年,其资金管理规模突破百亿元;同年,梁文锋在当年的金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》。2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”。2023年,他宣布正式进入人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。

图片

“我们的目标也很明确,就是不做垂类和应用,而是做研究,做探索。”梁文锋表示,这是出于“一种好奇心驱动”,“从远处说,我们想去验证一些猜想。比如我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。从近处说,GPT4还有很多待解之谜。我们去复刻的同时,也会做研究揭秘。”他表示,“我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。”他认为现在最重要的是参与到全球创新的浪潮里去,“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”梁文锋曾表示,中国人工智能进一步发展的瓶颈不是更多的融资,而是美国对最先进芯片的出口限制。他提到,自己团队中的大部分顶级研究人员都是来自中国顶尖大学的应届毕业生,并强调中国需要建立类似于英伟达及其AI芯片所依托的本土生态系统。“更多投资不一定意味着更多创新。否则,大公司会垄断所有创新,”梁文锋说道。
在一片称赞声之下,也有人质疑DeepSeek团队的能力,称DeepSeek的成功是中国政府的“心理战”(psyop)。PyTorch机器学习库的共同创始人之一、Meta AI的钦达拉(Soumith Chintala)对此类指控进行了回应。“我真是被这些人应对DeepSeek的方式惊呆了,他们竟然放出荒谬的阴谋论——尽管DeepSeek开源并且写出了有史以来一些最具细节的论文,”钦达拉在社交媒体平台X上发帖说道,“去了解。去复制。去竞争。别酸了,这只会让你看起来不专业。”前GitHub首席执行官弗里德曼(Nat Friedman)同样也发帖说道:“DeepSeek团队显然非常优秀。中国有很多有才华的工程师。其他的看法不过是安慰自己罢了。抱歉。”英伟达CEO黄仁勋则在写给同仁的一封信中表示:“任何新兴力量的出现,都是对行业生命力的最佳印证。他们以开源策略和场景化芯片设计展现的锐意,恰如我们当年用 GPU颠覆传统计算架构时的锋芒。”
DeepSeek的最新模型发布之后,中国科技行业的其他企业也陆续推出了竞品,纷纷加入到这场激烈的人工智能竞争之中。作为Qwen2.5-72B的升级版,阿里巴巴于26日发布了其最新的Qwen2.5-1M模型。总部位于北京的Moonshot AI旗下的Kimi AI也在周六宣布推出其最新的多模态推理模型Kimi k1.5,宣称其性能可与OpenAI的o1相媲美。

iWeekly周末画报独家稿件,未经许可,请勿转载



图片