新智元报道
编辑:LRS
【新智元导读】AI技术日新月异,像Netflix这样的大公司已经开始用AI制作特效,而新的AI模型也在游戏和科学研究中超越了人类。未来一年,我们可能会看到没有编程技能的人也能创造热门应用,甚至AI创作的歌曲也可能登上音乐排行榜前十。
AI发展之势迅猛,从技术、政策到产品风险,相比从前都有了很大变化。
最近,State of AI发布了2024产业报告,也是调研团队发布的第七份年度报告,从研究进展、行业局势、现有政策、安全问题、未来预测等角度出发,对人工智能行业的现状和预期进行了深度分析。
报告链接:https://docs.google.com/presentation/d/1GmZmoWOa2O92BPrncRcTKa15xvQGhq7g4I4hJSNlC0M/edit?usp=sharing
报告主要关注以下内容:
1. 前沿实验室的性能开始趋同,专有模型的优势逐渐消失,GPT-4与其他模型之间的差距正在缩小。OpenAI的o1模型再次让实验室在排行榜上名列前茅,但还能持续多久呢?
2. 规划和推理在大型语言模型(LLM)研究中占据了优先地位,各公司正在探索将LLM与强化学习、进化算法和自我改进相结合,以解锁未来的智能体应用。
3. 基础模型展示了它们突破语言的能力,支持跨数学、生物学、基因组学、物理科学和神经科学的多模态研究。
4. 美国对中国实验室实施的制裁对其生产高性能模型的能力影响有限,因为库存、获批硬件、走私和云访问的结合使国内能够构建高性能的(V)LLM,但国内的半导体产业发展仍然较为混乱。
5. 因为上市公司经历了人工智能曝光的牛市,人工智能公司的企业价值已达到9万亿美元。对私营人工智能公司的投资也有所增加,但尽管美国出现了GenAI巨额融资,增幅却小了一个数量级。
6. 一些人工智能公司开始产生可观的收入,包括基础模型构建者和从事视频和音频生成的初创公司。然而,随着模型作为企业抢占市场的一部分而变得更便宜,围绕长期可持续性的疑问仍未得到解答。
7. 伪收购成为人工智能公司的一条出路,因为一些公司难以找到可行的商业模式,因为保持技术领先的成本很高。
8. OpenAI未遂的政变之后,关于存在风险的讨论已经降温。然而,研究人员一直在深化人们对潜在模型漏洞和滥用的了解,并提出了可能的修复措施和保障措施。
研究进展
1. 前沿实验室的性能正在趋同,但OpenAI在推出o1后保持了其领先地位,规划和推理成为主要的研究前沿。
2. 基础模型展示了它们超越语言的能力,多模态研究推动了数学、生物学、基因组学、物理科学和神经科学的发展。
3. 美国的制裁并没有阻止中国的大型语言模型(V)LLM在社区排行榜上的崛起。
行业局势
1. 英伟达(NVIDIA)仍是全球最强大的公司之一,享受着市值达到3万亿美元的辉煌时刻,而监管机构也正在调查生成式人工智能(GenAI)内部的权力集中问题。
2. 更成熟的GenAI公司带来了数十亿美元的收入,而初创公司开始在视频和音频生成等领域获得关注。尽管公司开始从模型转向产品,但围绕定价和可持续性长期问题仍未解决。
3. 在公开市场的牛市推动下,人工智能公司的市值达到了9万亿美元,而私营公司的投资水平也在健康增长。
现有政策
1. 虽然全球治理努力陷入僵局,但国家和地区的人工智能监管继续推进,美国和欧盟通过了几份有争议的立法法案。
2. 计算需求的现实迫使大型科技公司面对扩张的现实世界物理限制和排放目标。与此同时,政府自身在建设能力方面的尝试仍在落后。
3. 预期人工智能对选举、就业和其他敏感领域的影响尚未实现。
安全问题
1. 随着之前警告我们人类灭绝即将到来的公司需要增加企业销售和消费者应用程序的使用,从安全转向加速的氛围发生了变化。
2. 世界各地的政府模仿英国在人工智能安全方面建立国家能力,成立研究所并研究关键国家基础设施的潜在漏洞。
3. 每一个提出的破解「修复」方案都失败了,研究人员开始关注更复杂、长期的攻击。
2025十大预测
预测覆盖了人工智能领域的各个方面,从大型投资到无代码应用的兴起,再到数据隐私和人工智能法规的实施,甚至还涉及了开源技术的竞争、市场领导者的挑战、人形机器人的发展趋势。
1. 一个主权国家向美国的大型人工智能实验室投资超过100亿美元,引发国家安全审查。
2. 一个完全没有编码能力的人创建的应用或网站走红,比如进入苹果应用商店前100名。
3. 前沿实验室在案件开始审判后,对数据收集的实践方式发生了重大转变。
4. 早期欧盟人工智能法案的实施结果比预期的要宽松,立法者可能会担心他们做得太过分了。
5. 开源的OpenAI o1替代品在一系列推理基准测试中实现超越。
6. 挑战者未能在英伟达的市场地位上取得任何有意义的突破。
7. 由于公司难以实现产品市场契合,对人形机器人的投资水平将下降。
8. 苹果在设备上的研究取得了强劲的成果,加速了围绕个人设备上人工智能的势头。
9. 由人工智能科学家生成的研究论文被一个主要的机器学习会议或研讨会接受。
10. 一个以「生成式人工智能」为元素互动的视频游戏将会取得突破性地位。
2023年度报告预测结果
正确预测
1. 好莱坞级别的制作公司开始使用生成式人工智能来制作视觉特效。
证据:虽然大部分效果还不理想,但生成式人工智能视觉特效已经在Netflix和HBO的作品中出现。
2. 美国联邦贸易委员会(FTC)或英国竞争与市场管理局(CMA)基于竞争理由调查微软/OpenAI的交易。
证据:两个监管机构都在调查合作伙伴关系。
3. 在全球人工智能治理方面,进展非常有限,会超出高层次的主动承诺(high-level voluntary commitments)。
证据:是的,来自布莱切利和首尔峰会的承诺仍然是自愿和高层次的。
4. 一首由人工智能创作的歌曲进入公告牌Hot 100前10名或Spotify 2024年热门榜单。
证据:歌曲「Heart on My Sleeve」就是例子,也可以看到一首由人工智能创作的歌曲在德国中位列第27名,并保持了几天。
5. 随着推理工作负载和成本的显著增长,一家大型人工智能公司(例如OpenAI)收购或建立了一个专注于推理的人工智能芯片公司。
证据:据报道Sam Altman正在筹集大量资金来实现,而谷歌、亚马逊、Meta和微软等公司也在继续构建和改进他们自己的人工智能芯片。
错误预测
1. 有生成式人工智能媒体公司因其在2024年美国选举期间的滥用行为受到调查。
解释:目前还没有,但让子弹飞一会。
2. 自我改进的人工智能智能体在复杂环境中(例如AAA级游戏、工具使用、科学探索)超越了现有技术的最高水平。
解释:还没有,尽管在开放性方面有一些比较有前景的工作,如在游戏上的强劲表现。
3. 科技IPO市场解冻,至少看到一家以人工智能为重点的公司上市(例如DBRX)。
解释:虽然the Magnificent Seven公司已经获得了强劲的增长,但私营公司仍在等待市场稳定;人工智能芯片公司Cerebras已经申请IPO。
4. 在生成式人工智能的扩展热潮中,有一个团队花费超过10亿美元来训练一个大规模模型。
解释:还没有完全达到,可以等明年再看看。
5. 金融机构推出GPU债务基金,以取代风险投资股权美元用于计算资金。
解释:还没有,一些风险投资基金传闻提供GPU以换取股权,但还没见过有人走上债务路线。
参考资料:
https://x.com/nathanbenaich/status/1844263448831758767
https://www.stateof.ai/