科技旋涡作者|贾桂鹏
在即将过去的2024年,AI技术无疑是最炙手可热的科技词汇,其内涵和外延都在随着人们越来越广泛的认可和应用变得无比丰富,复杂且充满了争议,但是毫无争议的是,这项或者叫这类新技术正在像历史上的蒸汽机、内燃机、电动机或者互联网一样缓慢但是无可阻挡地向人类社会的方方面面进行渗透。
有关AI的新闻就像天气预报一样每天都在更新,科技旋涡按照月份选取了我们认为具有重要影响的AI大事件进行了盘点,也希望大家能提出自己的看法与我们探讨。
一月
在2024年1月,三星的年度机皇Galaxy S24系列国行版正式发布。三星Galaxy S24系列是三星贯彻“AI FOR ALL”愿景的首款深度结合了AI的智能手机产品,同时也将会是未来一段时间内三星实现各种AI功能的重要载体。
Galaxy S24系列以Galaxy AI赋能更轻松的沟通、更高效的生产力、更清晰的影像和更细致的编辑,三星的目标是通过这款手机“推动AI创新成果的普及”。
新年伊始,斯坦福大学一个学生团队造出的“阿罗哈机器人”(Mobile ALOHA)火出了圈。在视频里,它熟练地切菜、打鸡蛋、翻炒、装盘,让人惊呼机器人取代厨师的日子可能不远了。
不过,在阿罗哈爆火后,其研发团队介绍,在阿罗哈完成一些复杂动作时,其背后会有一名操作员移动遥感手臂,再通过传感装置让操作手臂实现动作意图。但这也让人们首次畅想机器人能改变生活。
二月
2024年2月,苹果推出了其首款头戴设备Vision Pro。这款设备定价高达3500美元,旨在为用户提供全新的混合现实体验。
然而,Vision Pro的市场反应充满争议。一方面,苹果在技术上有所创新,但另一方面,其应用场景尚不明确,面向的用户群体存在很大争议。此外,高昂的价格也让不少消费者犹豫不决。
2024年2月15日,农历大年初六,OpenAI发布了其首个AI视频生成模型Sora,标志着一个历史性的里程碑。OpenAI在视觉领域实现了类似于大型语言模型的重大突破,无疑将在视觉生成领域引发一场重大的技术和商业革命。
但似乎Sora只在2024年的头和尾出现,其间并没有让用户感受到这款文生视频应用的价值,还是让人们有些失望的。
三月
3月18日,人工智能(AI)芯片龙头厂商英伟达在美国加州圣何塞召开了GTC2024大会,正式发布了面向下一代数据中心和人工智能应用的“核弹”——基于Blackwell架构的B200 GPU,将在计算能力上实现巨大的代际飞跃,预计将在今年晚些时候正式出货。同时,英伟达还带来了Grace Blackwell GB200超级芯片等。
英伟达创始人兼CEO黄仁勋表示,Blackwell构架B200 GPU的AI运算性能在FP8及新的FP6上都可达20 petaflops,是前一代Hopper构架的H100运算性能8 petaflops的2.5倍。在新的FP4格式上更可达到40 petaflops,是前一代Hopper构架GPU运算性能8 petaflops的5倍。
四月
在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA 3。据称,该模型将有多个具有不同功能的版本。
而据科技外媒报道,作为对标GPT-4的大模型,LLaMA 3的大规模版本参数量可能超过1400亿,而最大的LLaMA 2版本的参数量为700亿。LLavMA 3将支持多模态处理,即同时理解和生成文本及图片。
值得注意的是,LLaMA 3将延续Meta一直以来的开源路线。目前,开源模型界的竞争正在变得愈发激烈,开源大模型亦进化得越来越强大。
五月
2024年5月8日,谷歌DeepMind与IsomorphicLabs 联合在《自然》期刊上发布蛋白质领域最新人工智能模型AlphaFold 3!这一模型能够准确预测蛋白质、DNA、RNA 以及配体等生命分子的结构及其相互作用方式。
在预测类药物相互作用方面,AlphaFold 3实现了前所未有的准确度,包括蛋白质与配体的结合以及抗体与其靶蛋白的结合。在PoseBusters的基准测试中,AlphaFold 3的准确率比现有最佳传统方法高出 50%,而且无需任何结构信息输入,成为首个超越传统物理预测工具的人工智能系统。这种预测抗体与蛋白质结合的能力,对于理解人类免疫反应的各个方面以及新抗体的设计至关重要。
当地时间5月13日,OpenAI通过直播展示了产品更新。与此前传出的市场消息不同,OpenAI并未推出搜索引擎,也未推出GPT-4.5或GPT-5,而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。
据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。
同样在5月,微软再Build大会上,正式发布“Copilot+PC”,并将其称为全球首个为AI设计的Windows PC。
在这场发布会上,高通、联想、戴尔、宏碁、华硕、三星等供应商和OEM厂商系数到齐,一同加入Copilot+PC阵营,微软也对旗下自有的Surface产品线进行了更新。
六月
6月11日,WWDC 2024正式拉开帷幕。在本次发布会上,苹果一如既往地发布了iOS 18、iPadOS 18、macOS 15等软件系统,而万众瞩目的「苹果AI」也随着这些系统正式展现在了大众面前,苹果将其命名为Apple Intelligence。
Apple Intelligence是一款适用于 iPhone、iPad 和 Mac 的个人智能系统,它将生成模型的强大功能与个人情境相结合,提供非常有用且相关的智能。
当地时间6月13日,特斯拉举行了股东大会,马斯克承诺:特斯拉将在2025年开始“限量生产”擎天柱机器人,并于明年在自己的工厂测试仿人机器人。马斯克预测,明年将有“1000多个或数千个擎天柱机器人在特斯拉工作。”
马斯克对Optimus机器人的市场前景充满信心,他指出,当前拟人机器人市场年产高达10亿台,特斯拉计划至少占据其中的10%份额。
八月
8月6日,获OpenAI、微软、英伟达等投资的人形机器人初创公司Figure AI发布了第二代人形机器人Figure 02,并介绍道:“这是地球上最先进的AI硬件,距离向工业用户销售量产人形机器人的目标又近了一步。”
与一代机器人相比,Figure 02在硬件和软件上均有重新设计,人工智能、计算机视觉、电池、传感器和执行器等关键技术有所升级。据悉,Figure 02已在宝马斯帕坦堡工厂的生产线上进行测试,执行部件放置任务。
九月
9月10日,2024年苹果秋季新品发布会正式召开,会上发布了iPhone 16。iPhone 16是首款搭载苹果人工智能的手机,所以iPhone 16系列的芯片也大幅增强了AI方面的性能。iPhone16系列搭载苹果A18芯片系列,相比iPhone 15采用的A16仿生芯片,A18系列芯片性能实现跨代提升,CPU速度最高提升30%,GPU速度最高提升40%。
苹果表示,iPhone 16系列为苹果智能而设计,利用苹果芯片和苹果设计的生成式模型结合用户个人情境,实现实用且与iPhone用户高度相关的智能功能,苹果智能可协助用户轻松写作、表达自我、处理各种事务。
9月,Meta在Connect大会发布了一款原型产品Orion,再次将AR眼镜的未来拉近现实。作为全球首款真无线AR眼镜,Orion抛弃了传统笨重的线缆,实现了轻量化和高算力,成为AR硬件发展史上的一个重要里程碑。
Orion的分体式无线设计是最大的亮点——眼镜本体搭配手势追踪腕带和计算模块,通过无线连接实现强大的空间计算能力。加上70度视场角的波导显示和自然的人机交互,它展示了真无线AR眼镜的无限可能。
十月
2024年10月11日,特斯拉召开主题为“We,Robot”的Robotaxi演示活动,发布了名为Cybercab的Robotaxi。整场活动,马斯克一共展示了三个产品:Robotaxi、Robovan、Tesla Bot,以及自动驾驶方面的新动态。
另外,这次发布会,看起来演示的依然是Optimus Gen2,马斯克也没有明确表示它是否是新的Optimus。它在现场丝滑跳舞,并在现场为客人调酒。马斯克表示,未来人形机器人可以做很多日常工作,当未来成本降到两三万美元的时候,会比车更便宜,相信全球80亿人都会想要它。
十二月
当地时间12月5日—20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman)还在四场直播中现身站台,我们似乎离AGI(Artificial General Intelligence,通用人工智能)又更近了一步。
这次连续12天直播的噱头是OpenAI将焦点转向其技术并为其产品造势的一种方式。这是公司积极发展计划的一部分,因为它要与创业公司和科技巨头争夺生成式人工智能市场的更大份额。
与此同时,谷歌DeepMind首席科学家Jeff Dean宣布推出全新测试模型——Gemini 2.0 Flash Thinking。Dean通过一段视频展示了该模型如何解答物理问题,并提供解决方案。
该模型可以通过可视化的方式展示整个思维链过程,可以持续输出推理过程,而不是直接给出答案。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在社交平台上分享道,“这是我们到目前为止,经过最多仔细研究和设计推出的模型。”
写在最后
不难发现,2024年,AI落地应用开始深度与广度并存,既有在特定领域的深耕细作,也有跨领域的融合创新。同时,应用场景逐步多样化,AI已经无处不在。此外,AI对行业赋能的效果愈发显著,无论是提升效率、降低成本,还是优化体验、拓展应用,AI都展现出了强大的价值创造力。
未来,人工智能行业的发展将更加注重技术的深度融合、应用的广度拓展与价值的深度挖掘。随着技术的持续进步与应用场景的不断创新,AI将在更多领域展现出其无限潜力与巨大价值。而那些能够紧跟时代步伐、勇于创新实践的企业与项目,无疑将成为引领行业发展的佼佼者。