在英伟达最近发布的一则视频中,其创始人兼CEO黄仁勋在家中厨房从烤箱里取出并展示了他“烘焙”出的一道尺寸只有手掌大小的“甜点”。其实,该“甜点”是一款超级计算机,即该公司推出的Jetson Orin Nano Super开发者套件,旨在为AI开发者提供原型开发平台。
该套件主要由两部分组成:Jetson Orin Nano 8GB模组以及一个参考载板。其中最主要的部件是被英伟达定义为系统级模组(SoM,System on Module)的Jetson Orin Nano 8GB模组。该模组配有英伟达Ampere GPU和6核ARM CPU,不仅支持摄像头模块,还能通过最高4通道的支持功能实现更高的分辨率与帧率。而参考载板则能为开发者提供常用的连接端口,包括千兆以太网、USB 3.2 Gen 2和 USB-C、DisplayPort 1.2、两个摄像头端口和双 M.2插槽以及一个WLAN模块。
让生成式AI推理速度提升70%,“Super之称”名副其实
相比上一代开发套件,全新Jetson Orin Nano Super的生成式AI推理速度提升70%,这也是新版本套件在命名中加上“Super”的原因之一。其背后的秘密,就在于GPU的时钟速度从635MHz提高至1020MHz。在常见的INT8数据格式中,张量内核每秒可进行670亿次计算操作,即能达到67TOPS,而此前版本仅有40TOPS。
除了Jetson Orin Nano 8GB模组,英伟达Jetson Orin系列其他模组的AI性能都得到了大幅提升。例如,Orin NX 16GB模组的性能从100TOPS提至157TOPS,而Nano系列的另一产品Nano 4GB也从20TOPS提至34TOPS。
在新版套件中,英伟达还配备了更快的LPDDR5-6400内存,以便更好地向算术单元传输数据。新版套件的传输速度为102.4G/s,相比前代产品高出50%。内存带宽的提升将尤其有助于大型语言模型(LLM,Large Language Model)处理性能的提升。其CPU核心频率从1.5GHz提至1.7GHz,功耗为7至25瓦。
基于上述产品性能的提升,Jetson Orin Nano Super套件在大语言模型聊天机器人的开发、视觉AI智能体的创造、以及AI机器人部署中都表现得更为出色。
助力边缘式AI和视觉AI等新兴领域的发展
从下方图表可看出,Jetson Orin Nano Super在大语言模型、视觉语言模型、视觉Transformer模型应用中的性能分别可提达到上代产品的最高1.63、2.04、1.60倍。
边缘式AI,是当前的热门AI细分领域之一。由于它无需依赖互联网就能及时提供实时信息,故在AI机器人、可穿戴设备、自动驾驶、安全摄像头和智能家电领域有着广泛应用。在边缘式AI中,AI算法或模型并不会被集中部署在云端,而是被直接部署在传感器或物联网设备等本地设备端,从而可以在边缘设备上直接进行机器学习,甚至在没有连接互联网时也能进行AI计算,并能在几毫秒内处理数据和提供实时反馈。如此快速的边缘式计算离不开高性能的AI处理,而Jetson Orin Nano Super套件不仅有出色的AI计算能力、快速的内存带宽和全面的软件堆栈,还支持任何基于Transformer的生成式AI模型,因此它是边缘式AI开发的理想工具。
视觉AI,能让数字设备像人类一样识别和处理图像或视频中的物体,并能进行判断与决策。其能用于3D视觉定位、人脸识别、零售店的OCR扫描、MRI重建、视觉瑕疵检测等。在视觉AI中,视觉语言模型(VLM,Video Language Model)可以为视频分析提供更动态、更灵活的处理方法。通过VLM,用户可使用自然语言与图像和视频输入进行交互。Jetson Orin Nano Super匹配了英伟达Metropolis平台,故能为开发者提供专门针对视觉AI的应用框架,从而可以更轻松地将视频摄像头或传感器、与AI视频分析加以结合。
除了上述平台之外,Jetson还能支持英伟达的各种AI软件,包括Isaac机器人平台、Holoscan传感器处理平台等。尽管新版本的性能更强,但其2070元的建议零售价却更加划算,在欧洲市场其售价仅约为上一代价格的一半。
总的来说,英伟达一直致力于提供广泛的AI开发生态系统,相信在Jetson Orin Nano Super的加持下,广大AI开发者也将实现更多突破。