英伟达推出Jetson Orin Nano Super开发者套件，让生成式AI性能提升70%

DeepTech深科技

2024-12-19 16:55发布于北京DeepTech深科技官方账号

在英伟达最近发布的一则视频中，其创始人兼CEO黄仁勋在家中厨房从烤箱里取出并展示了他“烘焙”出的一道尺寸只有手掌大小的“甜点”。其实，该“甜点”是一款超级计算机，即该公司推出的Jetson Orin Nano Super开发者套件，旨在为AI开发者提供原型开发平台。

该套件主要由两部分组成：Jetson Orin Nano 8GB模组以及一个参考载板。其中最主要的部件是被英伟达定义为系统级模组（SoM，System on Module）的Jetson Orin Nano 8GB模组。该模组配有英伟达Ampere GPU和6核ARM CPU，不仅支持摄像头模块，还能通过最高4通道的支持功能实现更高的分辨率与帧率。而参考载板则能为开发者提供常用的连接端口，包括千兆以太网、USB 3.2 Gen 2和 USB-C、DisplayPort 1.2、两个摄像头端口和双 M.2插槽以及一个WLAN模块。

让生成式AI推理速度提升70%，“Super之称”名副其实

相比上一代开发套件，全新Jetson Orin Nano Super的生成式AI推理速度提升70%，这也是新版本套件在命名中加上“Super”的原因之一。其背后的秘密，就在于GPU的时钟速度从635MHz提高至1020MHz。在常见的INT8数据格式中，张量内核每秒可进行670亿次计算操作，即能达到67TOPS，而此前版本仅有40TOPS。

除了Jetson Orin Nano 8GB模组，英伟达Jetson Orin系列其他模组的AI性能都得到了大幅提升。例如，Orin NX 16GB模组的性能从100TOPS提至157TOPS，而Nano系列的另一产品Nano 4GB也从20TOPS提至34TOPS。

在新版套件中，英伟达还配备了更快的LPDDR5-6400内存，以便更好地向算术单元传输数据。新版套件的传输速度为102.4G/s，相比前代产品高出50%。内存带宽的提升将尤其有助于大型语言模型（LLM，Large Language Model）处理性能的提升。其CPU核心频率从1.5GHz提至1.7GHz，功耗为7至25瓦。

基于上述产品性能的提升，Jetson Orin Nano Super套件在大语言模型聊天机器人的开发、视觉AI智能体的创造、以及AI机器人部署中都表现得更为出色。

助力边缘式AI和视觉AI等新兴领域的发展

从下方图表可看出，Jetson Orin Nano Super在大语言模型、视觉语言模型、视觉Transformer模型应用中的性能分别可提达到上代产品的最高1.63、2.04、1.60倍。

边缘式AI，是当前的热门AI细分领域之一。由于它无需依赖互联网就能及时提供实时信息，故在AI机器人、可穿戴设备、自动驾驶、安全摄像头和智能家电领域有着广泛应用。在边缘式AI中，AI算法或模型并不会被集中部署在云端，而是被直接部署在传感器或物联网设备等本地设备端，从而可以在边缘设备上直接进行机器学习，甚至在没有连接互联网时也能进行AI计算，并能在几毫秒内处理数据和提供实时反馈。如此快速的边缘式计算离不开高性能的AI处理，而Jetson Orin Nano Super套件不仅有出色的AI计算能力、快速的内存带宽和全面的软件堆栈，还支持任何基于Transformer的生成式AI模型，因此它是边缘式AI开发的理想工具。

视觉AI，能让数字设备像人类一样识别和处理图像或视频中的物体，并能进行判断与决策。其能用于3D视觉定位、人脸识别、零售店的OCR扫描、MRI重建、视觉瑕疵检测等。在视觉AI中，视觉语言模型（VLM，Video Language Model）可以为视频分析提供更动态、更灵活的处理方法。通过VLM，用户可使用自然语言与图像和视频输入进行交互。Jetson Orin Nano Super匹配了英伟达Metropolis平台，故能为开发者提供专门针对视觉AI的应用框架，从而可以更轻松地将视频摄像头或传感器、与AI视频分析加以结合。

除了上述平台之外，Jetson还能支持英伟达的各种AI软件，包括Isaac机器人平台、Holoscan传感器处理平台等。尽管新版本的性能更强，但其2070元的建议零售价却更加划算，在欧洲市场其售价仅约为上一代价格的一半。

总的来说，英伟达一直致力于提供广泛的AI开发生态系统，相信在Jetson Orin Nano Super的加持下，广大AI开发者也将实现更多突破。

查看原图 100K