来源:OxyAI Studio李玉侠 | 首图:网络 | 作者:李玉侠
全文 800+ 字,预计阅读 5-10 分钟
在2025年3月19日的GTC大会上,英伟达(NVIDIA)发布了一系列重要的硬件和软件产品,以下是关键信息:
一、硬件发布
1.1 新核弹B300芯片
性能提升 相比去年发布的GB200芯片,GB300的推理性能提升了1.5倍。
出货时间 GB300预计将在2025年下半年出货。
1.2 B200打破DeepSeek-R1推理世界纪录
性能表现 单个DGX系统配备8个B200 GPU,可实现每秒超过250个token的处理速度,最大吞吐量达到每秒超过30000个token。
未来展望 随着Blackwell Ultra等新GPU的推出,这一纪录有望被进一步打破。
1.3 下一代AI超级芯片Vera Rubin
性能预览 Vera Rubin的整体性能是GB300的3.3倍,其中CPU内存是Grace的4.2倍,内存带宽是Grace的2.4倍,GPU将配备288GB的HBM4。
出货时间 预计2026年下半年发货。
1.4 个人AI超级计算机
DGX Spark 采用GB10芯片,售价3000美元,大小与Mac Mini相当,能够提供每秒1000万亿次的AI运算。
DGX Statio 采用最新的GB300芯片,拥有784GB的相干内存空间和800Gb/s的网络速度。
二、软件开源
2.1 NVIDIA Dyamo
这是一个用于加速AI模型推理的分布式推理服务库,能够将DeepSeek-R1的吞吐量提升30倍。
2.2 Llama Nemotron
新的AI推理模型,基于开源Llama基础模型构建,优化了计算效率和准确性。
三、其他进展
3.1 自动驾驶
英伟达与通用汽车达成合作,将使用英伟达的AI技术开发自动驾驶系统。
3.2 人形机器人
推出Isaac GR00T N1,全球首个开源的、完全可定制的人形机器人基础模型。
这些发布和进展展示了英伟达在AI芯片和相关技术领域的强大实力和持续创新能力。
进交流群