客户端
游戏
无障碍

2

评论

3

1

手机看

微信扫一扫,随时随地看

GTC:老黄震撼发布B300,B200已破DeepSeek-R1推理世界纪录

图片

来源:OxyAI Studio李玉侠 | 首图:网络 | 作者:李玉侠

全文 800+ 字,预计阅 5-10 分钟


在2025年3月19日的GTC大会上,英伟达(NVIDIA)发布了一系列重要的硬件和软件产品,以下是关键信息:


一、硬件发布


1.1 新核弹B300芯片

图片

性能提升 相比去年发布的GB200芯片,GB300的推理性能提升了1.5倍。


出货时间 GB300预计将在2025年下半年出货。


1.2 B200打破DeepSeek-R1推理世界纪录

图片

性能表现 单个DGX系统配备8个B200 GPU,可实现每秒超过250个token的处理速度,最大吞吐量达到每秒超过30000个token。


未来展望 随着Blackwell Ultra等新GPU的推出,这一纪录有望被进一步打破。


1.3 下一代AI超级芯片Vera Rubin

图片

性能预览 Vera Rubin的整体性能是GB300的3.3倍,其中CPU内存是Grace的4.2倍,内存带宽是Grace的2.4倍,GPU将配备288GB的HBM4。


出货时间 预计2026年下半年发货。


1.4 个人AI超级计算机

图片

DGX Spark 采用GB10芯片,售价3000美元,大小与Mac Mini相当,能够提供每秒1000万亿次的AI运算。


DGX Statio 采用最新的GB300芯片,拥有784GB的相干内存空间和800Gb/s的网络速度。


二、软件开源

图片

2.1 NVIDIA Dyamo 

这是一个用于加速AI模型推理的分布式推理服务库,能够将DeepSeek-R1的吞吐量提升30倍。


2.2 Llama Nemotron 

新的AI推理模型,基于开源Llama基础模型构建,优化了计算效率和准确性。


三、其他进展


3.1 自动驾驶 


英伟达与通用汽车达成合作,将使用英伟达的AI技术开发自动驾驶系统。


3.2 人形机器人 

图片

推出Isaac GR00T N1,全球首个开源的、完全可定制的人形机器人基础模型。


这些发布和进展展示了英伟达在AI芯片和相关技术领域的强大实力和持续创新能力。

公号👇发消息“我来了”,可直接领取“10G+自动驾驶相关资料”

联 系 & 声 明

进交流群

号主六耳
知识星球
声明:除文内特殊声明外,本公众号内所有文章编写或转载的目的仅用于学习和交流,不予以商用,不代表本号观点及立场。本公众号内资讯及正文引用图片均由个人公众号 ADS 智库六耳基于官网或公开信息梳理或引用。本公众号所引用及转载内容版权均归原作者所有,凡是注明来源 “ XXX ADS 智库 ” 或作者为 “ XXX 六耳、XXX ADS 智库 ” 的文章转载或引用时请注明来源 ADS 智库。若有版权或其他任何问题请联系六耳( 微信号:adas_miao ),本号将及时处理。


,安排一下?
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部