一、前言
自从年终奖到账后,我就开始纠结:等RTX 50系列显卡上市时,究竟该选5090还是5080呢?作为当之无愧的旗舰卡皇,RTX 5090带来极致性能的同时,注定要面临首发即断货和黄牛溢价的局面,非公版售价预计2万元以上;而RTX 5080的性能虽不及RTX 5090,但在4K游戏和生产力创作场景中也能做到游刃有余,非公版售价大概率落在万元区间,更能贴合普通玩家的预算。在没有正式官宣之前,应该会有不少小伙伴像我一样在5090和5080之间反复摇摆,静待RTX 50系列显卡正式发布。
终于,在2025年1月举办的CES展会上,NVIDIA正式发布了备受期待的RTX 5090和RTX 5080显卡。两款产品基于全新Blackwell架构,首次搭载GDDR7显存,独占黑科技DLSS 4。两款显卡通过显存规格、CUDA核心数和功耗设计的差异化布局,形成了清晰的旗舰与次旗舰市场定位——RTX 5090以21760个CUDA核心和32GB显存专攻极致性能领域,RTX 5080则以10752个CUDA核心和16GB显存偏向高性能兼具性价比的主流市场。
至于RTX 5090和RTX 5080该如何选择,我是这么考虑的:
● 从参数看,RTX 5090的综合性能领先RTX 5080差不多50%,但这一差距主要体现在8K分辨率、极端光追渲染或专业计算等应用场景,对于普通玩家的4K游戏、生产力创作需求,RTX 5080完全可以满足。
● 从功耗看,RTX 5090的功耗高达575W,需搭配1000W以上电源和更高端的散热系统;RTX 5080功耗为360W,对现有的中高端电源以及散热的兼容性更好。
● 从价格看,公版RTX 5090的国行售价约1.65 万元,RTX 5080国行售价8299 元。初期非公RTX 5090的售价超过RTX 5080的两倍,而作为次旗舰的RTX 5080,供货更充足、价格波动也更小一些。
虽说预算还算充足,但像我这类只有普通需求的消费者,理性消费比一步到位更实际。RTX 5080能满足4K游戏、视频剪辑、AI 绘画等主流应用场景, 省下的预算可以优化其它硬件或外设,何乐而不为呢?当然,如果你有8K游戏、专业3D渲染或大规模AI模型训练的需求,拥有极致性能的RTX 5090更适合你!
最终,我入手了微星RTX 5080 16G SUPRIM 超龙 SOC(下文简称微星RTX 5080 超龙 SOC),接下来就和大家分享这张微星“顶配规格”RTX 5080显卡的使用体验。
二、解读NVIDIA Blackwell架构
从完整的架构核心图看,NVIDIA Blackwell依然沿用GPC-TPC-SM层级架构,采用TSMC 4NP工艺制造,通过双芯片互联(10TB/s带宽)实现单GPU算力突破20 PetaFLOPS(FP4精度),专为游戏玩家和创作者打造。
此外,Blackwell架构带来第五代Tensor核心、新型SM多单元流处理器、第四代RT核心等重要升级,借助基于AI的神经渲染与神经着色技术加速开发者在应用中集成AI功能,包括实现生成式AI渲染与仿真技术的实时应用等。
关于架构的解读会涉及大篇幅专业术语,我想应该没多少人喜欢看这类晦涩难懂的内容,所以这里我提炼了Blackwell架构的核心特性,方便小伙伴们认识NVIDIA Blackwell。
1. 针对神经网络着色器优化的全新SM,全新RT Core与Tensor Core功能进一步增强并加速神经渲染能力。相比上一代NVIDIA Ada GPU,Blackwell SM的每时钟周期的整数运算吞吐量翻倍,可大幅提升对神经着色至关重要的地址生成任务的性能。
2. 第四代RT Core,将原有的三角形求交引擎升级为三角形集群求交引擎,以集群方式处理的求交性能提升了1倍;新增线性扫描球体(LSS),使用球体代替三角形来获得更准确的毛发形状拟合,能够大幅减少所需的几何图形数量,提升光线追踪中毛发处理效率。
3. 第五代Tensor Core,新增对FP4精度的支持,AI算力翻倍的同时内存需求减半(比如FLUX.dev模型VRAM占用从23GB降至10GB);采用第二代FP8 Transformer引擎,支持混合精度计算,能更好的适配生成式AI模型。
4. NVIDIA DLSS 4,全新帧生成 AI 模型速度提高了 40%,显存占用降低了 30%,并且只需运行一次即可为每个渲染帧生成多达3帧,使DLSS 4帧率较DLSS 3/3.5提升最高2倍,较传统图像渲染帧提升最高8倍,在保持或超越原生画质的同时降低系统延迟。
5. 提升能效的全新MaxQ,集成多项MaxQ电源管理创新技术,先进电源门控与新型分体式供电轨设计,可实现精细化供电控制,时钟动态调整速度较前代GPU架构提升1000倍,动态调频速度提升1000倍,响应延迟降至纳秒级,深度睡眠状态进入速度比Ada快10倍。
6. AI管理处理器(AMP),独立调度AI与图形任务,允许多个AI模型(语音、翻译、视觉、动画、行为等)与图形任务共享GPU资源,降低CPU负载,提升多任务效率。
7. 更新编解码技术,支持DisplayPort 2.1b UHBR20,新增MV-HEVC和4:2:2的编解码支持,可提高创作者的效率,采用第9代编码器和第6代解码器,提供AV1 UHQ和2x H.264解码功能。
目前,已经发布的基于Blackwell架构的显卡型号包括RTX 5090、RTX 5080、RTX 5070Ti和RTX 5070,旗舰型号RTX 5090搭载GB202 GPU(Blackwell家族最强芯片),RTX 5080采用GB203 GPU,RTX 5070则基于GB205 GPU。4/5月份还会发布甜品级型号RTX 5060Ti和RTX 5060,我还挺期待5060Ti的表现。
三、开箱与配件介绍
以往旗舰级显卡的包装盒的外观大都是清一色的炫酷、硬核风格,但微星SUPRIM系列反其道而行之,一代比一代更简约、更内敛,到了RTX 5090/5080 SUPRIM超龙,包装盒的外观竟然变得“优雅”了起来。
微星RTX 5080 超龙 SOC的包装盒正面是超龙专属“钻石晶体”LOGO和“SUPRIM”字样,左上角是微星LOGO,右上角的“SOC”标签说明这张显卡是超频版(比OC版更激进的超频方案),白色的背景上添加立体效果的钻切元素,如果不是右下角“5080”标识,谁能把它和一张性能超群的显卡联系在一起呢!
背面介绍了微星RTX 5080 超龙 SOC的暴风之怒散热系统,主要包括暴风7风扇、方形核心热管、真空腔散热板、波浪形鳍片 4.0和导流鳍片 2.0等。
显卡的附件一般都比较简单,微星RTX 5080 超龙 SOC有1条3x8pin转12V-2x6接口转接线和1个迷你显卡支撑架。
转接线使用了与微星ATX 3.1电源的显卡供电线相同的黑黄异色插头,接线的时候方便我们确认线材是否插紧。
显卡支撑架默认高度60mm,把顶部拧松后可调节支撑杆的高度,最大高度约98.6mm,底部直接约23mm,带有磁吸垫片,固定在机箱上的同时不会占用太大空间。
四、外观与细节展示
微星RTX 5080 超龙 SOC的外观以银黑为主色调,设计风格主打硬核和质感,八角形几何结构的导风罩,设计灵感来源于钻石切割工艺,线条硬朗、棱角分明,视觉上具有很强的立体层次感。
显卡的背部很迷人,金属背板表面融合了拉丝和磨砂两种处理工艺,将这块金属背板划分出三个不同灰度的区域,视觉效果拉满,稳稳拿捏了我这枚理工男的审美。尾部是一块大面黑色积镂空区域,与正面的风扇形成对流,可有效加速散热效率。
显卡中间是两块表面拉丝工艺处理的金属中框,质感很足,增强了显卡的刚性和耐用性。仔细观察可以发现,金属中框的边缘进行了精心打磨,呈现出金色切割痕迹,细节处理非常用心。
微星RTX 5080 超龙 SOC配备三把微星最新款暴风7风扇,有7个圆形弧线设计的扇叶,表面有龙爪纹理的导流槽,起到集中气流、增强风压的作用。官方宣称相较于RTX 40系列配备的刀锋7代风扇风量和风压分别增加了14.7%和31.1%,冷却效率可见一斑。
说到暴风7风扇,就不能不说一说微星RTX 5080 超龙 SOC的暴风之怒散热设计,它结合了暴风7风扇、方形核心热管、真空腔均热板散热技术和散热鳍片形状,兼具高效散热和安静的噪音体验。内置的均热板能迅速吸收来自GPU芯片和显存的热量,将其传递至核心热管,再通过包裹在周围的鳍片配合暴风7风扇挥发散热。
值得一提的是,微星RTX 5080 超龙 SOC配备了多达11根核心热管,其中有7根更是直径8mm的超级热管,导热效能远高于普通6mm热管。
显卡供电接口是16Pin 12V-2×6接口。需要提醒的是,有些电源的显卡供电线虽然接口规格能对上号,但插上之后能点亮显卡但点不亮显示器,需要使用配件中的3x8pin转12V-2x6转接线(3个8pin插满)才能正常开机。
在供电接口的上方有一枚双BIOS开关,可切换GAMING或SILENT模式,但两个模式的配置文件不会影响满载时的最高核心频率,而是影响风扇最高转速和满载功耗。在满载状态下,GAMING模式的风扇转速1620RPM,SILENT模式的风扇转速1060RPM;待机功耗不变,满载功耗提升至110%左右。
视频接口为1个HDMI 2.1b和3个DisplayPort 2.1b,最高支持4K@480Hz或8K@120Hz视频输出,支持分辨率最高7680x4320,也就是大家常说的8k。
不难发现,微星RTX 5080 超龙 SOC从设计灵感到外观造型再到细节装饰都围绕“钻石”展开,导风罩的风扇槽、显卡一角切出的斜面放置了一枚钻石LOGO、风扇中轴的装饰贴片、显卡侧面的亚克力发光板全都是钻石和SUPRIM元素,细节满满。
上机效果
微星RTX 5080 超龙 SOC尺寸约359x150x76 mm,安装时,I/O挡板是2槽的宽度,散热系统约2槽的宽度,实际厚度接近4槽的宽度,不过在安装时,只有I/O挡板有固定螺丝孔。而这张卡的重量约2614g,安装后切记使用显卡支架顶住另一端。
上机后,不论开灯还是关灯的效果都很赞,各有各的韵味。
五、性能测试
本次测试平台基于英特尔酷睿Ultra7 265K + 微星MEG Z890 ACE 战神打造,驱动已升级官网最新版,系统版本Windows 11 24H2,电源850W,确保可以充分发挥出微星RTX 5080 超龙 SOC的性能。
主板:微星 MEG Z890 ACE 战神
CPU:英特尔 酷睿 Ultra 7 265K
显卡:微星RTX 5080 16G SUPRIM 超龙 SOC
内存:海盗船复仇者48GB 8200MHz CUDIMM
SSD:朗科 NV7000-t PCIe 4.0x4 2TB
水冷:微星MAG CORELIQUID 寒冰I360 WHITE
电源:微星MAG A850GL 金牌全模ATX3.1 白色
机箱:微星白刃PLUS E-ATX机箱
3DMARK Time Spy Extreme 是针对4K分辨率 DirectX 12 游戏的性能测试,测试结果15489分,其中微星RTX 5080 超龙 SOC得分16357分。这项测试还预估了当前几款热门游戏的帧率,2K分辨率比较有参考价值:
战地5:200+FPS
Apex:140+FPS
GTA V:185+FPS
荒野大镖客2:125+FPS
堡垒之夜:140+FPS
Steel Nomad是一种针对高端游戏电脑的跨平台、非光线追踪基准测试,默认使用 DirectX 12 API。微星RTX 5080 超龙 SOC的综合测试结果7783分。
Port Royal测试结合了实时光线追踪和传统渲染技术来测量显卡性能。 场景具有光线追踪反射,阴影(光线追踪和阴影映射),具有光线追踪反射的玻璃表面,体积照明,粒子和后处理效果。
渲染分辨率为2560×1440,微星RTX 5080 超龙 SOC该项测试得分22010分,帧率101.90FPS。
NVIDIA DLSS功能测试:4K分辨率时,关闭DLSS帧率48.84FPS,开启DLSS帧率提升到182.61FPS,提升约274%。这项测试可以看出,NVIDIA的DLSS技术对游戏帧率的影响非常明显,尤其在开启光线追踪后。这里先卖个关子,后面我会结合游戏更直观的表现光线追踪与DLSS的关系。
DirectX光线追踪功能测试结果,4K分辨率平均帧率 99.68FPS。
六、游戏体验
归功于全新Blackwell 架构和支持多帧生成技术的 DLSS 4,根据官方给出的游戏数据显示,RTX 5080 的游戏运行速度几乎是RTX 4080的2倍,960GB/s的显存带宽比RTX 4080增加了约34%,游戏性能有了巨大提升。
说到游戏体验,就绕不开光线追踪和DLSS这两项热门技术
光线追踪通过模拟真实世界的光线特性渲染出更逼真的游戏画面,创造身临其境般的游戏体验。借助由第四代 RT Core 以及第五代 Tensor Core 加速的突破性神经网络渲染技术,Blackwell 架构解锁全景光线追踪的全新逼真效果。
一组《巫师3》游戏画面对比,光线追踪对游戏观感的加成一目了然,色彩更浓郁,花草、树叶这些小细节更丰富、更有层次感,光影效果也更逼真,画面的质感很让我惊艳。
开启光追后的画质和细节的表现力都有非常大提升,但这也意味着占用更多显卡资源,导致游戏帧率大幅下降,这时就轮到NVDIA DLSS出场了。DLSS帧生成的功能是在不影响画质和响应速度的前提下,利用AI技术创造更多高质量帧,提升画面流畅度。
《巫师3》中,2K分辨率开启超级光追+关闭DLSS帧生成时,帧率92 FPS;开启DLSS帧生成后帧率144 FPS,提升了约56.5%。
DLSS 4多帧生成与DLSS 3的帧生成有多大差距呢?以《赛博朋克2077》为例,2K分辨率最高画质开启超级光追,DLSS 3帧生成游戏帧率164FPS,DLSS 4多帧生成游戏帧率达到287FPS,提升约75%,可谓是提升巨大。
值得一提的是,之前的DLSS 3采用卷积神经网络 (CNN),通过分析局部上下文以及追踪连续帧中有关区域的变化来生成新像素。DLSS 4则应用了全新Transformer模型,使用双倍于CNN模型的参数量来更深入地理解场景,所生成的像素具有更好的稳定性、更少的伪影、更丰富的运动细节,边缘也更平滑。
《赛博朋克 2077》的超分预设中就给出了卷积神经网络和Transformer模型(50系显卡)两个选项,从下图可以看出,卷积神经网络的画面中出现了本不该存在的汽车后备箱盖的倒影(俗称伪影),本该出现在汽车侧身的倒影和排气口处的尾气却没有出现在画面里,而这些对细节的混乱表达在Transformer模型中得到了有效改善,这些改进可以让玩家在游戏中获得更加生动逼真的游戏体验。
《黑神话:悟空》
《黑神话:悟空》基于虚幻引擎5打造,支持Nanite虚拟几何体,可导入数十亿面片等高精度模型,细节表现力达到电影级;支持 Lumen动态全局光照,可实时计算间接光照与反射,结合全景光线追踪技术,精确模拟自然光效(如丁达尔效应、动态阴影),提升场景沉浸感;支持真实物理破坏效果,还原建筑崩塌、毛发与液体交互等效果,游戏体验很棒,但对显卡的要求极高。
2K分辨率+影视级画质+高级全景光追+DLSS质量+帧生成,游戏内置Benchmark测试平均帧率125FPS,在实际游戏中的帧率和测试基本一致,能维持在125FPS上下。
《赛博朋克2077》
《赛博朋克2077》由CD Projekt Red(CDPR)自主研发的游戏引擎RedEngine打造,支持动态全局光照、高精度物理渲染和复杂粒子特效,尤其在光线追踪技术上的表现突出,是迄今为止视觉设计上最令人叹为观止和图形密集型的引擎之一,被很多媒体标榜硬件性能的“标杆级”测试工具。
2K分辨率+超级光追+最高画质,Benchmark测试平均帧率261FPS,最高帧率达到283FPS。
《荒野大镖客2》
《荒野大镖客2》是迄今为止我玩过视觉效果最震撼的开放世界游戏之一,游戏基于RAGE引擎打造,拥有极高的图形细节,需要强大的硬件性能才能流畅运行。
在游戏中,4K分辨率+最高画质的帧率最高能到130FPS;2K分辨率+最高画质的最高帧率能到190FPS。
《刺客信条:幻景》
《刺客信条:幻景》使用育碧的Anvil引擎打造,它能够游刃有余地处理游戏中人口稠密的战场、茂密的森林以及错综复杂的城市环境,同时引入全局光照、模拟动态天气等,这些特性贯穿于整个游戏之中。游戏内置Benchmark的测试结果,2K分辨率最高画质,平均帧率159FPS,1%low帧109FPS。
《PUBG》
2K分辨率最高画质,游戏帧率最高能到280FPS,烟内帧率也能超过230FPS;4K分辨率最高画质,游戏帧率最高能到220FPS。
《CS2》
2K分辨率最高画质,游戏内正常场景的帧率维持在320+FPS;创意工坊Benchmark地图几乎包含了游戏内玩家能遇到的所有场景,综合测试平均帧率高达358FPS。
七、AI性能测试
为了保证测试结果的客观性,AI性能测试使用UL Procyon 基准测试套件完成,需要对比显卡AI性能的小伙伴可以参考详细数值。
AI图像生成测试
Stable Diffusion 1.5 FP16模型,测试总分4939,共耗时20.244s,速度1.265s/张。
参数设置:
批次大小:4
迭代步数:100
生成图像数量:16
图像分辨率:512*512
Stable Diffusion 1.5 INT8模型,测试总分50604,共耗时4.940s,速度0.618s/张,平均UNET速度:84.880it/s。
参数设置:
批次大小:1
迭代步数:50
生成图像数量:8
图像分辨率:512*512
Stable Diffusion XL FP16模型,测试总分4336,共耗时138.363s,速度8.648s/张。
参数设置:
批次大小:1
迭代步数:100
生成图像数量:16
图像分辨率:1024*1024
AI文本生成测试
AI Text Generation Benchmark可以反复且一致地测试多个LLM AI模型,测试的模型包括PHI 3.5 mini、MISTRAL 7B、LLAMA3.1 8B 和 LLAMA2 13B,使用OpenVINO运行测试,测试结果如下:
PHI 3.5 mini:总分5006、平均TTFT 0.21s、平均OTS 205.81tokens/s、加载时间2.43s;
MISTRAL 7B:总分5172、平均TTFT 0.28s、平均OTS 165.01tokens/s、加载时间3.16s;
LLAMA3.1 8B:总分4589、平均TTFT 0.26s、平均OTS 137.15tokens/s、加载时间4.6s;
LLAMA2 13B:总分5033、平均TTFT 0.44s、平均OTS 83.03tokens/s、加载时间5.48s。
生产力应用测试
这里测试的生产力工具是大家平时常用的Adobe软件(Ps+Pr+Lr),为了保证数据客观性,我依然使用UL Procyon对这几款Adobe软件进行更专业的性能测试,通过最后的分数量化电脑在执行编辑、导出任务时速度。
针对Adobe Photoshop和Lightroom的照片编辑基准测试分数:8434
UL Procyon照片编辑基准测试在照片编辑工作流程中使用Adobe Lightroom Classic和Adobe Photoshop。这项照片编辑基准测试首先将数字负片 (DNG) 图像文件导入Adobe Lightroom Classic,然后应用各种预设;部分图片会被裁剪、拉直和修改。在测试的第二部分中,将多个编辑和图层效果应用于 Adobe Photoshop 中的照片上。
针对Adobe Premiere的视频剪辑基准测试分数:62034
UL Procyon视频编辑基准测试在视频编辑工作流程中使用Adobe Premiere Pro,使用相关的应用来确保基准测试的分数可以反映出整个系统在实际使用时的表现。基准测试首先导入两个视频项目文件,项目时间线上包括各种编辑、调整和效果;第二个项目使用多个 GPU 加速效果。每个视频项目会使用H.264编码的Full HD格式和HEVC (H.265)编码的4K UHD格式进行导出。
八、功耗和噪音
微星RTX 5080 超龙 SOC的待机功耗只有10W左右,FurMark显卡压力测试2K分辨率满载运行20分钟,微星RTX 5080 超龙 SOC的最高温度只有62°C,显存温度只有58°C,核心功耗139W,整卡功耗360W。
微星RTX 5080 超龙 SOC的风扇支持智能启停功能,桌面待机时转速为0,噪音47.1dB;显卡满载时风扇转速1600转,噪音48.3dB,由此可见,暴风7风扇不仅散热效率高,对噪音的控制也灰常牛X。
九、总结
如果用一个词形容微星RTX 5080 超龙 SOC的体验,我会用“全能六边形战士”。得益于NVIDIA Blackwell架构的全面升级以及高品质硬件的基础保障,微星RTX 5080 超龙 SOC在3A游戏、AI创作以及生产力创作等应用场景中都有不俗表现,尤其在游戏方面,可以轻松驾驭几乎所有主流游戏的2K分辨率最高画质(最高级光追)以及4K分辨率次顶级画质,随着最新支持DLSS 4多帧生成的游戏发布,超过100 款游戏和应用借助这项技术实现性能倍增,未来可期!
OK,以上就是本次体验的全部内容,感谢大家观看。