耕升RTX 4070 SUPER 踏雪Mini显卡评测高性能ITX神器

中关村在线

2024-11-13 17:02发布于北京中关村在线官方账号

近期发售不少游戏大作，而通过我们此前的实机测试来看，70级显卡即可完美驾驭，其中又以后来发布的SUPER系列性价比最高。那么今天给大家带来的则是耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的评测。

踏雪Mini是目前耕升踏雪系列针对双风扇小尺寸显卡推出的型号，整体的设计语言与三风扇踏雪基本相同，但相对更圆润一些，非常符合ITX小巧迷你的设计初衷。

下面就让我们来一起看下耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的外观设计。

1 耕升GeForce RTX 4070 SUPER 踏雪Mini显卡概览

由于采用了双风扇设计，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡在外包装上也相对小巧，并且为踏雪标志性的白色雪花设计，在右侧有踏雪字样。

下面来看显卡本体，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡整体相对圆润，在显卡四边都有倒角处理。整体尺寸约为240×112×46mm（不含挡板），占用2槽空间，作为一款中高端产品来说，整体尺寸都非常小巧，能够兼容ITX机箱。

散热方面，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡整体采用了“踏雪Mini”散热器。主动散热的风扇部分，采用优化后的2个92mm炫风之刃风扇，经改良后提升风流量，并减低声噪，有效加强散热，纤巧的体积更可大大减低对机箱空间的要求。而风扇中央的扇标设计，则是熟悉的“雪花标”。

内部散热上，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡采用大面积紧密散热鳍片，高效铜板搭配多跟6mm复合式热导管。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的背板采用了踏雪系列标志性的纯白配色，带有耕升的英文字样，并有不规则雪花作为点缀。背板采用了穿透式散热系统设计，右方进一步加大积镂空间。

视频输出接口上，依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡侧面可以看到16pin供电接口，它的TDP功耗为220W，建议电源600W及以上。

2 NVIDIA GeForce RTX 4070 SUPER 架构浅析

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造，采用TSMC 4N NVIDIA定制工艺，旗舰核心AD102达到了的760亿个晶体管，而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升，最高可达到90-TFLOPS的着色器数据吞吐量。

本次发布的RTX 4070 SUPER共有7168个CUDA核心，提供了35.5-TFLOPS算力；56个第三代Ada RT Core拥有82.1 RT-TFLOPS；224个第四代Tensor Core可提供568 Tensor-TFLOPS（AI TOPS）。

RTX 4070 SUPER的L2 Cache容量为48MB，带宽为504 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性，我们以两张图来简单说明L2缓存的作用。

在真正的GPU中，内核是所有计算发生的地方，而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存，紧挨其处理内核，使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近，不可能非常大。

如果在L1缓存中找不到内核计算所需的数据，GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上，并通过一个非常高速的横梁系统连接到所有的GPC（图形处理集群），每个GPC包括多个SM。如果在L2缓存中找到了信息，那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息（被称为缓存缺失），那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量，并降低了性能和功耗效率。

更多详细的参数，我们为大家总结出了一张表格，可以看到从各方面的规格来说，这张RTX 4070 SUPER更接近于RTX 4070 Ti，但功耗相比RTX 4070只提升了20W。

3 测试平台简介

首先介绍一下测试平台，为了保障耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的性能发挥，我们的平台采用了上代旗舰i9-13900K。

下面还是来看看本次评测的显卡参数，目前最新的GPU-Z为2.60版本，参数识别较为详细。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡拥有7168个CUDA，Boost频率为2535MHz，较公版的2475MHz提升较大，但相比3风扇踏雪的2550MHz有小幅下降。

显存方面，12GB GDDR6X显存，位宽为192bit，显存带宽504 GB/s，光栅单元和纹理单元为80和224。

4 理论性能测试

本次耕升GeForce RTX 4070 SUPER 踏雪Mini显卡主要对比它的上下型号，RTX 4070 Ti以及RTX 4070。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装：FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能，取显卡分数实际测试结果如下：

在FS测试中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070，其中FS提升16%；FSE提升15%；FSU提升21%，综合提升17%。对比RTX 4070 Ti，综合成绩相差4%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相较RTX 4070的提升分别为：TS提升14%；TSE提升14%，综合约为14%。对比RTX 4070 Ti，综合成绩相差8%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相较RTX 4070的提升约为15%。对比RTX 4070 Ti，相差9%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡对比RTX 4070，提升为16%。

在DLSS 3的理论测试中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡在2K分辨率下DLSS开关相比RTX 4070的提升为15%/22%；4K分辨率，提升约为16%/22%。

从整体的理论测试成绩来看，传统的FS/TS/PR三项测试，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070综合提升约为16%左右；相比RTX 4070 Ti的差距在6%左右。

5 游戏性能测试

首先来测试一下由虚幻5引擎制作的《黑神话：悟空》，这款游戏支持DLSS以及FSR，并且均可开启帧生成，但是DLSS可以搭配全景光线追踪提供更逼真丝滑的游戏体验，所以我们本次DLSS测试，均在开启帧生成下记录帧数。

测试分别在2K及4K分辨率下进行，虽然RTX 4070 SUPER这张显卡定位2K高帧率的3A游戏，不过可以看到，在DLSS超级性能模式下，这张耕升GeForce RTX 4070 SUPER 踏雪Mini显卡也有着80帧的流畅水准。不过想要在打斗中享受电竞级帧率体验，还是建议在2K分辨率下。

另外目前《黑神话：悟空》的benchmark跑分软件没有全屏独占，只有窗口化全屏，所以在游戏内设置低分辨率，而桌面仍然用高分辨率的话，帧数提升并不明显。

经过实测，我们发现两端同步调节分辨率，相比只降低游戏分辨率，帧数差距非常大。如果玩家想通过降低分辨率来获得流畅的帧数，还需特别注意。

DLSS 效果对比

《黑神话：悟空》是目前我见过游戏中，DLSS效果最好的。可以看到，由于有复杂模型作为支撑，即便是在超级性能模式中，场景中所有的景物，包括主角的衣服，都和原生画质几乎毫无区别，但帧数相比原生画质，足足提升了200%还多。所以如果你感觉帧数不够，大可以将超采样清晰度降低一些，来获得稳定的高帧率。

在《极限竞速：地平线5》中，其中耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070提升明显，1080p达到12%，2K分辨率提升14%；4K分辨率提升17%，综合提升14%。

在《刺客信条：幻景》中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070的提升分别为：1080p提升8%；2K提升9%；4K提升15%，综合提升11%。

在《无主之地3》中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070的提升分别为：1080p提升21%；2K提升16%；4K分辨率提升16%，综合提升18%。

《光明记忆：无限》的光追测试软件是独立于游戏的测试工具，比游戏中用到的光线追踪技术更多，测试条件为“RTX最高/DLSS质量”。

性能方面，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡相比RTX 4070的提升分别为：1080p提升19%；2K提升22%；4K提升26%，综合提升22%。

在“游戏测试标杆”的《赛博朋克2077》中，耕升GeForce RTX 4070 SUPER 踏雪Mini显卡在超级画质下，2K分辨率百帧完全没有问题的；在光追超级画质下2K流畅运行同样没有问题；而作为次世代光追体验的超速模式中，2K分辨率下只有52帧。

不过上面我们的测试均为DLSS 2模式，尚未开启DLSS 3，下面在DLSS 3的专项测试中，能够看到帧数上的飞跃。

从上至下依次为超级画质/光追超级/光线追踪：超速模式。可以看到光线追踪：超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径，其实相比之前的光线追踪模拟了更多光线在不同表面的反射，完整的计算出了场景的真实光照，避免了上一代光追中出现“死黑”的情况。

另外《赛博朋克2077》更新了DLSS 3.5，支持光线重建技术。在上面的测试图中不难发现，光线重建能够更加精准的计算出反射部分的效果，接近于亮面金属表面的反射中，未开启RTX能够看出画质明显的区别，不再赘述。重点在于DLSS 3.5的开关效果，除了广告牌上所显示的内容更清晰外，放大后能够看到远处电线以及工业区建筑的细节外观。

6 DLSS 3性能测试

随着NVIDIA DLSS、NVIDIA Reflex以及先进的光线追踪技术的普及速度不断加快，现在已有超过600款RTX游戏和应用，为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

在DLSS 3的测试中，首先来看《赛博朋克2077》的，我们同样会将DLSS 3与DLSS 2的结果进行比对。

本次我们分别对《赛博朋克2077》，在三档画质下进行了DLSS 3的帧数测试，所有档位均开启DLSS质量记录帧数。

可以看到在2K分辨率下，在是光追超速模式，开启DLSS 3后耕升GeForce RTX 4070 SUPER 踏雪Mini显卡能达到80帧的成绩，已经是流畅运行标准。

另外DLSS 3技术主要针对于CPU瓶颈的游戏，所以也能够看到在越低的分辨率，帧数提升越大，其中光追超速的1080p分辨率能够达到50%左右的提升。

《地平线5》也是显卡测试的老朋友了，其出色的优化让很多入门级产品都能跑出较高的帧率。在耕升GeForce RTX 4070 SUPER 踏雪Mini显卡也有较明显的体现。在3种分辨率中，开启DLSS 3相比DLSS 2的提升分别为39%/28%/12%。

7 生产力工具测试

V-Ray

在生产力工具上，我们测试了最新版本的V-Ray渲染器，选择使用GPU渲染的CUDA测试和RTX测试，成绩如图。

Blender

Blender是一款专业的三维渲染软件，目前推出了固定的benchmark跑分软件，省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡得分分别为3023/1464/1536分，平均2008分。

8 AIGC测试-Procyon

AI时代不知何时已经离人们的生活越来越近，小到文本改写，大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力，不过目前NVIDIA推出了全新的TensorRT插件，可以充分调用Tensor算力，下面我们来测试一下耕升GeForce RTX 4070 SUPER 踏雪Mini显卡在这方面的性能表现。

我们的测试使用UL Procyon进行，在最新的测试项目中，SD1.5可分为INT8（8位整数）和FP16（半精度浮点）运算。

可明显看到，采用INT8的运算时间更快，不过这并不意味着INT8在性能上更具优势。

这里简单说明一下，INT8是使用更低精度的整数表示数据的一种方式，用于进一步减小模型的存储空间和加快计算速度。使用INT8可以在一定程度上降低模型的计算复杂度，特别适用于部署在资源有限的设备上，如移动设备、嵌入式设备等。

FP16则是一种占用存储空间较小的浮点数表示方法，用于在深度学习模型中减少模型参数和中间结果的存储需求，从而节省内存空间并提高计算效率。

不过在测试中并没有包含FP32的单精度浮点运算，其实在深度学习模型中，完整的逻辑应当包含在内，下面也简单进行介绍。

FP32是常见的浮点数表示方式，提供了更高的数值精度，适用于大多数深度学习模型的训练和推理过程。FP32 的精度比FP16高，但会占用更多的存储空间和计算资源。

所以从运算精度上来说：FP32 >FP16> INT8；而从内存占用上来说是：INT8 < FP16 < FP32。它们之间的精度和内存占用为正比的关系。

上图测试结果为模型更复杂的SDXL，可以看到测试总时间为262.015s；约合13.376 s/image。

另外，UL Procyon的AIGC测试同样使用了StableDiffusion进行批量生成，相较我们手动生成图片，结论更为精准。

9 RTX 视频超分辨率（RTX Video Super Resolution）测试

目前RTX 视频超分辨率（RTX Video Super Resolution）已经在部分浏览器中进行测试，首先玩家需要更新到NVIDIA最新驱动，在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

RTX 视频超分辨率是 AI 图像处理的突破，它超越了传统的边缘检测和特征锐化技术，极大地提升直播视频内容的质量。

开启RTX 视频超分辨率不仅需要最新版驱动，还需要使用RTX 40或30系列GPU，并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容（浏览器也需要更新到最新版本）。

开启后，目前已知的打开YouTube或者B站，都可以享受到RTX VSR效果的加成。

如果不确定，在全屏播放视频时，可以打开任务管理器，看到GPU负载增加，即为开启成功。

（点击放大查看原图）

在下面这幅图的对比中，可以明显看到开启RTX 视频超分辨率后，胡须明显更顺滑，已经看不出马赛克。

不过需要注意的是，RTX 视频超分辨率在低分辨率下效果会更明显，如果本身观看的视频为1080p或2K以上，则基本很难看出区别。

这对于一些网速不够快，只能看低分辨率视频的用户，或者视频片源本身不够清晰的情况，帮助非常大。

10 温度及功耗测试

功耗测试中，我们选择FurMark软件进行拷机测试，并采用GPU-Z检测温度，功耗仅计算显卡自身。

在最新的Furmark中，已经集成了相当多的功能，甚至还有benchmark跑分，不再是单纯的拷机软件。

耕升GeForce RTX 4070 SUPER 踏雪Mini显卡通过35分钟左右的拷机测试，温度在71℃左右，热点温度在82℃左右。

11 高性能ITX神器

RTX 4070 SUPER对于大部分玩家来说已经非常熟悉了，相比RTX 4070提升在15-20%左右，与RTX 4070 Ti的差距在5%左右，提升是巨大的，基本已经追到了RTX 4070 Ti的级别。

虽然从系列定位来看，RTX 4070 SUPER依然是一张定位2K分辨率的游戏显卡，但从性能来说它“进”可在4K畅玩独立大作，“退”可在1080p分辨率享受超高的电竞级帧率，而日常2K分辨率下，3A游戏百帧也是不成问题。

耕升这款耕升GeForce RTX 4070 SUPER 踏雪Mini显卡不仅集成了RTX 4070 SUPER的强大性能，更采用了双风扇小尺寸设计，可兼容绝大部分ITX机箱。

虽然双风扇在一定程度上让它的工作温度有所升高，但仍在正常范围内。不过相对来说更适合北方用户，而对于南方每年有八九个月温度在30℃以上的地区，还需要更良好的降温条件。

目前耕升GeForce RTX 4070 SUPER 踏雪Mini显卡在各大电商中均有售卖，感兴趣玩家不妨前去了解一下。

(9178173)

查看原图 120K

耕升RTX 4070 SUPER 踏雪Mini显卡评测 高性能ITX神器

耕升RTX 4070 SUPER 踏雪Mini显卡评测高性能ITX神器