嗯,对于影驰的BOOMSTAR星曜系列产品线,我想不用我再做过多的介绍了吧?单是RTX 40系的首发评测,我们就已经先后品鉴了RTX 4080星曜OC和RTX 4070 Ti星曜OC。这一次RTX 4070 GPU上市之时,来到MC评测室的影驰首发产品仍然是以炫美闪亮著称的星曜系列——影驰GeForce RTX 4070星曜OC(后文简称RTX 4070星曜OC)。
影驰GeForce RTX 4070星曜OC在GPU核心上采用的是NVIDIA新上市的代号为AD104-250 Ada Lovelace架构的RTX 40系最新成员RTX 4070,在技术特性上自然传承了Ada Lovelace架构的全部特色。嗯,是不是知道我要说什么了?对!复习Ada Lovelace架构的核心技术特色,咳咳,这是必须的。当然,如果你已经非常了解,那么就跳过这部分吧。(每逢首测,重复N+1遍,嗯)
来自Ada架构的RTX 40系GPU技术创新RTX 40 系列 GPU 具有一系列新的技术创新,包括:
缓存暴增
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
相对RTX 4070 Ti小精简,DLSS 3性能可期
先了解一下RTX 4070这颗GPU吧。从NVIDIA的官方白皮书资料来看,RTX 4070基本是在AD104-400核心的RTX 4070 Ti基础上做减法而来,从代号AD104-250也能看出端倪,跟当初GA104-400的RTX 3070 Ti到GA104-250的RTX 3070操作手法相似。不过当初从GA104-400到GA104-250时,NVIDIA只是对其进行了小刀——仅仅砍掉了两组SM单元,略微削减了一点显存带宽而已,这也导致RTX 3070和RTX 3070 Ti在价差和性能上并不匹配而导致RTX 3070 Ti陷入了比较尴尬的境地。
显然,这一次从RTX 4070 Ti到RTX 4070几乎可以说是简化较大——直接砍掉了14组SM单元,规格硬性精简近1/4。所以,RTX 4070一共拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。不过在显存方面仍然保持了RTX 4070 Ti的12GB GDDR6X配置,显存位宽仍然为192bit,总带宽为504GB/s,与RTX 4070 Ti保持一致。从纸面的规格推测,RTX 4070与RTX 4070 Ti应该存在着20%~25%的性能差距。
与前一代的对位产品RTX 3070相比,二者在核心纸面规格方面相差不大,SM单元和CUDA核心数量都完全一致,不过RTX 4070的显存容量、速率以及核心频率的配置上都要明显超过RTX 3070,因此在性能上应该是比RTX 3070会超出很多。和前一代定位高一档的RTX 3070 Ti相比,虽然在核心的纸面规格数据上略逊色,但显存容量、带宽、核心频率都完胜RTX 3070 Ti,再加上全新的SM架构、更大的L2缓存和新一代的光追核心、AI核心,仍然可以期待RTX 4070在性能方面将完胜RTX 3070 Ti。
▲影驰RTX 4070星曜OC的出厂核心频率预设为1920MHz~2610MHz,相比公版指导频率1920MHz~2475MHz有较大提升。
所以我们也想知道,从RTX 4070 Ti精简得到的RTX 4070,其性能表现到底会如何呢?相对于前一代的对位产品RTX 3070 Ti和RTX 3070,它在性能上有多大的优势?作为主打1440p中高端游戏市场的主流级甜点显卡,在光追+1440p+全特效的设置环境下,它有没有达成100fps+绝对流畅游戏的能力?话不多说,马上开干!
NVIDIA GeForce RTX 4070 Founders Edition产品参数
核心架构:Ada Lovelace
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2610MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:215W
建议搭配电源额定功率:650W
显卡厚度:2.5槽
首发参考价格:5299元
性能测试,DLSS 3加持下比RTX 3070 Ti强75%还要多由于NVIDIA对RTX 4070 GPU的官方定位是1440p分辨率下的100fps+光追游戏体验,因此我们将主要在这一分辨率下测试影驰RTX 4070星曜OC的游戏性能。同时考虑到现在仍然有不少玩家还在坚守1080p显示器的阵地,因此我们也将1080p分辨率纳入了测试范畴。
除了游戏性能之外,我们仍然还是会针对设计创作应用对RTX 4070星曜OC进行考察,同时结合当下热门的AI应用,我们也将选择部分软件来考察RTX 4070星曜OC的AI运算能力。最后,作为新一代的RTX 40系GPU的核心特点,能耗比方面我们也将在各种不同的应用中对其进行详细的考验。
测试平台
GPU:影驰GeForce RTX 4070星曜OC、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:英特尔Z790
内存:影驰名人堂DDR5 6000 32GB
电源:威刚XGP魔核金牌全模组750W 冰雪白
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 531.42
▲XPG魔核金牌全模组750W冰雪白
本次测试搭配的威刚XGP魔核金牌全模组750W采用全日系电容,14cm短机身,冰雪白色。
1. 高效转化输出完美支持30系列和40系列显卡稳定运作;
2. 细节体现,用料十足,全日系电容;
3. 多接口线材,支持双显卡/双CPU 运作,适用各类玩家;
4. 14cm短机身设计,适配更多MATX小巧机箱,适合搭配RTX 4070显卡;
5. 全壳和线材采用白色设计,白色控玩家的福音。
先请DLSS 3,RTX 40系显卡的“官方外挂”首先进行的是RTX 40系核心的DLSS 3超级分辨率技术测试。在融合了Frame Generation帧生成和Reflex延迟减少技术之后,它能给RTX 40系GPU带来巨幅的游戏性能提升效果。影驰RTX 4070星曜OC在DLSS 3的支持下会有怎样的表现呢?
DLSS 3支持下的RTX 4070星曜OC表现确实非常抢眼。首先是RTX 4070星曜OC在13款DLSS 3游戏中的不同性能体验,在这部分测试中我们用RTX 4070星曜OC在13款DLSS 3游戏中分别开启DLSS 2和DLSS 3进行测试,并与DLSS关闭时的原生帧率对比。结果显示,开启DLSS 2时,1440p和1080p分辨率下游戏帧率相对于原生帧率的平均提升幅度约为75%左右,而在开启DLSS 3之后,游戏帧率相对原生帧率的提升幅度平均值达到了150%。没啥好说的,遇到DLSS 3的游戏,你又正好在用RTX 40系显卡,那么开就完事儿了。
再来看下开启DLSS 3之后,游戏体验的另外两个重要指标参数PCL系统延迟和1%L fps的变化情况。由于DLSS 3内置了NVIDIA Reflex延迟降低技术,因此我们可以清楚地看到,开启DLSS 3之后,系统延迟PCL值得到了极大的降低,最高甚至降低程度超过了80%,普遍PCL降低程度也在50%以上。比如在1440p分辨率的《瘟疫传说:安魂曲》游戏中,关闭DLSS时游戏内的PCL延迟为141毫秒,1%L fps仅为29fps,游戏感觉会比较卡顿。但开启DLSS 3之后,不但PCL系统延迟从141毫秒下降到了61毫秒,1%L fps也从20fps提升到了76fps,此时游戏已经非常顺滑,基本不会出现任何卡顿的情况。
编者注:随着《反恐精英2》(Counter-Strike 2)的最新加入NVIDIA Reflex,十大竞技射击游戏中现已有九款支持NVIDIA Reflex,前六名更是全部支持。这些游戏包括:《Apex英雄》 《使命召唤:战区2》(Call of Duty: Warzone 2)《命运2》(Destiny 2)《逃离塔科夫》《堡垒之夜》《守望先锋:归来》《彩虹六号:围攻》和《无畏契约》。
DLSS 3性能测试的最后来看影驰RTX 4070星曜OC在开启DLSS 3的情况下,相对于上一代的产品RTX 3070 Ti开启DLSS 2的游戏性能比较。测试仍然基于13款支持DLSS 3的游戏。
测试的结果也毫不意外地再次显示了DLSS 3的强悍。从成绩来看,开启DLSS 3之后的RTX 4070星曜OC在1440p和1080p分辨率下,相对于仅支持DLSS 2的RTX 3070 Ti,游戏性能平均领先程度达到了75%和74%上下,非常可观。
传统游戏性能测试看完DLSS 3的考验,接下来看看在传统游戏中,RTX 4070星曜OC能交出怎样的答卷。在这部分测试中,一共有19款热门游戏参与了测试,包括新近上线的《最后的生还者:第一季》《霍格沃茨之遗》《原子之心》等。其中大部分是支持光追的游戏大作,因此我们在测试中都统一开启了光追(非光追游戏除外),并将游戏画质设置为预设的最高档(《生化危机4:重制版》除外,当手动调到最高档画质设置时,“爆显存”使得RTX 3070 Ti和RTX 3070皆无法运行,因此只能调到中挡位进行测试)。
在1440p分辨率下,RTX 4070星曜OC的游戏性能表现符合我们最初估计的预期值。在这一分辨率下,RTX 4070星曜OC相对于RTX 3070 Ti的游戏性能领先达到了25%左右,而相对RTX 3070的性能领先则近35%。
1080p分辨率下的游戏性能差距仍然比较明显。虽然此时RTX 4070星曜OC的性能领先程度相比1440p分辨率略有降低,但相对于RTX 3070 Ti仍然有23%左右的性能领先优势,相对于RTX 3070更是达到了33%左右的性能领先程度。
3DMark理论性能3DMark理论性能测试显示,RTX 4070星曜OC相比RTX 4070 Ti大约存在20%左右的性能差距,这与之前的纸面规格性能分析基本相符。相比RTX 3070 Ti,RTX 4070星曜OC在3DMark的综合成绩上平均领先前者约27%,同时相对于RTX 3070也有35%左右的综合性能优势。结合我们前面的实际游戏性能测试的情况,3DMark的理论性能比较与游戏测试结果还是基本相符的。
不只是游戏,Studio、AI还可以做更多再来看设计创作应用与当下非常火的AI计算应用环境下RTX 4070星曜OC的性能表现。在这部分测试中我们将通过视频转码测试、3D渲染测试以及AI应用体验三个方面来考核RTX 4070星曜OC是否足够全能。
视频转码
全新的第八代NVENC赋予了RTX 4070星曜OC非常不错的视频编码硬件加速性能。从测试中可以看出,在Davinci Resolve 18的测试中,RTX 4070星曜OC的H.264编码能力大约领先RTX 3070 Ti和RTX 3070 15%左右,H.265的编码能力领先更是达到接近50%。
同样,在剪映Pro的测试中也是如此,H.264的编码性能上RTX 4070星曜OC领先RTX 3070 Ti约30%,H.265的编码性能领先幅度更是达到了40%左右。
当然,对RTX 4070星曜OC来说,视频方面还有一个非常重要的优势,那就是对AV1格式视频的硬件编码支持。AV1相比传统的H.264或H.265格式视频,AV1视频拥有相同码率、分辨率下更小体积的视频和更好的视频质量,也代表着未来主流视频的趋势。而这些都是RTX 3070 Ti和RTX 3070所不具备的。
▲从两种不同格式的同码率、分辨率视频比较中,我们可以发现,AV1格式的视频(左)在视频清晰度的呈现上相比H.264编码的视频要更优秀,更清晰,细节更丰富一些,而且视频体积也相对小一些。
3D渲染性能
在3D渲染能力测试部分,我们选择了V-Ray Benchmark, Blender Opendata Benchmark和Blender 3.5实际模型渲染三种方式进行了评测。最终测试结果显示,在Blender模型渲染能力测试中,根据模型精度、大小的设置不同,影驰RTX 4070星曜OC的性能领先RTX 3070Ti达到了33%~55%,越是渲染负荷大的模型,影驰RTX 4070星曜OC的领先优势越明显。而在斑斓星系这个模型的渲染中,应该是由于对显存的需求过大,导致RTX 3070 Ti和RTX 3070都出现了“爆显存”的情况,因此性能差距被拉大到了140%的夸张程度。同样,在Blender Opendata Benchmark测试中,RTX 4070星曜OC平均性能也领先RTX 3070 Ti达50%左右,V-Ray Benchmark测试也有30%上下的差距。
AI性能测试
最后来体验一下现在比较好玩的一些和AI运算相关的功能(严格来说DLSS也是基于AI运算的)。在这部分测试中,我们主要通过ON1 Resiza AI 2022软件来考察RTX 4070星曜OC的图片AI处理性能,通过Chrome和FireFox浏览器来体验NVIDIA RTX VSR视频增强技术带来的更好观影体验(不是特别确定这一功能是否涉及AI计算,我们暂时将这一体验纳入AI运算体验的项目,仅供大家参考),最后我们通过Stable Diffusion来进行AI图片的生成计算考察RTX 4070星曜OC的AI图片计算生成能力。
ON1 Resize AI 2022测试中,我们选择了选择了5张5K照片,并将其等比无损缩放到200%(10K+级精度照片)。从测试结果来看,RTX 4070星曜OC的图片AI处理性能明显遥遥领先,相对RTX 3070 Ti、RTX 3070和RTX 2070 SUPER的领先程度分别达到了31%、37%和74%。
接下来我们体验了NVIDIA最新发布的RTX VSR(RTX Video Super Resolution,RTX视频超级分辨率)功能。随着531.42驱动上线,这一功能已经得以开放。玩家们可以在支持VSR的浏览器(目前最新版的EDGE和Chrome浏览器已经支持)或播放器中体验到RTX 30系以上GPU所带来的视频增强处理功能。
▲勾选RTX视频增强选项下的“超分辨率”,就能在支持VSR功能的浏览器中开启RTX 视频增强。
▲在《生死轮回》的游戏录像播放中,最新版Chrome浏览器由于支持VSR,播放(图左)游戏录像的清晰度和细节受益于RTX VSR而得到了一定的增强。相反,FireFox浏览器由于不支持VSR,只能播放原生的未经增强的视频画面。从对比中也能清晰地看到视频细节与清晰度确实得到了一定程度的增强。
▲用FireFox(右)和Chrome(左)分别播放哔哩哔哩网站上的一段《暗黑破坏神4》宣传片,也能够明显地看出VSR对于视频画面有着比较明显的增强作用。
然后来看看RTX 4070星曜OC的AI图片计算生成能力。测试我们选择的是基于AI图片生成计算的Stable Diffusion,相信不少玩家都已经尝试过这一有趣的基于AI模型的图片运算生成软件。测试中我们选择了NovelAI-WEBUI-AKI的国内玩家封装版整合包,并手动安装了最新的NVIDIA cuDNN以实现对RTX 4070 GPU的加速计算支持。
在测试中我们设置了一系列关键词,最终目的是生成坐落于水畔的优雅别墅和足球场景。通过两类图片的AI计算生成速度,我们可以衡量RTX 4070星曜OC的AI计算能力与RTX 3070 Ti、RTX 3070等的差距。
从测试结果来看,RTX 4070星曜OC的AI图片生成能力(在我们所给的图片精度大小条件下)约为9.04张/分钟,而RTX 370 Ti和RTX 3070分别只有约6.81张/分钟和6.68张/分钟,相比之下RTX 4070星曜OC的AI图片生成能力领先约为20%~30%。
功耗、散热与超频影驰RTX 4070星曜OC的TGP功耗设计为215W,最大可解放到250W。不过以实际游戏中的表现来看,距离TGP还有不小距离。测试发现RTX 4070星曜OC的游戏平均功耗大概在189W左右,Blender 3.5渲染工作负荷时功耗大概为156W左右,都远未触及215W的TGP限额。这也无疑再次证明了RTX 4070星曜OC拥有非常优秀的能耗比,在运行功耗比RTX 3070 Ti等产品低得多的情况下,拥有了更强的性能,而这个巨大的优势也往往容易被玩家所忽略。
另外必须要单独特别表扬的是影驰RTX 4070星曜OC的散热能力。在Furmark烤机30分钟左右,RTX 4070星曜OC的GPU温度还处在57℃左右,这是我们本次所有非公版RTX 4070显卡测试中散热表现最优秀的一款产品,同时静音效果也非常不错。
最后是简单的超频尝试,虽然出场预置频率已经达到了2610MHz,但高能耗比和优秀的散热控制还是为RTX 4070星曜OC留下了不小的超频空间,简单调校一番,RTX 4070星曜OC最终能在2800MHz Boost频率和11000MHz显存频率(等效)下完成所有稳定性测试。此时的性能相比超频前又有5%左右的提升。
RTX 4070星曜OC赏析:水晶质地,千镜美学在外观设计上,仍然是我们非常熟悉的“星曜”风格。外壳装机同样保持了系列传统管用的透明亚克力材质,搭配经典的钻石切割工艺,使得RTX 4070星曜OC呈现初了水晶一样的流彩透明效果。当然,和前几款星曜家族产品一样,RTX 4070星曜OC的透明上盖是可以轻松拆卸的,能够支持玩家自行进行DIY设计,打造个人专属外观。
▲RTX 4070 Ti星曜OC的透明亚克力上盖可以拆下来进行自主的DIY操作,这样就能打造出专属自己的独一无二的RTX 4070 Ti星曜OC外观。在今晚RTX 4070星曜OC首发上市时,影驰官方将提供5套官方定制的星曜产品供玩家选择。
▲全金属背板仍然是全白设计,采用一体压铸成型的金属背板有大量镂空设计,有效保障了散热性能,同时背板的白色喷涂搭配丝印工艺也提升了整体的质感。
▲RTX 4070星曜OC顶部搭配了“BOOMSTAR”信仰Logo灯效,采用了类似千层镜的设计效果,有着深邃无限的光影美学效果。同时,正面的三个透明风扇也搭配了ARGB灯效的扇叶,辉映顶部Logo灯营造出了非常梦幻的科技感与电竞游戏感。同时,通过影驰XTRME TUNER魔盘软件还能进行进行超频、灯控调整、温度监控等便捷操作。
▲星曜专属ARGB支撑架,支持炫彩光效并可自由调节高度,内置ARGB灯效供电接口,可直接插接主板联动。
▲短PCB+尾部镂空的设计能强化散热效果,RTX 4070星曜OC在电路上采用了8+3的11相供电设计。
▲RTX 4070 GPU,代号为AD104-250。
▲显存是来自美光的GDDR6X颗粒,单颗2GB,共6颗。
▲RTX 4070星曜OC采用的是RTX 40系显卡特色的16Pin ATX 3.0电源规范显卡供电接口。
▲视频输出接口设置为3DP 1.4a+1 HDMI 2.1
▲RTX 4070星曜OC采用了全新一代星卓Ⅲ散热系统,配备3个特制直径102mm、厚度20mm的高规格风扇,每个风扇拥有11片静霜扇叶,实现更强风力和更大风量;支持智能启停,随时随地为您在体验与负载中收放自如。
▲星卓III散热系统拥有5根6mm直径镀镍复合热管、大面积高效能均热板和鳍片,结合回流焊接工艺,带来更强的散热性能,合金加强件也能有效防止显卡变形,保障显卡的正常使用。
颜值性能都出色,万元预算装机的全能产品从整体测试成绩来看,RTX 4070星曜OC很好地体现出了作为RTX 40系第一款甜点级产品的价值。在传统游戏性能上,它相较于前一代的RTX 3070 Ti领先幅度达到了20%以上,开启DLSS 3之后性能领先更是达到了75%以上,实现了对前者的绝对超越。
作为一款定位于1440p分辨率游戏市场的产品,RTX 4070星曜OC完美地交出了自己的答卷,在1440p分辨率、全特效、光追开启的环境下,DLSS的加持使得RTX 4070星曜OC基本能在全部测试游戏中达到100fps+的游戏目标。同时,在能耗比的表现上也非常抢眼,215W的TGP设置下游戏功耗只在189W左右,3D设计渲染功耗更是不到160W,相比RTX 3070 Ti在能耗比遥遥领先,而且还有非常抢眼的AI运算能力表现。
对于想要从RTX 3070显卡,甚至是RTX 2070、RTX 2070 SUPER升级显卡的玩家来说,RTX 4070毫无疑问是当下最为合适的好性价比选择。可以说也是当下追求1440p全特效光追游戏流畅体验的很有性价比的产品。
目前来看,影驰RTX 4070星曜OC的市场价格为5299元,对于大多数玩家万元左右的装机预算来说,它确实是个很不错的选择。关键是无论是颜值还是性能,你都几乎挑不出什么毛病,而且还有非常优秀的散热和静音效果。对这一价位段的显卡选择来说,RTX 4070星曜OC绝对有潜力成为是那些挑剔的颜值控、性能控玩家的心爱之物。这是一款没有明显短板的产品,我们的建议是:如果有需要,买买买就完事儿了!
微软新闻推荐
win10系统推荐
系统教程推荐