这半年以来,除了像游戏场景之外,AIGC的火爆程度远超人们的想象,而利用GPU强大的算力实现AIGC成为了新用途,自然基于最新架构的RTX 4070显卡在AI创作上也更加出色,比如说AI创作性能能够比RTX 3070 Ti提升大约40%的幅度,将会成为创作者手中的一张神卡。那么这块显卡的实际表现究竟如何呢?我们一起来看下。
架构说明
对于RTX 40系显卡来说,想要满足包括AI创作以及DLSS 3等特效的实现,就不得不说Ada Lovelace架构,而这也是RTX 40系显卡的核心所在。相比较目前的安培架构Ada Lovelace架构在性能上有着巨大的飞跃,比如说流式多处理器的着色能力高达83TFLOPS,吞吐量是上代的2倍,第三代RT Cores 的有效光线追踪计算能力最高可以达到191TFLOPS,是上代的2.8倍,第四代 Tensor Cores则新增了FP8张量引擎,张量计算达到了1.32PTLOPs,和上一代相比更是提升了整整五倍。也正是因为有了如此强大的算力,无论是游戏玩家还是创作者都可以借助RTX 40系显卡实现更加高效的创作效率。
硬件光流加速器
今年RTX 40系显卡最大的特点就是采用了全新的DLSS 3技术,能够有效地提升游戏在开启光追等重压环境下的帧率表现。
硬件光流加速器的原理就是提取其中的图像光流信息,同时参考游戏引擎中的运动矢量信息借助AI生成新的中间帧,借助插帧以及超分辨率,让RTX 40系显卡只要传统1/8的渲染量即可实现几乎相同的画面输出。目前DLSS 3仅为RTX 40系显卡所独享,同时也是RTX 40系显卡的一项杀手锏。
在显卡规格上,NVIDIA GeForce RTX 4070显卡搭载的是AD104-250核心,拥有5888颗流处理器,36MB的L2高速缓存容量,184个TMUS,64个ROPS以及46个光追单元,除此之外NVIDIA GeForce RTX 4070显卡的基准频率为1920MHz,Boost频率为2475MHz,而FP32单精度算力为29TFLOPS。
显存上采用的是GDDR6X显存,显存容量为12GB,192bit的显存位宽,显存速率为21Gbps,总共拥有504GB/s显存位宽,另外官方给这款显卡的TDP为200W,当然实际测试的功耗有高有低。
外观
我们这一次拿到的是英伟达NVIDIA GeForce RTX 4070 Founders Edition也就是大家所称的公版显卡。
毫无疑问在见惯了NVIDIA GeForce RTX 4090 Founders Edition这样的庞然大物之后,NVIDIA GeForce RTX 4070 Founders Edition显然小巧了很多,而且卡槽也变成了传统的双槽显卡,这对于使用ITX机箱的消费者来说显然是一个天大的好消息。
除此之外,NVIDIA GeForce RTX 4070 Founders Edition也和上一代的RTX 3070公版显卡相差不大,在供电上继续采用12+4Pin的接口,当然相比较之前的80和90,官方给的转接线为双8Pin转12+4Pin,而RTX 4080、RTX 4090等显卡则是三8Pin转12+4Pin。
而显卡的扩展接口基本上算是标准接口,包括一个HDMI 2.1以及3个DP 1.4接口,基本能够满足发烧友的使用。应该来说相比较RTX 4080以及RTX 4090,NVIDIA GeForce RTX 4070 Founders Edition的外观还是跟RTX 30系公版显卡差不多,没有那种太过于惊艳的感觉,算是中规中矩吧。
测试平台
测试平台跟以前也大差不差,我们选择Intel Core i9-1900K处理器作为这一次测试的CPU,此外主板采用了ROG的Z790 Hero主板,内存则是科赋DDR5 6200内存,总容量达到了32GB,除此之外,我们也选用了WD_BLACK SN850X PCIe 4.0 SSD,事实上这套系统应对RTX 4090也是绰绰有余,更不用说RTX 4070显卡。本次测试基于微软Windows 11 22H2系统,采用的是Game Ready 531.42测试版驱动,未来显卡的性能将会随着驱动的完善而有所提升。
性能测试
理论性能
首先自然是理论测试,而理论测试的首选软件当然是最为著名的3DMark,包括借助FireStrike、TimeSpy以及Royal Port分别测试显卡在DX11、DX12以及光追性能,而与NVIDIA GeForce RTX 4070 Founders Edition做对比的则是NVIDIA GeForce RTX 3070 Ti显卡。
通过3DMark的测试可以看到,在传统的光珊化测试中。NVIDIA GeForce RTX 4070 Founders Edition显卡的理论性能比NVIDIA GeForce RTX 3070 Ti高出15%左右,似乎不是很高,事实上从FP32便可以看出,NVIDIA GeForce RTX 4070 Founders Edition的光栅化成绩提升不是很明显。而光追测试中,NVIDIA GeForce RTX 4070 Founders Edition显卡的领先幅度可以达到25%。
实际游戏测试
DLSS 3测试
当然如今的光追特效越来越拟真,对于显卡要求也越来越高,对此像英伟达这样的厂商便推出了DLSS等特效,借助AI来协助显卡在游戏中取得更高的性能表现。当然经过不断的迭代发展,目前的DLSS已经相当地成熟,并且几乎所有主流的游戏都会支持DLSS特效,同时RTX 4070显卡借助Ada架构还可以支持DLSS 3。那么RTX 4070显卡借助DLSS,能够在游戏中取得多少的性能表现呢?
在基于DLSS的测试中,由于除了FP32单精度性能之外,更加重要的便是Tensor Core的性能,自然在游戏表现中能够取得更加出色的成绩。而我们也可以看到支持DLSS 3的RTX 4070在游戏表现中显然要比RTX 3070 Ti更加出色,部分游戏的领先幅度也更大。
光栅化游戏测试
除了光追游戏之外,传统的光栅化游戏仍然占据主流,当然相比较光追游戏,光栅化游戏的性能基本上就是考察FP32的性能。可以看到在光栅化游戏中,NVIDIA GeForce RTX 4070 Founders Edition显卡的性能实际上跟3DMark的测试差不多,与RTX 3070 Ti之间的性能相差幅度也就在10-15%上下,而《荒野大镖客2:救赎》的领先幅度更是不到10%。
温度和功耗
除了游戏性能更加出色之外,Ada架构带来的优势还在于惊艳的能效,也就是说在提供更加出色的图形性能之外,在温度和能耗上的表现也更加地出色。我们自然也测试了在不同条件下的温度能耗的表现,通过FrameView进行记录。
通过对于3DMark以及《赛博朋克 2077》的性能测试可以看到,NVIDIA GeForce RTX 4070 Founders Edition显卡的领先幅度可以说相当地巨大,功耗领先幅度在80W左右,而温度也可以领先8摄氏度,显然这跟高能效比的核心有很大的关系,除此之外,厂商对于散热器散热性能的冗余也导致实际温度表现比预期的更加出色。
生产力测试
如果说2K游戏只是这块显卡的一部分的话,那么从去年年底开始爆火的AIGC则组成了NVIDIA GeForce RTX 4070 Founders Edition显卡的另一部分,如果说过去的生产力仅仅指的是传统的利用GPU算力从事的视频渲染等任务,那么新一代的生产力就应该是借助AI来协助用户创造更大的工作价值。因此目前越来越多的AIGC创作软件营运而生,从而让英伟达的AI性能有的放矢。其中包括Stable Diffusion、RTX视频超分辨率等应用场景。
Stable Diffusion
Stable Diffusion是一款非常受欢迎的开源图像生成模型,可以借助扩散模型生成海量的图片,极大地减轻了画家的作图时间,从而提升效率。当然早期的AI作图还相当地稚嫩,出现大量不符合构造的图片,不过如今随着模型的不断优化,AI作图也日渐成熟,从而制造出符合大家审美需求的图片,而Stable Diffusion模型目前基本上仅支持CUDA,因为也成为了英伟达显卡的专属。
在这里我选择了Stable Diffusion GRisk GUI进行测试,事实上想要实现AI画图也不是一件难事。比如说你需要增加众多的特征参数,来让你的图片满足你的需求。而这也是目前比较火热的一个职业,参数指定师。当设定了海量的参数之后,按下Render,随后图片就开始生成。
可以看到的是在AI合成图片的过程中,GPU基本上都是处于100%的状态,此外得益于出色的AI性能,实际上RTX4070只要10余秒便可以作出一副完整的图片,以满足你的需求,对于绘画一窍不通的用户来说,借助Stable Diffusion模型打造的绘画图软件无疑是一种超级神器。
RTX视频超分辨率
我们在看视频的时候,尤其是在线视频,经常会出现画面不清晰的时候,特别是片源清晰度过低,导致用户的观影体验受到极大的影响,过去消费者面对这种方法显然束手无策,不过现在用户可以借助显卡实现画面的优化,从而提升你的观影体验。比如说英伟达在RTX显卡上实装了RTX视频增强。
在安装了最新的驱动之后,你可以在英伟达的视频设置中找到RTX视频增强,可以选择超分辨率,从而让显卡实现视频的清晰化,其中4档的效果最为出色。
如果你开启了超分特效之后,通过Chrome收看Youtube、bilibili等主流视频网站的视频,那么英伟达的显卡就会自动运算,通过超分来让视频更加清晰,从而让视频显示更多的细节,当然打开超分之后,显卡的负载也一下子达到了50%左右。
通过对比可以看到,在开启RTX视频增强之后,F1赛车的画面更加地平滑,锯齿也得到了有效地缓解,字体也更加清晰,只是这种画面上的区别基本上需要通过暂停画面才可以直观地感受到,对于收看直播尤其是体育类直播的观众来说,RTX视频增强只能称得上是锦上添花。
除了在线视频网站之外,你也可以通过本地视频播放软件来使用RTX视频增强功能,比如说最新版本的VLC软件就可以支持RTX视频增强,当然与视频在线播放相差不大,视频的画面表现略有提升,代价就是需要花费30-50%左右的GPU资源。
AV1视频编码
目前直播的分辨率越来越高,传统的H265编码已经不能满足日益庞大的数据传输,此时AV1编码应运而生,逐渐开始被主流的影像制作工作室所接受。相比较H265,AV1编码能够保持画面几乎不变的情况下,让视频的码率有所下降,同时大幅减少视频的体积。目前在达芬奇18等主流视频制作软件中均已增加了对于AV1编码的支持。
不过对于国内用户来说,目前大红大紫的剪映也实现对于AV1视频编码的支持,对于剪辑小白来说也更加友好。
我们也使用剪映输出一段4K视频,根据剪映预估的大小,基于AV1编码下的视频体积为385M,而基于H264下的视频体积为513M。当然两个视频实际文件大小均有所提升。通过实际文件对比,AV1下的编码体积大约是H264的77%,实际画面也没有几乎没有什么损失,对于减少视频大小还是很有用的。
总结
毫无疑问作为一款承上启下的中高端显卡,NVIDIA GeForce RTX 4070 Founders Edition显卡的实际表现还是让人感到满意的。尽管在传统的光栅化游戏上,相比较上一代性能提升不是很明显。但是在光追游戏以及DLSS特效加持下,NVIDIA GeForce RTX 4070 Founders Edition显卡的表现就远超上代RTX 3070 Ti,此外英伟达也多次强调这款显卡主要面向的消费群体是2K分辨率的用户,那么开启DLSS之后,这款显卡也能在获得超过100帧的成绩,对于购买了高刷的消费者来说是一个福音。并且在提供更高性能的同时,显卡的功耗以及温度也让人十分地满意。
我们也看到,如今大红大紫的AIGC对于显卡的AI性能提出了更高的要求,而AI性能的飞跃也是RTX 40系显卡的另外一个亮点,借助强大的AI性能表现,用户的工作效率也得到了巨大的飞跃,从而让效益更高。
此外在AI软件中,毫无疑问英伟达占据了绝大部分的市场份额,这也是未来NVIDIA GeForce RTX 4070 Founders Edition显卡以及英伟达所拥有的巨大优势,毕竟AI属于专业计算领域,对RTX 40系显卡来说也有着更加广阔的发展空间。对于游戏玩家来说,NVIDIA GeForce RTX 4070 Founders Edition显卡显然是全新的万元装机的首选,毕竟借助DLSS 3等各种黑科技,在2K分辨率下可以获得超100帧的速率,对于拥有RTX 2070 SUPER显卡的消息来说是一个相当不错的更新换代的选择。
微软新闻推荐
win10系统推荐
系统教程推荐