性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测
时隔两年又三个多月,英伟达终于带来了全新的GeForce RTX 50系显卡。然而受到相关规定(满足综合运算性能TPP不超过4800的限制)的影响,RTX 5090的命运和RTX 4090一样,化身RTX 5090 D进入国内市场。同时,RTX 5090 D是没有公版(Founder Edition)的,因此,高端玩家们就只能从一众非公显卡里面去挑选适合自己的那一款了。

而说起耕升的踏雪系列,可能大家第一时间更多会想到纯白设计、中高端定位,很难会将过往最高只搭载过RTX 4070 TI SUPER芯片的它和旗舰显卡联想到一起。不过,当英伟达正式进入RTX 50系显卡时代之后,踏雪也迎来的蜕变,出现在了耕升的RTX 5090 D的产品名单里面。在了解耕升 GeForce RTX 5090 D 踏雪之前,我们先来简单回顾一下英伟达RTX 50系显卡到底有什么新的特点。
关于RTX 5090 D

相较于上一代RTX 4090 D来看,RTX 5090 D在芯片的规模上有了较大幅度的升级。虽然制程工艺不变,依然是定制的TSMC 4N,但是,凭借更大的芯片面积和新一代的Blackwell核心架构,后者的晶体管数量从763亿个增加至922亿个,CUDA核心数量增加将近50%,而且同样是12个GPC,RTX 5090 D每个GPC里的TPC和SM数量增多了,TPC从6个增至8个,SM从12个增至16个。编解码器同样进行了迭代加码,新增了4:2:2色度采样视频编解码的能力,节省CPU的负担,提升内容创作者的工作效率。此外,RTX 5090 D还用上了容量更大、性能更强的GDDR7显存,位宽也从384-bit增至512-bit。显示输出接口升级为3×DisplayPort 2.1b+1×HDMI 2.1b的配置,借助DSC技术最高支持4K@480Hz或8K@140Hz。
不过,这次的RTX 5090 D的命运并不像RTX 4090 D一样在核心规格作出调整。我们从表面参数上基本看不出与RTX 5090有什么区别,对游戏性能造成的影响肯定是远小于RTX 4090 D当初的。至于AI性能嘛,RTX 5090 D则从RTX 5090的3352 AI TOPS降至2375 AI TOPS,降幅约29%。
Blackwell架构有多牛
不断壮大的核心规模

其实,完全体的 Blackwell GB202共有12组GPC、24576个CUDA核心,RTX 5090 D上的GB202-250则用了其中的88.5%。从整体结构图上还能看到,GigaThread Engine调度器隔壁多了一个叫做AI-Management Processor(AI管理处理器,简称AMP)的帮手。AMP是一个位于管线前端的RISC-V处理器,支持Windows硬件加速GPU计划,能够更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的带领下可以协调工作,实现AI响应速度提高的同时,游戏画面也不会受到影响。

GPC段中,它所包含的TPC从Ada Lovelace的6组扩展到了8组。不过布局上还是一样的,一个独立的光栅引擎,两个ROP分区(每个包含8个ROP单元),而每组TPC包含两组SM。

SM段的变化是比较大的。现在所有的32个CUDA核心都能执行FP32/INT32运算了,因此INT32的算力可以说是增加了一倍。不过在一个时钟周期里面,核心只能二选一运算。NVIDIA表示,这种设计是为神经着色器优化的。

Tensor Core和RT Core自然也有升级。第5代Tensor Core继承了上一代架构的特性,并新增了FP4、FP6的支持,还把FP8 Transformer Engine更新到了第二代。其中,FP4是个比较值得关注的点,它相比常规的FP16模型需要的显存更小,在TensorRT模型优化器的支持下能够做到几乎没有质量损失。

现在,Blackwell上的SER(着色器重排序) 2.0还可以将神经网络的负载直接发送至Tensor Core处理,加速神经网络渲染,效率达到了Ada Lovelace上的2倍,降低开销之余还能提高精准度。

同时运作的话,LLM的响应时间变慢,游戏帧率也会受影响

而第4代RT Core中,新增的组件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同时,Blackwell提供了两倍于上一代Ada Lovelace的Ray-Triangle交叉检测吞吐量。它们的出现,与Mega Geometry技术息息相关,起到一个打基础的作用。

Mega Geometry是在TLAS(顶层加速结构)和BLAS(底层加速结构)两个层级的架构上做改进。BLAS一侧的Cluster-level Acceleration Structures(CLAS,簇级加速结构)最多能把256个三角形簇打包好,并将其作为BVH的基础部分输入,最后组成BVH树。同时,CLAS不仅能在游戏里面按需创建,还能缓存到硬盘里面,后面的帧要用的话直接从硬盘加载。这样一来,系统要处理的事情就少很多了。

TLAS还有个兄弟叫Partitioned Top-Level Acceleration Structure(PTLAS,分区顶层加速架构),是针对复杂场景设计的。NVIDIA表示,在很多游戏里面,场景内有不少物品比如建筑都是固定不变的,但是如果每一帧都要给它们构建一次TLAS,肯定就不划算。而正如名称中的Partitioned分区所示,PTLAS把场景内的物体分成了多个区域,一些用来放置静态的物品,然后一个全局分区用于处理动态的物品,同样可以做到减轻了系统的压力,提高运算效率。

值得一提的是,所有RTX显卡都能支持Mega Geometry,但跟所有新技术一样,Blackwell是目前支持最好的。
相关文章

4K高刷畅玩光追游戏! 影驰GeFroce RTX5090D大将显卡评测
影驰推出了GeForce RTX 5090 D大将这款显卡,很多朋友想要知道这款显卡性能如何?下面我们就来看看详细测评2025-02-11
延续家族系列黑灰配色! 映众RTX 5090 D曜夜X3显卡开箱
年发布的RTX 50系列,可谓抢足风头,包括超级冰龙、曜夜和映雪三大子品牌,比如那个号称顶配王者的是RTX5090 D曜夜X3,下面我们就来看看这款显卡的开箱2025-01-24
高端发烧玩家的白色恋人! AX电竞叛客RTX 5090 D X3W显卡开箱
今天我们就为大家送上来自柏能集团旗下品牌AX电竞叛客的RTX 5090 D X3W显卡的图赏,近距离欣赏这款纯白大作的魅力2025-01-24
七彩虹首张RTX 50系显卡! iGame GeForce RTX 5090 D Advanced 32GB开箱
首款GeForce RTX 50系显卡---GeForce RTX 5090D就要在国内亮相啦,这款显卡怎么样?下面我们就来看看开箱体验2025-01-22
英伟达RTX 50系列显卡性能大升级: 5090旗舰级性能最高增幅70%
近期,关于英伟达即将推出的GeForce RTX 50系列显卡的性能提升幅度,引起了广泛关注,这一全新系列的显卡在性能上将迎来显著提升,其中旗舰产品RTX 5090的性能提升幅度预计2024-12-15







最新评论