DLSS 4让帧数突破显示极限! 技嘉RTX 5080超级雕显卡评测
完整的GB202核心包含192个SM单元,每个SM包含128个CUDA核心;1个第4代RT Core;4个第5代Tensor Core;4个纹理单元。1个256KB的寄存器文件和128KB的L1共享缓存,它可以根据图形和计算工作负载的需要配置不同的大小。

在Blackwell架构的SM单元中,INT32整数运算的数量增加了一倍。与Ada架构的SM单元相比,实现了INT32与FP32内核的完全统一。不过在时钟周期内,统一内核只能作为FP32或INT32内核运行。

与Blackwell架构一同推出的还有GDDR7显存,采用pam3信号技术,它有着更高频率与更低电压的特点。
本代RTX 5090配备28 Gbps GDDR7显存,峰值显存带宽可达1792GB/s/秒,而RTX 5080配备更高的30 Gbps时钟频率的GDDR7显存,峰值内存带宽可达960 GB/秒。结合新的引脚编码方案,GDDR7实现了显著增强的信噪比(SNR)。
通过增加信道密度、改进的pam3信噪比、先进的均衡方案、重新设计的时钟架构和增强的I/O训练,GDDR7提供了更高的带宽。这些进步还显著提高了能源效率,提供了更好的性能和延长电池寿命,特别是在移动端,或功率受限的系统中。
Blackwell 第4代RT Core
在第4代RT Core中,简单来说它相比Ada架构,在渲染光线追踪场景时,提供了两倍光线三角形相交测试吞吐量,并引入了Mega Geometry的结构算法。

Opacity Micromap Engine
不透明微引擎在Ada架构中已经引入,这里不再过多讲述,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。
比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

不过Opacity Micromap Engine可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。
RTX Mega Geometry
除了上面提到的Opacity Micromap Engine,在BlackWell架构中,还引入了Mega Geometry(大型几何)的运算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的Blackwell RT核心包含一个Triangle ClusterIntersection Engine三角形群集交集引擎,它能够进一步加速大型几何的光线追踪,同时它的工作还包含标准的光线三角形交集测试。Linear Swept Spheres则主要用于光线追踪中精细的几何形状,比如发丝。
RTX Mega Geometry的理念与虚幻5引擎的Nanite虚拟微多边形几何体系统相同,在现代游戏中,模型更加细致,需要渲染的工作量大幅增加,如果全部按照最精细的级别处理,将会耗费极大的计算资源,所以将LOD分级便应运而生。

简单来说,就是根据一个物体距离摄像机的远近,来调节物体的细节水平。此前《黑神话:悟空》便应用了这样的技术,它消除了LOD的繁琐任务,可以扫描并导入极高精细程度的模型。并且,这不会影响性能。仍然可以获得实时帧速率。
在RTX Mega Geometry中提供了新的BVH构建功能,它采用三角形集群作为一级基元。新的集群加速结构Cluster-level Acceleration Structures(CLAS)可以从256个三角形空间紧凑批次中生成,然后使用CLAS集合作为输入来构建最终的BVH。

不过虚幻5引擎并非专为Blackwell而设计,RTX Mega Geometry的工作只是更高效的让游戏引擎调用API。由于其输入参数完全由GPU内存驱动,游戏引擎可以在GPU上更高效的运行LOD选择、动画、剔除等逻辑。同时最大限度减少对CPU的往返,进而减少与BVH管理相关的CPU开销。

然而在更加精细化的游戏引擎中,按照传统的流程,应用程序必须从场景中的每一帧的所有对象中构建一个顶层加速结构。而随着更大的世界规模以及繁杂的场景物体,仅靠LOD分级仍然难以实现质的变化。
为了解决这个问题,RTX Mega Geometry引入了一种新型的顶层加速结构(TLAS),称为分区顶层加速结构(PTLAS)。

它无需在每一帧都从头开始构建一个新的TLAS,PTLAS能够辨别从一帧到另一帧,哪些对象是静态的。
应用程序通过将对象聚合到分区中,并仅更新那些已更改的对象来节省开销。

例如,游戏可以将静态游戏世界的各个部分放入所属的分区中,同时将动态对象分离到每帧重建的“全局分区”中。与传统的TLAS相比,请求的分区更新越少,节省的运行时开销就越大。
另外好消息是,RTX Mega Geometry可通过底层API进行扩展支持,适用于所有支持光线追踪的NVIDIA GPU,也就是从图灵架构(Turing)开始。

不过Blackwell的第4代RT Core是专门为RTXMega Geometry而设计的,硬件中的特殊集群引擎实现了几何和BVH数据的新压缩方案,同时是第3代RT Core光线三角形相交率的2倍。因此,Blackwell架构可以实现用更小的显存,更高效的处理这些内容。
Linear Swept Spheres (LSS)
LSS(线性扫描球体)是Blackwell架构中新增的图形语言,它极大地简化了复杂头发和毛发的渲染开销,并能提升质量。

此前渲染头发仍然需要最基础的三角形来表达物体,如图所示,发丝中的一个线段需要6个三角形,而一根头发便需要无数个三角形来确保其精度。比如我们的头发则需要600万个三角形来表达。

Blackwell架构的RT Core引入了LSS新语言的支持,它类似于镶嵌曲线,允许灵活地近似各种链型。并且球体也更适合发行构建。
LSS的引入可以让发型构建,减少3倍的数据量,速度大约快了2倍,并可以使用更少的显存,获得更高的帧数。
相关文章

DLSS 4再次定义电子游戏! NVIDIA GeForce RTX 5080 FE显卡评测
RTX 5080却是有着NVIDIA自家推出的 Founders Edition公版设计产品,而且这次的Founders Edition设计非常精湛,称其为工业艺术品也毫不为过,下面我们就来看看详细测评2025-02-14
DLSS 4大力水手更猛了! iGame GeForce RTX 5080 Ultra W OC 16GB评测
今天我们来看看七彩虹 iGame GeForce RTX 5080 Ultra W OC 16GB显卡,带着对于RTX 50系显卡性能与游戏表现的好奇,抢先帮大家测试了一波,如果你也对RTX 5080感兴趣,可以2025-02-14
黑金设计搭配 DLSS 4! 影驰GeForce RTX 5080魔刃显卡评测
今天,我们就将目光投向影驰 GeForce RTX 5080 魔刃显卡,这款显卡定位 RTX 50 系列中的中高端市场,下面我们就来看看详细测评2025-02-11
经典性价比次旗舰乘上DLSS 4东风! 耕升 GeForce RTX 5080 追风显卡评测
耕升推出了新一代GeForce RTX 50系列产品,包括炫光、踏雪、追风等系列,今天我们就来看看追风显卡性能测评2025-02-11
DLSS 4性能全力冲锋! 耕升RTX5080炫光OC显卡拆解超频测试
继GeForce RTX 5090 D之后,RTX 5080也相约面世,在这里要为大家推荐的是来自耕升的玩灯高手——GeForce RTX 5080炫光OC2025-02-08
GeForce RTX 5080和RTX 4090谁是显卡之王? 7款游戏性能实测
RTX 5080上市后,性能备受关注,它和上一代旗舰RTX 4090谁更强?一种论调声称其性能非常炸裂,另外一种论调声称其性能提升幅度并不大,下面我们就来看看实际测评2025-02-08
DLSS4开启电竞级3A新时代 技嘉RTX 5080 AERO雪鹰显卡全面评测
作为全球一线板卡厂商的技嘉,为玩家们推出了超级雕(黑/白)、魔鹰、雪鹰和风魔、等一系列产品线的旗舰显卡,今天我们就来看看RTX 5080 AERO雪鹰显卡测评2025-02-08









最新评论