热点:

    游戏本性能再次飞跃 背后的图灵到底是何方神圣

      [  中关村在线 原创  ]   作者:尹航   |  责编:李诺

      从GTX 9系到GTX 10系演进,英伟达将GPU图形性能做了一次超大幅度的突破,可谓是震惊世人。而从GTX 10系到RTX 20系,这种性能飞跃仍在继续,但更多的则是来自三大功能方面的提升:

      其一,引入RTX(Real Time Ray Tracing),即光线追踪技术。

      其二,引入DLSS(Deep Learning Super Sampling),即深度学习超采样技术。

      其三,引入NAS(NVIDIA Adaptive Shading),即高级着色技术。

      虽然目前从游戏、应用端来看,对于三大技术的支持还没有全面铺开,但从现有的资源就可以看出,这三大技术对于未来图形计算有着非常重大的影响。

    ·移动版RTX 20显卡参数过硬

      去年8月,英伟达发布了桌面级RTX 20系图形显卡,引发业界广泛关注。而在今年初的CES上,英伟达又公布了移动级RTX 20系显卡,至此,游戏笔记本将正式从GTX 10系过渡到RTX 20系独显的新世代。那么RTX 20系独立显卡将为游戏本带来怎样的性能提升呢?

      在本次CES发布会上,英伟达展示了包括搭载RTX 2080独立显卡的微星GS65 Stealth以及技嘉Aero系列游戏新品,同时还展示了搭载RTX 2060的宏碁掠夺者Helios 500游戏本新品,根据官方介绍,移动级RTX 2060独立显卡能够提供优于桌面版GTX1070的性能,而移动版RTX2080显卡的性能已经大幅超越了GTX 1080独显的性能表现。

    游戏本性能再次飞跃 背后的图灵到底是何方神圣

      之所以能够在图形性能上大幅超越上代同级或更高一级的显卡,主要原因在于RTX 20系显卡的基本规格都进行普遍性的大幅度提升。以最新发布的RTX 2060显卡为例,其基于12nm制程图灵架构设计,CUDA流处理器达到1920个,与上一代GTX 1070独显的流处理器个数相当。同时还拥有6GB容量GDDR6显存,192bit显存位宽,并且支持实时光线追踪、NAS着色技术、DLSS深度学习超采样等新技术。

    游戏本性能再次飞跃 背后的图灵到底是何方神圣

      从硬性参数来看,全新的RTX 20系移动级显卡能够为游戏本带来更为强悍的图形性能输出,为玩家带来流畅的游戏画面体验。

    ·底层架构优化助力性能潜力爆发

      除了硬性的参数指标之外,RTX 20系显卡之所以性能发挥更为稳定和出色,与优化后的图灵架构密切相关。对于半导体芯片来说,参数是流于表面的性能指标,但是底层架构才是实现性能优化、提升、甚至爆发的根基,英伟达为RTX 20系显卡赋予的图灵架构正是为此而生。

    新卡皇降世 iGame RTX 2080Ti 首测
    图灵(Turing)架构示意图(TU102核心)

      此次RTX 20系显卡全面使用了图灵(Turing)架构,上图为TU102核心。我们可以看到完整的TU102核心由6组GPC组成,每组GPC包含6组TPC,不同于GTX 10系显卡的Pascal架构每组TPC仅有一组SM的设计,Turing架构每组TPC包含2组SM单元,所以一个GPC就包含12组SM单元,整个TU102核心一共有72组SM单元。

    新卡皇降世 iGame RTX 2080Ti 首测
    SM单元架构图

      我们再来简单剖析一下图灵架构的SM单元。可以看到,Turing架构的SM单元中已经没有了我们所熟悉的排列整齐的CUDA,而是变成了主要由64个INT32+64个FP32+8个Tensor Cores+1个RT Core组成的集合,同时添加了独立的INT数据路径,类似于Volta GV100 GPU的独立线程调度,支持FP32和INT32操作的并发执行。而Tensor Cores和RT Core则分别针对深度学习和实时光线追踪进行加速。

      需要注意的是,示例中的桌面级RTX 2080 Ti并非是完整版的TU102核心,其在SM单元上阉割了四组,由72组SM砍为68组,由此组成68×64=4352个CUDA单元、68×8=544个Tensor Cores以及68×1=68个RT Cores。

      因此,正是有强大的底层架构支持,才能让RTX 20系显卡在性能发挥上更加游刃有余。

    ·光线追踪将对游戏画面表现力产生深远影响

      最后我们再说说RTX光线追踪技术,因为它将对游戏画面表现力产生深远影响。

      RTX,全称Ray Tracing,光线追踪技术。是一种先进的实时光线渲染算法,与微软在DX12 API子集中力推的DXR技术站在相似的发展路线上,可以通过将光线扩展到整个场景中计算的方式打造出更加真实的环境,弥补了光栅化渲染的很多固有缺憾。

    新卡皇降世 iGame RTX 2080Ti 首测

    新卡皇降世 iGame RTX 2080Ti 首测
    RTX关闭和开启后的光影差异

      为什么现代的游戏拥有足以比拟真实世界的贴图材质,却依然带给我们假的感觉?其原因之一就是光线处理方法不自然。现在的游戏处理光线的方法是点光源通过物体反射到玩家的画面中,而那些复杂的光线反射和折射则通过预先处理好的“假”阴影等进行预加载,那么我们在玩游戏时只需要计算那些没有预加载的光线部分即可,效率很高但是很假。电影建模之所以有真实的视觉感受就是因为所有场景都是预渲染出来的,不需要在游戏中实时渲染。

    新卡皇降世 iGame RTX 2080Ti 首测
    RTX工作原理示意(注意光线箭头方向)

      实时光线追踪技术的原理是反推光线进程,以玩家的显示器为出发点(相当于一台摄像机),通过计算光线从显示器经过树叶,玻璃等的反射再到光源这一系列产生的效应,把阴影细节等部分加以保留,真正的做到了实时渲染且不卡顿。而这一切则是通过本次全新的图灵架构中的RT核心做到的。

    ·移动版/桌面版图形显卡性能越来越无差异化

      其实从GTX 10系开始我们就已经注意到,桌面级独显与移动级独显的性能差距已经几乎被抹平,这与GTX 9系之前桌面级与移动级泾渭分明的性能表现有着天壤之别。之所以能够达成这样的局面,很大程度上是来自制程工艺技术的进步,芯片体积缩小、性能增强的情况下,使得图形显卡完全没有必要从性能层面上再去区分桌面级与移动级,因而在RTX 20系图形显卡全面落地之后,延续了这种桌面与移动级的无差异化表现。

      对于这一代显卡来说,桌面级独显的价格成本上升不少,使得一部分用户望而却步,而移动版的发布则给了用户一个体验RTX 20系独显性能的最佳途径。同时,RTX 20系移动级独显也将为游戏本图形性能进化加上一枚助推器。

    本文属于原创文章,如若转载,请注明来源:游戏本性能再次飞跃 背后的图灵到底是何方神圣//nb.zol.com.cn/707/7074370.html

    nb.zol.com.cn true //nb.zol.com.cn/707/7074370.html report 4408   从GTX 9系到GTX 10系演进,英伟达将GPU图形性能做了一次超大幅度的突破,可谓是震惊世人。而从GTX 10系到RTX 20系,这种性能飞跃仍在继续,但更多的则是来自三大功能方面的提升:  其一,引入RTX(Real Time Ray Tracing),即光线追踪技术。  其二,引入DLSS(...
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • 笔记本电脑
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错