geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)

2016年5月7日,NVIDIA博得先机,率先发布了全球首款16nm游戏显卡——GeForce GTX 1080/1070,正如老黄所说:“A New King”诞生,至此,GPU界展开了全新的篇章,1x nm级的AN显卡大战一触即发。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(1)

在NVIDIA Editor's Day的发布会上,老黄自信地宣称:“GeForce GTX 1080比GTX Titan X还快,甚至比双路GTX 980 SLI还快!其VR性能是GTX Titan X的2倍,能耗比是GTX Titan X的3倍!”说完这席话,台下爆发出雷鸣般的掌声和欢呼声,作为Pascal架构的首发先锋,GTX 1080竟做到了战胜上代Maxwell架构的所有卡,不得不让人感叹,新时代终于来了,GTX 1080缔造了全新的性能神话。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(2)

GeForce GTX 1080

老黄在会上展示了一张GTX 1080运行游戏时的帧数对比图,对比的对象是GTX 980,通过柱状图可以看出GTX 1080在游戏中的表现大约是GTX 980的1.7倍。就在昨天,笔者参加NVIDIA的媒体技术讲解会,会上证实,GTX 1080的游戏性能的确是GTX 980的1.7倍,VR性能是GTX 980的2.7倍。如果算上SLI的效率,GTX 1080的确如老黄所说,比GTX 980双路SLI要强一点,而根据推算,GTX 1080应该比GTX Titan X2强25-30%,这样一看,提升的确很大。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(3)

GeForce GTX 1080

不过这些都是根据NVIDIA自己的跑分以及会议上的说明得出的结论,实际性能如何需要我们亲自去证明。就在前不久,我们拿到了NVIDIA的公版GeForce GTX 1080,也就是老黄会上所称的“Founders Edition”,同时,我们也得到了NVIDIA提供的测试驱动368.14,该驱动正是老黄在发布会上进行演示时所用的驱动。是时候揭晓GTX 1080的神秘面纱了,究竟它是否能够如我们所期待和推测的那样强悍,我们会用软件和游戏一一去证明,来和我们一起,去见证泰坦的陨落,新一代卡皇的真容吧!

似是故人的新架构

GeForce GTX 1080采用了两年前就已在GTC上被老黄透漏的全新架构——Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的Tesla P100,其采用GP100大核心,而这次发布的GTX 1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX 1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(4)

NVIDIA GP104-400核心

基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX 980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX 1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(5)

3DMARK 11 GPU成绩

GeForce GTX 1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。GTX 1080的默认Pixel Fillrate能力达到了102.8Gpiexls/S,默认Texture Fillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX 1080拥有9 TFLOPS的超高单精度浮点运算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(6)

GP104架构图

Pascal架构GP104-400芯片由以下主要的部分组成:

1、基于TSMC的16nm FinFET工艺。

2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。

3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared Unified Cache等缓冲体系。

4、GP 104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。

5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(7)

GP104 SM单元架构图

在GeForce GTX 1080上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell 2.0架构设计的显卡的体验。

初次见面,GDDR5X显存

HBM显存已经成为新一代高端显卡的标准之一,而且此前JEDEC也正式公布了JESD235A的技术规范标准,带来了TB/s级带宽、16/32GB超大容量的HBM2显存。不过HBM的问题在于显存成本依然很高,不可能短时间内应用在全部显卡上,因此GeForce GTX 1080使用了良品率更高,成本更低的GDDR5显存的升级版——GDDR5X显存。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(8)

GTX 1080上使用的GDDR5X显存

GDDR5X则可以简单理解为在GDDR5技术基础上的一个拓展,其选择采用双管齐下的方式来提升显存带宽。首先,它的总线从DDR(双倍数据倍率)升级到了QDR(四倍数据倍率)。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(9)

SDR、DDR及QDR的对比关系

需要说明的是,SDR(单倍数据倍率)即只利用时钟信号的上沿来传输数据;而DDR(双倍数据倍率)则同时利用了时钟信号的上沿和下沿来传输数据,这意味着系统可以在同样的时间内、同一时钟频率下将传输数据的速率提升一倍;而QDR(四倍数据倍率)则在DDR的基础上,进一步提供独立的写入接口和读取接口,以此达到四倍之于SDR的数据传输速率。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(10)

GDDR5X显存颗粒

同时,GDDR5X还简单粗暴的将数据预取位宽从8-Bit提升到了16-Bit,从而得到更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。相比之下,GDDR5现在最高也才7Gbps,超频到极限约为8Gbps。传输速率的提升再加上显存位宽的提升,相当于在提高车速的基础上又拓宽了车道数量,因此GDDR5X可以得到GDDR5两倍的带宽。

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(11)

GDDR5X显存特性

虽然从本质上说,GDDR5X同GDDR5相比没有什么区别,但大幅提升的频率还是带来了可观的带宽提升。在HBM2显存良率达标之前,至少在最近的一段时间内,NVIDIA和AMD必然还是以GDDR5X显存为主。此外,镁光已经宣称GDDR5X显存量产,这就给使用GDDR5X显存的GTX 1080的产能有了一个保证,而AMD的全新Polaris显卡应该也会用上GDDR5X显存。

猛戳末尾“阅读原文”查看核心技术与测试↓↓

猛戳末尾“阅读原文”查看核心技术与测试↓↓

猛戳末尾“阅读原文”查看核心技术与测试↓↓

geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)(12)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页