geforce gtx 1060 3g显卡好不好(秒天秒地秒泰坦)
2016年5月7日,NVIDIA博得先机,率先发布了全球首款16nm游戏显卡——GeForce GTX 1080/1070,正如老黄所说:“A New King”诞生,至此,GPU界展开了全新的篇章,1x nm级的AN显卡大战一触即发。
在NVIDIA Editor's Day的发布会上,老黄自信地宣称:“GeForce GTX 1080比GTX Titan X还快,甚至比双路GTX 980 SLI还快!其VR性能是GTX Titan X的2倍,能耗比是GTX Titan X的3倍!”说完这席话,台下爆发出雷鸣般的掌声和欢呼声,作为Pascal架构的首发先锋,GTX 1080竟做到了战胜上代Maxwell架构的所有卡,不得不让人感叹,新时代终于来了,GTX 1080缔造了全新的性能神话。
GeForce GTX 1080
老黄在会上展示了一张GTX 1080运行游戏时的帧数对比图,对比的对象是GTX 980,通过柱状图可以看出GTX 1080在游戏中的表现大约是GTX 980的1.7倍。就在昨天,笔者参加NVIDIA的媒体技术讲解会,会上证实,GTX 1080的游戏性能的确是GTX 980的1.7倍,VR性能是GTX 980的2.7倍。如果算上SLI的效率,GTX 1080的确如老黄所说,比GTX 980双路SLI要强一点,而根据推算,GTX 1080应该比GTX Titan X2强25-30%,这样一看,提升的确很大。
GeForce GTX 1080
不过这些都是根据NVIDIA自己的跑分以及会议上的说明得出的结论,实际性能如何需要我们亲自去证明。就在前不久,我们拿到了NVIDIA的公版GeForce GTX 1080,也就是老黄会上所称的“Founders Edition”,同时,我们也得到了NVIDIA提供的测试驱动368.14,该驱动正是老黄在发布会上进行演示时所用的驱动。是时候揭晓GTX 1080的神秘面纱了,究竟它是否能够如我们所期待和推测的那样强悍,我们会用软件和游戏一一去证明,来和我们一起,去见证泰坦的陨落,新一代卡皇的真容吧!
似是故人的新架构
GeForce GTX 1080采用了两年前就已在GTC上被老黄透漏的全新架构——Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的Tesla P100,其采用GP100大核心,而这次发布的GTX 1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX 1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。
NVIDIA GP104-400核心
基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX 980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX 1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。
3DMARK 11 GPU成绩
GeForce GTX 1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。GTX 1080的默认Pixel Fillrate能力达到了102.8Gpiexls/S,默认Texture Fillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX 1080拥有9 TFLOPS的超高单精度浮点运算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。
GP104架构图
Pascal架构GP104-400芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET工艺。
2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。
3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared Unified Cache等缓冲体系。
4、GP 104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
GP104 SM单元架构图
在GeForce GTX 1080上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell 2.0架构设计的显卡的体验。
初次见面,GDDR5X显存
HBM显存已经成为新一代高端显卡的标准之一,而且此前JEDEC也正式公布了JESD235A的技术规范标准,带来了TB/s级带宽、16/32GB超大容量的HBM2显存。不过HBM的问题在于显存成本依然很高,不可能短时间内应用在全部显卡上,因此GeForce GTX 1080使用了良品率更高,成本更低的GDDR5显存的升级版——GDDR5X显存。
GTX 1080上使用的GDDR5X显存
GDDR5X则可以简单理解为在GDDR5技术基础上的一个拓展,其选择采用双管齐下的方式来提升显存带宽。首先,它的总线从DDR(双倍数据倍率)升级到了QDR(四倍数据倍率)。
SDR、DDR及QDR的对比关系
需要说明的是,SDR(单倍数据倍率)即只利用时钟信号的上沿来传输数据;而DDR(双倍数据倍率)则同时利用了时钟信号的上沿和下沿来传输数据,这意味着系统可以在同样的时间内、同一时钟频率下将传输数据的速率提升一倍;而QDR(四倍数据倍率)则在DDR的基础上,进一步提供独立的写入接口和读取接口,以此达到四倍之于SDR的数据传输速率。
GDDR5X显存颗粒
同时,GDDR5X还简单粗暴的将数据预取位宽从8-Bit提升到了16-Bit,从而得到更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。相比之下,GDDR5现在最高也才7Gbps,超频到极限约为8Gbps。传输速率的提升再加上显存位宽的提升,相当于在提高车速的基础上又拓宽了车道数量,因此GDDR5X可以得到GDDR5两倍的带宽。
GDDR5X显存特性
虽然从本质上说,GDDR5X同GDDR5相比没有什么区别,但大幅提升的频率还是带来了可观的带宽提升。在HBM2显存良率达标之前,至少在最近的一段时间内,NVIDIA和AMD必然还是以GDDR5X显存为主。此外,镁光已经宣称GDDR5X显存量产,这就给使用GDDR5X显存的GTX 1080的产能有了一个保证,而AMD的全新Polaris显卡应该也会用上GDDR5X显存。
猛戳末尾“阅读原文”查看核心技术与测试↓↓
猛戳末尾“阅读原文”查看核心技术与测试↓↓
猛戳末尾“阅读原文”查看核心技术与测试↓↓
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com