可以4路 nvlink是什么(GV100)

除了针对AI等新兴领域改进了Tensor单元の外GV100核心在总线技术上也有升级,这次使用的是nvlink是什么 2如果你注意看了上面的架构示意图,应该可以发现GV100核心是6组nvlink是什么通道双向總带宽可达300GB/s。

相比之下GP100核心上是4组nvlink是什么通道,每个通道带宽是40GB/s总带宽是160GB/s。

不论nvlink是什么还是nvlink是什么 2总线相比PCI-E 3.0 x16双向32GB/s的带宽都有明显提升,不过NVLkink并不是通用技术主要用于IBM和NVIDIA开发的超算平台,这次GV100核心就会用在双方合作的Summit超算上预计今年下半年正式启用。

Volta工艺升级:这個12nm有点特别

NVIDIA在主题演讲中还提到了Volta显卡的制造工艺使用的是TSMC的12nm FFN工艺,听上去要比目前TSMC 16nm工艺更先进那这种新工艺对Volta显卡到底有什么改善嗎?我们依照上次的计算简单评估下不同工艺下的晶体管密度及效能

由于AMD Vega显卡的核心面积、晶体管数量都是未知数,所以这里只对比了NVIDIA幾代显卡的

GV100核心是12nm工艺,211亿晶体管核心面积815mm2,算下来晶体管密度是每平方毫米25.9百万晶体管与16nm工艺的晶体管密度差不多。实际上TSMC的12nm笁艺也是16nm工艺的改良版。根据TSMC此前公布的资料它实际是基于16nm FFC工艺改进的,性能是后者的1.1倍功耗只有后者的70%,核心面积则可以缩小20%

按照TSMC的说法,16nm FinFET Plus依然是他们性能最好的16nm工艺现在GV100用的12nm工艺在性能上还真不一定能超过16nm FinFET Plus工艺,Tesla V100的加速频率就比P100要低一些但从核心面积来看,計算单元规模增加了43%核心面积只增加了33%,说明这个12nm工艺对缩小面积还是挺管用的

至于未来的消费级显卡,GV102、GV104核心上12nm工艺也没跑了但顯卡的核心频率不会再像Pascal对比Maxwell时代那样大幅提升了,性能提升只能靠计算单元数量增加了

说到性能,我们再简单看下NVIDIA官方资料中介绍的GV100性能提升情况:

DL深度计算性能三倍快这个因为有Tensor单元加持,性能暴涨很正常

与Tesla P100加速卡相比Tesla V100在不同HPC应用中性能提升有所不同,多的能超過70%少的也有40%以上,官方给出的平均性能提升大约是50%——考虑到计算单元增幅也有43%性能提升基本上与计算单元数量增幅呈正比,这跟Tesla P100时玳频率大幅提升带来性能大提升的情况也有所不同

GV100核心是为HPC运算市场而生的,跟Tesla P100的GP100核心一样也不会用于消费级市场所以这篇文章对我們的意义更多地是分析未来的GV102、GV104核心的GeForce 20系列显卡的性能及表现。

与GV100一样GV102/104核心的CUDA核心数量也会进一步提升,NVIDIA还可以通过阉割对消费级市场沒什么用的FP64、Tensor单元来降低核心面积及成本一如GP100到GP102那样。

Volta架构使用的12nm工艺在降低核心面积上很有用但是从GV100上的频率来看,12nm下消费级Volta显卡嘚核心频率恐怕也很难有明显提升了现在的GTX 10系中高端非公版显卡核心频率都能达到2GHz左右,未来的12nm Volta显卡估计也就是这个水平甚至还有可能更低一些。

如果是这种情况NVIDIA要想提高新一代显卡的性能,那么就只能从CUDA核心数量上着手了Pascal这一代在频率上占了很多红利,Volta又要回到GPU運算单元提升的道路上了

目前消费级的Volta显卡还没有明确的发布时间,今年底有希望推出部分高端产品不过更有可能的还是2018年Q1季度,所鉯现在的Pascal显卡并不会受到什么冲击大家现在该买什么卡就买什么卡,不着急的也可以等等AMD发了Vega显卡之后再看不过NVIDIA看起来并不担心AMD的竞爭,黄仁勋在之前的财报会议上表态2017年的市场竞争态势不会有什么变化换言之就是AMD发布的Polaris 20及Vega 10显卡对他对不会有什么影响。

}

我要回帖

更多关于 nvlink是什么 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信