AMD公布Vega显卡详情：5年来GCN大改，HBM 2扩容没提速

从2011年底首发HD 7970显卡以来，AMD使用GCN架构已经有5年多时间了，同时针对图形、计算双重使命开发的GCN已经衍生出4代架构，时至今日依然是AMD显卡的主流，在异步运算等设计上很有前瞻性，在DX12/Vulkan时代依然不落伍。尽管如此，AMD还是准备了新一代显卡架构，昨晚正式公布了Vega显卡的架构设计，GCN架构将被NCU架构取代，不仅用上HBM 2显存，还会使用新的HPC缓存架构。

AMD之前就预告了这次活动，前情我们就不说了，这次官方公布的PPT洋洋洒洒近40页，前面介绍什么市场、趋势的内容就不提了，直接上干货，这篇文章可以告诉我们的是：

·Vega显卡新一代显存架构

·Vega显卡新一代几何渲染管线

·Vega显卡新一代NCU单元

·Vega显卡新一代像素引擎

但是AMD并没有公布的信息有Vega显卡的具体规格，包括但不限于流处理器单元数量、核心频率、显存频率、性能水平、上市时间、售价等等，这些关键信息还有待产品正式发布时再公布。

我们此前知道的Vega显卡

Vega显卡新一代显存架构

Vega显卡为人熟知的一个特点就是HBM 2显存，不过早在2015年的Fiji核心上AMD就使用过第一代HBM显存了，只是当时的Fiji架构并不是完全针对HBM开发的，现在的Vega核心不同，AMD称之为世界上最具并行性的GPU显存架构。

HPC缓存

HBM 2不仅仅是做显存，AMD给的定义是高带宽缓存（HPC，High Bandwith Cache）。

HBM 2优势

有关HBM 2显存的优势，我们之前的文章也介绍过多次了，相比HBM 1代1Gbps的速率，HBM 2的速率提升到2Gbps，这也是AMD宣称2x带宽/针脚的来源。

8倍密度，这是说HBM显存占用的面积比GDDR5更低

Techreport网站给出了Vega核心照片

看完上面的示意图，有些人可能要注意到HBM 2显存的配置方式跟Fury显卡不同——AMD之前是每个GPU核心堆栈4颗HBM显存，现在的Vega则是堆栈2颗，TR网站曝光的Vega实物图也证实了这个变化。这就解释了AMD之前公布的Vega显卡在使用了速率翻倍的HBM2之后，带宽为何是512GB/s，只跟第一代HBM显卡相同。

HBM 2显存容量更大，三星、SK Hynix都可以做到单颗容量4GB了，Vega显卡只要2颗就能实现8GB容量，容量上比Fury显卡扩大一倍，但堆栈数量少了一半，导致等效位宽从4096bit减少到2048bit，所以总带宽一降一升之后并没有变化，还是512GB/s。

这个问题怎么看呢？首先说512GB/s的显卡带宽在消费级产品依然是傲视群雄，比它高的是Tesla P100加速卡的720GB/s，但后者是针对高性能服务器市场的，价格贵的要死。其次，AMD这么做显然有助于降低成本，毕竟堆栈的HBM颗粒越少，制造难度也越低，成本也会更低。

HPC缓存主控

最高支持512TB虚拟寻址空间

自适应、细粒度数据迁移

辐射4、巫师3游戏的实例

AMD这么做的好处是什么？他们例举了巫师3、辐射4两款游戏做例子，它们分配的寻址空间要比实际占用的高得多，大约是实际使用的2倍，浪费严重。之所以这样，原因与DX11 API效率低有关，但也跟传统游戏的使用方式有关。

Vega显卡新一代几何渲染管线

Vega显卡第二个改进之处就是全新的可编程几何渲染管线，号称每周期吞吐率提升一倍，并使用了新的原语渲染器，改善了载入均衡。

2倍的吞吐率

新的原语指令渲染器

改善了载入均衡

Vega显卡新一代NCU单元

AMD显卡的GCN架构已经使用4代了，可以说是老骥伏枥，在Vega显卡上AMD又推出了NCU（Next-Generation Compute Engine）架构，优化了IPC性能，提高了灵活性。

NCU新一代引擎

此前曝光的AMD NCU架构

AMD在这次的PPT中并没有详细介绍NUC架构的特点，不过之前有消息提到了NCU的改进之处——现有的GCN单元中每个CU计算单元是64个流处理器，实际上是由4组固定16-Wide的单元组成，而Vega显卡的NCU架构中每组CU单元更具灵活性，可以根据工作负载来动态调配。

支持FP8、FP16精度计算

除了常规的FP32单精度、FP64双精度之外，NCU还将支持8位、16位计算，性能还会翻倍甚至4倍，这点其实也不是秘密了，因为之前公布的Radeon Instinct专业卡中MI25就是基于Vega显卡的，其25TFLOPS的性能就是指FP16，FP32浮点性能是12.5TFLOPS。

NUC为更高的时钟频率优化

注意这里的说法，AMD强调NCU是为更高的时钟频率优化，显然是在暗示Vega显卡的频率可以更高，目前的Polaris显卡虽然也是14nm工艺的，不过GPU核心频率在1.5GHz以内，这点比不上NVIDIA的Pascal显卡，后者跑到1.8GHz以上都不是事儿，现在AMD也强调Vega显卡为更高的时钟频率及IPC性能优化，希望核心频率也能跑的更高。

Vega显卡新一代像素引擎

最后一部分改进就是新一代像素引擎了，目前传统的架构中像素与纹理数据是非一致性的，新的像素引擎现在是后端与L2缓存相连，这将会提高使用延迟渲染技术的应用性能，换句话说这个改进对VR渲染之类的应用很有价值。

关注微信号expkf01，第一时间获知精彩活动和原创科技资讯。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。