打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AMD公布Vega显卡详情:5年来GCN大改,HBM 2扩容没提速

从2011年底首发HD 7970显卡以来,AMD使用GCN架构已经有5年多时间了,同时针对图形、计算双重使命开发的GCN已经衍生出4代架构,时至今日依然是AMD显卡的主流,在异步运算等设计上很有前瞻性,在DX12/Vulkan时代依然不落伍。尽管如此,AMD还是准备了新一代显卡架构,昨晚正式公布了Vega显卡的架构设计,GCN架构将被NCU架构取代,不仅用上HBM 2显存,还会使用新的HPC缓存架构。

AMD之前就预告了这次活动,前情我们就不说了,这次官方公布的PPT洋洋洒洒近40页,前面介绍什么市场、趋势的内容就不提了,直接上干货,这篇文章可以告诉我们的是:

·Vega显卡新一代显存架构

·Vega显卡新一代几何渲染管线

·Vega显卡新一代NCU单元

·Vega显卡新一代像素引擎

但是AMD并没有公布的信息有Vega显卡的具体规格,包括但不限于流处理器单元数量、核心频率、显存频率、性能水平、上市时间、售价等等,这些关键信息还有待产品正式发布时再公布。

我们此前知道的Vega显卡

Vega显卡新一代显存架构

Vega显卡为人熟知的一个特点就是HBM 2显存,不过早在2015年的Fiji核心上AMD就使用过第一代HBM显存了,只是当时的Fiji架构并不是完全针对HBM开发的,现在的Vega核心不同,AMD称之为世界上最具并行性的GPU显存架构。

HPC缓存

HBM 2不仅仅是做显存,AMD给的定义是高带宽缓存(HPC,High Bandwith Cache)。

HBM 2优势

有关HBM 2显存的优势,我们之前的文章也介绍过多次了,相比HBM 1代1Gbps的速率,HBM 2的速率提升到2Gbps,这也是AMD宣称2x带宽/针脚的来源。

8倍密度,这是说HBM显存占用的面积比GDDR5更低

Techreport网站给出了Vega核心照片

看完上面的示意图,有些人可能要注意到HBM 2显存的配置方式跟Fury显卡不同——AMD之前是每个GPU核心堆栈4颗HBM显存,现在的Vega则是堆栈2颗,TR网站曝光的Vega实物图也证实了这个变化。这就解释了AMD之前公布的Vega显卡在使用了速率翻倍的HBM2之后,带宽为何是512GB/s,只跟第一代HBM显卡相同。

HBM 2显存容量更大,三星、SK Hynix都可以做到单颗容量4GB了,Vega显卡只要2颗就能实现8GB容量,容量上比Fury显卡扩大一倍,但堆栈数量少了一半,导致等效位宽从4096bit减少到2048bit,所以总带宽一降一升之后并没有变化,还是512GB/s。

这个问题怎么看呢?首先说512GB/s的显卡带宽在消费级产品依然是傲视群雄,比它高的是Tesla P100加速卡的720GB/s,但后者是针对高性能服务器市场的,价格贵的要死。其次,AMD这么做显然有助于降低成本,毕竟堆栈的HBM颗粒越少,制造难度也越低,成本也会更低。

HPC缓存主控

最高支持512TB虚拟寻址空间

自适应、细粒度数据迁移

辐射4、巫师3游戏的实例

AMD这么做的好处是什么?他们例举了巫师3、辐射4两款游戏做例子,它们分配的寻址空间要比实际占用的高得多,大约是实际使用的2倍,浪费严重。之所以这样,原因与DX11 API效率低有关,但也跟传统游戏的使用方式有关。

Vega显卡新一代几何渲染管线

Vega显卡第二个改进之处就是全新的可编程几何渲染管线,号称每周期吞吐率提升一倍,并使用了新的原语渲染器,改善了载入均衡。

2倍的吞吐率

新的原语指令渲染器

改善了载入均衡

Vega显卡新一代NCU单元

AMD显卡的GCN架构已经使用4代了,可以说是老骥伏枥,在Vega显卡上AMD又推出了NCU(Next-Generation Compute Engine)架构,优化了IPC性能,提高了灵活性。

NCU新一代引擎

此前曝光的AMD NCU架构

AMD在这次的PPT中并没有详细介绍NUC架构的特点,不过之前有消息提到了NCU的改进之处——现有的GCN单元中每个CU计算单元是64个流处理器,实际上是由4组固定16-Wide的单元组成,而Vega显卡的NCU架构中每组CU单元更具灵活性,可以根据工作负载来动态调配。

支持FP8、FP16精度计算

除了常规的FP32单精度、FP64双精度之外,NCU还将支持8位、16位计算,性能还会翻倍甚至4倍,这点其实也不是秘密了,因为之前公布的Radeon Instinct专业卡中MI25就是基于Vega显卡的,其25TFLOPS的性能就是指FP16,FP32浮点性能是12.5TFLOPS。

NUC为更高的时钟频率优化

注意这里的说法,AMD强调NCU是为更高的时钟频率优化,显然是在暗示Vega显卡的频率可以更高,目前的Polaris显卡虽然也是14nm工艺的,不过GPU核心频率在1.5GHz以内,这点比不上NVIDIA的Pascal显卡,后者跑到1.8GHz以上都不是事儿,现在AMD也强调Vega显卡为更高的时钟频率及IPC性能优化,希望核心频率也能跑的更高。

Vega显卡新一代像素引擎

最后一部分改进就是新一代像素引擎了,目前传统的架构中像素与纹理数据是非一致性的,新的像素引擎现在是后端与L2缓存相连,这将会提高使用延迟渲染技术的应用性能,换句话说这个改进对VR渲染之类的应用很有价值。

关注微信号expkf01,第一时间获知精彩活动和原创科技资讯。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存
猜你喜欢
类似文章
李泽厚,美的告别
元宇宙,什么鬼?
深切哀悼中国人民的领袖江泽民同志
第一批阳康的夫妻,已经离婚了……
“永远吹冲锋号”专题片心得体会
顶流女星一脱成名,她救了30万中国军人性命。
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服