资讯

GPU史上最大性能飞跃:NVIDIA发布7nm安培架构GPU,拥有540亿晶体管的“核弹”

2020-05-14 22:57:34 31点赞 28收藏 72评论

本文经快科技授权发布,原标题:NVIDIA发布7nm安培:540亿晶体管核弹、GPU史上最大性能飞跃,文章内容仅代表作者观点,与本站立场无关,未经允许请勿转载。

5月14日晚,在GTC 2020线上发布会上,NVIDIA干脆利落地在几分钟内就放出了老黄的演讲视频,正式推出了安培(Ampere)架构GPU,7nm工艺,540亿晶体管,20倍AI算力,5大技术创新,总之新核弹来了。

目前NVIDIA还没有正式公开安培GPU的详细架构细节,但是跟上次的图灵GPU一样,黄仁勋表示这是NVIDIA八代GPU史上最大的一次性能飞跃。

GPU史上最大性能飞跃:NVIDIA发布7nm安培架构GPU,拥有540亿晶体管的“核弹”

首款基于安培GPU的产品是Tesla A100加速卡,根据NVIDIA所说,它带来了5大技术创新:

  1. 全新安培GPU架构,540亿晶体管,世界上最大的7nm处理器。

  2. 第三代Tensor Core AI核心,支持TF32运算,无需任何代码改变就可以让AI性能提升20倍,还支持FP64双精度运算,与HPC应用相比带来了2.5倍的性能。

  3. Multi-instance GPU多实例GPU:简称MIG,这是一项创新技术,可以将一个GPU划分为七个独立的GPU,针对不同的目标提供不同的运算,最大化提高计算效率。

  4. NVLink 3.0:新一代GPU总线的性能翻倍,可以在服务器应用中提供更有效的性能扩展。

  5. 结构稀疏性:这项新技术利用了AI运算中固有的稀疏性实现了性能翻倍。

这5大技术创新使得Tesla A100加速卡成为苛刻工作负载的理想选择,不仅可以用于AI推理、AI训练,还可以用于科学仿真、AI对话、基因组、高性能数据分析、地震建模及财务计算等等。

与此同时,NVIDIA还宣布了基于Tesla A100的DGX A100超算,有8路Tesla A100加速卡,性能高达5PFLOPS,阿里云、AWS云、谷歌云、微软Azure、甲骨文及腾讯云都将推出基于DGX A100的云服务。

目前DGX A100发布之后就立即上市了,跟当年的Tesla V100完全不同,美国、德国的多个实验室及超算中心已经开始使用Tesla A100作为超算解决方案了。

PS:今晚的视频中,老黄的头发已经白了一半,作为目前全球最强GPU的掌门人,7nm安培GPU显然花费了NV公司不少心血,目前揭开的还只是计算方面的,RTX游戏卡还没公布多少信息。

GPU史上最大性能飞跃:NVIDIA发布7nm安培架构GPU,拥有540亿晶体管的“核弹”

这次的GTC 2020大会演讲中,NVIDIA CEO黄仁勋主要谈的就是HPC计算、AI人工智能等方面的内容,目前推出的A100大核心也是针对这个领域的,与之相比的是3年前发布的Volta架构V100核心,很多东西跟RTX 3080 Ti游戏卡会不一样,大家不用纠结。不过官方并没有公布安培GPU的技术细节,Anandtech网站倒是给出了一份详细的介绍。

GPU史上最大性能飞跃:NVIDIA发布7nm安培架构GPU,拥有540亿晶体管的“核弹”

首先来说大方面的,V100核心使用的是12nm Volta架构,211亿晶体管,核心面积815mm2,而A100核心是台积电7N工艺,应该也是定制版的7nm工艺,826mm2,542亿晶体管,同样是核弹级别的。

V100核心拥有80组SM单元,5120个CUDA核心,SXM2/3架构,而A100核心是108组SM单元,SXM4架构,6912个CUDA核心。

AI方面是变化最大的,相比Volta架构的640个Tensor Core,A100核心的Tensor Core减少到了432个,但是性能大幅增强,支持全新的TF32运算,浮点性能156TFLOPS,同时INT8浮点性能624TOPS,FP16性能312TFLOPS。

常规的FP32、FP64性能提升倒是不算明显,从V100核心的15.7.、7.8TFLOPS提升到了19.5、9.7TFLOPS

频率方面,A100核心实际上还倒退了,从V100的1530MHz降低到了1.41GHz左右,毕竟核心规模实在太大,功耗已经飙到了400W,比V100的300/350W功耗高出不少。

显存方面,A100配备的也是HBM2显存,频率从1.75Gbps提升到了2.4Gbps,位宽5120bit,相比V100的4096bit增加了1024bit,容量也从16/32GB增加到了40GB。

不过HBM2的配置略显奇怪,增加1024bit理论上应该多1组HBM2,但从核心图上看又是6组HBM2显存,或许是2组512bit的?保不准以后还会有完整版A100核心。

不过HBM2显存位宽、频率双双提升的后果就是,A100核心寸带宽达到了1.6TB/s,远高于V100的900GB/s,比AMD的Radeon VII显卡的1TB/s带宽还要高。

最后,NVLink技术也升级到了3.0版,带宽从300GB/s提升到了600GB/s,适合服务器领域多卡互联,不过未来应该还会有PCIe版的。

GPU史上最大性能飞跃:NVIDIA发布7nm安培架构GPU,拥有540亿晶体管的“核弹”

未经授权,不得转载
展开 收起

NVIDIA NVIDIA JETSON NANO

NVIDIA NVIDIA JETSON NANO

735元起

NVIDIA 英伟达 RTX 3080 显卡

NVIDIA 英伟达 RTX 3080 显卡

暂无报价

NVIDIA 英伟达 RTX 3070 显卡

NVIDIA 英伟达 RTX 3070 显卡

暂无报价

NVIDIA 英伟达 RTX 3090 显卡

NVIDIA 英伟达 RTX 3090 显卡

暂无报价

ASUS 华硕 TUF GAMING GeForce RTX3080 显卡 10GB

ASUS 华硕 TUF GAMING GeForce RTX3080 显卡 10GB

5499元起

GIGABYTE 技嘉 GeForce GTX 1660 SUPER GAMING OC 显卡 6GB

GIGABYTE 技嘉 GeForce GTX 1660 SUPER GAMING OC 显卡 6GB

1749元起

MSI 微星 旗舰魔龙 GeForce GTX 1660 SUPER GAMING X 显卡 6GB

MSI 微星 旗舰魔龙 GeForce GTX 1660 SUPER GAMING X 显卡 6GB

1889元起

MINGYING 铭影 RX560D 4G 游戏独立显卡

MINGYING 铭影 RX560D 4G 游戏独立显卡

464元起

yeston 盈通 RX560D-4G D5 大地之神 显卡 4GB

yeston 盈通 RX560D-4G D5 大地之神 显卡 4GB

599元起

Hasee 神舟 GT610 多屏显卡HDMI DVI VGA接口

Hasee 神舟 GT610 多屏显卡HDMI DVI VGA接口

159元起

小影霸(Hasee神舟)GT210/710/730 1G DDR3炒股监控投影多屏显示电脑独立显卡 GT210 1G

小影霸(Hasee神舟)GT210/710/730 1G DDR3炒股监控投影多屏显示电脑独立显卡 GT210 1G

159元起

GALAXY 影驰 GeForce GTX 1050 Ti 大将 显卡 4GB

GALAXY 影驰 GeForce GTX 1050 Ti 大将 显卡 4GB

842.91元起

MAXSUN 铭瑄 GeForce GT 710 重锤PLUS 2GB 显卡

MAXSUN 铭瑄 GeForce GT 710 重锤PLUS 2GB 显卡

299元起

MAXSUN 铭瑄 GT 1030 变形金刚2G 显卡

MAXSUN 铭瑄 GT 1030 变形金刚2G 显卡

479元起

铭影GTX750ti显卡战神2g独立显卡吃鸡游戏显卡台式机电脑显卡 GTX750Ti 2GB

铭影GTX750ti显卡战神2g独立显卡吃鸡游戏显卡台式机电脑显卡 GTX750Ti 2GB

394元起

技嘉(GIGABYTE)GeForce RTX 2080 SUPER GAMING OC QDTH

技嘉(GIGABYTE)GeForce RTX 2080 SUPER GAMING OC QDTH

3629元起
72评论

发表评论请 登录
  • 最新
  • 最热
评论举报

请选择举报理由

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
28
扫一下,分享更方便,购买更轻松