本文约600字,需1分钟阅读

昨晚AMD果然举行了Next Horizon”大会,主题当然就是7nm产品,除了7nm Zen 2内核处理器外,少不了7 nm显卡,首发产品却是面向计算领域的Radeon Instinct计算卡——Radeon Instinct MI 60、Radeon Instinct MI 50。

Radeon Instinct MI 60/50依旧是基于Vega架构演进而来,7nm工艺加持下,晶体管密度增加一倍,在331mm2的核心面积中集成了132亿晶体管,作为参考14nm Vega核心核心面积484mm2晶体管数量却为125亿,进步相当明显。

新工艺还带了额外的“红利?#20445;?#22312;相同功耗情况下,性能提升25%;同样频率下,功耗下降50%,7nm工艺真的足够诱惑,毕竟解决了很多AMD显卡以往积累下来的问题。

AMD还很?#19981;?#35762;Vega是一个高度灵活的高性能架构,不过这一次7nm Vega核心架构似乎更加偏向于专业方面,拥有目前世界上最快的FP64/FP32 浮点性能、HBM 2显存、显存ECC?#26469;?#21151;能、唯一的硬件虚拟化,?#35270;?#20110;机器学习训练。

这一次AMD给Radeon Instinct计算卡配备了32GB HBM2显存,使得显存带宽突破了1TB/s大关,并支持ECC?#26469;?#25216;术,这些都意味着专门应用于计算领域,游戏领域可用不上这么夸张的显存容?#20426;?#24102;宽。

我们目前显卡均采用PCI-E 3.0接口,而7nm Vega架构率先完成了对PCI-E 4.0的适配支持,配合AMD专有的Infinity Fabric总线,支持四张Radeon Instinct计算卡同时并?#24615;?#31639;,具备极佳的扩展性,而?#33402;?#31181;架构下,显卡性能得到最大提升,双卡几乎是100%提升。

目前Radeon Instinct MI 60、Radeon Instinct MI 50的具体规格依然是保密的,不过AMD也提供了一些性能参考数据,Radeon Instinct MI 60双精度性能为7.4 TFLOPS,单精度翻倍至14.7 TFLOPS,整数性能118 TLOPS。这个数值与NVIDIA的Tesla V100显卡单精度浮点15 TFLOPS,双精度浮点7.5 TFLOPS相近。

Radeon Instinct MI 50具体规格、性能将会稍后公布,两张7nm Radeon Instinct显卡均会在今年出货,而7nm游戏显卡将会在明年与大家见面,至于是Vega架构还是Navi架构,大?#20063;?#19968;猜?


?
  • NightView研究生 2018-11-10 01:14

    快报快报!
    AMD在MI60的PPT当中没有对N卡进行正?#25918;?#32622;,得到的结果有误:
    wccftech.com/amd-radeon-mi60-resnet-benchmarks-v100-tensor-not-used/?tdsourcetag=s_pcqq_aiomsg
    在正确设置后,PCIe的Tesla V100深度学习RESNET-50性能达到了MI60的3.7倍!就连70W TDP的Tesla T4都比300W TDP的MI60更强,真是笑死?#27515;?img src="static/image/smiley/wsm/01.jpg" smilieid="159" border="0" alt="" />

    支持(0)  |   反对(0)  |   举报  |   回复

    19#

  • NightView研究生 2018-11-08 19:18

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    已经隐藏6层评论[点击展开]

    超能康猩猩 博士 :

    GV100也是7.4T,说最快依然没毛病
    2018-11-08 19:02 已有7次举报
  • 支持(0)  |   反对(7)  |   举报  |   回复
  • 你这是小数点精度不够看着一样而已
    然而真正更精确的指标是:
    Quadro GV100 FP32是14.807TFlops,FP64是7.40352TFlops
    MI60 FP32是14.7456TFlops,FP64是7.3728TFlops
    MI60的那7.4TFlops不过是四舍五入近似,根本没真正达到,而Quadro GV100才是真正达到了7.4TFlops的。

    况且别忘记Quadro GV100是有boost的,boost频率1628MHz
    Quadro GV100在boost后的真实性能是FP32:16.671TFlops,FP64:8.335TFlops

    支持(2)  |   反对(0)  |   举报  |   回复

    18#

  • 超能康猩猩博士 2018-11-08 19:02

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    已经隐藏5层评论[点击展开]

    NightView 研究生 :

    当Quadro GV100不存在是么?还是说Quadro GV100接口不是PCIE呢?
    2018-11-08 18:50
  • 支持(4)  |   反对(1)  |   举报  |   回复
  • GV100也是7.4T,说最快依然没毛病

    已有7次举报

    支持(0)  |   反对(7)  |   举报  |   回复

    17#

  • NightView研究生 2018-11-08 18:50

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    已经隐藏4层评论[点击展开]

    超能康猩猩 博士 :

    pcie接口的v100性能只有7T,NVlink的才能达到7.8T
    2018-11-08 18:45 已有7次举报
  • 支持(0)  |   反对(7)  |   举报  |   回复
  • 当Quadro GV100不存在是么?还是说Quadro GV100接口不是PCIE呢?

    支持(4)  |   反对(1)  |   举报  |   回复

    16#

  • 超能康猩猩博士 2018-11-08 18:45

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    已经隐藏3层评论[点击展开]

    NightView 研究生 :

    Tesla V100难道不是插PCIe插槽上用的?难道不是pcie capable?
    2018-11-08 18:32
  • 支持(3)  |   反对(0)  |   举报  |   回复
  • pcie接口的v100性能只有7T,NVlink的才能达到7.8T

    已有7次举报

    支持(0)  |   反对(7)  |   举报  |   回复

    15#

  • NightView研究生 2018-11-08 18:32

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    人家只说是第一个7nmGPU,什么时候说是最快了?
    2018-11-07 21:24 已有11次举报
  • 支持(1)  |   反对(12)  |   举报  |   回复
  • NightView 研究生 :

    第三张图的最左面那堆文字,你看不懂英文么?还是眼睛不好?
    2018-11-07 22:07
  • 支持(5)  |   反对(0)  |   举报  |   回复
  • 超能康猩猩 博士 :

    pcie capable gpu?
    2018-11-08 18:23 已有6次举报
  • 支持(0)  |   反对(6)  |   举报  |   回复
  • Tesla V100难道不是插PCIe插槽上用的?难道不是pcie capable?

    支持(3)  |   反对(0)  |   举报  |   回复

    14#

  • 超能康猩猩博士 2018-11-08 18:23

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    人家只说是第一个7nmGPU,什么时候说是最快了?
    2018-11-07 21:24 已有11次举报
  • 支持(1)  |   反对(12)  |   举报  |   回复
  • NightView 研究生 :

    第三张图的最左面那堆文字,你看不懂英文么?还是眼睛不好?
    2018-11-07 22:07
  • 支持(5)  |   反对(0)  |   举报  |   回复
  • pcie capable gpu?

    已有6次举报

    支持(0)  |   反对(6)  |   举报  |   回复

    13#

  • NightView研究生 2018-11-08 00:45

    游?#20572;?/h3>同功耗提升25%,所谓7nm也救不了GCN
    2018-11-07 17:39
  • 支持(1)  |   反对(2)  |   举报  |   回复
  • 游客 教授 :

    同样频率下,功耗下降50%
    2018-11-07 23:21 已有4次举报
  • 支持(0)  |   反对(4)  |   举报  |   回复
  • MI25功耗300W,频率1500MHz,12.288TFlops的单浮点
    也就是说, MI60在300W功耗情况下,拥有12.288*1.25=15.36TFlops单精度浮点,计算下来是1875MHz频率
    因为默认单精度浮点是14.7TFlops所以计算下?#21019;?#27010;1800MHz频率

    根据同频率下功耗低50%,所以MI60在1500MHz的时候只有150W功率,增加375MHz后,功耗翻倍到300W,你认为这样可能?#28304;?#20040;?a
    所以这个“同频率”很有可能是同为1200MHz甚至1000MHz的时候,多半不是1500MHz下,这功耗低得有意义么?

    支持(0)  |   反对(1)  |   举报  |   回复

    12#

  • 游客教授 2018-11-07 23:21

    游?#20572;?/h3>同功耗提升25%,所谓7nm也救不了GCN
    2018-11-07 17:39
  • 支持(1)  |   反对(2)  |   举报  |   回复
  • 同样频率下,功耗下降50%

    已有4次举报

    支持(0)  |   反对(4)  |   举报  |   回复

    11#

  • NightView研究生 2018-11-07 22:07

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 超能康猩猩 博士 :

    人家只说是第一个7nmGPU,什么时候说是最快了?
    2018-11-07 21:24 已有11次举报
  • 支持(1)  |   反对(12)  |   举报  |   回复
  • 第三张图的最左面那堆文字,你看不懂英文么?还是眼睛不好?

    支持(5)  |   反对(0)  |   举报  |   回复

    10#

  • 超能康猩猩博士 2018-11-07 21:24

    NightView 研究生 :

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
    2018-11-07 13:14 已有4次举报
  • 支持(12)  |   反对(4)  |   举报  |   回复
  • 人家只说是第一个7nmGPU,什么时候说是最快了?

    已有11次举报

    支持(1)  |   反对(12)  |   举报  |   回复

    9#

  • 游客  2018-11-07 17:39

    同功耗提升25%,所谓7nm也救不了GCN

    支持(1)  |   反对(2)  |   举报  |   回复

    8#

  • 游客  2018-11-07 15:53

    专注挖矿几十年

    支持(0)  |   反对(0)  |   举报  |   回复

    7#

  • NightView研究生 2018-11-07 13:35

    INT整数性能都只有118TLOPS,然而Tesla V100的FP16都能有120TFLOPS了。
    至于RTX8000的INT4整数性能则达到了500多TLOPS...

    支持(2)  |   反对(0)  |   举报  |   回复

    6#

  • 游客  2018-11-07 13:24

    一般说到TFLOPS都会用FP32性能来?#22797;?#36825;里牛逼,直接用FP64了,不知道的还以为AMD这一代性能只有上代一半呢

    支持(1)  |   反对(1)  |   举报  |   回复

    5#

  • NightView研究生 2018-11-07 13:14

    AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快

    已有4次举报

    支持(12)  |   反对(4)  |   举报  |   回复

    4#

  • 游客  2018-11-07 12:57

    amd加?#20572;?18买的1070ti刚送去返修,nv真的烂。

    已有7次举报

    支持(4)  |   反对(7)  |   举报  |   回复

    3#

  • liyun_1981博士 2018-11-07 12:14

    按摩店早就应?#20040;?#28608;下英伟达了

    已有6次举报

    支持(2)  |   反对(7)  |   举报  |   回复

    2#

  • 游客  2018-11-07 12:10

    AMD加油就行了

    支持(3)  |   反对(1)  |   举报  |   回复

    1#

加载更多评论

回复

热门文章
1跨越50年之战,AMD锐龙7 2700X与Intel Core i7-8086K的?#31354;?#23545;决
2618精选:XFX Radeon VII 4899元带回家,RX 590 8GB黑?#21069;?#20165;售1196元
3两条M.2合体带来双倍速度:慧荣展示M.4 SSD,PCIe 3.0 x8接口
4全球首款PCI-E 4.0 SSD发布,技嘉推出AORUS NVMe Gen4 SSD
514nm产能不足,英特尔寻求三星代工Rocket Lake系列处理器
6有?#35270;?#31572;:装机时内存选择单条16GB还是两根8GB的?
7DRAM厂商正在评估采用EUV技术,主要是为了降低单位生产成本
8分析预测明年5G iPhone屏幕尺寸改变:大的6.7英寸、小的5.4英寸
9超算全球500强:中国上榜数量蝉联世界第一
快三押大小单双技巧