英伟达发布新卡皇,搭载完整的84组sm单元!


   在日前举办的GTC 2020主题大会中,NVIDIA正式公布了采用8nm工艺安培架构的RTX A6000和RTX A40两款专业图形卡和计算卡,分别面向工作站和服务器产品。其定位用以替代RTX 8000和Tesla T4,值得一提的是,这一次NVIDIA没有再用Quadro品牌来冠名。NVIDIA表示,由于RTX已能代表未来图形运算的一切,因此舍弃了过往常用的Quadro和Tesla产品线。

  NVIDIA 3000系列显卡采用代号为GA102的核心。相比于之前的GA100,在GA102核心中,FP64单元大幅减少,增加了RT Core,Tensor Core也略微减少,换来的是FP32性能翻倍,同时第二代RT core和第三代Tensor core也使得安培架构显卡可以获得相较于前代100%的性能提升。

  GA102核心总计共有7组GPC单元,每组有12组SM单元,总计84组,RTX 30系列显卡视乎规格不同启用的SM单元总数不同,RTX 3090是82组,RTX 3080是68组,RTX 3070是46组。而此次发布的Quadro RTX A6000具备完整的84组SM单元,共计10752个CUDA流处理器,相较于RTX 3090的10496个CUDA流处理器更完整,同时配有高达48GB的GDDR6显存,相较于3000系列显卡的GDDR6X,有所退步,NV方面解释称是由于GDDR6X显存达不到这么高的容量。

  NVIDIA表示,新卡RTX专业卡的性能提升十分出色,光线追踪场景的性能提高了2倍,从而为电影摄制者提供了更快,更逼真的场景和电影创作。即使是视觉工具制造商,例如Luxion,在其KeyShot可视化工具中,RTX A6000的性能的性能也提高了3倍,从34.7 FPS跃升至88.9 FPS。相较于上代RTX 8000几乎翻倍

  RTX A6000是工作站图形卡,而A40是供服务器使用的计算卡,因此从技术上讲,Tesla A40可以视为Tesla T4的后继产品。不同之处在于,A40将支持显示输出,而Tesla服务器卡过去并不支持。与RTX A6000一致,Tesla A4同样配备了48GB的GDDR6显存,但规格有所差别,A6000的等效显存频率为16Gbps,显存带宽为768 GB/s,而A40相对保守一些,等效显存频率为14.5Gbps,显存带宽为696GB/s。且两张新卡均支持第三代NV Link,可串联两张卡同步运算,显存容量可扩充至96GB让双GPU共用。

  相比于RTX 3000系列显卡,NVIDIA新发布的RTX A6000和Tesla A40并不是面向普通消费者,A6000作为专业图形卡,受众更多是专业需求人士,而A40这张卡则是更多用于深度计算领域。对于用来玩游戏或是普通渲染计算的用户来说,RTX 3090显然更适合他们。