精彩收藏 · 2023年5月31日 0

英伟达的最新“算力杀器”,DGX GH200到底有多强?

​一,NVIDIA宣布推出DGX GH200人工智能超级电脑

英伟达在5月29日开幕的COMPUTEX台北电脑展正式发布了DGX GH200 AI超级计算机,以及其搭载的GH200 Grace Hopper超级芯片。这种超级计算机专门用于AI计算,利用NVLink技术集成了256颗GH200超级芯片,使其如同一个GPU一样完美工作。

性能方面,DGX GH200超级计算机的运算速度可达1 Exaflop(百亿亿次),具有144 TB内存,远超此前的DGX A100。

英伟达CEO黄仁勋表示,“生成式人工智能、大语言模型与推荐系统,是推动现代经济的数字引擎。DGX GH200 AI超级计算机整合了英伟达最先进的加速计算和网络技术,能够扩展AI前沿领域。”

NVIDIA DGX GH200主要功能

>256个英伟达Grace Hopper 超级芯片,全部与NVIDIA NVLink互连   

>144 TB的巨大共享GPU内存空间   

>900千兆字节每秒(GB/s)  GPU到GPU带宽   

>FP8 AI性能的1倍

>NVIDIA基本命令™ 和NVIDIA AI Enterprise软件

二,强大的Grace Hopper芯片

英伟达的芯片命名很有讲究,它的所有芯片系列都是科学家的名字。这一次发布的超级计算机所用的GH,就是Grace Hopper的缩写。

Grace Hopper是美国计算机科学家、数学家和美国海军少将。她是哈佛Mark I计算机的第一批程序员之一,是计算机编程的先驱,发明了最早的链接器之一。霍普是第一个设计出与机器无关的编程语言理论的人,她用这个理论创造的FLOW-MATIC编程语言后来被扩展为COBOL,一种早期的高级编程语言,至今仍在使用。Fortran也有她的功劳。

英伟达的Grace Hopper是两个处理器做在了一个PCB上,它分为Grace和Hopper两部分,如下图,一左一右。

Grace是CPU,它是ARM架构的。

72个Arm Neoverse V2内核,采用Armv9.0-A ISA,每个内核4×128位SIMD单元。117MB的L3高速缓存。512GB的LPDDR5X内存,提供高达546GB/s的内存带宽。64X的PCIe5.0通道。英伟达可扩展一致性结构(SCF)网状和分布式缓存,内存带宽高达3.2TB/s。

Hopper是 GPU:
高达144个SM,拥有第四代Tensor Cores、Transformer Engine、DPX,与英伟达A100 GPU相比,FP32和FP64的整体性高出3倍。高达96GB的HBM3内存,提供高达3000GB/s的速度。二级缓存60 MB。扩展GPU内存功能使Hopper GPU能够将所有CPU内存作为GPU内存进行寻址。每个Hopper GPU可以在一个超级芯片内寻址多达608 GB的内存。

三,256个Grace Hopper有多强?

这款超算专为大规模生成式AI的负载所设计,由256块GH200超级芯片组成,拥有1 exaflop 的AI性能、144TB内存(是英伟达目前DGX A100系统的近500倍)、150英里光纤、2000多个风扇。需要提及的是,之前型号(DGX A100)只有8个GPU。

DGX GH200重达40000磅(约合18143千克),堪比四只成年大象的体重。

黄仁勋将其描述为世界上第一个具有巨大内存的加速计算处理器:“这是一台计算机而不是芯片。” 它专为高弹性数据中心应用而设计。如果Grace Hopper的内存不够用,英伟达有解决方案——DGX GH200。它是通过首先将8个Grace Hoppers与3个NVLINK交换机以900GB传输速度的Pod连接在一起再将32个这样的组件连接在一起再加上一层开关连接总共256个Grace Hopper芯片由此产生的 ExaFLOPS Transformer Engine具有144 TB的GPU内存,可用作巨型GPU。

英伟达表示它有1EB的计算能力!这是什么概念?刚刚出炉的世界超级计算机Top500排名,第一名的Frontier也就是1.1E的算力,1EB的算力,约等于Top500的25%!当然超级计算机的算力都是针对性的,英伟达的GH200有两大优势:第一是量产,第二则是针对AI推理这些的优化,能让大模型LLM运行的更快,或许年底在大企业部署之后,我们使用AI的成本和速度都能得到提升。

官方还表示,正在研发下一代Helios(古希腊神话太阳神-赫利俄斯)超级计算机,将配备四个DGX GH200系统,包含1024个GH200超级芯片;每个系统都将连接到英伟达Quantum-2 InfiniBand网络,能够为训练大型人工智能模型提高数据吞吐量。

四,英伟达独创NVIDIA NVLink交换系统

什么是NVLink,NVSwitch?

NVLink这是一种超快的芯片到芯片互连互通技术,将允许定制芯片连贯地互连到公司的 GPU、CPU、DPU、NIC和 SoC。

NVSwitch并非作为取代NVLink的技术,而是使两组NVLink共16颗GPU能够互相具备全速沟通通道的手段;在设计上,NVLink被加在每两组GPU之间,两组NVLink则在透过高速通道连接。

NVIDIA NVLink交换系统:

使用NVLink 4连接多达256个NVIDIA Grace Hopper超级芯片。每个连接NVLink的Hopper GPU可以寻址网络中所有超级芯片的所有HBM3和LPDDR5X内存,从而获得高达150TB的GPU可寻址内存,256个Grace Hopper就是英伟达的GH200超级计算机

DGX GH200超级计算机,是第一台将Grace CPU与Hopper GPU通过NVLink配对使用的超级计算机,全新的架构使得NVLink带宽是上一代的48倍,大大提高了AI计算的能力。

英伟达采用了创新的方案,使用NVLink-C2C连接技术将Arm架构的NVIDIA Grace CPU、NVIDIA H100 Tensor GPU整合到一个模块上。这项技术相比传统PCIe总线,速度提升了7倍,减少了5倍互联能耗,同时搭载了600GB共用内存。

五,A股多家公司回应与英伟达合作关系

英伟达的大涨也带动A股相关概念股猛涨,金百泽连续3个交易日20cm涨停,鸿博股份连续3个交易日10%涨停,胜宏科技近两日大涨超27%,精研科技近3个交易日暴涨28%。

热度正起,龙头公司却澄清与英伟达的关系。金百泽上周五发布异动公告表示,公司未向英伟达公司供货,不存在相关收入;仅部分研发的产品方案需要,会有采购英伟达的相关产品。英伟达公司的业绩情况,与公司的业绩并无直接相关影响。

不过,澄清公告并未影响市场对其的追捧,本周一,金百泽继续20cm涨停。

鸿博股份也于上周五发布异动公告,公司表示,截至目前,北京AI创新赋能中心项目已投入实际运营,相关产品与服务处于测试推广阶段。英博数科目前与五季智能(北京)科技有限公司签署算力租赁服务合同,英博数科在协议签署后的12个月内向五季智能提供高性能GPU算力出租服务,1期交付不超过256台服务器总计不低于1280P算力。英博数科已于本月初产生营业收入与利润,具体经营情况请以公司后续公告为准。

多家公司回应与英伟达合作关系

受英伟达概念大涨影响,投资者互动平台关于向英伟达供货的提问也明显增多,多家公司给出肯定回复后,股价出现大涨。

奥士康今日在互动平台回复称:公司有通过供应体系向英伟达提供PCB系列产品。早盘,奥士康股价封死涨停。

顺网科技回复:合作伙伴有英伟达。公司股价20cm涨停。

博杰股份回复称:与英伟达有合作订单,金额不大。公司股价近两日大涨12%。

以下这些公司也回复过与英伟达相关业务或合作。

易华录表示,公司和英伟达的合作还在洽谈阶段。

电连技术表示,公司对英伟达有相关产品的研发送样。

中电港表示,公司是英伟达在国内的授权分销商之一。

神州数码表示,公司是英特尔、英伟达的分销合作伙伴。

中富通表示,英伟达是控股子公司英博达的上游合作方之一。

先进数通表示,目前公司与英伟达的合作规模较小,对公司业务没有重大影响。

奥拓电子表示,英伟达为公司的重要客户。

奥比中光表示,公司发布的新品3D iToF相机Femto Mega由公司与微软、英伟达联合研发制造。

移远通信表示,公司5G模组与英伟达Jetson AGX Orin平台已成功完成联调。

环旭电子表示,公司“云端及存储产品”所服务的客户Mellanox已被英伟达收购

铁粉号盘中随时更新,近期热点发掘文章:

光伏反转,高纯石英砂概念除了石英股份、欧晶科技还有谁(深度分析)

光伏的暴击来了,不是超跌反弹,原因有二

硬核逻辑:数字中国纳入考核KPI,新型工业化分支2小龙(低位逻辑)

ChatGPT算力硬伤引爆CPO,CPO概念成长逻辑分析

钙钛矿赛道0~1加速开启,钙钛矿及HJT上游核心材料低位龙头(业绩反转)

美国大储毛利25%+以上,核心龙头机会分析

充电桩利空调整,分歧机会来临,低估三小龙

我会在 公众号:海涵财经 每天更新最新的医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。

— END —

先赞后看,养成习惯

免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除

人工客服(haihancaijing009):

图片