ChatGPT概念股 · 2023年3月1日 0

解决ChatGPT高算力需求,三大技术是核心,AIGC高算力产业链初探(附股)

前言:全球掀起ChatGPT热潮,人工智能提出几十年以来,从未如此火爆,而算力建设无疑是重中之重,之前有介绍过CPO技术,本篇将对影响ChatGPT未来算力的三大技术尽心逐一分享。

本篇目录
1.来龙去脉
2.需求背景
3.适应AIGC高算力要求的三大技术
4. 认识光计算
5. 硅基光电子计 算产业链
6.认识CPO
7.相关上市公司
8.独家核心提示

一,来龙去脉
根据微软统计,GPT-3.5 在微软Azure AI 超算基础设施上的训练总算力消耗约为3640PF-days,大约需要7–8 个30 亿投 资规模的数据中心才能支持ChatGPT 运行。2 月7 日-2 月9 日ChatGPT 官网多次因为满 负荷而无法登入,再次显示当前算力不足的问题,算力基础设施升级需求凸显。

二,需求背景
1.AIGC 的发展将催生巨大的算力市场。
ChatGPT 高智能化的背后是高算力及 RLHF 模型。ChatGPT 的高智能化来源于两点,GPT模型的高参数以及 RLHF 模型对 AI 理解人类思维逻辑、常识、价值观的训练优化过程。据 OpenAI 介绍,新的 GPT-3.5 使用了 Reinforcement Learning from Human Feedback (RLHF)模型即基于人类反馈的强化学习。这个模型使用人工 AI 训练师,用人类的视角给 AI 的行为评级并反馈给 AI,让 AI 逐步理解怎样的回答在人类看来是“好的”。其核心目标是让 AI 在训练过程中逐步产出和人类的认知逻辑、思维方式、语言逻辑等一致的程序逻辑。这也是 ChatGPT 在人类眼中表现出高度智能化的重要原因。

根据 ChatGPT 开发公司OpenAI 的研究报告《AI andCompute》,2012 年起,用于训练AL 所需要的算力每隔3-4 个月翻一倍,整体呈现指数型 上涨趋势。2012-2018 年,训练AI 所耗费的算力增长约30 万倍,而摩尔定律在相对应的 时间内只有7 倍的增长。算力的指数型增长也意味着高昂的算力成本,根据Lambda 测算,以V100 理想状态下28 TFLOPS 的算力和最低3 年起的云计算成本,GPT-3 的完整训练成 本将达到460 万美元,下一代GPT-4 参数将会更多,成本也将水涨船高,这将给算力相关 领域带来广阔的需求增量空间。

2.摩尔定律逼近物理极限,芯片性能提升速度放缓,换来成本、能耗激增。
摩尔定律是半导体行业的一个重要定律,其核心内容是:集成电路上可容纳晶体管的数量每过 18-24 个月就会翻一倍即处理器性能大约两年会翻一番。而现如今,随着速率快速提升,不断缩小的器件逐步逼近物理极限,虽然芯片科学家在 50 多年间使用各种手段来试图追赶摩尔定律,但仍然无法改变摩尔定律即将失效的事实。同时,随着晶体管密度增加,需要不断对晶体管技术进行改进,使得芯片价格愈发昂贵,根据 Digitimes 预测,台积电 3nm 工艺报价将超过 2 万美元,相比 5nm 上涨了25%。此外,随着设备性能提升,数据中心耗能已经达到社会总耗能的 2%一定比例,急需降低能耗。

3.传统可插拔光模块技术演进难以支撑高算力背景下数据中心的可持续发展。
根据Cisco 数据,在高算力背景下交换机交换芯片、光模块功耗增长迅速,传统可插拔光模块技术演进 难以支撑数据中心的可持续发展,主要由于:1)SI(电传输)的实现遭遇材料瓶颈,PCB 传输高速电信号,在应用传统可插拔光模块时,信号传输距离长、传输损失大。更低损耗 的可量产PCB 材料面临多重技术困难;2)功耗问题,满载1.6T 模块设备功耗巨大,散热 设计难度大;3)成本问题,整机成本相应提升,会加大网络建设的初期投入;4)端口设 计密度无法持续提升,传统可插拔光模块系统在支持128端口时需要非常复杂的系统设计,模块散热难度较大。

三,适应AIGC高算力要求的三大技术
|1.光子技术-后摩尔定律时代新赛道。
硅光子技术是光通信领域的一项技术,该技术基于硅和硅基衬底,利用 CMOS 工艺进行光器件开发和集成,旨在使用激光束代替电子信号传输数据。该技术最大优势在于信号传输速率高,可将处理器内核之间的传输速率提升 100 倍以上,并且光子芯片在制造工艺复杂度上远低于电子芯片,尺寸一般在百纳米级左右,可有效缓解芯片制程进入10nm 后制造工艺的瓶颈。现阶段,随着摩尔定律逐步逼近极限,芯片制成难度大,成本高,光子芯片在吸收了成熟微电子技术后,可以有效缓解芯片的尺寸、耗能问题,成为“摩尔定律”下的一条新技术路径,国内外各大厂纷纷选择入局。根据 Yole Group 预测,2027 年,硅光子市场规模将达到 9.72 亿美元,21-27 年的 CAGR 为 36%。

2.光电共封装技术-有望为 AI 集群与大数据中心提升传输速率,降低整体能耗。
传统技术是将硅光模块和 CMOS 芯片两个独立的模块在 PCB 上实现连接,虽更便于更换,但在功耗、尺寸和成本上都较为不利。光电封装技术(Co-Packaged Optics)是将硅光模块和 CMOS 芯片集成在同一个封装内之后,共同装配在一个插槽上,形成芯片与模组的共封装。首先硅光模块和 CMOS芯片之间的数据连接质量(信号耗损)相比 PCB 板来说要改善不少,因此能降低功耗;另一方面,在大规模量产之后,高级封装也能带来成本上的改善。最后,使用 CPO 之后,由于都集成在同一个封装内,整体系统的集成度大大提升,尺寸减小,因此也能提升硅光子技术在数据中心应用场景的普及。以 32×100Gbps 为例,现在所使用的交换机功耗 436W,而 CPO 交换机通过共同封装大幅度缩短电连接,功耗仅 230W。据市场调研机构 Lightcounting 预测,CPO 将于 2024 至 2025 年开始商用,2026 至 2027 年开始规模上量,主要应用于超大型云服务商的数通短距场景,到 2027 年,CPO 端口将占 800G 和 1.6T 端口的近 30%,目前市场仍由200G/400G 端口主导。CIR 预计到 2027 年,共封装光学的市场收入将达到 54 亿美元。

3.液冷技术-解决服务器散热问题的有效方案。
液冷是指使用液体取代空气,对发热部件进行散热的技术。目前随着数据量不断增加,数据中心需要增加更多服务器来提升计算能力,而受限于环保政策与数据中心面积,增加单位柜功率密度成为调和解决此矛盾的关键解决方案。据Colocation America 发布的数据,2020年全球数据中心单机柜平均功率为16.5KW,而 2008年仅为 6KW,增加了 175%。根据赛迪顾问预测,2025 年,全球数据中心单机柜平均功率将达25kW。目前,液冷技术相较风冷散热,有几大优势:1)利用液体传导热能能力更强及更高比热容的特点,保持服务器的稳定性及使用效率,省去空调系统建设,增加数据中心使用空间;2)相较传统风冷散热系统噪声更小;3)使数据中心的建设不受海拔、地域的限制,液体比热容不受海拔等因素的影响,因此在选择液冷数据中心时,所受限制更小。总体来说,液冷系统将保持一个较快的增长速度,据中国液冷数据中心发展白皮书预测,预计到 2025 年,中国液冷数据中心市场规模将达到 1283-1330 亿元,增速保持在 23-30%左右。

四,认识光计算
传统的光计算理念包括:50 年代开启的基于光学信息处理的光计算理论和系统研究;1996 年 Goodman 提出的斯坦福矩阵向量乘法器。在光学晶体管方面,包括 1975 年 McCall 等首次提出基于晶体双折射的光学晶体管器件;1976 年 Jain 等提出的基于二阶谐波产生的非线性光学晶体管;2019 年 Zasedatelev 等通过聚合物的等离激元效应增大光与物质的相互作用,实现了带增益可级联的全光晶体管,试图通过光的带宽优势实现超高频率的数字或模拟信号的逻辑处理元件,组成全光计算机体系研究,颠覆并取代微电子的计算机。

算力和能耗是光电计算中的核心问题。从实际应用的角度,需要对光电计算的算力和能耗进行深入评估。硅基光电计算芯片的直接竞争对手是进行大规模并行计算的专用集成电路芯片。

五,硅基光电子计 算产业链
硅基光子芯片目前通常是由 ECI 电芯片和 PCI 硅光芯片通过 2.5D 或 3D 封装堆叠组成。光学组件主要有光学神经网络计算芯片及激光器等部件组成,承担神经网络算法的线性计算和高通量数据搬运;电学组件包括电算力芯片主控板、数模转换器(Digital to Analog Converter,DAC)、模数转换器(Analog to Digital Converter, ADC)及相关驱动电路等部件组成。电学芯片承担神经网络算法中的部分非线性运算,并起到保存神经网络算法模型和权重、传输数据、控制光学芯片等功能。

硅基光电芯片将数十到数百个光器件(包括片上光源、MZ 调制器、探测器、波分复用等)集成到同一芯片上,在数据收发端替代原有的电传输模块,可在降低能耗的同时大幅增加数据通量。其中,硅光调制器主要采用 MZ 结构实现对光的调制,即对光信号进行计算与编码。

由于硅本身为间接带隙材料无法直接发光,作为光源,发光效率低,硅基光电子激光器依旧无法完成集成,相关高速激光器产业链也有望受益于硅基光电子计算的快速发展。

,认识CPO
硅光技术NPO 与CPO 技术可以有效降低功耗,是顺应算力升级的可持续发展路线。当前网络架构升级需要一方面满足人工智能、机器学习等应用对于带宽持续增加的实际需求,另一方面也需要突破功耗瓶颈,降低系统建设成本。对此,可以从交换机硅光技术发展的 两个阶段实现,第一阶段为NPO(Near packaged optic,近封装光学)技术阶段,可以在 CPO(Co-packaged optics,共封装光学)生态完备前,在最短时间内享受到低成本、低 功耗收益。第二阶段为CPO 技术阶段,这是交换机硅光技术的最终形态,可以极限降低网 络的成本和功耗。

CPO 架构是基于硅光技术实现高度集成的形态,通过共封装形式大幅缩短交换芯片和光引擎间的布线距离,进而降低SerDes 的驱动功耗成本,同时可实现更高密度的高速端口,提 升整机的带宽密度,实现大幅降低功耗,根据锐捷网络数据,相比应用传统光模块的设备,CPO 设备整机功耗将降低23%。NPO 方案则是基于硅光技术的高集成度和开放的生态,通过开放的光引擎接口,与交换芯片共同组装在同一块主板,以标准化架构的方式实现光 引擎和芯片的解耦,实现对于功耗的降低。

CPO 技术在AI 集群和HPC 中渗透率将逐步提升,预计在2027 年部署的800G 和1.6T 端口中,CPO 端口将占到近30%。根据LightCounting 预测,未来5 年时间内,AI 集群与 HPC 将会是CPO 技术主要的两大切入点,其背后的驱动力也是高算力、高带宽的迫切需 求。LightCounting 预计可插拔光模块设备将在未来5 年甚至更长时间内继续主导市场,然 而在2027 年部署的800G 和1.6T 端口中,CPO 端口将占到近30%。Communications Industry Researchers (CIR)指出,2025 年全球共封装光学元件(CPO)的销售额将超过13 亿美元,并预测至2028 年全球共封装光学器件的销售额将会翻一番,达到27 亿美元。

铁粉号近期热点发掘文章:

硬核逻辑:数字中国纳入考核KPI,新型工业化分支2小龙(低位逻辑)

ChatGPT算力硬伤引爆CPO,CPO概念成长逻辑分析

我会在 公众号:海涵财经 每天更新最新的医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。

— END —

先赞后看,养成习惯

免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除

人工客服(haihancaijing009):

图片