精彩收藏 · 2023年4月12日 0

华为盘古大模型要点梳理,相关受益公司一览(附股)

今日(4月8日),由中国人工智能学会主办的”人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。国际欧亚科学院院士、华为云人工智能领域首席科学家田奇出席并演讲。

田奇表示,人工智能行业渗诱率将持续提速,2026年将达到20%。他提出了一种将大模型像自动驾驶一样划分为”0~L2″不同阶段的方式,并称大模型已成为应对A应用碎片化的一种方式,将导致市场向大公司集中,产业规则及格局也可能随之改变。他分享人工智能发展面临的两大趋势:

第一,从小模型到大模型,过去10年内A算法的算力需求提升了40万倍。大模型可能收编高度定制化的小模型,导致市场向大公司集中:资本门槛高,大模型开发和训练一次1200万美元;技术门槛高,对AI框架深度优化和超强的并行计算能力。第二,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到AI的深刻影响。

如下为演讲内容及现场PPT整理:从2018年的Bert model3.4亿参数到2020年1月份微软GPT170亿参数,GPT3达到1750亿。去年谷歌发布的PaLM,模型参数达到了5400亿,大模型的数据规模持续提升。

田奇表示,人工智能行业渗诱率将持续提速,2026年将达到20%。他提出了一种将大模型像自动驾驶一样划分为”0~L2″不同阶段的方式,并称大模型已成为应对A应用碎片化的一种方式,将导致市场向大公司集中,产业规则及格局也可能随之改变。他分享人工智能发展面临的两大趋势:

第一,从小模型到大模型,过去10年内A算法的算力需求提升了40万倍。大模型可能收编高度定制化的小模型,导致市场向大公司集中:资本门槛高,大模型开发和训练一次1200万美元;技术门槛高,对AI框架深度优化和超强的并行计算能力。第二,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到AI的深刻影响。

如下为演讲内容及现场PPT整理: 从2018年的Bert model3.4亿参数到2020年1月份微软GPT170亿参数,GPT3达到1750亿。去年谷歌发布的PaLM,模型参数达到了5400亿,大模型的数据规模持续提升。

海量数据训练能够提升大模型泛化能力和通用性,表现出较的性能。多种原因会导致大模型领域的研究机构、企业的集中,两个关键因素:1)资金门槛,GPT-3在千万美元量级,2)技术门槛,巨大模型训练需要专业人员和对框架深度理解,优化能力。

大模型在改变A产业规则和格局,A和传统科学计算融合,如气象海洋农业土木地质等。传统科学计算解决物理世界问题,大量偏做分方程求解,并行度不高,对海量问题解决消耗大时间长。近两年Al for science有很多代表性工作,如A1气象预测等。华为发布了很多行业的大模型,具体用在气象、药物分子、波浪高度的实时预测。如华为云盘古药物分子大模型,缩短先导药物研发周期从数年到1个月。AI和传统科学计算融合有很多问题要去思考,希望人工智能为传统的科学计算带来新的思路、新的工具和新的方法,也希望传统科学计算为AI带来更严密的科学指导。

大模型成为应对AI应用碎片化新的开发范式,华为大模型是产业喊能的重要权纽。大模型赋能千行百业,把它分成了三个层级L0.L1到L2。L0就是基础通用模型,比如说GPT-3叫foundationmodel,直接应用到行业中比如工业质检、遥感影像中可能不是最好的效果。因此基础模型还要和行业数据相结合。在L0的基础上加入行业数据,混合训练得到大模型L1,再把L1在具体下游千行百业细分场景进行一些部署,得到部署模型或者细分场景任务模型L2。为了尽快的赋能,降低生产成本、提高效率,如何从行业大模型L2中快速生产,从部署到端测、编测和云测,这就是一个非常重要的问题。

而大模型本身要分两个阶段,第一个阶段是预训练阶段,需要海量数据训练基础模型,第二阶段是微调或者部署阶段。此外,为了让模型越来越好,需要对大模型进行持续迭代。从盘古的节奏上看,在2019-2021年我们开始立项盘古大模型,2021年4月我们正式发布盘古NLP、CV、盘古科学计算大模型,2021年9月份发布药物分子大模型,2022年6月发布矿山大模型,2022年11发布了气象、海浪、金融大模型。华为云过去几年人工智能项目已经应用超过1000个项目,其中30%用在客户的核心生产系统中,平均推动客户盈利能力提升18%。

从赋能千行百业的层次上看,L0是我们的基础模型,L1是行业大模型,在L2方面是场景模型,涉及到细分领域的应用和行业ModelArts可以做算法、通信、存储、算法优化等。

这里举例了一些盘古大模型的行业应用,电力巡检、轨道巡检等等,相较于传统方法有较好的效率提升。此外,NLP方面,我们2022年交付了一个阿拉伯语的模型方案,在科学领域,发布了气象、海浪预测模型等。

具体案例一,华为云盘古CV大模型:

具体案例二,华为云盘古科学计算大模型,包含气象、药物等方向应用:

华为认为未来Al for lndustries将是人工智能新的爆发点,基于在华为云上的大数据、大算力、大模型,实现边端云协同,为企业客户、消费者和开发者提供大模型的能力。华为云盘古大模型将推动人工智能开发从”作坊式”到”工业化”升级。盘古大模型将重点做好行业应用,为煤矿、水泥、电力、金融、农业、国家云创造产业价值。

总结来看:

1、AI从小模型走向大模型。大模型可能收编高度定制化的小模型。大模型资本门槛高、技术门槛高,导致市场向大公司集中;

2、人工智能发展已从局部探索走向千行百业,走进企业核心生产系统。人工智能行业渗透率提速,预计2026年将达到20%;

3、盘古大模型发展历程:

2019-2021大模型立项;

2021-04发布盘古NLP、CV和科学计算大模型;

2021-09发布盘古药物分子大模型;

2022-06发布盘古矿山大模型;

2022-11发布盘古气象、海浪、金融OCR大模型;

4、华为盘古大模型的特点:

1)优秀的泛化能力:充分挖掘数据内在联系,对不同场景鲁棒性更强;

2)高效样本筛选能力:海量无标注样本筛选,节省80%人力标注代价;

3)小样本/零样本能力:白动数据增强,挖掘算法实现零训练样本下缺陷样本识别,较传统方法发现效率提升2-3倍;

4)低门槛Al开发:提供自动工作流、自动数据处理、自动调参、自动生成模型,减少对AI工程师的依赖;

5、华为盘古大模型将率先在应用的行业包括:

NLP模型:智能ERP、办公

CV模型:工业质检、物流仓库、时尚辅助设计

科学计算:气象预测

相关受益公司:

源杰科技:华为哈勃投资,高速率低功耗光芯片核心标的。公司研发储备100GEML激光器(应用于数据中心400G、800G高速光模块)、高速硅光模块(应用于数据中心400GDR4架构)以及大功率硅光激光器(应用于CPO光引擎)。预期23/24 PE 80.6/58.63x。

裕太微:华为哈勃投资,国内以太网物理层芯片稀缺标的。大陆极少数大规模百兆、千兆的以太网物理层芯片量产供应商。已完成5G及10G PHY芯片的技术预研,2.5G PHY产品已于去年年底量产。预期23/24 PE 518.89/191.02x。

创耀科技:公司首款星闪芯片将于2023年年中完成验证,其终端客户包括整车厂、Tier1厂商及消费电子厂商等。预期23/24 PE 41.41/29.66x。

长光华芯:华为手机VCSEL芯片IDM供应商,布局硅光平台。400G、800G光模块中的硅光芯片国产率极低,公司有望在光通信领域展开第二增长曲线。预期23/24 PE 68.21/44.69x。

我会在 公众号:海涵财经 每天更新最新的医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。

— END —

先赞后看,养成习惯

免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除

人工客服(haihancaijing009):

图片