MaaS(Model as a Service)算是比较新颖的词汇,中文解释是模型即服务。当然这个词汇其实在之前也有提出,没太多人在意,其引爆点在于3月16日百度老大李彦宏提出MaaS将会改变云计算的游戏规则。
就在ChatGPT发布不久,硅谷著名的投资人查马斯(Chamath)在自己的视频账号上发表了一个观点。他认为,随着大模型的功能越来越强、成本越来越高,AI领域有可能会形成一种独特的商业模式,叫做模型即服务,英文简称是MaaS(Model as a Service)。这种商业模式最近也经常被国内外一些学者和企业家探讨。
所谓模型即服务,你可以这么理解。就是大公司,开发出了一套AI模型,这是一个底板。你可以把他想象成一个接受过良好基础教育,数理化全都满分,各种基本功都特别扎实的应届生。基础虽好,但对于专业领域,还是个门外汉。你要是让他做点具体的、特别专业的工作,比如医疗、教育、销售,他还得再深入学习。
而MaaS模式,指的就是把这个算法的培训过程,分成两段。基础教育阶段,需要极大的投入,数理化全都得学一遍。这个阶段,由巨头完成。他们相当于模型的创造者,给你送来一个特别聪明、基本功特别好的通识型人才。而第二个阶段,你得把通识型人才,培养成能在某个领域干活的专业人才。这一步,科技巨头并不擅长,就得由细分领域里的公司来完成了。做这个细分领域训练的人,被称为模型打磨者。
这个针对AI模型在细分领域的二次训练,就是留给新玩家的机会。按照MaaS模式,科技巨头在将来会对外开放icon这些AI模型的调用接口。吸引一些规模较小,但是对行业理解更深的玩家,付费使用这些接口,并将模型打磨成真正满足行业需求的应用。
MaaS到底是什么?
这里我们看个例子,设想一下你是一个中小企业的老板,你现在想给自己的企业的增加效率,于是你计划引入人工智能来帮助公司,然后计划开始准备,首先公司没有人工智能的算法开发人员,你先招聘了这些人员,然后在去找阿里云租借了算力服务器,应用服务器,数据库等等,然后你需要从网上开源的大模型找到一个合适你公司业务的,最后在开始不断的算法调优,训练。看完这个过程,你觉得对于中小企业来说有什么问题呢?
1.开发门槛高,模型开发往往需要大量数据的准备,以及匹配的海量GPU算力。通常只有大公司才有这方面的投入,对于中小企业则存在一定的难度。
2.模型的定制化需求高,在具体的问题上面,通用的模型效果不是特别好,还得做相应的定制化微调,这对开发人员提出了很高的要求。
3.今天模型众多,调用方式不同,AI开发者需要查看很多的资料,来修改这个那个参数,使用不同模型的难度比较大。
那么为了解决这个问题,Model as a Service 就顺应而出了。过去,云计算厂商(阿里云/腾讯云/其他云)通常会把硬件资源、通用的软件能力、底层框架等来提供服务,现在,模型也上升到底层框架服务的维度,开始成为第一生产力。下图是魔搭社区MaaS的一个基本结构,提出了All For everyone的一个概念。
有没有什么例子呢?在抖音之前有个视频特效比较火就是时光相册,就是上传不同时期的人的照片,然后会将其五官对齐,然后变成样貌展示,下面这个文章就是AI开发者的一个例子,他只需要一分钟就可以做到这样的事。
看了开发者的例子后,我们来看看券商对这个的一些评价,这里节选部分证券相关:
有能力的大公司提供预训练模型,使得垂直行业的小公司能够构建和部署 AI 模型,而无需投资构建和维护自己的模型所需的基础设施、硬件和专业知识。未来,MaaS 有望成为人工智能的核心商业模式,同时多模态大模型发展更进一步 扩展了AI 落地的场景与可能。
我个人的想法就是云计算厂商未来全面介入MaaS, 先进场先吃肉。简单讲通用大模型,适合通用场景,小模型或叫行业大模型更懂行业know how(可以理解为行业壁垒),做过B端业务的都知道,行业know how有多重要,通用平台只适合普适性场景。垂直行业大模型是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案
李彦宏表示大模型时代将产生三大产业机会:通用大模型、行业大模型、应用
一是MAAS通用大模型。OPENAI公司做出的Chatgpt、百度 公司做出的文心一言都属于这种。通用大模型在Chatgpt出现之前,很多研究者都认为这个方向走不通,OPENAI解决了从0到1的问题,现在越来越多的大公司都加入进来开始攻关了,通用大模型的研发已经成为各国新一轮技术竞争的核心领域。
通用大模型需要庞大的算力、数据、算法训练做支撑,是烧钱的活,只有超级大公司能做。OPENAI背后微软 投资了上百亿美金,在中国也只有百度、腾讯、阿里、360这些既有数据又有钱又有人的公司才能做。
通用大模型类似于互联网时代的操作系统,比如WINDOWS、安卓、IOS操作系统,是人工智能的底座,实际上是不会同时存在太多的。因为本身壁垒极高,先发者又保有优势,相互竞争会非常激烈,最终只会剩下几家大的,就看谁做的最好。
目前中国最早推出的通用大模型是百度的文心一言,阿里、百度等大公司也不得不跟进人工智能这次科技革命,相信未来中国也会有几家通用大模型。通用大模型的运行和服务都在云上,通用大模型公司就是服务本身,文心一言通过百度智能云对外提供服务,chatGPT通过微软云 对外提供服务,这对云计算的要求很高,模型、框架、芯片、应用必须高度融合。
这个方向存在很多的投资机会,比如AI芯片、算力、云计算、光通信、大模型本身,但不是今天讨论的重点。
二是行业大模型,即细分垂直行业大模型。这是通用大模型和企业之间的中间层。他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。拓尔思就是媒体资讯、网络舆情、产业大脑等多个细分领域的行业大模型,这个是今天讨论的重点,后面再说。
三是应用开发。基于现有的文字、图片、语音视频生成的能力可以开发出今天还无法想象的应用。在 AI时代、在大模型时代,也会出现这种现象级的应用,只不过它是基于大模型来开发的。
很久前分析的万兴科技 就是这一类应用的代表。高质量行业大模型不可或缺,意义十分重大,是人工智能商业化落地的基础。通用大模型作为操作系统,虽然有良好的泛化能力,能嫁接到所有的行业和公司上面,但是也有2个非常明显的缺点:一是知识覆盖面广但是深度不够。二是在匹配下游企业具体需求上不精准。
造成这2个缺点的原因大家可能都清楚。
一是行业数据壁垒。比如在金融、政府、媒体、医疗等特定领域的知识并不公开,开放度很低,有些还涉及保密,通用大模型没有办法获取这些数据并进行训练,就不具备对专业业务场景的理解能力。
二是不同行业不同企业的需求各不相同,通用大模型只能提供通用的场景应用,没有办法对接所有企业来进行深度适配,商业化就无法精准落地。所以,李彦宏说,当通用大模型面向某一个行业进行精调,就会更好地解决某个行业的问题,吃的比较透,它就可以服务相应行业很多的企业或者组织。大模型商业化落地的基本条件是具备能精准适配下游场景任务,且保证结果高效、可控、合规的“高质量”行业大模型。
怎么样生成一个高质量的行业大模型呢?
那就是在通用大模型的基础上,利用行业数据进一步训练生产行业大模型,并对行业大模型调优实现。这其中,对通用大模型“再训练”、“调优”形成高质量行业大模型的两个基本动作,也决定了厂商必备的三大能力:丰富的行业数据积累、大模型调优能力、AI工程化。首先,行业数据是基础。数据是数字经济 时代最宝贵的资产,是粮食。行业数据搜索引擎上搜不到,买不到,必须靠长时间的积累。
这是有极高的壁垒的,只有长期为细分领域提供数据服务的公司才能获得全面真实深度有效的数据,而这种数据能快速提升行业大模型学能力,并不断拉开与后来者之间的差距,为厂商带来先发优势。然后,必须具备大模型调优能力。
大模型调优能力需要具备领先的深度学/NLP技术积累/知识图谱/搜索引擎等多方面的人工智能能力,这一点只有极少数的公司才具备。
四是AI工程化能力。AI工程化是指提供AI应用开发的系列方法、工具和实践集合,形成快速测试、构建和部署AI应用开发流水线,加速AI应用落地过程,实现模型自动重新训练和部署。行业大模型只解决了大模型“可用”的问题,若想AI成为企业的生产力,还需要解决大模型“落地”的工程化问题,否则落地效率、周期会远超预期。
AI工程化能力涉及两个方面:1)通过分布式训练提升计算效率,解决大模型大体量参数、复杂网络结构带来的内存、通讯以及计算瓶颈;2)实现模型开发过程的持续生产、持续交付和持续部署。一方面,需要将定制化解决方案经验沉淀形成标准化产品,实现产品与服务的规模化,加速商业化落地效率;
另一方面,也需要完善AI开发生命周期的工具、固化开发流程,提高模型开发全流程的紧耦合度,提升大模型训练效率。
我会在 公众号:海涵财经 每天更新最新的数字经济、大数据AI、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除