在 ChatGPT 引爆科技领域之后,人们一直在讨论 AI「下一步」的发展会是什么,很多学者都提到了多模态,我们并没有等太久。3月15日,OpenAI 发布了多模态预训练大模型 GPT-4。
一,GPT-4的升级体现为以下几点:
1,支持多模态输入:GPT-4的API可以接受图像,并生成相应的字幕,并对图像进行分析。
2,超大上下文:GPT-4支持25,000个单词的上下文,可以使得完整的文档适合于一个提示符内(意味着,可以给 GPT 一篇长文,让他来分析,牛逼了)。
3,在BAR考试中取得优异成绩:GPT-4取得了BAR 90分(满分一百),同时在生物奥林匹克竞赛的视觉题方面获得了99分,其推理能力远超ChatGPT。
在理解图片上,GPT-4的表现相当惊艳。GPT-4可以根据图片来生成描述、标题或者故事。它能理解“梗图”,解释笑点。在纸上画出网站的草图,拍下来发给GPT-4,GPT-4能快速生成网站的HTML代码。它能看懂数据图表,做进一步计算,能处理论文截图里的文字和图片,对论文做总结摘要。
相比GPT-3.5,GPT-4更可靠、更有创意,对于更细微的指令的处理能力更强。在各种专业测试和学术基准上,GPT-4与人类水平相当。它通过了模拟律师考试,且分数在应试者的前10%左右(GPT-3.5的得分在倒数10%左右)。此外,对于英语以外的语种支持,GPT-4也得到了更多优化。
升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当。
比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。
做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。
4,更具创造性和协作性:与用户协作生成、编辑和迭代写作任务,具有更高的创造性和协作性。
首先,看图能力可以用来解释表情包、梗图。
提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:
用巨大的过时VGA接口给小巧的现代智能手机充电。
更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。
甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。
发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。
出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。
再最后附上出现的问题,在几秒钟内瞬间得到解决办法。
在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。
之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。
现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底。
也可以指定之后所有回答的形式,比如全用json格式。
二,GPT-4的遗憾
然而,GPT-4并不是完美的,他依然还存在很多待解的问题,或者说是此次发布的遗憾。
遗憾1、参数规模没有大规模提升
GPT-4是一个大规模预训练模型,对于大模型而言,参数规模往往是一个关键指标。一般情况下,更大的参数规模意味着更强的技术能力。
在此前不久,业界就在流传GPT-4将在参数规模上有大幅度提升,甚至传言将达到100万亿级的参数规模,这也拉高了业界的期待。
此次发布的GPT-4,并没有公布准确的参数规模。如果参数规模提升了一个数量级,OpenAI肯定会大肆宣扬一番,并将其作为GPT-4的一个关键突破。既然没说,那大概率就是没有大的改进。
遗憾2、一个假的多模态,不能生成图片、视频
大模型的发展趋势,除了更好的性能表现外,一个关键的突破就是多模态。所谓多模态,就是文字、图片、视频、语音这些不同模态的信息之间的相互转换。比如,输入一段文字内容,AI应用可以依据文字描述来自动生成一幅画甚至是一个视频。
ChatGPT是很强大,但他的强大只表现在文字领域,还不能跨模态。GPT-4的一个关键升级就是多模态,业界最期待的也是这个。然而,此次发布的GPT-4却有点失望,他在多模态上有点突破,可以输入图片内容,但是输出的却还只能是文字。用户最期待的图片、视频生成,他没能实现,这是一个巨大的遗憾。
遗憾3、“发疯”问题有改善,但没彻底解决
ChatGPT在使用过程中,偶尔会遇到“发疯”的情况,变得胡言乱语,这给微软带来了不小的麻烦。那么,GPT-4把这个问题解决了么?
根据测试结果来看,这个问题有改善,但还没能彻底解决。
OpenAI承认,GPT-4 与早期的 GPT 模型具有相似的局限性,它仍然不完全可靠,可能会存在推理错误。
但是,但 GPT-4 相对于以前的模型已经有比较显著的改善了。OpenAI对不同模型进行了内部对抗性真实性测试,具体来看,进行了涵盖学习、技术、写作、历史、数学、可惜等九类测试,准确度为 1.0 意味着模型的答案被判断为与人类理想回答一致。
OpenAI将GPT-4 与ChatGPT-V2、ChatGPT-V3、ChatGPT-V4进行了比较,最终结果如下:
在OpenAI的内部对抗性真实性评估中,GPT-4的得分比我们最新的GPT-3.5高40%
三,GPT快速迭代,激发AIGC+元宇宙无限潜力
当前AIGC的火热并不意味着元宇宙的衰退。相反,AIGC作为重要工具,能够高效地建设内容丰富的元宇宙,有助于推动元宇宙的发展进程。GPT-4的到来,很大程度上加速了AIGC赛道的发展,同时也加速了AIGC与元宇宙密切结合与爆发。
破解元宇宙内容难题
元宇宙是一个虚拟的世界,可以用来构建各种虚拟场景和虚拟应用程序,包括游戏、社交网络、虚拟现实、物联网等等。然而,在元宇宙的发展中,内容难题一直是一个重要的问题。因为元宇宙需要大量的内容支持,这些内容需要满足不同用户的需求和兴趣,同时还需要与不同的应用程序和场景相匹配。当前制约元宇宙相关产业发展的重要瓶颈,不是XR的技术问题,而是内容生产上的不足,如何提供能够满足各行各业需求的高质量内容是元宇宙目前急需解决的问题。
现在,AIGC正在成为打破这道瓶颈的关键,内容创作经历了从PGC到UGC再到AIGC。AIGC拥有高效率、智能化与沉浸式体验等多重优势,有望极大地提升元宇宙内容的生产效率,并借助已有资源、信息、数据的挖掘、收集与整合,在元宇宙里构建新的交互场景。此次随着GPT-4的到来,AIGC赛道加速发展,过去那些耗费巨大的知识性和创造性工作的边际成本将大幅降低,过去制约元宇宙相关产业发展的内容问题将迎刃而解,从而产生巨大的生产效率和经济价值。AIGC,通过降低元宇宙的内容生产门槛,帮助企业释放平台化的能力,让内容生产行为变得更加普及,让更多的人参与进来。
四,GPT-4的相关公司梳理
此次发布会,除了GPT-4本身技术性能的提升以外,还有一个很重要的看点,那就是其商业化进展。从微软近期的动作来看,他是准备在GPT-4基础上大干一场。整理了微软近期将ChatGPT与其业务体系整合的情况,可以发现,微软的很多业务都已经可以看到ChatGPT的身影。
1. 海外线:产品销售主要在海外,可以直接列入openAI:
1,万兴科技:万兴喵影、亿图软件等产品,布局图文、视频剪辑等赛道,绝大部分收入来自海外,有望率先接入GPT-4落地。
2,福昕软件:PDF浏览器、编辑器等布局海外市场,9成收入来自海外,有望率先接入GPT-4落地。
3,昆仑万维:昆仑万仪布局多模态,游戏收入主要来自海外,opera浏览器有望率先接入GPT-4落地。
4,新国都:子公司新国都智能布局AI内容生成、视频处理技术,在海外市场推出多款产品,有望率先接入GPT-4落地。
2. 国内多模态AI解决方案:
1、创维数字:受益一带一路,打造横跨国内外两大市场的多模态AI边缘算力和多模态应用平台。聚焦国内外运营商千兆终端、网络设备。国内方面,随着三大运营商奠定云计算、数据、AI算力核心平台地位,公司依托运营商及百度文心等国内大模型,有望布局国内家庭、医疗、商务AI终端市场,打造AI边缘算力平台。国外方面,公司为全球最大机顶盒供应商,有望快速接入openAI、谷歌等AI,受益GPT-4多模态浪潮。当前估值20倍,尚处低位,建议关注。
2、博汇科技:音视频监管小巨头,布局音视频网络运维监控和内容安全监控,受益广电信创和GPT-4多模态带来的内容安全新需求,同时拓展高等教育、会议等市场。
3、罗普特:聚焦AI视觉应用的小巨人,布局存算一体,有望受益GPT-4多模态应用。
4、当虹科技:公司专注于智能视频技术的算法研究,拥有高质量视频编转码、智能人像识别、视频云服务等技术,聚焦AI视觉应用,有望受益GPT-4多模态
大规模预训练模型这个赛道异常热闹,尤其是OpenAI可以说已经成为科技界的明星。然而,大模型的竞赛才刚刚开始,鹿死谁手犹未可知。
GPT-4再好,也是别人的东西,我们当然更期待中国自己的大模型。
正好,百度将在明天(3月16日)发布文心一言,让我们小小期待一下吧。
所以,压力给到百度了。
铁粉号盘中随时更新,近期热点发掘文章:
光伏反转,高纯石英砂概念除了石英股份、欧晶科技还有谁(深度分析)
硬核逻辑:数字中国纳入考核KPI,新型工业化分支2小龙(低位逻辑)
钙钛矿赛道0~1加速开启,钙钛矿及HJT上游核心材料低位龙头(业绩反转)
我会在 公众号:海涵财经 每天更新最新的医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除
人工客服(haihancaijing009):