Google正式反击了,这一次带来的不是虾兵蟹将。在发布会上除了发布,让人感觉平平无奇的硬件,这次大模型的准备可谓强悍。谷歌在I/O开发者大会上宣布了一系列令人震撼的AI新功能和产品。其中最受关注的是全新的大语言模型PaLM 2,该模型在部分任务上超越了GPT-4。此外,还推出了AI办公助手、全新的搜索功能以及三大基础模型上线谷歌云。
2023年5月10日,Google发布了最新的AI模型PaLM 2,当日Google股价上涨4.1%,收于111.75美元。
PaLM 2 是Google 的下一代大型语言模型,它建立在 Google 在机器学习和负责任 AI 方面的突破性研究传统之上。
它擅长在高级推理任务中,包括代码和数学、分类和问答、翻译和多语言熟练程度以及自然语言生成,比我们以前最先进的法学硕士(包括 PaLM)更好。它可以完成这些任务,因为它的构建方式 – 将计算优化缩放、改进的数据集组合和模型体系结构改进结合在一起。
PaLM 2:google最先进大模型PaLM 2采用Pathways架构,是基于JAX在TPU v4上构建的PaLM升级版。它接受了100多种语言的训练,具有更强的语言理解、生成和翻译能力,擅长常识推理和数学逻辑分析。
此次推出了四种不同规模的PaLM 2,分别为“壁虎”(最小)、“独角兽”(最大)等。给用户使用不同的选择。
Duet AI:AI办公助手Duet AI是Google的AI助手,可内嵌在各种办公软件中。它已经在Gmail、Google Docs、Google Sheets中展示了其能力,包括根据提示补充邮件内容、生成PPT等。此外,还能提供编程帮助,支持Go、JavaScript、Python和SQL等编程语言。
Bard:支持图片和集成Google地图,取消了Bard的排队试用,将其全面开放到180+国家和地区。新增日语和韩语对话功能,中文版本即将推出。Bard现在支持编程和推理能力,同时还支持图片回答和谷歌地图集成。
搜索重构:加入AI对话Google搜索加入了AI对话功能,可以更智能地回答复杂的问题。用户可以进一步与搜索结果进行对话式提问,获取更精准的答案。
要知道Google的人工智能直接和间接从业人员大几千人,人数是open AI的数倍,但是还是被长期被压着打的一个重要原因,是自己一直限制手脚,考虑过多发展道德伦理问题。
现在好了,被逼到绝境直接重生了….说到这想嘲讽排名度了…同时代的
PaLM 2 可以做什么
1、推理
PaLM 2可以将复杂的任务分解为更简单的子任务,并且比以前的LLM(如PaLM)更好地理解人类语言的细微差别。例如,PaLM 2 擅长理解谜语和习语,这需要理解单词的歧义和比喻含义,而不是字面意思。
2、多语言翻译
PaLM 2 在并行多语言文本和比其前身 PaLM 更大的不同语言语料库上进行了预训练。这使得 PaLM 2 在多语言任务方面表现出色。
3、编码
PaLM 2 在大量网页、源代码和其他数据集上进行了预训练。这意味着它擅长流行的编程语言,如Python和JavaScript,但也能够用Prolog,Fortran和Verilog等语言生成专门的代码。将其与其语言功能相结合可以帮助团队跨语言协作。
PaLM 2 是如何构建和评估的
建筑 PaLM 2
PaLM 2 擅长高级推理、翻译和代码生成等任务,因为它的构建方式。它改进了其前身,手掌,通过统一大型语言模型中的三个不同的研究进展:
使用计算优化缩放:计算优化缩放的基本思想是按比例缩放模型大小和训练数据集大小。这项新技术使 PaLM 2 比 PaLM 更小,但效率更高,整体性能更好,包括更快的推理、更少的服务参数和更低的服务成本。
改进的数据集组合:以前的LLM,如PaLM,使用预训练数据集,主要是纯英语文本。PaLM 2 通过更加多语言和多样化的预训练组合改进了其语料库,其中包括数百种人类和编程语言、数学方程式、科学论文和网页。
更新的模型架构和目标:PaLM 2 具有改进的架构,并接受了各种不同的任务培训,所有这些都有助于 PaLM 2 学习语言的不同方面。
评估 PaLM 2
PaLM 2 在推理基准任务(如 WinoGrande 和 BigBench-Hard)上取得了最先进的结果。它比我们以前的大型语言模型PaLM更加多语言,在XSum,WikiLingua和XLSum等基准测试上取得了更好的结果。PaLM 2还提高了葡萄牙语和中文等语言的翻译能力,超过了PaLM和Google Translate。
PaLM 2 延续了我们负责任的 AI 开发和对安全的承诺。
训练前数据:我们删除敏感个人身份信息的形式,过滤重复的文档以减少记忆,并共享对人们在训练前数据中的表示方式的分析。
新功能:PaLM 2 展示了改进的多语言毒性分类功能,并内置了对毒性生成的控制。
评估:我们评估了 PaLM 2 一系列潜在下游用途的潜在危害和偏见,包括对话、分类、翻译和问答。这包括开发新的评估,以衡量与有毒语言危害和与身份术语相关的社会偏见相关的生成性问答设置和对话设置中的潜在危害。
相关标的:中科创达:谷歌推动从云到边Al革命核心受益者Rubik大模型发布:中科创达最近发布的Rubik大模型,被视为谷歌PaLM 2在国内的最稀缺对标。其核心产品Rubik Language预计在2024年达到ChatGPT3.5水平。
产品横向扩展:Rubik系列围绕现有业务构建AI生态,产品包括Rubik Edge和Rubik Multi-Modal,以及预计在2027年推出的Rubik Robot。这些产品将服务于智能手机和智能驾驶领域,提升人机交互体验。中科创达还计划将大模型拆分为各种中小模型,以满足不同的场景需求和提高客户适配性。
纵向做应用:中科创达将从智能应用为中心,发展成模型驱动的机器与机器、机器与人交互的全新智能世界。Rubik大模型将与公司现有的智能汽车和物联网业务整合,满足各行业需求。
当前A股唯三发布大模型的公司(三六零、昆仑万维、科大讯飞)在2023、2024年的平均PE分别为120X、69X,相较之下,中科创达被显著低估。
迅游科技:全资子公司成都狮之吼科技有限公司是Google在全球市场重要的战略合作伙伴,在海外广告业务方面已经与Google展开全面、深入的合作。
易点天下:合作方包括阿里达摩院、Google广告算法团队等,在AIGC、智能剪辑、小语种AI翻译等领域上都有投入和布局,部分研发成果已经实质应用于业务中
我会在 公众号:海涵财经 每天更新最新的数字经济、ChatGPT、AI算力、CPO/硅光芯片、大数据、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除