ChatGPT概念股 · 2023年3月1日 0

拓尔思关于ChatGPT影响的深度产业访谈

ChatGPT概念股

拓尔思公司发展到 2000 年到 2011 年的阶段,核心的技术就是基于检索技术,开发了智 能内容的管理

搜索引擎是我们自然语言处理的一个核心应用的技术,公司是 30 年以来坚持 在这方面的积累,在全国整个大量的企业级的搜索都在用 ELSG 的设计、spark 这些开源软件的时候,我们公司完全捉到了自主可控,完全捉到了信创的银 窝,应用到政府、金融,包括媒体等诸多的行业

数字经济研究院目前主要的一个研究方向就是人机对话,像托马斯公司这几年 以来在整个技术应用上面,比如围绕着像中国中医科学院的中医中文问答,中 国标准化研究院的国家标准的问答

像 OpenAI 热点事件出来以后,我们的研究人员对于整个 OpenAI 的过去、现在 和未来也持续性进行了研究

结合我们公司的一些技术沉淀的事实和我们本身对场景应用研究,未来展望有了 一些系统的梳理

ChatGPT 加快数字劳动力时代的发展 1 新的智能新意时代,ChatGPT 的出现引领了数字劳动力的时代,带来了第四种用 工模式 2 数字劳动力将是生产力的第五次革命,这种新的经济时代、用工模式将会快速的 演变。三大传统的用工模式包括全职员工、外包员工、兼职员工,数字化劳动力 是第四种用工模式,打破了人与机器的边界

a 依托人工智能技术,包括像 NLP 相关的一些技术,自主完成或者协助人类来完 成各种企业的各种工作,比如前端对客人或者员工的文案工作等等,或者是中 后台运营协同等工作 b 像 Tab、BP 就能够帮助写文案内容或者代码,实际上它是一种数字化劳动力的 一种。我觉得在这种传统劳动力跟数字劳动力的结合下,通过我们这种 NLP 相 关的技术赋能 c 能够让传统劳动力爆发出更高效这种增长力水平。

根据麦肯锡统计数,到 2030 年,数字化劳动力的这种市场规模可以达到 1.73 万亿水平 d GPT 的火爆加速推动这个事件。劳动数字化全面转变的核心在于劳动力,它的 大脑、认知能力跟分析能力决定了数字劳动力是否能够准确的理解人类的任务 指令,是否能够高效的去准确的完成任务 3 GPT 能做到这一点是基于人类反馈的强化学习,有一个千亿规模的模拟训练,可 以融合世界的知识与规矩,使认知能力跟沟通能力接近人的水平 a ChatGPT 的火爆将增强大众对于这种对话式的 AI 的一个信心,我们会有更多的 研究来加入行列,推动整个对话式的 AI 的发展 b 对话式 AI 大概分成四类,信息查询类、专家咨询类、助手类以及交流类 i 第一类是信息查询类,用户可以去查询企业的相关的一些信息,相当于数 字化劳动能够替代一些枯燥重复性的劳动 ii 第二类是专家咨询类,这是比较重要的一点,相当于数字劳动力能够替代 部分或者扩充这些资源稀缺的劳动力,需要我们大脑的赋能,专家系统可 能是投顾类,或者是法律顾问类 iii 第三类是助手类,相当于数字化劳动力能够帮助人类去完成相应的一些任 务,帮你订个机票,预定个会议等等 iv 第四类是交流类,数字化劳动力能够满足人类情感交流的需求,可能是情 感的陪伴,或者是闲聊场,或者是虚拟在元宇宙里的

4 四类对话式 AI 对标不同的应用场景 a 第一类信息查询应用的比较多,比如智能客服机器人,一些售前信息的查询,相当于降本增效 b 第二类专家咨询是 MLP,需要加上世界知识,行业知识,专家系统 i 为企业去打造个性化咨询,根据司法部数据显示,全国办理各类的法律事 务的事件大概是 1,300 多件 ii 涉及到诉讼或者是非诉讼的大概 1,300 万件。按照中国的律师平均费率是 大概一个小时是 2,788,每个案件平均服务时长十小时来算,整个法律的咨 询的总体市场规模达到 3,600 个亿 iii 如果是按照律师事务所这种维度来计算,像 21 年年底全国共有律师事务所 3.65 万家,对法律服务技术的投入按每年 100 万来算,法律的服务的总体 分了大概是 300 万 iv 相当于我们要把一些法律相关的知识形成企业的大脑,能够去对外赋能,其中就涉及到我们怎么去利用这些知识构建出复杂的知识体系里头来 c 第三个场景是助手类,比如智能车载助手,其中很重要的一点是智能创作,比 如直播文案的生成,广告文案的生成,或者做一些剧本的创作。整个智能创作 市场主要是分成数字资讯类、数字营销类和行政办公类

18 年公开数据显示,18 年各级的网信办审批的互联网信息、新闻信息服务 单位总共有 700 多家,在主要的一些门户资讯,比如像微信公众号,它的 总量大概是 2,100 万,活跃账户有 350 万 ii 按每年 SaaS 化软件一年 3,000 块报价来算,总体规模大概在 120 个亿左 右。数字营销类每年的全球广告支出蛮高,18 年在 e-master 数据显示,全 球 18 年的全球广告支出高达 6,000 多亿美元,数字广告就占到了 2,800 亿 美金 iii 我们希望能够在数字营销里提供一个数字营销的广告的助手。

在行动办公 领域,我们可以看到爱乐咨询的一个数据显示,PC 这种办公软件的用户活 跃数在 5.3 亿的数字上下波动 iv 预计这个数字在未来几年也不会有太大的变化,这个群体其实是智能创作 的一个重点挖掘的对象,按照每个用户付费 100,总体规模可以达到 530 个亿 5 基于对话式 AI 市场,拓尔思公司规划未来拓尔思的优势有以下几点 a 第一点,拓尔思有来自境内外的各行各样的数据市场,超过 1,200 个亿,已经 具备千亿数据的数据索引等,这些是我们的一些核心资产,包括我们背后的这 些模型,包括我背后的加工能力等等 b 第二点是技术的沉淀,我们坚持核心自主的研发,实现国产化,拥有 40+的发 明专利,800 的软件着作权 6 技术沉淀也相当于 AI 的三大要素之一。最后是客户的沉淀,整个数据的产品和服 务已经国内外超过 1 万家的企业级的用户在广泛使用 a 像智能客服现在基本都是基于检索式的,基于我们数据库,我们将有一些基于 深度模型,去库里检索答案,返回给用户。

思想是基于一个大模型,有排量数 据去训练一个模型出来,再加入人类反馈的数据,我们需要累计高质量的人类 的反馈数据,这样我们就能够提供更优质的对话体验 b 还有第二点,我们需要行业深耕,像这类 DP,它是一个通用模型,缺乏对一 些行业客户、行业知识的了解,我们对行业是非常了解的,我们未来会让对话 式的 AI 这种人工智能技术去跟行业客户的业务流程去更深度的融合,包括从 局部业务到全场景的覆盖,实现全业务的数字化、智能化 c 我们会持续的在行业中不断的累加场景,深耕场景,解决核心业务的一个问 题。从长远来看,拥有更好的数据,更好的行业的一些 know-how,更有利于 去微调我们的一个大模型的,给客户带来更好的产品体验的。像 ChatGPT,不懂的地方会一本正经胡编乱造,目前的技术发展路径是不是已经 开始往准确率这方面去走呢? 1 目前整个智能客服是比较成熟的一个阶段,但是所采用的技术基本都是基于线索 式,保证了所有的回复都是从库里拿出来回复给用户的。像 ChatGPT,它是基于 生成式的这种方式去回答用户,比较难保证回复的可靠性 2 所以我们在后续的训练跟维护的过程,我们去增加一些这种规则,或者是增加一 些这种安全检测的一些模块进到系统里头,能够保证我在一些异常条件下去规避掉这些问题 3 现在 CC 已经能够让可靠性保证在一个比较小的结果里头,但是它还是会有这样一 个问题存在

无论是信息查询、专家咨询、助手或者交流,从公司的视角以及整个产业发展趋 势来看,哪一块最先有可能形成商业化的落地? 1 我觉得几个点都有可能。一个是这种专家咨询类的,它实际上是需要有一块比较 好的相当于是企业大脑的角色,把这些行业的知识变成一个企业的大脑 a 变成一个模型的知识。ChatGPT 证明了在一些大数量前提下,是一个比较好的 表现的,这一块是在智能创作助手类的,一个是我们能够去高效地提升智能创 作的水平 b 现在它的这种文本生成能够已经能够满足创作者的大部分的需求,相当于我能 够去帮助创作者生成一个初级的版本,创作者在上面再去继续修改,能够有一 个比较好的效率提升 c 在不管是直播文案的生成或者广告文案的生成,或者基本创作等等,还有在交 流的,它已经像 GPT,拥有一个比较大的模型,拥有一个比较好的一种世界知 识\通用知识的前提下,能够回答各类相关的一些问题 2 如果我们是按照比如在元宇宙里,或者是在一些养老领域等行业里去定制一个这 种相关行业的,可能也是会有一个比较好的表现。所以我觉得大概可能是这几块 3 专家咨询类未来会在法律咨询的市场有一个比较亮眼的商业模式的落地

如果未来转向人工智能对话式的方式,是不是对于数据的采集其实是会有偏好性 的,或者我们如何确保自己采集过来的数据是针对相关的行业,而并不是会跨到其他 行业,我们怎么去确保未来这种算法以及数据的针对性是足够匹配到行业的一个情 况? 1 好,您提到的其实是一个模型上下文关联的一个能力。在这种大模型的前提下,大模型是能够学习到相关的上下文的一个知识 2 比如我们拿法律的整个行业的数据进来,训练出一个大的模型的结构,再基于人 类的一些反馈加入训练,最后出来的一个模型会在不同的条件下,识别到不同的 上下文的知识的。在不同的领域里头它是带有不同的知识,都是能够识别到这一 点的 在这个问题解决之后,现在我们最大的痛点是在哪里?拓尔思后续会在哪个行业 率先落出相关的商业模式,并能产生实际的收益? 1 这一块我简单的回答一下。接下来首先就是语义智能,它本身是一个经验型的,这种技术的积累在这一块首先还是来自于你所熟悉的行业。我们强调的最多的人 工智能的场景的应用,要选择一个比较好的主题 2 在选择主题以后,你自己作为公司在深度的积累知识,最后结合语义智能,围绕 着主体场景,理解可能就越深。后面通过训练数据,还有源源不断的能积累的进 来,训练的整个的模型。

ChatGPT概念股

算法会积累的越来越丰富所以我们觉得经验值是非常重要。举个例子,拓尔思在 媒体行业,譬如垂直领域的 120 多家媒体,有 40 多家是我们的客户,一半以上的 审计的融媒体中心也是我们的客户 a 我们这几年以来在整体的打包服务中,有一个拓尔思的妙笔。小思的智能写作 实际上就是一个合成,但是需要我们了解整个的编辑记者,在他们应用材场景 中间,对于他们的新闻要素,新闻稿件的形成的整个的细节 b 我们先不断在丰富的在积累。原来一个编辑记者要花 30 分钟才搞定的一个稿 件,我们可能快速的一秒钟就能够生成一个初稿,最后让他进行新加工 c 另外,融媒体中心成立完以后,他们出稿子的频率越来越快,任务越来越多,越来越大,这种情况下,怎么能够快速高效的去完成他们的这种劳动工作?

还 有一块,譬如刚才您讲到专家咨询,我们现在正在跟国家知识产权局深度打造 我们的专业的咨询服务,这就是个很专业的活了 4 因为整个国家知识产权局现在有 2 万多专利评审人员,80%的时间都在拓尔思的 三大平台上进行工作,这就是我们长期积累的知识 a 国家专利局有全国最大的最全的专利库,我们公司称之为数据的这些文本信 息,都是一篇一篇的专利原作,对原作要进行语义智能的这种分区,要进行各 种各样的标语,这些事情我们都做了 b 接下来在申请专利的过程中间,我们的专利申请人员对于整个专利申请的流 程,整个专利检索的专业的知识,我们能够打造专业的技术服。回头来说,我 们实际上强调的还是对行业深入了解和熟悉的程度 c 它的背后有一系列这种知识库的间接。我们拓尔思有一个自己的知识图谱的研 究院,在开源情报这方面多年以来持续实现了我们一定比例的收获,并且还有 很好的增长趋势 d 基于我们对整个的开源情报的这些分析,各种各样的数据的采集加工,我们不 断再迭代,也形成了我们的自己的知识图谱的各种各样的算法

未来是不是会有可能在每个行业都诞生出一个龙头,类似于搜索引擎龙头,而不 会像现在通过谷歌我们对各行各业所有人一起去进行搜索?未来的趋势到底应该是以 垂直行业为主,还是有一个大一统的搜索平台为主? 1 从目前应用事件上来讲,我非常认同你的说法,这也是我们研究院一直在沟通 的。因为刚才我们都提到了一个共同的问题,就是现在我们关注的女性事件,大 家背后说她胡说八道。实际上你会发现它现在整个积累的时间和计算的时间,尽 管跟我们国内的公司比已经有了一个数量级的差异,但是它不能够穷尽一切 2 理论上来讲,它能够穷尽一切,以后它就真正能够替代人了。现在我们在探讨应 用的同时,反过头来反思我们国内有哪些应用场景,从这两方来讲 3 我们认为每一个垂直的专业板块空间都是非常大的,也就是拓尔思未来的发展。在整个人工智能和大数据的中间软件,我们已经达到了比较强大的自主可控的软 件平台的积累。但是对于每一个垂直行业的这种深度的应用,在知识积累方面,我们也不是什么行业都去干 a 但是我刚才跟您举例的,譬如知识服务用在专利检索,用在整个专利行业,未 来一个百亿级的规模,大家会需要有更多的这种服务的时候,我们就把更多的 给打造好,围绕着金融,围绕着媒体,围绕着这几个深度的行业去做就好 b 我们还有一个可以拓展的行业,结合虚拟人和两足机器人到更多新的应用,我们也在拓展我们的新的市场。譬如在两足机器人,围绕 着养老院场景,下的精力是最多的,一旦走进来,我们可能就能够比别人积累 更多的支持

铁粉号近期热点发掘文章:

硬核逻辑:数字中国纳入考核KPI,新型工业化分支2小龙(低位逻辑)

ChatGPT算力硬伤引爆CPO,CPO概念成长逻辑分析

我会在 公众号:海涵财经 每天更新最新的医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。

— END —

先赞后看,养成习惯

免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除

人工客服(haihancaijing009):

图片