一、ChatGPT颠覆性生产工具,微软百亿美元商业化
2022年11月30日,OpenAI发布了对话式AI新模型ChatGPT。该模型使用简单,只需向ChatGPT文字提出需求,即可让其完成回答问题、书写代码、创作文本等指令。ChatGPT模型首次采用RLHF(从人类反馈中强化学习)方式。
2015年,OpenAI由马斯克、美国创业孵化器YCombinator总裁阿尔特曼、PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。2019年微软向其投资10亿美元,2023年1月24日微软公司在其官方博客宣布,已与OpenAI扩大合作伙伴关系,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破。2020年OpenAI宣布了GPT-3语言模型,之后不断发展至2022版的ChatGPT。
ChatGPT根据用户输入的文本,自动生成回复内容。ChatGPT的功能包括:交互,以及基于交互的文本/代码创造、信息检索等。ChatGPT能回答连续性的问题、承认自己的错误、质疑不正确的假设,拒绝不合理的需求,对话互动包含普通聊天、信息咨询、撰写诗词作文、修改代码等。实际应用上,ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成,并一定程度上替代搜索引擎。
明尼苏达大学一项研究中,ChatGPT顺利通过该学校四门课程的研究生考试题,平均成绩为C+。
图:当前阶段GPT-3.5的进化历程
资料来源:符尧等《拆解追溯GPT-3.5各项能力的起源》,九方智投、太平洋证券研究院
ChatGPT获得广泛关注,微软计划将其整合进全栈产品。ChatGPT开放注册后“炸翻天”。2022年11月30日开放注册后,一周用户数突破100万人,月访问量达2100万人次。由于庞大用户群涌入,ChatGPT甚至一度宕机。微软正努力将其纳入其流行办公软件,并向其他企业出售该工具的使用权限。2023年1月24日,微软公司在其官方博客宣布,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破。
期间,微软宣布,计划将ChatGPT等人工智能工具整合到其所有产品中,其中包括将ChatGPT融合到必应搜索引擎,将ChatGPT融合到Word、PowerPoint、Outlook邮箱等Office办公套件。“美版今日头条”BuzzFeed在宣布和OpenAI合作,未来将使用ChatGPT帮助其创作内容后股价2天累计涨幅超300%。
技术上,ChatGPT的上线意味:语言类AI底层技术NLP进步显著,同时启示AI其他领域应用更高效率的Transformer和产出更类人的RLHF算法。ChatGPT是GPT-3和GPT-4之间的过渡版本。从GPT-1到ChatGPT,使用更先进的训练模型、更海量的训练数据,功能越来越全面,表现越来越类人。
图:GPT系列产品升级情况
资料来源:,九方智投、华安证券
应用上,GPT的升级推动AIGC的发展,AIGC渗透率有望在2025年提升至10%,市场规模或将于2030年逾万亿。
商业模式上,ChatGPT的后续计划推出:免费的「基础版」和付费的「专业版」。付费版ChatGPTProfessional版本每月收费42美元,具备全天可用性、更快的响应速度以及新功能的优先权。ChatGPT调优有望在医疗、客服机器人、虚拟人、翻译、营销、游戏、社交、教育、家庭陪护等多个领域被应用:
云服务:客户使用ChatGPT云服务支持聊天机器人应用程序;
内容营销:ChatGPT根据用户的兴趣和喜好向用户推送广告;
数据盈利:ChatGPT生成的大量数据,包括会话日志和客户反馈,出售给第三方或用于改进ChatGPT的功能来变现;
咨询服务:ChatGPT分析客户对话提供建议,改善体验;
版权授权:ChatGPT可授权聊天机器人应用程序中使用。
ChatGPT仍有改进的空间:当前偶尔可能生成不正确或荒谬的信息;可能会有违反伦理道德的答案;由于其所基于的训练数据库仅截止2021年(而非基于实时数据),回答可能已经过时等。
图:ChatGPT的局限性
资料来源:OpenAI官网,九方智投、财通证券研究所
二、ChatGPT横空出世,AIGC风潮渐盛
AIGC风潮渐盛,应用前景广阔。ChatGPT火爆的背后折射出AIGC在全球的蓬勃发展。ChatGPT上线推动文本类AI渗透于文本生产、智能批阅等应用领域,同时其对训练模型的改进对AIGC的全面发展有广泛意义。
AIGC(人工智能生成内容)是通过AI技术来自动或辅助生成内容,21世纪10年代中期以来已经进入快速发展阶段。从发展背景看,AIGC的兴起源于深度学习技术的快速突破和日益增长的数字内容共计需求;从应用价值方面看,AIGC将有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。
AIGC(人工智能生成内容)全称为AIGeneratedContent,对应互联网的PGC(专业生产内容)、UGC(用户生成内容)、PUGC(专业用户生成内容)等概念,AIGC是通过AI技术来自动或辅助生成内容,解决内容生成瓶颈问题。
早期萌芽阶段:1950s-1990s,受限于当时的科技水平,仅限于小范围实验。
沉淀积累阶段:1990s-2010s,AIGC从实验性向实用性逐渐转变。
快速发展阶段:2010s至今,自2014年起,随着以生成式对抗网络(GAN)为代表的深度学习算法的提出和迭代更新,AIGC迎来了黄金时代,生成内容百花齐放,效果逐渐逼真至人类难以分辨。
图:信息技术群
资料来源:中国信息通信研究院,九方智投、太平洋证券研究院
ChatGPT平台型技术将带动全行业AI发展提速:ChatGPT是AIGC技术进展的里程碑,该模型使得利用人工智能进行内容创作的技术成熟度大幅提升,有望成为新的全行业生产力工具,提升内容生产效率与丰富度。部分行业如搜索引擎、文稿创作、艺术设计等可能出现行业格局与商业模式的骤变,全行业“AI+”浪潮已至。数据、算力、算法作为AI三要素,相互耦合,共同促进,将带动AI行业整体协同发展。
AI三要素相互耦合,共同生成AI模型。一个传统的AI模型包括训练和推断(预测)两大部分。训练环节指将训练数据(通常为现有的历史数据)输入进算法中,通过AI芯片(GPU、FPGA等)提供算力支撑,以及数据工程师的分析调参,最后生产满足特定功能的AI应用模型。推断环节指通过向训练完成的AI应用模型中输入实际应用场景中的新数据,并生产对应的推断结果。在这一过程中,数据、算法和算力扮演着同等重要的角色,三要素的耦合关系是探索AI未来发展道路的重要基础:
1.数据是AI模型的“汽油”:数据是一切人工智能的基础。
2.算力是AI模型的“发动机”:算力是最容易被直观量化的指标(英伟达每年推出的新GPU参数),但也是目前最大的瓶颈。算力的瓶颈并不体现在算力的绝对大小,而在于实现该算力的成本。
3.算法是AI模型的“大脑”:算法是AI实现技术跃迁的根本,也是最难以被直观理解的部分。
算法、数据、算力是AI大模型训练的基础。
三、中国企业直道超车机会,ChatGPT技术与全球市场优势不大
chatGPT确实一定程度上有从量变到质变的突破,但是chatGPT需要搜集全球数据(隐私与法律障碍),未来进入中国市场优势也很小。chatGPT使用起来很贵,大规模商用还要解决一系列问题,在一些专业领域可能表现暂时不如一些专业模型。
中国企业在中国国内能否奋起直追,直到超车很重要。国内相关重要公司都已经启动了相应的1+N(一个模型,n个领域)专项技术攻关。
投机机会:从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。
计算机视觉:云从科技-UW、格灵深瞳-U等;
注数据领域的海天瑞声等;
算力领域的海光信息、龙芯中科、宝信软件等;
算法领域的海康威视、大华股份、科大讯飞、奥普特以及AIGC领域的万兴科技等。
互联网传媒:跟进AIGC的技术发展和文本、音频、图像等单模态的应用落地。相关标的:中文在线、汉仪股份、视觉中国、昆仑万维、蓝色光标。
计算机:泛AI领域是相关主线。AI领军:科大讯飞、万兴科技、虹软科技,云从科技(上证e互动平台公开披露了视觉语音NLP都类似chatGPT的“预训练模型+反馈调优”路线)、汉王科技(互动易平台公开披露了NLP技术积累和项目)、博彦科技、商汤科技(H)。自然语言处理:科大讯飞等;
图:AIGC应用场景相关部分互联网传媒和计算机上市公司
资料来源:斯公司公开信息,互动易平台,上证e互动平台,Wind,Choice,九方智投、申万宏源
重点标的:
1.科大讯飞:AI语音龙头,技术实力领先,启动“讯飞超脑2030计划”。科大讯飞真正的壁垒来源于语义和场景,消费品、汽车、教育、医疗背后都是语义和场景,未来各垂直领域的AI落地有望快速增长。
科大讯飞从人工智能技术及产品应用出发,致力于让机器“能听会说,能理解会思考”。公司从语音识别延生到语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等算法,并在消费者、智慧教育、智慧城市、智慧司法、智能服务、智能汽车、智慧医疗、运营商等领域实现深度应用。
科大讯飞技术实力领先。科大讯飞两次荣获“国家科技进步奖”及中国信息产业自主创新荣誉“信息产业重大技术发明奖”,被任命为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。
科大讯飞是最有希望做出最好的中文对话系统的企业,并且是最有可能在教育、医疗等领域落地的。全国唯一的认知智能实验室,也已经有开源的预训练模型,成为业界流传最广泛的中文预训练模型之一,Github上排名第一。
讯飞超脑计划分为三个阶段:
第一阶段2022-2023年:要让软硬一体机器人发展为外骨骼机器人,做宠物型的机器智能硬件,要具备理解人多模态的认知能力,以陪伴为概念且可养成。并发布专业虚拟人家族,在医疗、教学等更多的领域帮助人类。
第二阶段2023-2025年:要让外骨骼机器人进入生活,未来十年每个家庭都将有一个机器人,并发布陪伴虚拟人家族,可以陪伴老人,有温度的进行情感化交流。
第三阶段2025-2030年:要让懂知识、会学习的陪伴机器人进入家庭,且数字虚拟人能够自我学习和进化。人工智能将在2030年真正解决人类现在最关心的老龄化、人口出生率降低的问题,公司要用软硬一体化的实际能力,真正在刚需中帮助人类更好地面对未来。
图:讯飞超脑2030计划的三个阶段
资料来源:科大讯飞官方微信公众号,九方智投
2022年有望发布实际成果,2023年前将发布数款重点产品:1)公司将2022年首发专业虚拟人,2023年打造数字经济下的虚拟人家族。2)2023年发布可养成宠物玩具。利用主动对话、场景感知以及理解等技术,不断养成、不断学习,它将更有灵气、更加有趣、更能陪伴人类成长。
2.拓尔思:依托NLP能力助力机器人语义理解。被任命为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。
拓尔思是领先的大数据、人工智能、数据安全产品和服务提供商,其主营业务包括:①人工智能:专注于语义智能(也经常被称为语言智能或者认知智能)技术(包括NLP)的研发和产业化。②大数据:以数据获取、数据治理、数据检索、数据分析挖掘全生命周期的技术能力提供大数据产品及服务。③数据安全:全资子公司天行网安提供数据安全传输和交换产品及服务。
图:公司大数据领域技术积累与数据资产情况
资料来源:公司公告,九方智投、国盛证券研究所
公司人工智能和大数据两大业务(合计占比72%)有望受益于ChatGPT带来的市场增益。
人工智能-文本AI算法:公司是国内最早从事自然语言处理(NLP)研发的企业之一,在语义智能领域具备自主可控的底层技术,可以提供预训练模型和阅读理解等技术成果。
大数据-文本AI数据:公司是最早从事中文全文检索技术研发的企业,现已将领先优势拓展到数据采集、治理、分析挖掘等大数据核心技术的全生命周期。
图:拓尔思虚拟人业务定位是赋予智能虚拟人实用的灵魂——智能驱动的大脑
资料来源:公司公告,九方智投、国盛证券研究所
3.海天瑞声:一站式数据服务提供商。生成的训练数据主要覆盖智能语言、计算机视觉和自然语言处理三大领域。海天瑞声是我国领先的AI训练数据专业提供商。自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。
公司所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可。
提供一站式数据服务,有望受益于AI发展对上游数据训练集的需求。海天瑞声提供从设计到实施(采集-清洗-脱敏-标注)的一站式数据服务解决方案。其拥有1050+数据成品库,包含190种语言,内容覆盖智能家居、智能驾驶、虚拟主播、有声书、智慧金融、智能安防、智能搜索等数十个业务场景。同时,自研一体化数据平台,平台内上千款自研标注工具联合打通,支持复杂业务场景标注需求。
参考资料:
20230130-太平洋-ChatGPT发布有望引发人工智能新浪潮
20230130-财通证券-ChatGPT:开启AI新纪元-20230129
20230129-申万宏源-微软投资openAI一小步,chatGPT与AI一大步!
20230114-国盛证券-计算机:ChatGPT是否是AI的革命
20221211-国盛证券-ChatGPT算法突破,泛AI加速
20230129-中信建投-行业周报:ChatGPT热度不减,建议持续关注AI与数据要素领域
20230121-东吴证券-行业深度报告_ChatGPT:又一个“人形机器人”主题
本报告由研究助理协助资料整理,由投资顾问撰写。投资顾问:王德慧(登记编号:A0740621120003)
相关教程
2023-03-10
2023-03-14
2023-02-19
2023-03-15
2023-03-10
2023-02-08
2023-03-14
2023-05-05
2023-07-26
2023-06-03
2023-02-12
2024-10-23
2024-10-22
2024-10-22
2024-10-21