证券研究报告 ChatGPT研究框架 ——【AIGC算力时代系列报告】 行业评级:看好 2023年2月14日 分析师 邮箱 证书编号 陈杭 chenhang@stock e.com.cn S1230522110004 李佩京 lipeijing@stocke.co m.cn S1230522060001 姚天航 yaotianhang@stocke .com.cn S1230522010001 张建民 zhangjianmin@stock e.com.cn S1230518060001 研究助理 邮箱 安子超 anzichao@stoc ke.com.cn 摘要 【芯片算力】▲芯片需求=量↑ x 价↑ , AIGC拉动芯片产业量价齐升。1)量:AIGC带来的全新场景+原场景流量大幅提高;2)价:对高端芯片的 需求将拉动芯片均价。ChatGPT的“背后英雄”:芯片,看好国内GPU、CPU、FPGA、AI芯片及光模块产业链。 相关标的:海光信息、景嘉微、龙芯中科、中国长城、安路科技、复旦微电、紫光国微、寒武纪、澜起科技、德科立、天孚通信、中际旭创。 【深度学习框架】深度学习框架是人工智能算法的底层开发工具,是人工智能时代的操作系统,当前深度学习框架发展趋势是趋于大模型训练,对 深度学习框架的分布式训练能力提出了要求,国产深度学习框架迎来发展机遇。 相关标的:百度 、海天瑞声、商汤科技、微软、谷歌、Meta 。 95% 【深度学习大模型】ChatGPT是基于OpenAI公司开发的InstructGPT模型的对话系统,GPT系列模型源自2017年诞生的Transformer模型,此后大 模型数量激增,参数量进入千亿时代,国内百度也发布了ERNIE系列模型并有望运用于即将发布的文心一言(ERNIE Bot)对话系统,未来国内厂 商有望在模型算法领域持续发力。 添加标题 相关标的:百度、科大讯飞、商汤科技、谷歌、微软。 【应用】ChatGPT火爆全球的背后,可以窥见伴随人工智能技术的发展,数字内容的生产方式向着更加高效迈进。ChatGPT及AIGC未来有望在包 括游戏、广告营销、影视、媒体、互联网、娱乐等各领域应用,优化内容生产的效率与创意,加速数实融合与产业升级。 相关标的:百度、腾讯、阿里巴巴、网易、昆仑万维、阅文集团、捷成股份、视觉中国、风语筑、中文在线、三七互娱、吉比特、天娱数科。 【通信】AIGC类产品未来有望成为5G时代新的流量入口,率先受益的有望是AIGC带来的底层基础算力爆发式增长。 相关标的:包括算力调度(运营商)、算力供给(运营商、奥飞数据、数据港)、算力设备(浪潮信息、联想集团、紫光股份、中兴通讯、锐捷网 络、天孚通信、光库科技、中际旭创、新易盛)、 算力散热(英维克、高澜股份)。 2 1、芯片算力 3 mNpMqQpPyQpRsPmQoOmQpM8OcM8OmOoOoMmPjMqQtRiNmNnQ8OqRtPwMqMpMuOqRpN 算力需求爆发拉动芯片量价齐升 光模块和光芯片 Transformer技术 模型迭代 量 预计每3.5个月翻一番 算力 模型训练成本> 1200万美元 英伟达GPU A100> ChatGPT完美运行 1万颗 AI芯片(加速器) 资料来源:浙商证券研究所 GPU 芯片 需求 价 AI训练计算需求 训练数据 芯片需求快速增加 芯片均价大幅提升 算力需求增加 模型算法 通过AI服务器实现 CPU FPGA AI 光模块 4 人工智能四层架构,芯片为底层支撑 AI绘画:盗梦师 AI音乐:DeepMusic 百度:文心大模型 华为:盘古大模型 百度:PaddlePaddle 上层应用 大模型 深度学习框架 华为:MindSpore CPU AIGC GPU 底层芯片 AI写作:弈写 ChatGPT 谷歌:PaLM OpenAI:GPT3.5 Meta:PyTorch 谷歌:TensorFlow FPGA ASIC 5 资料来源:澜舟科技,IDC,量子位,电子发烧友等,浙商证券研究所 人工智能不同计算任务需要各类芯片实现 • 强大的调度、管理、 协调能力; • 应用范围广 • 开发方便灵活 通 用 性 强 , • 并行架构 • 计算单元多 • 适合大量逻辑确定 的重复计算 • • • • 低延时 开发周期短 硬件可根据需求调整 成本和壁垒高 • • • • 成本低 能耗低 性能强 针对AI设定特定架构 CPU GPU 应 用 方 便 FPGA ✓ 逻辑判断 ✓ 任务调度与控制 ✓ 模型训练 ✓ 研发阶段 ✓ 数据中心 ✓ AI推理 性能更优,能效更高 资料来源:Huawei forum,浙商证券研究所 AI用ASIC ✓ 成熟量产阶段 6 ChatGPT流量激增,为AI服务器带来重要发展机遇 原场景流量提升+新应用场景 服务器算力要求提升 达成1亿月活跃用户耗时 终端用户使用频率提高, 数据流量暴涨,对服务器 的数据处理能力、可靠性 及安全性等要求相应提升 史上用户增速最 快消费级应用 2个月 9个月 30个月 54个月 60个月 AI服务器需求增加 传统CPU服务器 通用性较强,专用性较弱 算力无法满足 78个月 应用 数据的质和量发生变化, 非结构化数据占比激增 AI服务器需求 288亿美元 原场景流量提升 创造新应用场景 ChatGPT在问答模式的基础上进行推理、编写代码、 文本创作等,用户人数及使用次数均提升。 智能客服 游戏NPC 智能音箱 陪伴型机器人 资料来源:Sensor Tower,World of Engineering,头豹研究院,华经产业研究院,浙商证券研究所 内容生产 CAGR=18.8% 全球AI服 务器市场 规模 122亿美元 …… 7 2020 2025 AI服务器快速增长,大力拉动芯片需求 2022年中国人工智能芯片 市场规模占比 中国人工智能服务器工作负载预测 训练 推理 ASIC, 1.0% 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% FPGA, 0.4% AI服务器=? 异构形式 NPU, 9.6% CPU 2020 2021 2022 2023 2024 2025 2026 2021年全球服务器市场格局 其他, 17.1% 新华三/HPE, 15.6% GPU, 89.0% 2021年中国服务器市场格局 其他, 21.8% 浪潮, 30.7% ODM, 8.5% 浪潮, 8.9% 华为, 1.1% 联想, 6.4% GPU 或 FPGA 戴尔, 15.4% ODM, 35.5% + 或 联想, 6.6% 华为, 7.4% 戴尔, 7.5% 资料来源:IDC,《2022-2023中国人工智能计算力发展评估报告》,芯八哥,wind,浙商证券研究所整理 新华三/HPE, 17.5% ASIC 8 AI服务器芯片构成——CPU+加速芯片 CPU+加速芯片:通常搭载GPU、 FPGA、ASIC等加速芯片,利用 CPU与加速芯片的组合可以满足 高吞吐量互联的需求 芯片种类 应用场景 应用领域 AI服务器 计算机视觉 优点 机器学习 (算力 >30TOPS) 自然语言处理 缺点 GPU 提供了多核并行计算的基础结构,核心 数多,可支撑大量数据的并行计算,拥 有更高浮点运算能力 管理控制能力弱,功 耗高 FPGA 可以无限次编程,延时性较低,拥有流 水线并行(GPU只有数据并行),实时 性最强,灵活性最高 开发难度大,只适合 定点运算,价格比较 昂贵 ASIC 与通用集成电路相比体积更小,重量更 灵活性不够,价格高 轻,功耗更低,可靠性提高,性能提高, 于FPGA 保密性增强,成本降低 资料来源:华经产业研究院,亿欧智库,浙商证券研究所 训练 高度 适配 推理 (算力 >30TOPS) 计算 (5~30TOPS) 9 01 CPU擅长逻辑控制,可用于推理/预测 整个CPU的指挥控制中心,由指 令寄存器IR、指令译码器ID和操 作控制器OC等组成。 暂时存 放数据 的区域, 保存等 待处理 或已经 处理过 的数据。 控制单元 控制指令 存储单元 CPU 数据 取指令 指令译码 执行指令 修改指令 计数器 作为计算机系统的运算和控制核心, 是信息处理、程序运行的最终执行单元。 控制指令 优势 有大量的缓存和复杂的逻辑控制单元, 擅长逻辑控制、串行的运算。 劣势 计算量较小,且不擅长复杂算法运算和 处理并行重复的操作。 运算单元 执行部件,运算器的核心。可以执行算术运 算和逻辑运算。运算单元所进行的全部操作 都是由控制单元发出的控制信号来指挥。 资料来源:CSDN,浙商证券研究所整理 CPU运行原理 在深度学习中可用于推理/预测 10 服务器CPU向多核心发展,满足处理能力和速度提升需要 多核心CPU 单核心CPU 串行单任务处理 分时多任务处理 “一心一用” “一心多用” 英特尔 从单核到多核 AMD 从双核到96核 处理的任务更多、 处理速度更快 分时多任务处理 “多心多用” 系统性能优劣不能只考 虑CPU核心数量,还要 考虑操作系统、调度算 法、应用和驱动程序等。 2005 2010 2017 2020 奔腾D系列 酷睿i7-980X 酷睿i9 Lakefield 史上第一个双核 处理器 首款6核处理器 18核处理器 首款采用混合架构 的x86 5核处理器 2005 2007 2018 2020 2023 Athlon 64 X2 Phenom9500 第二代锐龙 Threadripper 锐龙Threadripper 3990X 霄龙9004 同一块芯片内整 合两个K8核心 首款原生4核处 理器 最大核心数量已 达到32核 拥有64核 资料来源:芯论语,半导体产业纵横,AMD官网,浙商证券研究所 2023 Sapphire Rapids 拥有56个核心 核心数量最多可 达96个 11 GPU高度适配AI模型构建 ChatGPT引发GPU热潮 AI模型构建(以英伟达A100为例) 训练过程 GPU的并行计算高度适配神经网络 • • • 百度:即将推出文心一言 (ERNIE Bot) 推理过程 GPU帮助高速解决问题:2048 个 A100 GPU 可在一分钟内成规模地处理 BERT 之类
计算机行业【AIGC算力时代系列报告】:ChatGPT研究框架-20230214-浙商证券-64页
温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 于 2023-06-13 15:49:26上传分享