GPT4全方位升级,AI商业化时代来临 ——AI跟踪报告之九 2023年3月29日 作者: 光大证券电子通信行业首席分析师 刘凯,执业证书编号:S0930517100002 证券研究报告 核心观点 GPT 4与ChatGPT对比:全方位升级 GPT4为多模态模型,支持图片输入,文本能力升级; GPT4支持复杂性问题解决,可靠性与安全性显著提升;推出可预测深度学习堆栈,开源 Evals 评估框架。 微软Copilot:AI商业化里程碑 Dynamics 365 Copilot:GPT4赋能业务全线。 Dynamics 365为整个微软商业应用产品线,带来由全新一代人工智能驱动的产品 升级,为各项商业应用全面引入互动式的人工智能助手; Microsoft 365 Copilot:开启全新工作方式。微软使用微软生成式AI助手Copilot对Microsoft 365工具套件进行升级,采用OpenAI 推出的GPT-4,集成到Word、Excel、PowerPoint、Outlook和Teams等应用中,开启全新工作方式; Power Platform Copilot:低代码未来前景打开。基于 GPT 能力提供 AI-powered 的帮助,让制作者可以用自然语言描述他们想 要的应用、流程或机器人,然后 Copilot 可以在几秒钟内完成创建,并提供改进的建议。 国内巨头纷纷入局 百度:发布文心一言大模型,性能强大、功能丰富,为垂类应用落地提供强大支持; 华为:大模型布局多年,建立联合体推动产业化; 海康威视:AI开放平台为碎片化的行业应用场景提供了一站式算法训练平台,具备基于小样本数据训练高精度算法的能力; 大华股份:打造巨灵平台,提供一站式算法训练,包含上千个各种场景下的AI算子和预训练模型。 投资建议:云端算力/边缘算力、模型/算法/数据、应用三个维度关注AI行业投资机会 云端算力:寒武纪、海光信息、芯原股份等; 边缘算力:翱捷科技、晶晨股份、瑞芯微、全志科技等; 模型/算法/数据:建议关注三六零(A股唯一自研大模型)、商汤科技(神经网络)等; 应用:海康威视、大华股份等。 风险提示:ChatGPT信息泄露风险、虚假信息法律风险,行业研发不及预期风险。 请务必参阅正文之后的重要声明 招商基金 2 目 录 模型:GPT 4相较ChatGPT全方位升级 微软Copilot:AI商业化里程碑 国内巨头纷纷入局 投资建议:云端算力/边缘算力、模型/算法/数据、应用三个维度 关注AI行业投资机会 风险分析 请务必参阅正文之后的重要声明 qRoNpPpPmPpMsRxOmQtNqP9PcM8OsQmMoMsRfQnNsRkPnOqQ6MoPrMMYmOwOvPpMoM 一、GPT 4相较ChatGPT全方位升级 1、多模态模型:支持图片输入,文本能力升级 2、支持复杂性问题解决,可靠性与安全性显著提升 3、推出可预测深度学习堆栈,开源 Evals 评估框架 请务必参阅正文之后的重要声明 4 1.1、多模态模型:支持图片输入,文本能力升级 GPT-4支持图片输入,多模态模型功能强大。相较于GPT-3.5仅支持文字或代码的输入和输出,GPT-4支持图片输入,并生成说明、 分类和分析结果(输入图片还处于内测阶段,尚未公开真正结果)。具体来说,GPT-4能够在用户输入散布式文本和图像后,自主 生成文本输出(自然语言、代码等)。 根据OpenAI 官网案例,GPT-4能够发现图片中的异常之处,明白“梗图”中的含义和笑点,甚至能直接阅读并分析带有图片的论文。 图1:GPT-4能够发现图片中的异常 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 图2:GPT-4发现鸡块的排列与世界地图的联系 资料来源:OpenAI官网,光大证券研究所整理 5 图3:GPT-4能够解释论文内容 资料来源:OpenAI官网,光大证券研究所整理 1.1、多模态模型:支持图片输入,文本能力升级 在标准学术视觉基准测试中,GPT-4性能优于其它模型。OpenAI在一组标准学术视觉基准测试中对GPT-4的表现进行评估, 根据结果,GPT-4在TextVQA、图表质量管理、AI2D等方面都显著优于其他模型。 此外,OpenAI表示,这并不完全代表GPT-4的能力范围,因为该模型被发现能够不断解决新任务,公司计划近期发布更多 分析和评估数据。 图4:GPT-4在文本、图片处理方面与SOTA等模型的对比 资料来源:OpenAI官网,光大证券研究所整理 注:OpenAI以机器学习模型设计的传统基准评估了GPT-4,结果显著优于现有大模型 请务必参阅正文之后的重要声明 6 1.1、多模态模型:支持图片输入,文本能力升级 文本能力方面,GPT-4的表现显著优于现有大型语言模型。 GPT-4能够处理超过2.5万字的文本,允许长篇内容创建、扩展 对话以及文档搜索和分析等应用场景。 OpenAI在为机器学习模型设计的传统基准测试(包括MMLU、HellaSwag、ARC等)中比较GPT-4与GPT-3.5、SOTA等模 型的性能。结果表明, GPT-4在基准测试中的表现显著优于现有大型语言模型,并且在大部分的测试中优于最先进的SOTA 模型。 图5:GPT-4在基准测试中的表现显著优于现有大型语言模型 资料来源:OpenAI官网,光大证券研究所整理 注:OpenAI以机器学习模型设计的传统基准评估了GPT-4,结果显著优于现有大模型 请务必参阅正文之后的重要声明 7 1.1、多模态模型:支持图片输入,文本能力升级 MMLU 基 准 ( Multilingual MultiLevel Unification,是一种新的基 准测试,旨在评估多语言NLP模型 的性能)常用于测试大规模多任 务语言理解能力,涵盖自然科学、 社会科学、艺术、人文等领域, 通常使用英文编写。 图6:GPT-4 在 MMLU 基准测试中表现优于 GPT-3.5、Chinchilla、PaLM 等语言模型 OpenAI 使 用 Azure Translate 将 MMLU基准翻译成多种语言,并 将GPT-4与其他语言模型应用测 试。 结果表明, GPT-4在包括拉脱维 亚语、威尔士语和斯瓦希里语等 多种小众语言上的表现,均优于 GPT-3.5、Chinchilla、PaLM等语 言模型的英语表现。 资料来源:OpenAI官网,光大证券研究所整理 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 8 1.2、支持复杂性问题解决,可靠性与安全性显著提升 GPT-4 在 人 类 模 拟 考 试 中 的 表现超越GPT-3.5。在没有专 门培训的情况下, GPT-4在 律 师 考 试 、 LSAT 、 GRE Quantitative等测试中的得分 基本全部高于GPT-3.5。 图7:GPT-4 与GPT-3.5在各项考试中表现情况对比 在 律 师 资 格 考 试 ( Uniform Bar Exam)中, GPT-4的分 数在应试者的前10%左右, 显著优于GPT-3.5倒数10%左 右的得分。 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 9 1.2、支持复杂性问题解决,可靠性与安全性显著提升 GPT-4在语言风格方面得到更新。与具有固定冗长语气和风格的经典ChatGPT不同,开发人员(普通用户也将会开放)可以 通过描述在系统中规定AI的语言风格,即拥有“自定义”的功能。 图8:GPT-4拥有自定义语言风格的功能 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 10 1.2、支持复杂性问题解决,可靠性与安全性显著提升 GPT-4在可靠性与安全性方面实现最好结果。OpenAI表示,在6个月的时间内通过对抗性测试程序和ChatGPT经验教训迭代 调整GPT-4,在可靠性、真实性、可控性以及拒绝越界和敏感问题方面获得有史以来最好结果。相较GPT-3.5, GPT-4对禁 止内容作出响应的可能性下降82%,生成可靠性内容的可能性提高40%。 然而,OpenAI仍然提示GPT-4在偏见、隐私和虚假信息等方面的风险。为此,OpenAI纳入更多人工反馈(包含ChatGPT用 户),并与50多位专家合作,在技术发展的同时提高AI的安全性。 图9:GPT-4响应不正确行为和敏感信息的可能性更低 图10:不同主题下,GPT-4的对抗性测试结果显著优于其他模型 资料来源:OpenAI官网,光大证券研究所整理 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 11 1.3、推出可预测深度学习堆栈,开源 Evals 评估框架 构建可预测的深度学习堆栈是GPT-4项目的重点之一。OpenAI开发基础设施和优化算法,能在多个模型中表现出可预测行 为。为验证可预测性,OpenAI通过对使用相同训练方法但计算量少10000倍的模型进行推断,在内部代码库中准确预测 GPT-4的最终损失。 为便于用户选择模型,开源Evals评估框架。Evals框架用于创建和运行基准,以评估 GPT-4 等模型,同时逐个样本检查性 能。使用Evals指导模型开发,方便用户将其应用于跟踪模型版本的性能和不断发展的产品集成。比如,Stripe使用Evals来 补充人工评估,以衡量其 GPT 驱动的文档工具的准确性。 OpenAI认为,准确预测未来的机器学习能力是安全性的重要组成部分。但相较于潜在影响而言,其并没有得到足够的重视。 OpenAI正加大开发力度,为社会提供更好的未来系统预期指导。 图11:OpenAI代码库下一个单词预测 图12:GPT-4扭转了逆向缩放(模型性能随规模扩大而下降)趋势 资料来源:OpenAI官网,光大证券研究所整理 请务必参阅正文之后的重要声明 12 资料来源:OpenAI官网,光大证券研究所整理 目 录 模型:GPT 4相较ChatGPT全方位升级 微软Copilot: AI商业化里程碑 国内巨头纷纷入局 投资建议:云端算力/边缘算力、模型/算法/数据、应用三个维度 关注AI行业投资机会 风险分析 请务必参阅正文之后的重要声明 二、微软Copilot:AI商业化里程碑 1、Dynamics 365 Copilot:GPT4赋能业务全线 2、Microsoft 365 Copilot:开启全新工作方式 3、Power Platform Copilot:低代码未来前景
GPT4全方位升级,AI商业化时代来临-20230329-光大证券-41页
温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 于 2023-06-13 15:20:23上传分享