ChatGPT 林惠⽂@真格基⾦ daimajia.com 体验 ChatGPT 与 GPT-3 的对⽐与 GPT-3 的对⽐与 GPT-3 的对⽐强烈建议体验 https://mirror.xyz/ 0x6E12A28086548B11dfcc20c75440E0B3c10721f5/9O9CSqyKD j4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc ChatGPT 提升的核⼼点 • 敢于质疑不正确的前提 • 主动承认错误和⽆法回答的问题 • ⼤幅提升了对⽤户意图的理解 • ⼤幅提升了结果的准确性提升⼈类意图的⼀致性连续多轮对话能⼒提升的原因加⼊了基于⼈类的反馈系统 Reinforcement Learning from Human Feedback 丛问题库⾥抽取问题标记者（Labeler）书写期待的回复什么是⾹蕉？⾹蕉是⼀种⽔果，从⾹蕉树…. 采样问题，并列出所有模型和标记者的回答标记者（Labeler）排序所有标记着答案被标记的数据⽤来调优 GPT-3.5 ⽤排序答案训练奖励模型写个⽔獭的故事什么是⾹蕉？⾹蕉是⼀种⽔果，从⾹蕉树…. ⾹蕉是芭蕉科、芭蕉属植物... ⾹蕉，从属性来说，与草莓、葡萄、猕猴桃是亲… ⾹蕉为芭蕉科植物⽢蕉的果实。原产亚洲东南部… 通过模型⽣成初步回答输⼊奖励模型得到分数和优化参数很久很久以前... 持续优化参数迭代往前捋捋 chatGPT GPT-1 GPT-2 GPT-3 2018 2019 2020 15 亿参数 1500w 美⾦ 1750 亿参数 1.17 亿参数 InstructGPT 2022 再往前捋捋 chatGPT Decoder GPT-1 Transformer T5 BERT GPT-2 BART RoBERTa GPT-3 M2m-100 XLM InstructGPT BigBird ALBERT Encoder 2017 《Attention is All You Need》 ELECTRA 继续再往前捋捋 CNN 卷积神经⽹络 Transformer RNN 循环神经⽹络 GPT-1 GPT T5 B BERT 1990开始 - 2006突破 - 2015繁荣 2017 开始 RoB 继续再往前捋捋 CNN 卷积神经⽹络基于规则机器学习 GPTTransformer RNN 循环神经⽹络 T5 BER 1950 开始 1980 开始 1990 开始 - 2006 突破 2017 开始发展趋势基于规则机器学习神经⽹络 Transformer ⼿写规则，简单粗暴只能处理⾮常少量数据找到⼀些函数或参数分类固定量数据像⼈脑⼀样学习开始尝试⼤量数据优化⼈脑学习过程关注重点⽽⾮全部分类⻩⾖和绿⾖提前标记⼀些数据根据⼤量数据分类学习⼀个复杂的参数集合发展趋势神经⽹络 Transformer 像⼈脑⼀样学习优化⼈脑学习过程关注重点⽽⾮全部提前标记⼀些数据根据⼤量数据分类学习⼀个复杂的参数集合 GPT3 投喂海量的学习数据⽆需分类数据 1200 万美⾦ ChatGPT ⼈对结果的反馈成为学习过程的⼀部分

ChatGPT-真格基金分享

网站升级 > 碳达峰碳中和书籍 > 碳达峰碳中和书籍 > 文档预览

30 页 0 下载 464 浏览 0 评论 0 收藏 3.0分

温馨提示：当前文档最多只能预览 5 页，若文档总页数超出了 5 页，请下载原文档以浏览全部内容。

ChatGPT-真格基金分享第 1 页

ChatGPT-真格基金分享第 2 页

ChatGPT-真格基金分享第 3 页

ChatGPT-真格基金分享第 4 页

ChatGPT-真格基金分享第 5 页

下载文档到电脑，方便使用

当前文档最多只能预览 5 页
还有 0 页可预览，继续阅读

本文档由于 2023-06-13 15:06:52上传分享

举报

下载原文档(5.53 MB)

收藏分享

给文档打分

评论列表

暂时还没有评论，期待您的金玉良言

最新文档