2023.02 I 内容提要 ChatGPT 团队规模不足百人(共 87 人)。分析发现,其显著特征是“年纪很轻”、“背 景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。 该团队平均年龄为 32 岁,“90 后”是主力军。他们引领的这一波大型语言模型技术风 潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重 大突破。 团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布 看,校友最多的前 5 大高校是斯坦福大学(14 人)、加州大学伯克利分校(10 人)、麻省 理工学院(7 人)、剑桥大学(5 人)、哈佛大学(4 人)和佐治亚理工学院(4 人)。另 外,该团队有 3 人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大 学就读,目前均在团队担任研发工程师一职。ChatGPT 不一味强调高学历,其成员并非“清 一色”的研究生学历,而是本、硕、博人数相对均衡。 团队成员有 10 人从谷歌跳槽加入,其他成员也大多来自 Facebook、Stripe、Uber、 Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel 等顶尖或知名科技 公司。另外,该团队有 5 人被评为 2023 年度“AI 2000 全球人工智能学者(全名单链接: https://www.aminer.cn/ai2000)”,其中 2 人为 OpenAI 联合创始人,2 人分别被评为 全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作 用至关重要。 从成员职位构成看,该团队成员近 9 成为技术人员,未配备技术与产品之外的职能人员 (如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时 代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两 个月时间内在全球引爆。 II ChatGPT 是 OpenAI 在大型语言模型领域多年技术积累的结果。统计发现,在与 ChatGPT 相关的先前 7 大技术项目研发中,ChatGPT 团队成员参与人数最多的是 CodeX 项目,共有 22 人参与过,占总团队人员总数的 25%;其次是 webGPT 和 instructGPT, 共有 9 人参与过;第三是 GPT3,共有 6 人参与过;第四是 RLHF,共有 3 人参与过。由此 可见,ChatGPT 团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是 1/4 团队成员曾参与过同样基于 GPT3 的 CodeX 项目的研发经验,对后续成功研发 ChatGPT ChatGPT先前七大技术项目 打下了坚实的基础。 webGPT 9 InstructGPT 9 codeX 22 GPT3 6 GPT2 0 GPT1 0 RLHF 3 0 5 10 15 20 25 ChatGPT团队参与人数(人) 数据来源:AMiner 科技情报平台 图 ChatGPT 团队参与先前 7 大技术研发人数 分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力 的创业机构。团队成员大多是从“大厂”跳槽,以及作为应届生加入,其次就是从相对“稳 定”的科研机构和高校教职岗位离职后加入。即使从 ChatGPT 团队离职的 4 位成员,也仍 然选择加入创业公司或机构。 III 数据来源:AMiner 科技情报平台 图 ChatGPT 团队成员流动示意图 ChatGPT 团队中的华人表现抢眼。团队共有华人 9 人,占团队总人数 10%。其中 5 人 本科就读于中国内陆高校,3 人大学教育经历均在美国高校完成。梳理毕业于中国内陆高校 的 ChatGPT 华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科, 之后赴美深造,获得硕士或博士学位,然后加入美国诸如 Dropbox、OpenAI 等创新型公 司。 表 ChatGPT 团队中的华人成员 姓名 职务 研发工程师 翁家翌 毕业院校 学士:清华大学 硕士:卡内基梅隆大学 工作单位 (按时间顺序排列) OpenAI 研发工程师 学士:清华大学 (MTS) 博士:斯坦福大学 研发工程师 学士:华中科技大学 Mythic; (MTS) 博士:马里兰大学帕克分校 OpenAI OpenAI 赵盛佳 江旭 IV 姓名 职务 毕业院校 学士:清华大学 研发工程师 硕士:德克萨斯大学奥斯汀 分校 袁启明 AI 应用研究 经理 工作单位 (按时间顺序排列) Dropbox; OpenAI 学士:北京大学、香港大学 Dropbox; 博士:印第安纳大学伯明顿 Affirm; 分校 OpenAI 翁丽莲 深度学习研 学士:麻省理工学院 究员 博士:麻省理工学院 OpenAI 肖凯 研究员 学士:麻省理工学院 硕士:佐治亚理工学院 Steph Lin 高级研究员 欧阳龙 牛津大学(人类未来 研究所); OpenAI 学士:哈佛大学 Self-Employed; 博士:斯坦福大学 OpenAI 加州大学伯克利分 信息缺失 博士:加州大学伯克利分校 校; OpenAI 张马文 数据来源:AMiner 科技情报平台 华人学者欧阳龙参与了与 ChatGPT 相关的 7 大技术项目中的 4 大项目的研发,他是 InstructGPT 论文的第一作者,是 RLHF 论文的第二作者,可见他是这两个关键技术项目的 核心人员。 根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:1)注重科 技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮;2)“大厂”前沿科技创新 疲态显现,鼓励年轻人将目光投向创业公司;3)海外华人学者是全球科技创新的重要力量, 鼓励加强对外学术交流。 V 目 录 内容提要 II 一、职位分工:近 9 成为技术人员,高度聚焦技术研发 1 二、年龄分布:“90 后”科研“后浪”显示强大创新能力 2 三、教育背景:绝大多数拥有名校学历,6 人毕业于中国高校 3 四、人员流动:10 人从谷歌跳槽加入,1 人曾在百度任职 5 五、华人成员:在国内完成本科学业,后赴美深造并就业 7 六、成员贡献:1/4 成员参与过 codeX 研发,欧阳龙表现突出 8 七、性别特征:团队由男性主导,女性仅占 1 成 10 八、2023 年“AI 2000 学者”入选情况:5 位顶尖学者入选 12 九、启示与建议 13 附件:ChatGPT 团队全体成员名单(87 人) 15 VI 2022 年 11 月 30 日,OpenAI 公司(美国致力于人工智能研究的非营利机构)发布了 由大型语言模型驱动的自然语言处理工具 ChatGPT。该工具通过学习和理解人类语言,能 够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由 于在同行中具有较卓越的性能,ChatGPT 推出仅 2 个多月的时间即引爆全球。除了关注 ChatGPT 性能本身外,业内人士更关注该 AI“梦之队”成员到底具有哪些特征,才促使他 们在全球大型语言模型创新技术领域如此独领风骚。 根据 OpenAI 官网显示,为 ChatGPT 项目做出贡献的人员共 87 人①(名单详情见附 件)。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献、 性别分布等数据进行统计分析,并总结归纳其特征。 一、职位分工:近 9 成为技术人员,高度聚焦技术研发 从 ChatGPT 团队职位分工看,研发人员共 77 人,占比 88%,其中含 1 名公司联合创 始人,即 Wojciech Zaremba(被评选为 2023 年 AI 2000②机器人领域最具影响力学者); 产品人员共 4 人,占 5%。另外,6 人职位信息无法获取。从成员职位构成看,该团队未配 备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。 由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推 广营销,也能在短短的一两个月时间内在全球引爆。 https://openai.com/blog/chatgpt/ “AI 2000 全球人工智能学者”名录涵盖了 20 个核心主题领域和一些新兴领域。每年从过去 10 年中来 自各领域排名前 10 名的学者被命名为“AI 2000 最具影响力学者”,前 11-100 名学者被命名为“AI 2000 最具影响力学者提名”。因此,每年将有约 200 名最具影响力学者,从 2020 年至 2029 年 10 年将形成一 个由约 2000 名学者组成的名录,他们正在推动 21 世纪 20 年代人工智能各个领域的创新和进步。参阅网 址:https://www.aminer.cn/ai2000/about/introduction 1 ① ② 未知; 6; 7% 产品人员; 4; 5% 研发人员; 77; 88% 数据来源:智谱研究根据公开资料统计 图 1 ChatGPT 团队职位构成 二、年龄分布:“90 后”科研“后浪”显示强大创新能力 从 ChatGPT 团队年龄分布看,20~29 岁的成员有 28 人,占全体成员(剔除年龄信 息缺失的 5 位成员)的 34%;30~39 岁的共 50 人,占 61%;40~49 岁的仅 3 人,无 50~59 岁年龄段的成员,60 岁以上的有 1 人。经计算,该团队平均年龄为 32 岁。由此 可见,“90 后”是这支团队的主力军,他们引领了这一波大语言大模型技术的创新风潮, 这说明经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。 20以下 0 年龄段(岁) 20~29 28 30~39 50 40~49 3 50~59 0 60及以上 1 信息缺失 5 0 10 20 30 人数(人) 数据来源:AMiner 科技情报平台 图 2 ChatGPT 团队年龄分布 2 40 50 60 三、教育背景:绝大多数拥有名校学历,6 人毕业于中国高校 在 ChatGPT 团队中,27 人具有本科学历,25 人为硕士研究生学历,28 人拥有博士研 究生学历(注:5 人信息缺失),占比分别为 33%、30%、37%。作为全球人工智能顶尖研 发团队,其成员学历并非“清一色”研究生学历,而是本、硕、博人数相对均衡。 学士/本科 博士研究生 33% 37% 硕士研究
智谱研究&AMiner-ChatGPT团队背景研究报告-2023.2-25页
温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 于 2023-06-13 15:41:06上传分享