人工通用智能的火花:GPT-4的早期实验 S´ebastienBubeck Varun Chandrasekaran Ronen Eldan Johannes Gehrke Eric Horvitz Kamar Peter Lee Yin Tat Lee Yuanzhi LiScott Lundberg Harsha NoriHamid PalangiMarco Tulio RibeiroYi Zhang arXiv:2303.12712v1 [cs.CL] 2023年3月22 日 微软研究院 摘要 人工智能(AI)研究人员一直在开发和完善大型语言模型(LLMs),这些模型在各种领域和任务中表现 出非凡的能力,挑战我们对学习和认知的理解。由OpenAI开发的最新模型GPT-4[Ope23],是使用前所未有 的计算和数据规模训练出来的。在本文中,我们报告了我们对GPT-4早期版本的调查,当时它还在OpenAI 的积极开发中。我们认为,(这个早期版本的)GPT-4是新一批LLM的一部分(例如,与ChatGPT和谷歌的 PaLM一起),它比以前的AI模型表现出更多的通用智能。我们讨论了这些模型的上升能力和影响。我们证 明,除了对语言的掌握,GPT-4还能解决跨越数学、编码、视觉、医学、法律、心理学等领域的新颖而困难 的任务,而不需要任何特殊的提示。此外,在所有这些任务中,GPT-4的表现都惊人地接近人类水平,而且 往往大大超过了ChatGPT等现有模型。鉴于GPT-4能力的广度和深度,我们认为可以合理地将其视为人工通 用智能(AGI)系统的早期(但仍不完整)版本。在我们对GPT-4的探索中,我们特别强调发现它的局限性 ,并讨论了在向更深入和更全面的AGI版本迈进时面临的挑战,包括可能需要追求一种超越下一个单词预测 的新范式。最后,我们对近期技术飞跃的社会影响和未来的研究方向进行了思考。 内容 1 介紹 1.1 我们研究GPT-4情报的方法 1.2 组织我们的示范活动。 4 7 8 2 多模态和跨学科构成 13 2.1 综合能力..........................................................................................................................................13 2.2 愿景 .................................................................................................................................................16 2.2.1 超越记忆的图像生成.............................................................................................................16 2.2.2 按照详细的指示生成图像( ` a la Dall-E)。........................................................................17 2.2.3 在草图生成中可能的应用 .....................................................................................................18 2.3 音乐 .................................................................................................................................................19 3 编码 21 3.1 从指令到代码...................................................................................................................................21 3.1.1 编码挑战 ..............................................................................................................................21 3.1.2 现实世界的情景 ...................................................................................................................22 3.2 了解现有代码...................................................................................................................................26 1 4 数学能力 30 4.1 与GPT-4的数学对话 ........................................................................................................................31 4.1.1 对原问题的第一个概括.........................................................................................................31 4.1.2 原问题的第二个变体 ............................................................................................................32 4.1.3 对谈话中强调的局限性的分析 ..............................................................................................34 4.2 数学问题数据集上的表现 .................................................................................................................35 4.3 各个领域的数学建模 ........................................................................................................................37 4.4 高等数学..........................................................................................................................................39 5 与世界的互动 43 5.1 工具的使用 ......................................................................................................................................43 5.1.1 使用多种工具来解决更复杂的任务.......................................................................................44 5.1.2 讨论......................................................................................................................................49 5.2 体现的互动 ......................................................................................................................................49 5.2.1 热身运动:地图导航 ............................................................................................................49 5.2.2 基于文本的游戏....................................................................................................................49 5.2.3 真实世界的问题 ...................................................................................................................52 5.2.4 讨论......................................................................................................................................53 6 与人类的互动 54 6.1 了解人类:心智理论........................................................................................................................54 6.1.1 测试心智理论的具体方面 .......................................
劲爆!154页微软GPT研究报告:人工通用智能的火花
温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 于 2023-06-14 16:51:44上传分享