小颖美食2024年10月14日发布:专访OpenAI研发团队:曾对ChatGPT走红感到困惑

⭐发布日期:2024年10月14日 | 来源:小颖美食

⭐作者:曹越 责任编辑:Admin

⭐阅读量:691 评论:9人

【2024澳门天天开好彩资料】

【新澳天天彩免费资料大全最新版本亮点】

【新奥48图库免费资料图】 【澳门天天开彩免费资料大全新版】 【新奥门特免费资料大全下载安装】 【2021澳门特料码特天天开奖记录】 【2024澳门天天开好彩大全开奖记录开奖结果】 【2024新澳精准资料免费提供】 【2024新澳门天天彩免费资料】 【新澳天天免费资料】
【2024年新澳今晚开奖记录查询】 【天天香港资料大全】 【金鹰一码全年资料】 【2024年澳门大全免费金锁匙】 【2O24年澳门今晚开码料】 【新澳门天天开彩二四六免费】 【2024新澳今晚开奖号码】 【管家婆一肖一码】

2022 年 11 月底,当 OpenAI 免费推出 ChatGPT 时,这家总部位于美国旧金山的人工智能公司对它几乎没有什么特殊期待。显而易见的是,OpenAI 内部没有人准备好迎接如此大规模的轰动。从那以后,该公司一直在追赶用户的期望、解决用户发现的问题,并尝试让自己的成功利益最大化。


在 OpenAI 研究政策的桑德希尼·阿加瓦尔(Sandhini Agarwal)说,ChatGPT 被内部视为一个“研究预览”,是一项两年前的技术的更好版本,更重要的是它试图通过收集公众的反馈来解决模型的一些缺陷。在 OpenAI 研究 ChatGPT 的科学家利亚姆·费杜斯(Liam Fedus)说:“我们不想把它作为一个巨大的技术进步来夸大它的水平。”


为了了解 ChatGPT 聊天机器人背后的故事——它是如何制作的,OpenAI 自发布以来如何更新它,以及它的开发者对其成功的看法——我采访了四个人,他们帮助构建了这款最受欢迎的互联网应用。除了阿加瓦尔和费德斯,我还采访了 OpenAI 的联合创始人约翰·舒尔曼(John Schulman)和 OpenAI 对齐团队(Alignment Team)的负责人简·莱克(Jan Leike),该团队致力于让人工智能只做用户想做的事情(并仅限于此)。(注:人工智能领域的对齐,指的是引导人工智能系统的行为,使其符合设计者的利益和预期目标。)


我的感觉是,OpenAI 仍然对其“研究预览”的成功感到困惑,但已经抓住这次机会推动这项技术更好地发展,观察数以百万计的人是如何使用它的,并试图解决最糟糕的问题。


(来源:STEPHANIE ARNETT/MITTR | ENVATO)


自 2022 年 11 月以来,OpenAI 已经多次更新了 ChatGPT。研究人员正在使用一种叫做对抗性训练的技术来阻止用户对 ChatGPT 的欺骗(这也被称为越狱)。这项工作让多个聊天机器人相互对抗:一个聊天机器人扮演坏人,通过生成文本来攻击另一个聊天机器人,迫使它突破常规约束,做出不应该做出的行为。成功的攻击会被添加到 ChatGPT 的训练数据中,希望下一代模型能够学会忽略它们。


OpenAI 还与微软签署了一项数十亿美元的协议,并宣布与全球管理咨询公司贝恩(Bain)合作。贝恩计划让可口可乐等客户使用 OpenAI 的生成式人工智能模型进行营销活动。除了 OpenAI 本身,关于 ChatGPT 的轰动还引发了新一轮围绕大型语言模型的热潮,全球各地的公司和投资者纷纷投身其中,生怕慢人一步。


短短三个月里,我们看到了很多报道。但 ChatGPT 是如何诞生的?OpenAI 采取了哪些步骤来确保它已经准备好向公众开放了?下一步又是什么?对此我们知之甚少。


为了便于阅读和理解,我们对采访内容进行了编辑。


简·莱克(Jan Leike):老实说,现在的状况真是太棒了。这让我们很惊讶,我们一直在努力追赶公众的热情和期望。


约翰·舒尔曼(John Schulman):在 ChatGPT 发布后的几天里,我经常查看推特,当时有一段非常疯狂的时期,推特上充斥着 ChatGPT 的截图。我之前期望它能符合用户的直觉,我也希望它能获得一群粉丝,但我并没期望它能达到现在这个流行程度。


桑德希尼·阿加瓦尔(Sandhini Agarwal):我认为这对我们所有人来说都绝对是一个惊喜。我们更多地关注这些模型本身,以至于我们忘记了公众会对它感到多么惊讶。


利亚姆·费德斯(Liam Fedus):我们对它的反响感到非常惊讶。我们已经看到过许多通用聊天机器人,我们自己也知道它很难做好。然而,我们的内测给了我们信心,因为我们看到有些东西真的很棒。


简·莱克(Jan Leike):我很想更好地理解是什么推动了这一切——是什么推动了它的疯狂传播和爆红。老实说,我们不理解,也不知道原因。让该团队感到困惑的部分原因在于,ChatGPT 背后的大部分技术并不新鲜。ChatGPT 是 GPT-3.5 的一个微调版本。GPT-3.5 是 OpenAI 在 ChatGPT 出现前几个月发布的大型语言模型家族。GPT-3.5 本身就是 GPT-3 的更新版本,后者诞生于 2020 年。该公司在其网站上提供了这些模型的 API 接口,这使得其他软件开发人员可以很容易地将模型插入到他们自己的代码中。OpenAI 还在 2022 年 1 月发布了另一款 GPT-3.5 微调版本,名为 InstructGPT。但公众并没有对之前这些版本如此痴迷。


利亚姆·费杜斯(Liam Fedus):ChatGPT 模型与 InstructGPT 模型使用了相同的语言模型,但微调方法稍有不同。我们添加了一些对话数据,并调整了一些训练过程。所以我们不想把它当作一个巨大的技术进展,也没想夸大它。结果表明,对话数据对 ChatGPT 有很大的正面影响。


约翰·舒尔曼(John Schulman):如果用标准基准来评估它的技术能力,两个模型之间其实并没有实质性的差异,但是 ChatGPT 更易上手和易用。


简·莱克(Jan Leike):在某种意义上,你可以把 ChatGPT 理解为已经存在了一段时间的人工智能系统的另一个版本。本质上来说,这并不是一个比之前更强大的模型。在 ChatGPT 出现之前,同样的基础模型已经以 API 的形式使用了将近一年。但从另一种意义上说,我们使它更符合人类的需求,即用户想让它做什么。它可以与你对话,聊天界面使其很容易上手,它努力让自己提供帮助。这是一个惊人的进步,我认为这是人们开始意识到的一件事。


约翰·舒尔曼(John Schulman):ChatGPT 更容易推断出用户的意图。用户可以通过不断调整提示来得到他们真正想要的东西。ChatGPT 的训练方式与 InstructGPT 非常相似,都使用了一种被称为“从人类反馈中强化学习(RLHF)”的技术。这是 ChatGPT 的成功秘诀。其基本想法是拿到一个会生成各种内容的大型语言模型,比如 GPT-3.5,然后通过教它人类用户真正喜欢什么样的回答来调整它。


简·莱克(Jan Leike):我们安排了很多人阅读 ChatGPT 的提示和回答,然后判断一个回答是否比另一个回答更好。所有这些数据被合并到一次训练中。这和我们在 InstructGPT 上所做的是一样的。你希望它(生成的内容)是有帮助的、真实的、无害的。还有一些关于制作对话和成为一名虚拟助手的东西。比如,如果用户的问题不清楚,它就应该追问。它还应该澄清一下,自己是一个人工智能系统。它不应该假设自己是一个不应该拥有的身份,它不应该声称自己拥有它不拥有的能力,当用户要求它做一个它不应该做的任务时,它必须拒绝。在这次训练中出现的一句话是“作为一种由 OpenAI 训练的语言模型……”,之前它并没有明确地说出来,但这句话被人类评审员看得很重。


桑德希尼·阿加瓦尔(Sandhini Agarwal):是的,我想事情就是这样发生的。我们有一系列的、不同的标准,人类评分者必须对模型进行排名,比如真实性。但他们也会青睐于他们认为很好的做法,比如不要扮演一个它不应该扮演的角色。因为 ChatGPT 使用的技术与 OpenAI 之前所用的相同,所以团队在准备向公众发布这个模型时并没有做任何不同的事情。他们觉得,用以前模型所用的标准就足够了。当我们准备发布时,我们并不认为这个模型会带来全新的风险。GPT-3.5 已经存在于这个世界上了,我们已经知道它足够安全了。通过 ChatGPT 对人类偏好的训练,该模型只是自动学会了拒绝,它会拒绝很多请求。


简·莱克(Jan Leike):我们确实为 ChatGPT 做了一些额外的“破坏性测试”,OpenAI 的每个人都坐下来试图打破它。我们也有外部团体在做同样的事情。我们还有一个开放给可信赖用户的早期访问程序,他们也会提供反馈。


桑德希尼·阿加瓦尔(Sandhini Agarwal):我们确实发现它产生了某些不必要的输出,但 GPT-3.5 也会产生类似的东西。所以就风险而言,作为一个研究预览——因为这是它最初的意图——它没什么问题。


约翰·舒尔曼(John Schulman):你不能等到系统完美了才去发布它。我们已经对早期版本测试了几个月,测试人员对该产品有正面的反馈。我们最关心的是事实性,因为这个模型喜欢制造东西。但是 InstructGPT 和其他大型语言模型已经存在了,所以我们认为只要 ChatGPT 在事实性和其他安全问题方面比那些模型更好,就足够了。根据我们有限的评估,我们在发布之前确认了该模型确实比其他模型更真实和安全,所以我们才做出了发布的决定。OpenAI 一直在关注人们如何使用 ChatGPT。它第一次看到,一个大型语言模型被数千万用户以千奇百怪的方式使用,这些用户可能希望测试它的极限,发现它的缺陷。该团队试图抓住 ChatGPT 所能产生的问题最大的案例——从亵渎宗教的文字到窃取信用卡号码的恶意软件代码——并利用这些例子来调整该模型的未来版本。


桑德希尼·阿加瓦尔(Sandhini Agarwal):我们还有很长的路要走。我认为,ChatGPT 的病毒式传播已经让我们已知的很多问题浮出水面,并且变得至关重要——这些是我们想要尽快解决的问题。比如,我们知道这个模型仍然很有偏见。是的,ChatGPT 非常擅长拒绝不好的请求,但它也很容易被提示所误导,使它不去拒绝我们希望它拒绝的东西。


利亚姆·费杜斯(Liam Fedus):看到用户的多样化和创造性,已经很令人兴奋了,但我们总是专注于需要改进的领域。我们认为,通过部署、获得反馈和改进的迭代过程,我们可以产生一致性最强、性能最强的技术。随着技术的发展,新的问题不可避免地会出现。


桑德希尼·阿加瓦尔(Sandhini Agarwal):在发布后的几周里,我们看到了人们讨论了一些最可怕的案例,即人们能看到的最糟糕的事情。我们评估了每一个问题,并讨论了我们应该如何解决它。我们发现的很多事情都与越狱有关,这绝对是一个我们需要解决的问题。但是因为用户必须尝试一些复杂的方法,才能让模型说出不好的事情,所以也不能说这被我们完全忽视了,而且这也不是让我们非常惊讶的事情。不过,这是我们现在正在积极努力改进的事情。当我们发现越狱的情况时,我们会将它添加到训练和测试数据中。我们看到的所有数据都将用来塑造未来的模型。


简·莱克(Jan Leike):有时一些例子会在推特上疯传,但也会有一些人私下联系我们。每次我们有了一个更好的模型,我们都想把它放出来并测试它。我们非常乐观地认为,一些有针对性的对抗性训练可以大大改善越狱的情况。目前还不清楚这些问题是否会完全消失,但我们认为,我们可以让很多越狱工作变得更加困难。我想再强调一次,在模型被公布之前,我们就知道越狱是可能的。但我认为,一旦你部署了这些系统,就很难真正预测它们会出现哪些安全问题。所以我们非常关注人们使用这个系统去做什么,看看到底发生了什么,然后再对此做出反应。这并不是说,我们不应该在预测安全问题时主动弱化它的重要性。但是,当一个系统进入现实世界时,真的很难预见会发生什么。2023 年 1 月,微软发布了 ChatGPT 支持的必应搜索,这是一个以聊天机器人形式存在的搜索引擎,许多人认为它是 OpenAI 未发布的 GPT-4 的一个版本。因为 OpenAI 的原话是:“必应背后的驱动技术,是一个微软为搜索定制的、我们的下一代模型。它结合了来自 ChatGPT 和 GPT-3.5 的进步。”科技巨头开始用上了聊天机器人,这给那些负责构建底层模型的人带来了新的挑战。


桑德希尼·阿加瓦尔(Sandhini Agarwal):现在的风险肯定比六个月前要高得多,但仍低于一年后可能会达到的水平。显然,在这些模型中,真正重要的一点是它们被使用的上下文。对于谷歌和微软而言,模型会生成虚构的事实,这是一个很大的问题,因为它们本质上是搜索引擎,用户会期待正确的、真实的内容。搜索功能对大型语言模型的要求,远远不同于一个好玩的聊天机器人。我们需要弄清楚,我们如何在所有这些不同的用途之间游走,然后创造一些对人们有用的东西。在不同情景下,我们所期望的行为可能会有所不同。这增加了更多的压力。因为我们现在知道,我们正在以产品为目的去塑造这些模型。ChatGPT 是一个现在有了 API 的产品。我们正在构建这种通用技术,我们需要确保它在所有方面都能胜任。这是我们现在面临的关键挑战之一。


约翰·舒尔曼(John Schulman):我低估了人们在政治话题上使用 ChatGPT 的兴趣。在收集训练数据时,我们本可以做出一些更好的决定,这样就可以减少由此引发的问题。我们现在正在努力解决它。


简·莱克(Jan Leike):在我看来,ChatGPT 有很多失败之处——我们有很多的事情要做。我没觉得我们解决了所有这些问题。对我们自己和其他人而言,我们都必须传达清楚这项技术的局限性。我的意思是,语言模型已经存在一段时间了,但现在还处于早期阶段。我们知道它们所有的问题。我认为我们需要抢先用户一步,合理地管理期望,并明确表示这不是一个成品。


支持:Ren


原文:

https://www.technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how-chatgpt-built-openai/

【澳门全年免费资枓】 【新澳门开彩开奖结果历史数据表】
【新澳2024费资料】 【新澳门天天开奖资料】
【2024年澳门出码表】 【水果奶奶澳门免费资料官方网站】
【2024年澳门天天开彩好结果特奖】 【2024澳门天天】
【澳门天天开彩好特】 【新澳门彩天天开奖结果】
【2024年开奖结果老澳门】 【新奥天天彩免费资料大全】 【新澳门资料大全正版资料2023】
上一条新闻 下一条新闻

推荐文章

发表评论

布鲁纳·冈萨雷斯

7秒前:通过 ChatGPT 对人类偏好的训练,该模型只是自动学会了拒绝,它会拒绝很多请求。

IP:76.22.2.*

新垣樽助

1秒前:用户可以通过不断调整提示来得到他们真正想要的东西。

IP:61.76.8.*

wwnawat

2秒前:5 的进步。

IP:88.28.4.*

小颖美食APP介绍

APP图标

2024澳门天天开奖结果查询APP名:小颖美食

版本:V2.58.926

更新时间:2024-10-13 20:21

香港开码表这是一个功能强大的2024澳门挂牌资料大全免APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:桑德希尼·阿加瓦尔(Sandhini Agarwal):现在的风险肯定比六个月前要高得多,但仍低于一年后可能会达到的水平。

新奥资料免费精准期期准APP介绍

APP图标

2024年澳门天天开好彩最新版APP名:小颖美食

版本:V9.50.815

更新时间:2024-10-13 21:17

无论是澳门六开彩开奖结果2024年快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

2024澳门挂牌正版挂牌今晚APP介绍

APP图标

2024年新澳9494开奖网APP名:小颖美食

版本:V3.63.821

更新时间:2024-10-13 22:23

2024新澳门开奖结果应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

新奥门特免费资料大全凯旋门APP介绍

APP图标

2024年澳门正版免费大全APP名:小颖美食

版本:V3.54.735

更新时间:2024-10-13 15:20

2024新澳免费资料晒马汇这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

玄蓝破解官网APP介绍

APP图标

2024新澳开奖结果APP名:小颖美食

版本:V8.14.757

更新时间:2024-10-13 13:24

这是一款功能强大的澳门二四六天天彩资料更新应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:但是因为用户必须尝试一些复杂的方法,才能让模型说出不好的事情,所以也不能说这被我们完全忽视了,而且这也不是让我们非常惊讶的事情。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

2024年新奥开什么今晚四十五期APP介绍

APP图标

2024新奥彩资料大全APP名:小颖美食

版本:V2.54.953

更新时间:2024-10-13 19:23

这是一款功能强大的2024奥门资料大全免费应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:短短三个月里,我们看到了很多报道。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

新澳天天开奖资料大全最新开奖结果查询下载APP介绍

APP图标

新澳2024年精准一肖一APP名:小颖美食

版本:V5.11.723

更新时间:2024-10-13 14:24

这是一款功能强大的2024澳门天天开好彩大全开应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:在 ChatGPT 出现之前,同样的基础模型已经以 API 的形式使用了将近一年。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

新澳最新版资料心水APP介绍

APP图标

2024澳门六开彩开奖结果直播APP名:小颖美食

版本:V6.82.879

更新时间:2024-10-13 13:22

今天的最新动态包括:ChatGPT 的训练方式与 InstructGPT 非常相似,都使用了一种被称为“从人类反馈中强化学习(RLHF)”的技术。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

澳门管家婆天天彩APP介绍

APP图标

澳门正版资料免费更新方法APP名:小颖美食

版本:V2.35.448

更新时间:2024-10-13 18:19

这是一款功能强大的澳门内部传真大全应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:桑德希尼·阿加瓦尔(Sandhini Agarwal):我认为这对我们所有人来说都绝对是一个惊喜。。

2024全年资料免费大全优势APP介绍

APP图标

澳门管家婆一肖一码一中一APP名:小颖美食

版本:V7.12.622

更新时间:2024-10-13 24:18

这款功能强大的澳门二四六天下彩天天免费大全应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

2024澳门六开彩查询记录APP介绍

APP图标

澳门天天好准的资料APP名:小颖美食

版本:V8.99.719

更新时间:2024-10-13 20:17

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

香港一肖一码100%准APP介绍

APP图标

2024年澳门天天免费咨料大全APP名:小颖美食

版本:V9.75.724

更新时间:2024-10-13 23:24

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。