爱奇艺2024年10月13日发布:实测OpenAI最强模型o1：会做大学数理化，但弱智吧依然难解

⭐发布日期：2024年10月13日 | 来源:爱奇艺

⭐作者：张家瑜责任编辑:Admin

⭐阅读量:390 评论：9人

【2024澳门天天六开好彩】

【2024年天天彩澳门天天彩】

【新奥精准资料免费提供510期】

【管家婆2024澳门开奖结果2024】

【新澳门2024年资料大众网】

【澳门六开彩免费精准大全】

【新奥管家婆资料2024年】

【2023澳门新资料大全免费吗】

【2024新澳门正版免费资料】

【204年新奥开什么今晚】

【新澳天天开奖资料大全105】

【2024新澳今晚开奖结果资料查询】

【澳门六开彩天天免费领取】

【2024年新澳门全年免费大全】

【2024新奥正版资料免费251期】

【新澳资料大全资料】

【2024澳彩管家婆资科】

【2024澳门冷码未开】

克雷西发自凹非寺
量子位 | 公众号 QbitAI

OpenAI传说中的“草莓”终于正式上线！

不仅可以胜任更复杂的推理任务，在数学、代码和其他科学领域也能解决更难的问题。

OpenAI这次“无预警发布”震撼了科技圈，o1更是被CEO奥特曼称它为了一种新范式的开始。

发布之后，各路大神和网友都纷纷用各种问题测试OpenAI o1的表现：

还有人进行了花式考验，结果被o1强大的推理能力秀到了。

Q：你的回复中有几个字？
A1：这句话有七个字
A2：一共五个字

量子位也进行了一番实测，下面就一起来了解。

推理能力大进化，但还是难敌弱智吧

该说不说，o1虽然在推理能力上取得了很大进步，但面对充满心机的弱智吧问题，还是掉进了人类挖的陷阱。

当然了，对于正经问题，o1的表现还是很强的，首先看看逻辑推理能力。

思考这道题时，preview和mini分别用时21秒和14秒，不过从文本上看mini思考得反而更多。

其中还出现了一些西里尔字母乱入，不过对整体影响不大。

最终，二者也都给出了正确的答案——丙。

值得注意的是，mini（右）的解答当中还出现了修正的过程。

接下来看下o1在大学数理化题目上的表现。

首先是这道考研数学真题，涉及的知识点是曲面积分、高斯定理等内容：

还是分别看下preview和mini的思考，可以看到mini的思考过程大概是preview的简略版，当然速度也快了不少。

不过preview给的思考过程当中再次出现乱入，这次是泰语。

实际解答过程也是preview比mini更加详细，不过不知道为什么preview用了英文回答。

最后的计算结果化简方式也有所不同，但数值上是相等的，而且也做对了。

对比4o这边，先偷懒后作弊（调用了代码解释器），结果最后答案还是错的。

第二道数学题关于概率。

这道题preview依然是用英语进行了作答，步骤比mini更加详细，当然都是对的。

而4o的答案前面的过程倒是基本都对，但是最后一步的求解出现了问题，只给出了1这一个解，并且不是本题答案。

物理方面，这里选择了一道大学物理中的光学题：

preview（左）和mini都给出了正确解答，内容也基本一致。

化学的题目是一道物化题，主要涉及电化学等内容。

这里把AgCl/Ag的标准电极电势作为已知条件一同输入给模型。

Preview（左）和mini大致的解题思路还是差不多，在计算步骤上有指对运算先后的差别，当然最后的结果还是对的。

最后一项测试就不再做考试题了，而是看看模型编写代码的能力如何。

这里选择的题目难度非常高，真人的通过率只有14%。

以下是preview（左）和mini的解题思路：

从代码上看，两者核心逻辑相似，但在具体操作上略有区别。

两套代码均通过了测试，内存消耗也比较接近，而mini给出的代码运行时间更短（38毫秒）。

小数比较还是不会？

测试发现，对于大模型难以答对的名场面——小数比大小，preview（左）和mini都答不对。

甚至preview在思考过程中明明已经提到过9.8比9.11大。

但同时preview在思考过程中表示，9.8和9.11有可能指的是日期，所以做不对也许另一原因。

针对这个问题，大神谢赛宁也晒出了他的测试结果，发现o1在思考过程中将9.8当成了重力常数，而9.11是一个“意义不明的数字”。

所以o1可能不是不会，而是把这个问题想复杂了。

为了进一步探究，我们把问题改得具体些，强调一下9.8和9.11都是数字，这下没有了歧义之后就能一次做对了。

可以看出，提示词的影响还是不小的。

由于o1在内部采用了一些类思维链过程，因此prompt的设计和普通版本也有所区别，OpenAI官方发布了一则提示：

提示词应简单且直接
避免在提示词中使用思维链
使用分隔符让promot更清晰
控制RAG内容的长度

回到我们的测试，面对其他几个大模型败北名场面，o1也有不小的进步。

比如在数字母的任务上就有所进化，即使是一串乱打的字母也能数对。

还有面对经典的“反转诅咒”（即知道A是B却不知道B是A）问题，也终于一次性答对了Mary Lee Pfeiffer（汤姆·克鲁斯的母亲）的儿子是谁。

One More Thing

关于这次发布的o1，除了各个方面的成绩之外，还有一些其他的发现。

比如前特斯拉自动驾驶负责人、两度进入OpenAI又两度离职的大神Andrej Karpathy发现，o1-mini在被要求证明黎曼猜想的时候出现了拒绝回答的情况，表示大模型“犯懒”依然是一个大问题。

还有网友说觉得mini的表现比preview好，想问下有没有人知道原因或者有啥看法。

这条消息也把奥特曼吸引了过来，回复了一句“Yes I have one”。

根据OpenAI内部员工Kevin Lu发布的一则推文来看，mini的性价比确实比preview更高。

根据这张图显示，preview版本论性能比不上尚未公布的满血o1，论经济性又比不上mini。

顺便提一句，preview版本存在消息数量限制，并且数量是按周进行重置的，几轮测试下来已经快要用尽了。

参考链接：
[1]https://x.com/rowancheung/status/1834300353619075494
[2]https://x.com/karpathy/status/1834374965942255835
[3]https://x.com/sama/status/1834381401380294685
[4]https://x.com/_kevinlu/status/1834278160038592633

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

【港澳彩资汛网】【2024正版资料全年免费公开】

【二四六天天彩资料大全凤凰】 【玄机彩图二四六天天好图】

【2O23新澳门天天开好彩】 【二四六香港天天开彩大全一】

【2024年正版资料免费大全一肖】 【2024新奥资料免费精准109】

【澳门六彩网址】 【管家婆天天彩】

【二四六天天好彩资料】 【天天澳门开彩开奖结果】【澳彩全年资料一】

点赞数: 0

推荐文章

4000元发圈引爆潮流！马丽戴出千万身价，奢侈品牌狂欢
阅读：34403 更新：2024年10月13日
【唐山市乐亭县】第一届政府质量奖申报通知
阅读：25805 更新：2024年10月13日
不可思议的“团体催眠”，迅速解决你的失眠情绪问题！
阅读：98486 更新：2024年10月13日
中国互联史上最严重同室操戈，拼多多希音在美国生死内斗
阅读：2754 更新：2024-10-12 13:17
高途佳品、学而思优品，摸着东方甄选过河原创战败后为什么叫败北，而不是败东、败西，真相竟然是这样
阅读：2904 更新：2024-10-12 17:19
村子里、茶山上，也有博物馆（解码·提升公共文化服务水平）
阅读：390 更新：2024-10-12 17:23
42岁贾玲新增代言！穿露腰短袖大秀身材，网友：腹肌线条太好了西游中，万圣公主为什么放弃龙族太子小白龙，而选择妖怪九头虫？
阅读：567 更新：2024-10-12 17:23
氪星晚报｜山姆中国COO换人，电商业务转向CMO汇报；哈啰：学生成租电动车的主力群体，平台租赁订单增长40%；华为Mate XT非凡大师京东开启预约，同一用户一年限购一台
阅读：36 更新：2024-10-12 16:24
炸窝了！樊振东：跳个舞就老实了，大家要笑死在张雨霏的评论区！
阅读：68 更新：2024-10-12 24:20
陈梦樊振东退赛！票价不降反升，最高1688惹争议，球迷质疑饭圈化《爱情公寓》和《甄嬛传》都有售后，一个被骂惨，一个却让人期待
阅读：41 更新：2024-10-12 16:23

发表评论

4秒前：11大。

IP:19.58.3.*

布莱恩·普莱斯列

3秒前：11是一个“意义不明的数字”。

IP:79.92.8.*

阿尔缅·哲加尔哈尼扬

5秒前：第二道数学题关于概率。

IP:11.79.3.*

爱奇艺APP介绍

APP图标

2004年管家婆资料大全APP名:爱奇艺

版本:V9.37.951

更新时间:2024-10-12 13:22

2024澳门开奖结果查询这是一个功能强大的2024澳门免费APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：这条消息也把奥特曼吸引了过来，回复了一句“Yes I have one”。

下载安卓版下载iOS版

澳门二四六天好彩资料精选APP介绍

APP图标

2024年新澳门精准免费大全-免费完整资料APP名:爱奇艺

版本:V5.64.172

更新时间:2024-10-12 24:18

无论是49629澳彩资料查询快速浏览新闻还是深入了解某个话题，这款新闻APP都能为您提供全面、精准的信息服务。

备用下载安卓版备用下载iOS版

澳门彩51249.comAPP介绍

APP图标

2024年新澳门免费资料APP名:爱奇艺

版本:V2.55.772

更新时间:2024-10-12 14:17

新澳门4949正版大全应用界面简洁易用，用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然，让您随时掌握世界动态。此外，您还可以参与评论，与其他读者交流看法，形成一个互动活跃的社区。

备用下载安卓版备用下载iOS版

澳彩资料免费资料大全APP介绍

APP图标

澳门管家婆全年正版资料大全APP名:爱奇艺

版本:V7.63.226

更新时间:2024-10-12 14:19

澳门2024年生肖图这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道，涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能，您可以根据兴趣定制新闻源，确保每条信息都与您相关。

备用下载安卓版备用下载iOS版

2024澳门马报纸资料今天APP介绍

APP图标

二四六免费资料大全APP名:爱奇艺

版本:V2.27.939

更新时间:2024-10-12 13:16

这是一款功能强大的澳彩二四六天天开奖结果应用，专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯，还为您带来今日的最新动态：而4o的答案前面的过程倒是基本都对，但是最后一步的求解出现了问题，只给出了1这一个解，并且不是本题答案。。无论是获取信息还是提升效率，这款APP都是您理想的助手。

备用下载安卓版备用下载iOS版

二四六天天彩免费资料查询APP介绍

APP图标

澳门六开彩天天开奖结果生肖卡APP名:爱奇艺

版本:V1.47.583

更新时间:2024-10-12 14:15

这是一款功能强大的2024澳门天天六开好彩免费应用，旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯，让您随时了解发生的重大事件。今天的最新内容包括：甚至preview在思考过程中明明已经提到过9.，为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

备用下载安卓版备用下载iOS版

彩霸王2024年全年资料香港APP介绍

APP图标

新澳2024正版资料免费公开APP名:爱奇艺

版本:V2.47.389

更新时间:2024-10-12 14:16

这是一款功能强大的2024年9月7日新澳门开什么生肖应用，专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯，让您时刻掌握世界动态。今日的最新内容包括：根据这张图显示，preview版本论性能比不上尚未公布的满血o1，论经济性又比不上mini。，为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么，这款APP都能成为您不可或缺的助手。

备用下载安卓版备用下载iOS版

新澳门免费资料大全APP介绍

APP图标

新奥门特免费资料大全下载安装APP名:爱奇艺

版本:V8.24.236

更新时间:2024-10-12 13:23

今天的最新动态包括：8和9.，让您第一时间掌握关键资讯，做出明智的决策。这个应用不仅是您的信息获取工具，更是一个提升生活质量的得力助手。

备用下载安卓版备用下载iOS版

澳门最准的资料免费公开APP介绍

APP图标

奥彩4949资料大全APP名:爱奇艺

版本:V9.87.341

更新时间:2024-10-12 18:14

这是一款功能强大的2024全年新澳门笤家兔费资料应用，能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯，以及今天的最新动态：11都是数字，这下没有了歧义之后就能一次做对了。。

备用下载安卓版备用下载iOS版

新澳开奖记APP介绍

APP图标

2024年新澳开奖结果查询表APP名:爱奇艺

版本:V9.68.760

更新时间:2024-10-12 22:14

这款功能强大的奥六资料免费大全应用旨在提升您的日常效率，帮助您轻松应对各种任务。应用界面友好直观，用户可以快速导航，获取所需信息。它不仅提供最新的24小时热点资讯，还定期更新各种主题的文章和评论，确保您始终走在信息的前沿。

备用下载安卓版备用下载iOS版

新澳2024年最新版资料APP介绍

APP图标

2023澳门天天开好彩免费资料APP名:爱奇艺

版本:V1.99.441

更新时间:2024-10-12 22:15

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源，提供最新的头条、热点和专题报道，涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送，确保获取最相关的信息。

备用下载安卓版备用下载iOS版

2024六开彩天天免费资料APP介绍

APP图标

新澳资彩免费大全APP名:爱奇艺

版本:V2.92.731

更新时间:2024-10-12 14:21

APP界面友好，支持快速浏览和离线阅读。您还可以通过搜索功能，快速找到特定主题的新闻。互动功能让您可以评论、分享文章，与朋友讨论热点话题。无论您是在通勤、休闲，还是工作间隙，这款APP都能让您轻松掌握最新动态。

备用下载安卓版备用下载iOS版