九游会j9官网登录入口现场展示了 o3-mini 的编程才气-j9九游会登录入口九游会官网j9·

你的位置：j9九游会登录入口九游会官网j9· > 新闻资讯 > 九游会j9官网登录入口现场展示了 o3-mini 的编程才气-j9九游会登录入口九游会官网j9·

九游会j9官网登录入口现场展示了 o3-mini 的编程才气-j9九游会登录入口九游会官网j9·

发布日期：2025-06-17 17:53 点击次数：114

OpenAI 公布下一代模子，o1 之后径直o3！

"双 12 "直播步履终末一天，终于来了个大的，奥特曼本东说念主也再次现身直播间。

o3 比较 o1 最隆起的收货，一是顶尖重要员竞赛CodeForces分数超过 2700，东说念主类超过这个分数的咫尺只消不到 200 个。

二是在为 AGI 准备的测试ARC-AGI上分数从 32% 跃升到了 75.7%、87.5%。

为什么有两个收货呢？

因为 o3 撑握低想考进度和高想考进度两种斥地，高想考进度豪侈的算力（横轴）也径直拉满。

ARC-AGI 是 Keras 之父 Fran ç ois Chollet 发起的测试基准，典型题目为图形逻辑推理。

另一项测试是堪称最难数学测试的EpochAI Frontier Math，包含最新未公开前沿题目。

此前陶哲轩对这项测试的第一印象是"可能难住 AI 好几年"。

o3 在测试中比之前 SOTA 从 2 分素养到 25 分。

东说念主类专科数学家处理其中沿途题目也要豪侈数小时到数天，当今 o3 只需要想考几分钟了。

此次直播还公布了o3-mini，撑握低中高三种想考进度斥地。

主要展示了代码才气，低斥地下 o3-mini 和 o1-mini 差未几，中高斥地也曾超过了 o1 郑再版。

参与商议的北大学友任泓宇，现场展示了 o3-mini 的编程才气。

他使用了特殊版块的 ChatGPT，称为 ChatGPT α。

任务如下：

写一个 Python 剧本，在土产货为一个带有大文本框的 HTML 文献启动就业器。当我在该框中输入文本并按下提交时，它应该将该代码请求发送到 OpenAl o3-mini API ，使用 medium reasoning_effort ，得到生成的代码，将其保存到桌面上的临时文献中，然后在新的 Python 末端中实行该文献。还有一些细节：

不错在 ~/api_key 中找到我的 API 密钥

请在向 API 的请求中添加一些非常的辅导，指定它只应复返莫得任何样貌或 Markdown 的原始代码

你将在 Mac 条记本电脑环境运转

o3-mini 的想考经由用了 38 秒，然后代码秒出，一次运转到手。