OpenAI全新o3 – pro震撼登场,推理模型新纪元开启!

2025-06-11 1 0

哇塞!OpenAI在深夜给大家带来了超级大惊喜,正式推出了号称“最新最强版”的推理模型o3 - pro!这就像是AI世界里一颗耀眼的新星突然升起,瞬间照亮了整个领域!

更让人兴奋的是,在o3 - pro闪亮登场的同一时间,o3模型竟然降价80%,而且关键是还不降智!这简直就是鱼和熊掌可以兼得的好事呀!

官方测评结果那也是相当惊人!在专家评估里,所有人都一边倒地更偏爱o3 - pro给出的回答,而不是o3的。这足以证明o3 - pro的实力是多么强大,就像一个超级学霸在众多学生中脱颖而出!

此外呢,o3 - pro还一举超越了o3和o1 - pro,成为了当前OpenAI模型里最擅长数学、科学和编程的佼佼者!它就像是一个全能的战士,在这些领域里战无不胜!

OpenAI的CEO奥特曼那也是第一时间激动不已,他兴奋地表示:

  • 这模型真是太聪明啦!我第一次看到它相对于o3的胜率时,眼睛都瞪大了,简直不敢相信自己的眼睛!

目前呀,o3 - pro已经取代o1 - pro,面向ChatGPT的Pro和Team用户开放啦。Enterprise和Edu用户也不用着急,下周就能获得使用权限,就像一场盛大的派对,大家都有机会入场!

对于开发者来说,更是好消息不断,o3 - pro已经可以通过API接入了:

每百万输入tokens收费20美元(约合人民币143元),每百万输出tokens收费80美元(约合人民币574元)

这价格有多贵呢?

温馨提示哦,据说有网友简单说了句“嗨”就花了80美元呢,这可真是让人咋舌呀!不过这也从侧面反映出o3 - pro的独特之处。

或许OpenAI也意识到这个价格有点小贵,所以另一边马上宣布o3降价80%。这就像是在给大家送福利,让更多人能享受到AI的魅力!

o3降价80%还不降智,这简直就是性价比之王呀!

官网显示,o3的最新API价格如下:

每百万输入tokens收费2美元,每百万输出tokens收费8美元。

和o1 - pro相比下降了80%以上,不仅只有o3 - pro价格的1/10,而且和GPT - 4o(每百万输入/输出分别为2.5美元和10美元)基本持平。这真的是太划算了!

至于降价原因,明面上说的是OpenAI对推理服务架构进行了全面优化。

也就是说,虽然o3和o3 - pro底层模型相同,但因为推理更高效了,价格自然就下调啦,这就像是给汽车升级了发动机,速度变快还省油!

不过呢,就在奥特曼对这一价格“沾沾自喜”的时候,关于o3“是否真的没有降智”却引发了一场大争议。

网友们那也是毫不客气,在奥特曼这条推文底下直接表达了自己的怀疑。

甚至有博主以亲身经历(暂无法确定真实性)出来发声,觉得o3在实测中变笨了。

  • OpenAI降价可不是出于慈善……

然而呢,这一说法也遭到了其他网友的反驳。总体来看,目前对峙双方都还没有拿出实质性的证据,这场争议就像是一场激烈的辩论赛,胜负未分!

虽然争议还没有讨论出结果,但一些关于o3 - pro的测试结果已经新鲜出炉啦。

和开头说的一样,官方在更严格的“4/4可靠性”评估中也验证了o3 - pro在数学、科学和编程方面尤为擅长。

p.s. 这项评估需要o3 - pro在四次尝试中(而不仅仅是一次,pass@1)正确回答问题~

不过官方也多次提醒,由于o3 - pro可以使用工具,所以响应时间通常比o1 - pro更长。

  • 我们建议把它用在对可靠性要求更高的棘手问题上,多等几分钟那也是非常值得的!

这也和网友们实测下来的感受一致,o3 - pro确实变强了,能够解决一些其他模型无法答对的问题。不过呢,响应变慢了,价格也是真贵呀。

HyperWriteAI的CEO让它思考“1 + 1 = ?”,结果往往需要耗时1分钟以上(第一次问甚至用时16分钟)

当然啦,这也正好说明了这是o3 - pro的错误打开方式。

不管是官方建议还是一些网友的好实测结果,都表明o3 - pro更适合挑战一些有难度、有价值的问题。

宾大教授Ethan Mollick分享了一个其他模型都失败了的问题:从“SPACE”到“EARTH”制作一个单词阶梯。

这个游戏要求模型从“SPACE”到“EARTH”,每次只改变一个字母,而且单词要真实有效且长度不变(右侧为解释“为什么这是一个合法的英语单词”)

而o3 - pro成功完成了挑战,并且这不是模型通过联网搜索得到的答案,而是通过推理得到的,这简直太厉害啦!

另一位生物医学科学家也分享了与o3 - pro合作开发免疫系统的例子。

作为对比,他也向o3提出了同一任务(要求先识别出人类天然免疫系统的关键局限性),结果表明o3 - pro更胜一筹。

  • o3列出的前五个问题虽然强调了类似的重要问题,但后两个问题无需彻底重构免疫系统即可解决。
  • 相比之下,o3 - pro不仅提出了更多限制,而且它所指出的每一个限制都是极其关键、内在的问题,需要彻底重构。

整体来说,通过ARC - AGI测试结果可以看到,o3 - pro在高难任务上表现略好,但提升幅度不大,而且成本会随难度上升。

p.s. 这项测试主要考验AI在面对新问题时的抽象推理和问题解决能力~

奥特曼还发了一篇小作文呢!

  • 这可是我最后一次在没有任何人工智能帮助的情况下写这样的文章啦。

有意思的是,同一时间奥特曼火速发了一篇小作文——

题目是《The Gentle Singularity(温和的奇点)》,来探讨AI发展对人类社会的影响。

他的主要观点包括这些:

1、2025年,我们迎来了能够真正进行认知工作的智能Agent,编写计算机代码的方式将彻底改变。2026年,我们很可能会看到能产生原创见解的系统;2027年,或许会出现能在现实世界中执行任务的机器人。这就像是打开了一扇通往未来的大门,让人充满期待!

2、到了2030年代,智慧和能源——即想法及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的基本限制;如果智慧和能源变得充足(加上良好的治理),理论上我们可以实现一切。这简直就是一个美好的蓝图呀!

3、随着数据中心的生产逐渐自动化,智能的成本最终应该会接近电力成本。(很多人关心ChatGPT每次查询用多少能量;平均每次查询大约耗电0.34瓦时,大概相当于烤箱运行一秒多一点,或高效灯泡使用几分钟。此外,每次查询大约用水0.000085加仑,约等于十五分之一茶匙。)这意味着未来AI的使用成本会越来越低,大家都能轻松享受!

4、相比AI,人类有一个长期且重要的优势:我们天生在意他人,以及他人怎么想、怎么做,而对机器却没什么感情。这就是人类独特的魅力所在!

5、从相对论的角度看,奇点是一点点发生的,融合是逐步进行的。我们正攀登那条技术指数增长的长弧线;向前看总觉得是陡峭的垂直,向后看则像是平缓的线,但其实它是一条平滑的曲线。(回想2020年,如果那时我们说2025年会接近AGI,听起来会很疯狂,但对比过去五年所发生的一切,也许现在的预测不那么疯狂了。)这就像是在告诉我们,科技的发展是循序渐进的,但前景无限!

6、我们(整个行业,不只是OpenAI)正在为世界构建一个大脑,它的极限将取决于我们的好点子。这让我们每个人都有机会为这个“大脑”贡献自己的智慧!

7、OpenAI如今做的事情很多,但最根本的身份仍是一个超级智能研究公司

BTW,奥特曼最新推文有透露,原计划中的公开权重模型要推迟了。

嗯,又一个期货(doge)~

相关文章

Meta重金布局AI,却难掩行业竞争哀伤
腾讯云海外大单彰显实力,引领中国云出海新风潮
微信电商:对标拼多多,美梦能否成真?
2025年重庆外卖消费行为洞察:品质引领市场走向
扎克伯格积极布局AI,共绘行业新希望
6月13日外媒科学网站摘要:科技新突破,未来超精彩!

发布评论