分享好友 最新资讯首页 最新资讯分类 切换频道
GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?
2025-08-06 09:01

明敏 鹭羽 发自 凹非寺

量子位 | 公众号 QbitAI

GPT-5这回是真的要来了。

现在,全网都在“偶遇”GPT-5。

不仅是ChatGPT上有踪迹:

图片

而且在MacOS应用的模型列表中也发现了GPT-5。

图片

还有、微软Copilot以及OpenAI API平台上,也都被网友抓到已经悄悄接入/测试GPT-5。

图片

这一大波泄露,大家对GPT-5的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。

图片

连向来怼天怼地的马库斯都说:不开玩笑,这一次GPT-5真的要来了。

图片

从已经泄露的信息来看,GPT-5肯定更强大。

它将整合GPT系列和o系列,实现多模态和推理能力大一统、编程能力很强、百万tokens上下文、支持等。

最快下周就会发布!

据说微软Copilot上的GPT-5将向所有人开放,不受订阅限制。今年3月,奥特曼在采访中还说了GPT-5将免费向用户开放。

感觉GPT-5这一波,是要全面铺开啊。

所以到底有多强?

根据OpenAI内部人士透露,GPT-5实现推理能力(o系列)和多模态交互能力(4o以及GPT系列)的大一统,以后不用再手动切换模型。

模型包含多个版本:

图片

模型的技术亮点可能包括:

其中GPT-5(o3-alpha)被曝在高级编程方面表现出色,能达到接近人类程序员水平,“实现更快、更精准的软件开发”。

它可以自动编写高质量的游戏原型,支持很多应用程序定制以及可以根据特定要求进一步细化。

图片

以及在物理方面也表现出色,一些zero-shot的demo效果也很不错。

Lobster (mini版本代号)有消息称它是一个专用的编程模型。在精度和功能方面均优于Claude 4等模型,尤其是在一些复杂的编码任务上。

Lobster可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。

例如一名用户让Lobster和另一个模型同时创建交互式神经网络动画,Lobster一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。

图片

另外Lobster据悉也集成了o3系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。

支持文本、图像、工具调用等多模态,具备类似Agent的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像GPT-4一次只能处理一类输出。

Lobster将是编码、推理、多模态理解的融合,将OpenAI之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。

starfish(nano版本)则在前几天悄悄出现在了大模型竞技场上。

图片

测试结果显示,这个模型只能做静态的小游戏界面,无法启动游戏。

图片

除了模型本身外,现在微软和cursor也被曝将火速接入GPT-5。

微软正试行新版Copilot的 “Smart 模式”(或称 “magic mode”),能够智能判断何时调用GPT‑5的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在GPT‑5发布后第一时间集成该模型至Copilot及Microsoft 365生态中,Azure也在为集成GPT-5做准备。

图片

同时也有人发现,cursor团队正在内部测试GPT-5 Alpha版本(图中被模糊掉的部分原来标了GPT-5-Alpha)

图片

从各方泄露信息来看,GPT-5确实如奥特曼所说,强得可怕。

不过,现在大家更冷静、更理智、也更不容易被忽悠了。

有人就说,那又如何?GPT-5可能在刚刚发布时表现很好,1周过去它就会开始变笨,像此前所有模型一样。

图片

也有人表示这可能是因为模型发布后,出于安全考量会ban一部分能力,所以让大家感觉这是炒作出来的幻象。

图片

“泼冷水王”马库斯也发文表示,即便GPT-5真的更强大,但是他还是要给出7个悲观预测

  1. 尽管GPT-5在能力上会远超GPT-4,但GPT-5仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。

  2. GPT-5仍然难以处理一些复杂的物理、心理和数学推理任务。

  3. 幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。

  4. 自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。

  5. GPT-5不会是像AGI一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。

  6. 系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。

  7. GPT-5只是基础的规模扩展,未来AGI将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是GPT系列所缺乏的。

社区里也弥漫着相似的观点,毕竟已经被奥特曼溜了太多次,再不发布,网友们都累了……

天天各种真假混杂的爆料,一些泄露的GPT-5基准测试都是fake news,网友表示,现在除了官方,谁都不可信。

图片

当然也有不少网友认为,这些“不经意间的”泄漏,都是OpenAI在炒作。

图片

总之,不管模型是不是真如宣传所说的这么好,都赶紧发布吧!

图片

参考链接:[1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/[2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e[3]https://x.com/nicksomed/status/1950507062091485551[4]https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com

相关阅读
最新文章
镇坪县长寿药膳美食选拔赛!邀你共赴“棋”“味”长寿之约!【959推荐】
当秦巴晨露浸润黄连叶尖药乡烟火缠绕天麻醇香一场交织着康旅韵致与舌尖巧思的盛会正沿着镇坪县城徐徐铺展7月31日至8月2日,镇坪
以色列计划“全面军事占领”加沙并围困活跃城市,计划得到特朗普首肯
新华社援引以色列媒体28日报道称,以安全内阁正在考虑对加沙地带进行“全面军事占领”,并对巴勒斯坦伊斯兰抵抗运动(哈马斯)活
嘉信理财交易员Q3市场情绪调研:43%看涨加密货币、32%看涨现货加密ETF
金色财经报道,金融行业巨头(Charles Schwab)公发布2025年第三季度交易员情绪调查结果,调查结果显示交易员的整体市场乐观情绪显
今年上半年 山西社会融资存量规模达6.9万亿元
7月31日,从人民银行山西省分行举行的2025年上半年山西省金融统计数据新闻发布会获悉,上半年,全省社会融资存量规模达6.9万亿元
武清区举办“寻美武清”主题活动暨网络人士交流联谊活动
2025年7月31日,区委统战部、区委网信办联合举办“寻美武清”活动暨网络人士交流联谊活动,区委统战部、区委网信办相关负责同志
《扫毒风暴》大结局,马英子漂亮有才,为何卢少骅牺牲她偏爱哑女
段奕宏、秦昊主演的缉毒大剧《扫毒风暴》大结局了,卢少骅逃亡多年,终于被警方抓到,成功判了死刑,林强峰和卢少骅的猫鼠游戏,
城市更新推进情况报告:上海862个公园24小时开放 超目标完成“千座公园”计划
东方网记者项颖知7月31日报道:上海市十六届人大常委会第二十三次会议30日听取市政府关于城市更新工作推进情况的报告。近年来城
国产视频生成再突破!从影视级短片到远洋亲情连线,AI让天涯变咫尺
给专业导演配齐创作助手,还帮远洋海员实现“视频自由”。作者 | 陈骏达编辑 | 漠影起猛了,AI现在都能生成武打戏了,还是人虎搏
三全食品斥资13亿赴澳建厂 本土冻品企业出海步调不一
中经记者蒋政北京报道一直鲜有披露境外营收的(002216.SZ),突然筹划在海外投资建厂事宜。根据该公司日前发布的公告显示,计划
国补持续下发,富森美再迎政策利好
近日,国家发展改革委已会同财政部,向地方下达了今年第三批690亿元超长期特别国债支持消费品以旧换新资金,下一步将继续加强统
推荐文章