2025.08.09
本文字数:2684,阅读时长大约4分钟
作者 |新皮层NewNewThing 王杰夫
8月8日凌晨,OpenAI终于发布了新一代有整数编号的GPT模型GPT-5,距上一代GPT-4发布已经过去2年4个月零24天。
过去,每一代GPT模型都标志着某种技术上的突破:随着参数规模扩大,GPT-3「涌现」出了GPT-2没有的智能水平;到了GPT-4,模型开始具有图像理解相关的多模态能力。相比之下,打磨了2年之久的GPT-5却显得有些「平庸」:OpenAI说GPT-5是个「博士」,但在各项能力上,除了更低的幻觉——比GPT-4o低约45%,比OpenAI o3低约 80%,GPT-5没有展示出先前模型没有的能力,AGI也没有到来。
幻觉降低是模型最大优化。
甚至连OpenAI自己都不再将GPT-5称作「模型」,而是将其定义为「一个统一的系统」(One unified system)。
不过,对于这个曾被寄予AGI理想的「模型」,OpenAI给出了所有竞争对手中最低的调用价格:GPT-5标准版比GPT-4o价格更加便宜,输入从2.5美元/百万tokens降低到1.25美元/百万tokens,输出则保持不变,依然为10美元/百万tokens——相较而言,同等级的Claude Sonnet 4、Gemini 2.5 pro的输出价格都为15美元/百万tokens,Claude Opus 4的输出价更是高达75美元/百万tokens。
GPT-5定价低于Claude和Gemini最强模型。
这个定价彰显了OpenAI通过GPT-5想要击中的真正目标:B端专业开发者市场——目前,这个市场主要被Anthropic掌控。
OpenAI的C端增长惊人,但B端可能才是AGI关键
ChatGPT用户量在今年上半年以来激增。The Information 7月30日的报道显示,ChatGPT周活跃用户已经达到7亿,相比今年3月增长了2亿,相比去年同期增长了4倍。要知道微信在今年第一季度的月活刚刚突破14亿,通常周活会比月活低不少,而这款中国国民级应用已经推出了14年。
然而在B端市场,OpenAI一开始的领先优势已经被Anthropic攻占。
今年年初开始,Anthropic在B端市场反超了OpenAI。数据来源:Menlo Ventures
7月31日,美国VC机构Menlo Ventures发布报告称,OpenAI的模型目前仅占据企业模型市场25%的份额,落后Anthropic的32%,屈居第二;而就在2024年年底,双方的位置还是完全相反的。更早之前的2023年,OpenAI掌控了50%的B端市场,比Anthropic、Google、Meta等几家公司在B端的份额加起来还多。
报告中还提到,只有11%的企业表示在过去一年中更换过供应商。考虑到更换模型供应商现象是如此罕见,那么OpenAI与Anthropic在短短半年内地位的颠倒只能说明,OpenAI在获得新的B端客户上大大落后于对手。
包括AI Coding在内的新增市场更多选择了Anthropic而非OpenAI。数据来源:Menlo Ventures
原因之一在于过去半年来AI应用领域的爆发式增长,比如专注于agent的Manus、Genspark,以及专注于AI Coding的Cursor和Windsurf。这些公司普遍没有自研模型,而是基于接入的第三方模型构建产品。其中,Anthropic由于上下文更长、长链推理更稳定、编码能力更强等优势拿下了比OpenAI更多的B端客户,而这也正是这次GPT-5提升的主要方向。
GPT-5发布中强调其Coding能力上的准确率提升。
GPT-5发布会上,OpenAI联合创始人Greg Brockman几乎用一半的时间展示了GPT-5在指令遵循和编码能力上的进步,在多步骤指令遵循上以69.6%超过o3的60.4%,在评估编码能力的SWE-Bench上,以74.9%超过o3的69.1%。尤其在降低幻觉方面的改进更加明显,OpenAI称GPT-5事实错误的可能性比GPT-4o低约45%;在思考模式下,GPT-5事实错误的可能性比OpenAI o3低约80%。
Robust(稳定的)和Reliable(可靠的)成为此次GPT-5发布会上出镜率最高的词汇,显示出OpenAI希望重塑其产品形象的努力。
提升能力的同时,GPT-5已经将模型输出成本降低到只有对手的2/3。此外,多个迹象显示,GPT-5效仿DeepSeek进行了多项工程创新,从多个层面「节约」token的使用。
OpenAI表示,在编码工作中,GPT-5相比o3模型在输出时减少了22%的token消耗量,工具调用次数减少了45%。此外,GPT-5还提供了名为「最低推理强度」的新功能,当降低推理强度时,模型倾向于更快速的响应,以及更少的工具调取。
就在GPT-5发布的前一天,OpenAI还开源了两款推理模型,并且很快就登上了AWS平台。在此之前,由于与微软签署的独家授权协议,OpenAI模型除了在自家平台销售外,只能够通过微软Azure平台销售。
夺回B端市场并不只是出于商业考量。一位熟悉MiniMax的人士曾对「新皮层」称,Minimax今年年初做过一拨战略调整,即像Anthropic那样将专业开发者作为主要的服务对象,背后的关键原因就在于他们认为专业开发者对模型反馈的价值巨大,这些反馈可以为模型性能提升明确方向,这是C端用户很难提供的。
简化产品,但用户不一定买账
C端仍然是OpenAI创造收入的重要来源。随着周活用户两个月内从5亿增长至7亿,OpenAI今年前7个月的收入也几乎翻了一番 ,年化收入达到120亿美元。
进入2025年后,OpenAI的营收增速陡峭。数据来源:The Informaiton
对C端用户来说,GPT-5将是个产品体验上的转折——从臃肿,到简洁。
作为一个系统而非一个模型,GPT-5其实包含了3个部分:一个基础模型,负责解答大多数问题;一个深度推理模型,用于处理复杂问题;还有一个能够基于对话类型、问题复杂度以及用户行为习惯决定调用哪个模型回答问题的「路由器」。
更新后的ChatGPT已经不再向用户提供模型选择功能,用户与ChatGPT对话时,ChatGPT会自动帮用户选择最适合的模型来回答问题——简单问题用普通模型回复、复杂问题才会调用推理模型,如果用户执意要它用推理模型回复,可以在提示词中加入「认真思考一下」的prompt。
ChatGPT已不再提供多模型选择。
随着模型增加和功能增多,ChatGPT正变得越来越臃肿,模型的自动化调用可以减少普通用户的认知和选择负担,同时也有助于降低OpenAI的计算成本——如果问题不复杂,让模型简单回答就够了,而不用使用思维链并长篇大论地输出。
事实上,ChatGPT确立这种将复杂技术包装到后台、前端界面只保留极简交互方式的「傻瓜化」趋势已经有了一段时间。早在2024年年中GPT-4o推出时,模型联网搜索这一功能就已经实现了自动切换,当用户提出了有时效性或需要精确数据的问题时,模型就会自动联网。
OpenAI并不是第一个构建这种模型自动调度能力的大模型公司。今年5月,阿里巴巴通义千问团队发布Qwen3模型时,自动切换「思考模式和非思考模式」就已经作为模型亮点推了出来。然而不久前的7月22日,通义官方团队宣布Qwen3「停止使用混合思维模式」,它没有交代原因,但提到这是「与社区沟通和深思熟虑后」做的决定。
通义团队的决定可能与它主要面向B端市场有关。与C端用户更在意产品体验相比,B端专业客户通常有更强的开发能力,在调用API时也更看重模型输出的稳定性而非灵活性。不过产品体验很大程度上仍然取决于用户认知而非模型公司的认知——模型公司可能认为能简单回答就简单回答、需要深度思考时再调用复杂模型是个好方案,但用户可能认为:有思维链的才是好的。
微信编辑| 七三
第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com
(注:我们会对线索进行核实。您的隐私将严格保密。)
《护士被老头添的欲仙欲》,《w3u7903ejky2ywls》胡秀英光着屁股撅起来图片
“嘘别告诉妈妈”
受调教成0不许穿内裤随时挨c
……
08月12日
“纯爱本子r18无删减免费”少女乐队的呐喊
↓↓↓
08月12日,【滔滔两岸潮】台湾“小豌豆”南昌成长记:冀架起两岸青少年交流桥梁,18🈲乳液啪啪免费漫画网站,3D蒂法被❌AV免费视频,乖好舒服把腿张开蜜桃,www.汤不热com
08月12日,航拍宁夏|俯瞰中卫,小樱吃鸣人萝卜是哪一集,女自慰免费观看,龙卷抬着屁股迎接主人,蒂蒂有话说2023年最新版
08月12日,陕西华山“风起云涌”美不胜收,男生夏天穿校服裆部凸起图片,呦小箩莉XXX69HD,18🈲白浆自慰,བོད་ཀྱི泡妞8
08月12日|浙江海事驻点助义乌汽车出口“一箱到底”|.女教师第一次|动漫少萝裸体🔞🔞🔞视频|云缨被❌羞辱打开腿|范冰冰裸被❌高清网站
08月12日|2024年度总票房破300亿|蘑菇视频5|娜美裸乳被爆白浆的图片|娜维娅被打吐血|扒开雏田❌狂揉❌难受
08月12日|【高质量发展调研行】滇池东岸卧龙古渔村焕新生 游客“Country Walk”松弛感拉满|十大色情禁片未删减版百度云|全棵大胆裸体秀|外网缅北视频100集网盘|男男做爰黄✌片全过程动漫……
08月12日,上周末美国多州发生枪击 至少6人死亡,3D动漫美女曹颖被爆❌,日本被❌到爽🔞奶头游戏,肉大榛一出一进免费观看下载,美女隐私㊙️让男人吻
08月12日,【这个城市有点潮】福建武夷山:一叶“大红袍” 茗香漫青山,老师夹震蛋上课自慰漫画,亚洲AV成人片无码网站,国产91❤️白丝袜美女,WWWW1250XXXX
08月12日|重庆:“警景”联动 创意宣传共筑交通安全防线|小光裸体任小智玩|国产91探花㊙️入口手机在线|㊙️入口宅男导航|furry狼人榨精Gay片同性
08月12日,上海⇌广州 东航C919机型执飞航线上新!,女警察用🐻夹我的🍌动漫,舒淇三级12次做爰电影,用姐姐的脚帮我设,91在线无码精品㊙️入口九
08月12日,(两会访谈)麦家:警惕“翻拍潮”,原创精神不可丢,游艇宝贝HD最新版本更新内容,扒开甘雨狂揉难受,野原琳爆乳被❌漫画,小🐤🐤戳进🍑无遮挡露全身
08月12日,“就业不要只看一线城市”是一种理性提醒,91久久人妻丝袜一区二区三区,扒开胡桃❌狂揉❌难受3d,打男光屁股㊙️免费网站中国,女性の粪脱粪浣肠视频网站
08月12日|“荷花奖”民族舞剧《醒·狮》在香港首演 市民近距离体验道具|巨胸动漫魅魔下裸❌漫画今日更新|免费涩涩18🈲️网站樱花|60岁老熟女叫床高潮了|Free❌❌❌video丝袜套
08月12日|2024囊谦自然观察节落幕 记录到396种物种|初音被扒开衣服狂桶j喷水|小少萝疯狂❌喷水自慰|小🐔🐔戳进女生的🍑|鸣人的假期有辉夜的版本
08月12日|风雨不减旅客访澳热情 业界冀开发“一程多游”|涩里番❤️成人app入口|520886·mooc新疆视频|小🐤🐤入🍑🍑打扑克|裸体的日本在线观看
安心丈夫拒绝同房,iPhone16将配备8GBRAM|山西襄垣:新“鸡”遇唱响“致富曲”|主人戒尺抽打红肿sM调教|把腿张开老子臊烂你打屁股|成人免费色情美女酒吧|野外妓女B❌❌❌BXXX现看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺