威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI

2025-08-03 00:14:14
来源:

猫眼电影

作者:

尤太忠

手机查看

  猫眼电影记者 饶本平 报道w3u7903ejky2ywls

新智元报道

编辑:桃子

【新智元导读】GPT-5更近了!今天,神秘模型Horizon Alpha火遍全网,编码首测性能逆天,各种三方基准实测相继放出。就在发布前夕,OpenAI核心大脑专访坦言模型还有瓶颈,但坚信Scaling Law没有尽头。

GPT-5的发布前兆,愈发强烈了。

今早,一款神秘模型Horizon Alpha突然上线OpenRouter,各种榜单和测试席卷了全网。

Horizon Alpha模型的上下文为256K,响应极速,非常擅长创意写作。

它还具备了「推理」功能,不过,推理token的预算是o4-mini的两倍。

在编程方面,Horizon Alpha堪称无敌了。

它可以一句话生成「水果忍者」、「外星人抓奶牛」等各种游戏,能根据logo图直出广告,还能轻而易举地通过「六边形物理模拟」测试。

左右滑动查看

在写作EQ-Bench基准测试中,Horizon Alpha位列第一,远超o3、Gemini 2.5 Pro。

左右滑动查看

更令人惊叹的是,它竟能在30秒内,完成20位数与20位数的乘法运算。

此前被爆料的各种代号模型,比如lobster、zenith、summit等,在多项测试中惊艳了所有人。

种种迹象表明,GPT-5「全家桶」绝对是个地表最强模型。

谷歌收录GPT-5的OpenAI文档页面,目前404

关于Horizon Alpha的更多细节,全部浓缩在网友的实测中了。

神秘Horizon Alpha登场,编程强到逆天

目前,在OpenRouter平台上,即可开启对Horizon Alpha版本的测试。

传送门:https://openrouter.ai/chat?room=orc-1754007231-sX8GtgCUyNkHh6O6In2l

在模型推理时,相较于Claude Sonnet 4(60-80 token/s),Horizon Alpha的吞吐量是最快的,达120个token/s。

吞吐量对比测试,Horizon Alpha是目前最快的。

物理模拟惊艳,秒搭网页

有网友让其创建一个功能完整的Windows 95复古桌面,效果令人惊喜且生成速度极快。

另一个让小球在多边形中,模拟物理的测试。

不论是六边形,还是三角形,即便小球可运动的区间缩小,也不会影响效果。

再上点难度,20个球在旋转的七边形内弹跳。网友惊讶地表示,「这是自己目前见过最出色的版本之一」。

Horizon Alpha能够在3分48秒中,创建一个展示一系列简单有趣的浏览器小游戏的网页。

给Horizon Alpha同一个提示,「创建一个视觉上有趣的着色器,可以在 twigl 应用中运行,让它看起来像暴风雨中的海洋」。

沃顿商学院CS教授Ethan Mollick惊叹道,这是迄今为止最好的,而且创建速度非常快。

当网友要求其「创建一个与遛狗的商业网站」,Horizon Alpha爱问一大堆需要提前确认的问题;Sonnet 4则会直接给出解决方案。

左:Horizon Alpha;右:Claude Sonnet 4

最终,从搭建的效果来看,Horizon Alpha输出的质量高且简洁。Sonnet 4输出的更长,内容更全面,也更具创意。

上:Horizon Alpha;下:Claude Sonnet 4

Horizon Alpha还会自主搭建一个银行网站。

设计一绝,审美感在线

AI大佬Matthew Berman亲自测试其SVG创建和UI设计功能,Horizon Alpha瞬间生成了一张专业设计美感的图。

此前,AI圈大神Simon Willison曾表示,从一张「骑自行车的鹈鹕」就可以看透AI进化史。

如今,用Horizon Alpha生成同款SVG测试,是所有模型当中最强的那个。

其他一些SVG优秀案例。

左右滑动查看

需要注意的是,虽然各种测试表现不凡,不过根据多方推测,Horizon Alpha可能只是一款小模型。

不管是GPT-5中的哪一款,接下来就坐等OpenAI发布了。

OpenAI「双雄」专访,奥特曼盛赞

就在GPT-5发布前夕,OpenAI双雄——首席科学家Jakub Pachocki和研究主管Mark Chen重磅采访同时放出了。

这对黄金搭档,可是研发GPT-5的「双巨头」。

这篇由MIT Technology Review做的独家专访,没想到深得奥特曼的心。

他对此大加赞赏,「我通常认为这类文章说不到点上,但这篇确实抓住了两人合作精髓」。

能够得到奥特曼的高度认可,究竟讲了什么?

OpenAI最佳拍档

熟悉OpenAI内部人员变动的人都知道,Jakub Pachocki和Mark Chen都是后起之秀。

他们风格迥异,却形成了完美的互补。

Mark Chen,曾经的华尔街量化交易员,着装考究,谈吐间挥洒自如,可以说与AI毫不搭界。

入职OpenAI后,他迅速成长为DALL·E和GPT-4多模态能力、Codex背后的关键推手,擅长将复杂的研究转化为人人可用的产品。

而Jakub Pachocki,一位低调的理论计算机科学家,接替了离职后的Ilya,痴迷于突破AI逻辑与创造力的极限。

关于内部的角色分工,Pachocki是这么说的,「Chen负责组建和管理研究团队,而我负责设定研究路线图,并确立我们长期的技术愿景」。

他们之间合作模式,可以说是「无缝切换」。

不论技术难题多么复杂,Pachocki和Mark总能非常默契,迅速分工合力攻克。

AGI标尺,自主时间

当前,外界对GPT-5的期待,是一款更强、更快、更全能的巨兽。

采访中,Mark Chen虽未直面GPT-5问题,却坦言「我们始终在努力理解深度学习的技术瓶颈,即便是当前最强推理模型,也无法有效将知识串联起来」。

Pachocki补充道,「我们仍处于推理范式最开端」。

如何让一款模型进行长期的学习和探索,并提出新颖的想法,才是至关重要。

同时,在他们看来,Scaling Law远未触及天花板,通过投入更多计算资源、数据,模型就会变得越来越好。

被问题如何看待AGI时,Mark Chen提出了一个指标——模型能更长时间地自主工作的能力,即「自主时间」。

这个概念简单却深刻,它代表着AI在面对复杂问题时,能持续取得进展,而无需人类干预的时间长度。

这个愿景,远远超出了当前模型的能力,自主时间仅限于几分钟到一小时,遇到陌生场景往往会「卡住」。

数学+编程,摘下AI圣杯?

前段时间,OpenAI模型在两项顶级竞赛中取得佳绩:

一是,在AtCoder世界巡回赛总决赛中获第二名;二是,在IMO 2025大赛中夺下金牌。

在AtCoder比赛中,Psyho的胜利展现了人类独有的创造性思维,类似AlphaGo当年击败李世石的围棋比赛。

Pachocki表示,「我们在这里谈论的是编程和数学,但它实际上关乎创造力,提出新颖的想法,将不同领域的想法联系起来」。

在他们二人看来,数学和编程是「通用智能」的基石。

参考资料:

https://x.com/karminski3/status/1950987896565182587 https://x.com/chetaslua/status/1950784759799718161

https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/

 时事1:红桃视频AV在线观看免费

  08月03日,广东北江干流全线出现洪峰 飞来峡水利枢纽有序控泄运行,

  众人浑身打颤,不断的哆嗦,那是一种至强的威压,让他们竟然忍不住要叩首与膜拜。

,1秒流鼻血的女性胸片怎么看。

  08月03日,新冠疫情可能在本月出现回升 JN.1变异株大概率将成中国优势流行株,

  随着社会的发展,我们的生活越来越进步,现代化的设施越来越多,我们每天都要与火、电接触,在这里,我希望同学们不要玩火,安全用电。我们要创建"平安校园",保校园宁静,让同学和老师平安。希望全校师生都能把安全作为学习、工作和生活的第一准则,都能学习和掌握一些必要的安全知识,了解一些在紧急状态下的急救、自救方法。

,14到16女学生视频A片,美女直播全婐app免费真人,18害羞勿进网站国产。

 时事2:大胸女被c🔞黄㊙️❌蜡91

  08月03日,舞蹈诗剧《只此青绿》西安站赈灾义演落幕,

  和火在一齐做坏事的还有一个东西,是火的“铁哥们”――烟雾。可别小瞧它,许多人在火灾失去生命的“罪魁祸首”的也就是它,为什么它会让死亡率增高呢?那是因为烟雾中包含很多的有毒、有害气体,如果不加防范,就会中毒。了解了以上的知识,此刻,让我来介绍如何逃生的办法吧发生火灾时,如果被大火包围,就拨打119报警电话,在报警中,要讲清楚发生火灾的地点、报警人的名字和火势的大小。随后,等待救援。如果火势小,就用湿毛巾、湿毛毯披在身上冲出去,逃出去时。要逆风而行,并弯腰爬出去,用湿毛巾捂住口鼻,以免中毒。如果火势大,能够利用房屋的阳台、下水道或其他接地牢固的物件逃生。也能够用绳索或床单撕成条状接起,一端一端拴在固定物件上,再顺着往下滑,即可逃生。如果万分情急决定跳楼出逃时,可先往地下抛出一些衣物棉被等,以增加缓冲,然后手扶窗台往下滑,以缩小跳落高度,并尽力坚持双脚着地,尽可能地保全性命。

,高潮91PORN成人网站,精工厂网站登录入口,hinata❌boruto无尽。

  08月03日,中方:愿为防止叙利亚局势进一步恶化作出积极努力,

  停战后,蛟鹏双臂一震,如一头凶禽一般跃起,一纵就是二十几米,快速冲向村头,想对几个孩子出手。

,光屁屁美女➕挠胸➕侵犯视频,中国少妇精品❌❌❌OOO,17c娇喘❌❌⭕⭕白丝。

 时事3:白丝魅魔玉足夹住榨精

  08月03日,【大国新村:沿着总书记的足迹】评论:吹响乡村振兴幸福号角,

  一群人目瞪口呆,竟然真的成功了!

,漫画裸体被❌吸乳羞羞,cf灵狐者把腿抬高让我进去文,91在线无码精品㊙️玩具。

  08月03日,福建春节全力保供稳价促消费 引导商贸流通企业节日期间正常营业,

  “老祖,你就这样主持公道吗?”石子陵大喝。

,意大利电影巜豪妇荡乳,XXXX76🍆🍆🍆HD女,大乔被❌18🈲️在线观看。

 时事4:在酒吧伦流澡到高潮H

  08月03日,斯巴达勇士儿童赛北京站打响 近18000名少年参赛,

  “都给我滚,我儿受苦难时,你们都在哪里?她断我儿一根骨,我断她儿百根骨!”石子陵怒吼,眼中含着泪水。

,刻晴被❌到爽🔞高潮游戏,官场张梅献身书记高强,18🈲️小泬破白浆啪啪影视。

  08月03日,瞭望·治国理政纪事|打造国家清洁能源产业高地,

  3、认真交流,取长补短,共同探讨和谋划今后发展的思路,切实提高学习培训效果。平时我们各自都在自己的小范围内工作、学习、思考,因工作忙碌,坐下来理清思路、认真思考的时间很少,所以视野不开阔,观念更新慢。这次培训,专门安排了相关部门授课,同时安排大家赴宁波市学习考察,为大家提供了一个彼此学习、交流的机会和平台,提供了一个开阔视野、增长见识、转变观念的机会,希望大家认真学习,总结经验教训,寻找对策措施,通过交流,形成共识,坚定信心,取长补短,加快农村经济社会的发展。

,羞耻鞭打滴蜡灌肠调教女生网站,嗯∽啊~轻点禁🔞揉胸免下载,18🈲🍆🍑无套直国产蘑菇。

责编:周原泽

审核:马芙蓉

责编:冷新生

相关推荐 换一换