新智元报道
编辑:桃子 英智
【新智元导读】近来,GPT-4.1关键人物揭秘了GPT-5进展,挑战在于平衡推理与聊天能力。与此同时,OpenAI首席研究官在新采访中,畅谈了通往AGI之路的关键要素。
GPT-5到哪一步了?
最近,GPT-4.1核心研究员Michelle Pokrass透露,构建GPT-5的挑战在于,在推理和聊天之间找到适当的平衡。
她表示,「o3会认真思考,但并不适合进行随意聊天。GPT-4.1通过牺牲一些闲聊质量来提升编码能力」。
「现在,目标是训练一个知道何时认真思考、何时交谈的模型」。
在长达50分钟的最新对谈中,Michelle首次对外介绍了更多关于GPT-4.1背后开发过程,以及RFT在产品中发挥的关键作用。
面对AGI的终极目标,OpenAI首席研究官表示,「AGI不仅仅是ChatGPT,还包含了很多东西」。
当前,OpenAI面对的不仅仅是技术挑战,还得在信任、伦理上找到平衡。
GPT-4.1研发背后
Michelle Pokers表示,GPT 4.1的目标是让开发者在使用时感到愉快。
有时候,为了优化基准测试而调整模型,结果看起来不错,实际使用却发现一些问题,比如模型不遵循指令、格式怪异,或者上下文太短。
团队花了很多精力与用户沟通,收集他们的意见,然后将这些反馈转化为研究过程中真正能用得上的信息。
研究人员会观察反馈中反复出现的主题,如指令遵循能力。
OpenAI内部也使用了这些模型,所以能感觉到模型在哪些地方表现得不好。
综合这些因素,团队可以确定哪些评估指标是客户真正需要重点优化的。
OpenAI有一款电子邮件产品,在处理邮件时能获得免费的推理服务。作为交换,公司能利用这些数据。
Michelle真的很喜欢看到人们构建的各种酷炫的用户界面。
团队在模型开发的最后阶段悄然加入了一项改进,就是大幅提升了UI和编码能力。
她也看到喜欢人们使用Nano的情况,它小巧、便宜又快。
Nano背后的假设是,能否通过廉价且快速的模型来大幅推动AI的普及?答案是肯定的。人们对和成本延迟曲线上的各种地方都有需求。
在提升模型性能方面,GPT 4.1聚焦长上下文和指令跟随。
长上下文处理能力是衡量模型在复杂任务中表现的重要指标,但生成有效的长上下文评估内容颇具挑战。
OpenAI致力于获取更多真实世界的长上下文评估数据,以提升模型在实际应用中的表现。
在模型应用中,模糊性处理是一大难题。
是向用户进一步询问信息,还是依据已有信息进行假设推理,这需要开发者能够灵活调整模型的策略。
GPT 4.1在这方面做出改进,增强模型的可操控性,减少因模糊性导致的困扰。
API出现错误时,模型可能卡顿,影响使用体验。
OpenAI通过改进训练算法和数据处理方式,让模型面对错误和异常情况时持续稳定运行。
GPT 4.1在代码编写能力上有显著提升,在局部代码修改任务中表现出色,但涉及全局上下文和复杂代码推理时,仍需优化。
例如,处理文件间复杂技术细节传递的任务时,模型的理解和处理能力有待加强。
在前端编码方面,团队不仅要求功能正确,还注重美观和规范,符合工程师的专业审美。
RFT新突破
微调技术在GPT 4.1扮演着重要角色,RFT(强化微调)的出现,为模型能力拓展带来新的可能。
与传统的SFT相比,RFT在特定领域展现出强大的优势。
在芯片设计、生物学和药物研发等领域,RFT的微调过程数据效率极高,仅需几百个样本就能取得良好效果。
在药物研发中,通过RFT可以利用独特且可验证的数据,让模型更精准地模拟药物作用机制,加速研发进程。
芯片设计领域,RFT能帮助模型更好地理解和处理复杂的设计规则,优化设计方案。
这些领域的共同特点是,虽然需要不断探索,但实验结果容易验证,与RFT的优势高度契合。
OpenAI首席研究官:通往AGI之路
在外媒TechINAsia最新文章中,通过采访OpenAI模型背后的人,向外界再次展示了OpenAI可预见的AGI的未来。
Mark Chen,这位华人研究科学家,在内部模型研发中扮演着举足轻重的作用。
在OpenAI的七年时间里,他从研究科学家逐步晋升为首席研究官,负责模型开发和公司整体研究工作。
他领导了多项里程碑式的项目——o1系推理模型、文本到图像模型Dall-E,以及融入视觉感知的GPT-4。
从金融到AI,意外的职业转折
Mark Chen的职业生涯,并非从一开始就锁定AI。
在MIT获得数学与计算机科学双学位后,他原本的计划是,继续攻读博士学位,成为一名教授。
然而,命运的转折点出现。
在计划合作的教授创立了一家对冲基金后,他改变了方向,随之加入了金融行业。
在这样高频交易的世界里,Mark Chen度过了6年。
他坦言,「这份工作在某些方面令人满足,但在其他方面非常不满足。你面对同样的竞争对手,大家都在追求更快,但你感觉不到自己正在改变世界」。
2016年,谷歌AlphaGo在一场历史性比赛中,击败了九段棋手李世石,其人类水平的表现甚至让AI专家震惊。
受此启发,Mark Chen通过实现Deep-Q神经网络复刻AlphaGo。正是这一尝试,让他彻底迷上了AI。
尽管没有博士学位,幸运的是,他通过OpenAI的驻留计划,幸运地迈入了这一领域。
找到AGI最佳平衡
在谈及AGI之时,Mark Chen表示,「我们采用非常广泛的定义,它不仅是ChatGPT,还包括了其他东西」。
一直以来,OpenAI将AGI视为AI的圣杯,并制定了五级框架来实现这一目标。
而现在,他们已经到达了第三级,智能体AI(Agentic AI)——能自主执行复杂任务和规划。
Mark Chen介绍称,OpenAI近期推出的两款AI智能体产品,Deep Research和Operator尚处于早期阶段。
Operator在未来,速度可以更快,轨迹可以更长,这些产品代表了OpenAI对智能体AI的雄心。
他还强调,平衡短期产品发布与长期研究,将计算资源分配到OpenAI的整个项目组合中,是自己工作的核心,最终确保OpenAI在商业化与科学探索之间找到最佳平衡。
Mark Chen对OpenAI内部算法的优化充满信心。
他表示,自家的推理模型在训练时,使用的数据远少于预训练模型,但通过更多计算资源实现了高效性能。
由此,OpenAI在效率上不逊于谷歌Gemini 2.5等竞争对手。
回应开源
几天前,奥特曼在一次会议上称,预计今年夏天开源首个推理模型。
在采访中,Mark Chen同样透露,公司正计划发布GPT-2以来首个开源语言模型。
他认为,开源模型的优势在于推理能力和开发者对其进行优化,但也因安全措施较少,而存在滥用的风险。
面对DeepSeek等AI模型强势崛起,Chen显得从容不迫。
他表示,在AI领域最大的危险,是反应过度。OpenAI坚信自己的路线图,专于长期目标而非短期市场噪音。
最后,Mark Chen还为想要进入AI领域的年轻人提供了建议:「深入熟悉所有工具,永远保持好奇心」。
你玩的工具越多、越好奇,就越能理解其他人试图推动的领域,以及未来的正确方向。你必须保持领先。
这是一个变化很快的领域。你看到的许多被探索的事物,都是未来的瞥见。
参考资料:
https://www.techinasia.com/man-models-openais-research-chief-road-agi
https://www.youtube.com/watch?v=NNGbaiN1L7Y
https://x.com/slow_developer/status/1921248876687999153
https://x.com/jacobeffron/status/1920849638166315104
《柳二龙解开内裤给唐三》,《w3u7903ejky2ywls》男人的🍌伸到🍑里情趣阁动漫
“原神3D同人18video网站”
男教练撕开舞蹈老师👙👙视频
……
05月19日
“涩涩🔞动漫乱码精品”起底微短剧“日进斗金”财富密码
↓↓↓
05月19日,第七届“金画眉戏剧展”在京开幕 1500余名小演员带来近150部剧目,无码㊙️人妻一区二区三区筱田优,黑客破解农村夫妻同房,原神芙宁娜裸体❌开腿羞羞,XXXxX性女HD性爽
05月19日,迎峰度夏打出“科技牌” “虚拟电厂”助力电力供应有保障,色视频网站在线观看,日韩欧美成人拳交,♥免费版本子♥网站太中,园子被小兰扒个精光屁股被打
05月19日,美国阿肯色州发生枪击案 造成3死4伤,黄x㊙️18禁站,蜜桃AV精品一区二区三区视频,日本猛❌猛❌猛❌护肤品,免费观看美女裸色😍在线观看
05月19日|国家开放大学2023年度美育教学成果展开幕 多位艺术名家出席|成人🔞动作片|无尽❌裸体❌扶她❌❌动漫|摸老太婆奶头大腿间|把奶罩脱了屁股撅到天上去
05月19日|缅甸宣布将国家紧急状态延长6个月|宝贝~你里面好紧我好爽视频|furry狼人男同♂漫画网站|达达利亚被首席C出水了|видео 美国HD欧美
05月19日|布局“长远”? 美国把欧洲往火坑里推|斗破苍穹美杜莎❌h黄漫|高H乱好爽要尿了潮喷H漫画|男男GaY打屁股✅免费网站|罗宾巨胸爆乳露双奶头漫画……
05月19日,腊八将至年味渐浓 江西南昌:花市销售旺 商家备足货源,亚洲⭕⭕⭕⭕XXX222310,美女露出🐻让男生揉日漫,神里绫华疯狂被❌喷水自慰,免费无遮挡🔞漫画网站下载
05月19日,网传河南周口幼儿园一女童遭校车碾轧 当地教体局通报,把jiji进女班长屁屁里视频,胡桃扒下她的内裤让人摸她,模特薛婧《姿韵》,国产🈚️AV码
05月19日|(新春走基层)兰州新区农业升级增效锦上添“花”:30万枝郁金香香飘全国|五悠r18本子无遮挡|中国做受影片|强扒乳罩摸双乳吃奶视频软件|美女脱👙露出🐻吃我的🍌在线观看
05月19日,总书记@你来认领家乡特产,方觉夏对镜一字马,二次元美女挤奶🈲🚫动漫,日本爱情动漫,弹丸论破胸围在乳房里什么位置
05月19日,公安部:2023年打掉涉黑恶犯罪组织1900余个 抓获犯罪嫌疑人2.7万名,赵露思AV婬乱一级A片,无码人妻丰满熟妇啪啪网站牛牛,爱威奶在线观看,张婧仪㊙️被男人桶到爽AI
05月19日,让善行接力 让爱心传递(暖闻热评),把🍌伸进老师的🍑www网站,雏田爆乳被秘软件3D,中国美女➕光屁屁➕露全身,freeHD18❌❌❌丝袜
05月19日|国家航天局紧急调配高分卫星助力新疆阿克苏地震应急救援|少妇扒开双腿自慰出白浆视頻|亚洲经典一区二区三区爱妃记歌词|Hentai❌全彩无码|校花在体罚室被扒开腿供人玩弄
05月19日|为何出现大范围雨雪冰冻天气?中央气象台回应|柳神让我❌她我爽了好久|妮可基德曼XXXX性视频|亚洲国产精品㊙️麻豆蝴蝶传媒|被老师嗯~啊潮喷喝水高H漫画
05月19日|香港特首:洪水桥站及北环线将发挥北部都会区作为经济新引擎潜力|无码专区FC2PPV无码|免费➕无码➕国产41动漫在线|甘雨被旅行者咬出乳液|揉⋯啊⋯嗯~出水了震动器
驻韩美军战斗机在韩国坠落,我可以参加你们婚礼吗|吉林向“水韵江苏”发出“白山松水”冰雪之约|午夜香蕉爽爽爽AV视频|免费69视频毛片399|十八禁免费网软件|美女的胸又黄又大精灵宝可梦
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺