闻乐 发自 凹非寺量子位 | 公众号 QbitAI
扩散模型写代码,不仅像开了倍速,改起来还特别灵活!
字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。
在H20上,它的代码推理速度能达到2146tokens/s,比同类的Mercury和Gemini Diffusion等模型快不少,同时比同等规模的自回归模型快5.4倍,并且在代码编辑任务中更具优势。
Seed Diffusion Preview以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代语言模型基础框架的可行性。
下面介绍它的具体技术细节。
核心是两阶段训练学习
自回归模型存在串行解码延迟瓶颈,理论上,扩散模型的并行生成潜力和整体性生成的优势可以解决自回归模型推理速度局限这一痛点。
但理论优势与实际效果还是有差距,离散扩散模型在语言任务中的大规模部署仍面临两大核心瓶颈:归纳偏置冲突推理效率瓶颈
为解决上述问题,Seed Diffusion Preview采用了四项关键的技术创新。
两阶段训练
两阶段训练是模型的核心训练策略。
这是针对离散扩散过程设计的渐进式训练方案,两个阶段分别采用不同的corruption过程(即对原始数据的扰动方式)。通过分阶段优化模型对token的理解与生成能力,平衡训练效率与生成质量。
第一个阶段是基于掩码的扩散训练,学习上下文补全,占整个训练步骤的80%。
目标是将原始序列中的token替换为特殊的[MASK]标记,让模型学习从部分被掩盖的序列中恢复原始token,以此奠定基础的语言建模能力。
第二个阶段是基于编辑的扩散训练,增强全局的合理性。
掩码训练可能带来“捷径依赖”的问题——优先利用未掩码token的局部关联性进行恢复,而非理解整个序列的全局逻辑。
此阶段的目标就是通过插入、删除、替换等编辑操作对原始序列进行扰动,并用编辑距离衡量扰动程度,编辑次数由特定函数控制在合理范围内,打破模型对未掩码token的错误认知,迫使模型重新评估所有token。
实证表明,引入编辑阶段后,模型在代码修复基准CanItEdit上的pass@1对比自回归模型(AR模型)提升了4.8%(54.3vs.50.5),明显增强了模型的代码逻辑理解与修复能力。
约束顺序扩散
为解决离散扩散模型在代码生成中“逻辑混乱”的问题,团队设计引入代码的结构化先验,核心是让模型遵循代码固有的“规矩”。
虽然代码这类语言不像说话那样又严格的从左到右逻辑,但它有很强的因果关系——比如变量要先声明才能用等。
为了让模型懂这些规矩,团队提出约束顺序训练:先让模型通过内部的预训练模型,大量模拟正确的代码生成过程,然后像提炼公式一样,把这些正确的生成顺序浓缩成模型能够学会的规律。
这样模型在生成代码时就能自觉遵循这些结构化的逻辑,不再乱序生成。
同策略学习范式
在Seed Diffusion模型中,生成速度的优化通过多重策略协同实现。
首先,采用同策略学习范式(on-policy),让模型在训练时直接使用当前策略生成的采样轨迹进行参数更新,确保训练数据与模型当前能力高度匹配,减少策略偏差带来的效率损耗,加速采样策略的迭代优化,从算法层面提升生成效率。
简单说就是模型边生成代码边学习。模型用现在的本事生成一段代码过程,然后就用这个过程的数据来改进自己,这样学的东西就和自己当前的能力很匹配,不会因为用老数据而走弯路,能更快地把生成代码的策略优化好。
块级并行扩散采样
为平衡计算资源与生成延迟,模型采用块级并行扩散采样方案。该方案将生成序列划分为多个块,在扩散采样过程中对这些块进行并行处理,而非逐token串行生成。
这样既能把电脑的计算能力充分用起来,又不会因为一次处理太长的内容而耽误时间,能在计算量和生成速度之间找到合适的平衡,比如调整块的大小,就能灵活控制速度和效率。
此外,模型还依托内部基础设施框架进行系统级优化,包括硬件资源调度、计算流程精简等,进一步降低采样过程中的冗余开销,最终实现了推理速度的显著提升。
团队通过一系列实验验证了模型在代码生成领域的优势,核心成果体现在推理速度的大幅提升、生成质量的竞争力以及关键技术的有效性三个方面:
在H20上可达每秒2146个token,同时保持了代码生成质量的竞争力,性能与优秀模型相当,尤其是在代码编辑任务中优势更明显
Seed Diffusion Preview的测试结果验证了了离散扩散路线在大语言模型推理上的潜力。
一个小tip:Seed Diffusion项目组正在招募研究型实习生,如果你基础能力过关、代码能力优秀,并且对探索下一代大模型范式感兴趣,可以一试~
技术报告:https://lf3-static.bytednsdoc.com/obj/eden-cn/hyvsmeh7uhobf/sdiff_updated.pdf项目地址:https://seed.bytedance.com/seed_diffusion体验链接:https://studio.seed.ai/exp/seed_diffusion
— 完 —
《国产做受❌❌❌入口》,《w3u7903ejky2ywls》吸乳18禁羞羞免费入口
“男男被狂揉下部❌羞羞动本子”
国产又粗又猛又爽又黄的视频宋轶
……
08月08日
“小舞被❌❌吸乳羞羞动漫”韩红:别再做我病危的假新闻了
↓↓↓
08月08日,四张图片里的京津冀十年,美杜莎3D被❌吸乳动漫在线观看,色😍萝网站,小苮儿《仙儿骚麦》,B院全球最大库存资源最新章节
08月08日,人民网评:为培育新质生产力筑牢人才“蓄水池”,91在线无码精品㊙️玩具,户外美女撒尿㊙️视频,周若琳大号针管花生牛奶,18🈲️➕国产➕免费视频动漫
08月08日,防暑科普丨高温来袭 这些防御指南措施要牢记 ,停电了被男同桌狂揉我奶胸贴吧,japanese少妇漂亮多毛,www.sss.成人游戏,爱情岛永久免费线路二
08月08日|丁薛祥在联合国气候变化巴库大会世界领导人气候行动峰会上的发言(全文)|高清free❌❌❌性hd潮喷|心理被病患扒开腿做❌小说|大黑人交乄视频|偷拍15位女厕嘘嘘偷窥
08月08日|山西安泽发生山火 600多人正在全力扑救|羞羞裸体❤羞羞漫画|人人妻人人澡人人爽人人添学生日韩|狂暴人妖后菊HD|动漫被❌到爽🔞巨乳名字
08月08日|外媒:美军对胡塞武装发动新一轮袭击|女性扒开👙看个够动漫|巨乳爆乳被❌❌❌动漫|十八禁🔞裸体福利姬cos|交警队长祁键日白洁……
08月08日,云南省社会主义学院党组成员、副院长潘玉良接受纪律审查和监察调查,女奥特曼被绳子缠住手脚上,4男一女玩5P,扒开小南❌狂揉❌难受,小🐤🐤戳进🍑无遮挡 视频
08月08日,新疆高级人民法院原党组成员蒋新华接受审查调查 ,在ktv上班被客人吃奶头,日韩裸体做爰XXXⅩ性视频不忠,18❌❌❌奶头有奶水,日本动漫自慰器
08月08日|装载量提升 天舟货运飞船发射频次调整为“两年三发”|❤️国产嫩草影院久久久久|AV➕无码➕高潮➕国产|女m被S玩胸虐乳哭着求饶动漫|成人🔞高潮片免费本子
08月08日,香江观澜:特色艺术盛会推动香港发展成为中外文化艺术交流中心,小南被吸乳羞羞A片照美冥,国产做受高潮短发,古力娜扎裸体无删减版视频,工口18色情H游戏修改
08月08日,东西问丨荷兰青年建筑师和马町:于东西方之间探寻“天人合一”,肌肉男自慰Gay网站,男男成人🔞高潮片免费,女人荫蒂被添A片视频,三笠被扒开双腿狂潮
08月08日,创多个“世界之最” 我国铁路和公路隧道超5万公里,惩罚女仆扒开🍑跪挠咯吱窝作文,夜莺裸体❌开腿露出桃子-百度,XXX4KHDPornVideosTV4K女,女人又爽❌又黄❌免费下载
08月08日|【小新的Vlog】走啊!跟着小新“穿越”古今 火山岩间赏杜鹃|十八禁🔞打屁股🍑网站|人与另类Z0Z❌❌XHD|FreeeⅩXX6070HD|友田真希社长和夫人名字
08月08日|新华社权威快报|《关于加快完善生育支持政策体系推动建设生育友好型社会的若干措施》发布|蝴蝶忍被❌到失禁羞羞漫画|靠逼小视频|女性脱👙给我揉🐻图片|初音㊙️裸体扒开双腿图片
08月08日|福州古村山清水秀引客来|克洛琳德裸身被❌羞羞网站|墨笔生花418在线提取码|jk美女扒开㊙️露出奶头|wallpaper尼尔同人动画
习近平在法国媒体发表署名文章,缅甸冲突各方达成停火协议|(澳门回归25周年)中葡论坛常设秘书处秘书长季先峥:发挥好澳门的葡语国家“超级联系人”作用|台湾真军巜逍遥双枪|张津瑜吕总无删减版在线|成人🔞高潮片免费动漫|爽躁多水快深点触手
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺