威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

2025-09-11 01:13:10
来源:

猫眼电影

作者:

贝特朗·波尼洛

手机查看

  猫眼电影记者 王超帅 报道w3u7903ejky2ywls

新智元报道

编辑:LRST

【新智元导读】LLM.265研究发现,视频编码器本身就是一种高效的大模型张量编码器。原本用于播放8K视频的现成视频编解码硬件,其实压缩AI模型数据的效率也非常高,甚至超过了许多专门为AI开发的方案。该工作已被世界微架构大会MICRO-2025正式接收,相关成果将于今年10月在首尔进行展示与讨论。

在大模型的发展历程中,提升参数规模已被多次证明是提升模型智能的最有效手段之一。

然而,随着模型参数量的增加,GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。

在有限的硬件资源下,如何更有效地训练和推理更大规模的模型,已成为一个备受关注且具有显著经济价值的课题。

为应对这一挑战,压缩技术逐渐成为研究的重点,尤其是在大模型的训练和推理过程中,内存和通信带宽已成为最关键的瓶颈。

压缩技术通过减少数据量,直接缓解了系统瓶颈,使得压缩率的提升往往能直接转化为系统效能的增强。

模型压缩的巨大潜力吸引了大量研究者探索多种方法,致力于压缩大模型训练和推理过程中的各类张量,以提升整体效率。

来自杜克大学、卡耐基梅隆大学和香港科技大学的研究团队发现,视频编码器本身就是一种有效的张量编码器。

论文链接:https://arxiv.org/abs/2407.00467

代码链接:https://github.com/Entropy-xcy/llm.265

更重要的是,视频编解码器具备许多对于大规模模型系统至关重要的特性。

灵活的码率控制

传统的量化压缩方法通常局限于整数存储,这使得存储空间只能以整数位来控制(例如3bit、4bit每个元素)。然而,视频编解码器能够灵活控制码率,支持任意实数的位数(例如每个元素平均3.1415bit),从而更加高效地利用存储空间。

多种张量的压缩

传统的量化压缩算法通常只针对少数几种张量进行压缩。而LLM.265方法发现,视频编解码器在处理模型参数、激活函数、KV缓存、参数梯度和反向传播梯度等多个张量时,具有卓越的压缩效果。

通过使用统一的压缩算法对整个系统中的大部分张量进行压缩,极大地降低了AI系统的复杂度。

硬件支持

现有的GPU已自带视频编解码器,LLM.265可以直接利用现有GPU的硬件视频编解码单元加速张量压缩。

此外,视频编解码硬件的实现效率高且已有几十年的成熟经验,因此直接利用或调整视频编解码器进行张量压缩,对于大模型加速器的设计与实现是一种切实可行的方案。

为什么是视频编码器?

视频编解码器是一个神奇的怪物。

时间x宽度x高度x色彩,最初在计算机上播放视频的工程师一定想不到,这个庞大四维视频张量,可以在几十年后做到在8K,240fps的分辨率下,在手掌大小的移动设备上通过无线网络播放。

诚然,摩尔定律提供了算力基石,然而除此之外更加难以置信的是,视频编解码器的发展,使得视频矩阵可以在被压缩几千倍的情况下,让人类视觉上几乎看不出和原视频的差别。

如今,在计算机体系结构领域的顶会中,大模型加速器是毫无疑问的兵家必争之地,是当今时代毫无疑问的「杀手级应用」。

殊不知,30年前体系结构领域也有一个「杀手级应用」,就是视频编解码!

可以说,30年前的视频编解码这个话题的卷的程度,丝毫不弱于当今的大模型加速器。

然而在这卷的过程中,视频编解码器和其硬件实现也已经被卷得优化到了极致,让今天做大模型加速和压缩的研究者回头望去,就好像历史在重演,让人不自觉的便要学习之前的经验。

然而视频编码器正是这么一个具象的经验,在大模型压缩领域的很多研究,都有意或无意的借鉴了许多视频编码器的工作流程,比如说DeepCompression的熵编码,QuaRot和QUIP,和MXFP的分组量化。

然而纵使借鉴,却未有人尝试直接利用视频编解码器,LLM.265改变了这一「灯下黑」的现状。

下面用两个更具体的例子抛砖引玉,展示视频编码器可以高效压缩张量的原理。

正交编码均摊离群值(Outlier)的编码压力

在信息论领域,高效压缩服从正态分布的数据早已涌现出众多成熟方案。

然而,对现代大模型而言,无论是权重还是激活,往往呈现「正态主体+离群值」的混合分布(见图a、c),既跨度大又要求对分布中心保持高分辨率。

这种「宽动态范围+高精细度」的双重需求让传统压缩/量化方法进退维谷:不是浪费大量比特覆盖离群值,便是牺牲中心区域精度,或直接截断离群值,结果都难以令人满意。

然而视频编解码器中的正交变化(如H.264中的DCT)为此提供了一条更为优雅途径。

有时候,模型参数中会出现一些特别大的数字,就像炒菜时放进一大块盐,如果没拌匀,整道菜就会忽咸忽淡。

而DCT(离散余弦变换)就像一把把盐搅拌均匀的勺子,把「盐味」分散到周围,让整锅菜的味道更均衡、协调。如图a→b所示,DCT先把含离群值的分布「整形」成更规整的近正太分布。

从具体例子来说,在图c→d过程中,DCT可以将「128」这一极端值的能量分散到邻近系数,把原本集中的编码压力均匀摊薄。

最终,虽然整体幅值略有升高,但离群值被彻底吸收,后续的编码管线的复杂度和存储开销都大可以大降低。

帧间预测+残差编码

谈及视频编码,首先必须提到其灵魂技术——预测编码。正是预测编码,使得视频压缩效率达到了前所未有的水平。预测编码的核心思想是「预测而非直接存储」。

如果我们能够依据已有信息对待编码的数据块进行精准预测,那么该块本身就无需再存储;即便预测并不完美,也无需担心,只要能够得到数据块的大致轮廓,随后计算出真实数据与预测之间的残差,并仅保存能量更低的残差信息即可。

相比直接保存完整数据块,仅存残差便能大幅缩减所需比特数。

上图概述了视频编码器在张量压缩中的工作链路。编码器首先对输入帧进行边缘预测(见图b):一旦判断出存在连续边缘,便直接记录「从(x₁,y₁)到(x₂,y₂)的像素均为蓝色」这类几何描述,而非逐像素存储。

凭借这种轮廓级表达,数据体积骤减,压缩比随之倍增。类似地,LLM的权重、激活和梯度张量也蕴含可视化意义上的「边缘」。

这些张量通常呈轴向分布,即沿同一轴方向的数据整体偏高或偏低(见图b)。

视频编码器可以把这类轴向结构视作「可预测」的边缘区域,先用预测值勾勒大致轮廓,再只编码预测与真实之间的低能量残差(见图c)。

对残差先进行正交变换,再进行量化后,其信息熵会进一步降低(见图d),于是需要传输或存储的比特数大幅减少,压缩率显著提升。

实验结果

实验结果表明,在几乎所有模型压缩的场景中,无论是推理还是训练,也不论是单卡还是分布式环境,使用视频编解码器对张量进行压缩都能取得显著的效果。

针对权重压缩的实验,LLM.265将传统的4 bit量化进一步推进至2.5 bit,在仅用2.5 bit的预算下仍能够实现与原来4 bit相当的性能,几乎与全精度基准线持平,未出现可感知的精度下降。

在训练过程中,LLM.265将每参数的平均通信比特从之前的3.5 bit降至1.4 bit,通信量因此缩减约2.5倍,同时收敛速度也超过了此前的最先进方法。这些结果充分说明视频编解码器在张量压缩方面具备卓越的潜力。

关于未来加速卡设计、编码器和LLM系统的思考

用更多计算换更小数据量会越来越划算

随着模型规模的持续扩大,摩尔定律的效应趋于衰减,计算能力的提升相对受限,而通信和内存带宽的瓶颈在硬件成本、能耗以及可扩展性方面表现得尤为突出。

在此背景下,数据压缩作为一种「用计算量换取更小数据规模」的技术手段,对缓解内存和通信压力具有重要意义。

研究结果发现,视频编码模块在芯片上占用的面积不足GPU面积的百分之一,这意味着在现有GPU上额外集成若干视频编码单元即可显著提升系统级能效,降低整体成本;若进一步研发专用于张量的编码单元,效益将更加突出。

不再强求无损压缩,有损有更高的自由度

过去的压缩加速器研究大多聚焦于无损方案,而无损压缩的理论上限通常不超过两倍的压缩率。

LLM.265的实验表明,在允许适度有损的前提下,只要在性能与精度之间进行合理的权衡,就可以实现远高于无损的压缩率,同时在训练和推理阶段仍能保持模型效果和精度的可接受水平。

更重要的是,有损压缩方案往往只需对现有硬件进行少量改动,即可在需要时切换回无损模式,保持灵活性。

通用还是专用,that is the question

LLM.265的实验提示可以从两条路径进行探索:

一是将现有视频编码器精细化为专门的张量编码器,去除与张量无关的功能模块,强化对张量有价值的部件,并加入针对张量特性的专用模块,以追求极致性能;

二是将张量编码的功能融入视频编码器之中,利用视频、图像以及通用文件压缩流水线之间的高度相似性,实现硬件压缩加速器的模块共享。

若能够构建一个能够服务多种压缩场景的共享加速器,则有望在硬件资源利用率和系统整体效率上获得更大收益。

结语

通用抑或专用,计算体系结构自诞生伊始便笼罩着激烈的争论。千位架构师、千种应用,恰似千人千面、千个哈姆雷特,孕育出万般设计。

正是这种无限的自由度,造就了体系结构与架构设计的独特魅力,也促成了芯片史上无数大胆、疯狂的创新。

然而,架构师面对的并非舞台上「文无第一」的妙语横生,而是「武无第二」的沙场血战。

在无数基准测试的天平下,所有的架构设计都高下立判。每一次架构抉择,都足以左右一个企业的兴衰存亡——此为即决高下,也决生死。我想,这正是芯片架构设计最令人着迷之所在。

参考资料:

https://arxiv.org/abs/2407.00467

 时事1:九一丨PORNY丨自拍

  09月11日,宁夏:多举措缓解工业企业融资难题,

  这是小不点观看原始真解,从“战神图录”中悟出的一种身法,金翅大鹏对决神灵,那种轨迹的奥秘以及符文的运转,给他留下了深刻的印象。

,白丝袜❌美女扒开裙子图片。

  09月11日,美英联军对也门萨达市北部发动袭击,

  2、提高自我保护能力,学会碰到突发事件,能冷静对待,学会自我保护;

,火影㊙️黄动漫免费软件,日本熟妇色❌❌❌❌❌日本免,白丝少萝自慰网站。

 时事2:激烈舌👅吻从腿吻到嘴

  09月11日,庆祝中华人民共和国成立75周年云南美术作品展亮相昆明,

  庄子中的人被惊动了,不少人持兵器冲来,当到了附近后,全都一阵吃惊。

,女仆被脱得只剩下丝袜和内衣,千仞雪3D同人18❌AV动漫,兽娘通信牛娘贝尔第一集在线观看Mp3。

  09月11日,湖南开展国际科技联合研发 助力优势产品“走出去”,

  4、掌握必须的消防安全常识。如遇到火警应立刻逃到安全的地方,然后打119报警。值得注意的是,在我们学校,上个礼拜举行过一次消防疏散演习,同学们也掌握了必须的知识。但我们的教师和同学还要增强意识,随时留意安全消防报警讯号,遇到突发情景学会逃生自救。

,女人的隐私㊙️祼🐻视频,好爽⋯好紧⋯腿张开自己动视频,大胸女被c黄秘应用。

 时事3:明日方舟的W本hr18

  09月11日,百余名台胞汇聚广西东兰体验非遗壮族“蚂拐节”,

  今年在档案系统全面开展档案服务质量年活动,各级档案部门和全体档案工作者要不断创新服务机制、拓展服务领域、提高服务水平,积极探索建立覆盖人民群众的档案资源体系和方便人民群众的档案利用体系。一是以服务民生为重点,不断丰富档案工作服务大局、服务经济社会发展软环境建设的内容和手段,做好档案查阅利用服务、现行公开文件查阅中心工作。二是认真贯彻执行《中华人民共和国政府信息公开条例》,把档案馆建设成为各级党委、政府指定的政府公开信息场所,积极做好政府公开信息提供利用工作。三是围绕科学发展观和构建社会主义和谐社会,加强和做好农业农村、林权改革、社会保障、劳动就业、社区等档案工作的指导服务。四是建立和完善档案寄存、档案鉴定整理、档案抢救保护、档案目录、档案信息资源中心管理工作。五是建立为非公经济建档服务体系,积极主动为非公经济建档提供指导服务。六是大力宣传家庭建档知识,积极做好家庭建档指导,广泛推广家庭建档。七是积极探索档案协作组工作方式,抓好机关档案协作组工作,采取丰富多彩的形式,定期或不定期开展档案业务学习与交流活动,掀起档案馆室和档案工作者之间比、学、赶、帮的热潮。

,宵宫裸体㊙️无遮挡Coc,韩国真做无遮挡A片A片,初音未来洗澡光胸光屁屁无遮挡。

  09月11日,丹麦国王腓特烈十世登基 称愿成为“有凝聚力的明日之君”,

  7、在游泳中碰到溺水事故时,现场急救迫在眉睫,心肺复苏最为重要。将溺水者救上岸后,要立即清除口腔、鼻咽腔的呕吐物和泥沙等杂物,保持呼吸通畅;应将其舌头拉出,以免后翻梗塞呼吸道;将溺水者的腹部垫高,使胸及头部下垂,或抱其双腿将腹部放在急救者肩部,做走动或跳动"倒水"动作。

,AV➕无码➕高潮sm免费,老师扒开让我❌了一夜网站,校花❌开腿让我爽了作文。

 时事4:FerrPorno馃拫馃憴60

  09月11日,以跳出历史周期率为战略目标 牢牢把握“九个以”的实践要求深入推进党的自我革命,

  人类为了满足自己的贪欲和尽情享乐,不断地向我们的地球妈妈索取:人们开山砍树,将地底下的石油、天然气不断抽出,在她的身上挖矿井,打坑道,肆意破坏地形地貌和地质构造;并向大气中排放有毒气体,向清澈的河流中排放污水。于是天空不再湛蓝美丽,河水不再清澈甘甜。地震、海啸、山体滑坡,各种灾难频频发生。我们的地球妈妈病了,而且病得不轻,她已不再有能力保护她的孩子——地球上的各种生命。也许有一天,她会毁灭。那时,我们人类将到哪里生存?我们无处可去!科学家至今尚未在宇宙中找到适合我们人类居住的星球。地球是我们唯一的家园。离开了地球妈妈的怀抱,我们将无法生存。作为她的儿女,我们不能再放纵自己的贪欲,必须立刻行动起来,拯救我们的地球妈妈,拯救我们的生存家园。

,好想被c秘好爽丝瓜,91漫画网站永久入口,武警体育生榨精XXXGAY网站。

  09月11日,国家统计局:造假是统计领域最大腐败,

  毕业班质量对一所学校而言相当重要,其重要性体现在四个方面:毕业质量是检验教师教学成果的重要指标;毕业质量是反映学生阶段性学习的重要里程碑;毕业质量是学校办学质量的重要指标;毕业质量是体现学校管理水平的重要窗口。

,!脱让学生C🐻,地下室的雏田全彩漫画免费阅读,八重神子裸身被❌羞羞视频。

责编:刘晓江

审核:张运煜

责编:陆继善

相关推荐 换一换