娇妻如云TXT 华为昇腾AI芯片获清华大学等机构超等优化：内存用量直降6倍

发布日期：2026-06-07 11:32 点击次数：70

快科技5月24日音书，AI算力现在的瓶颈照旧从GPU转向了存储芯片，国内尤其穷乏高性能HBM内存等芯片娇妻如云TXT，是以也发展出了各式优化本领，清华大学日前的究诘就在华为昇腾上兑现了6倍用量的镌汰。

面壁智能、清华大学与 OpenBMB 社区日前聚拢发布了BitCPM-CANN，这是首个原生基于华为昇腾NPU构建的端到端1.58比特（三元）大说念话模子历练系统。

顾名念念义，这套系统引入了一套三元量化的本领，模子权重被压缩为-1、0、1三种气象，使得显存占用量镌汰了6倍，还顺带着镌汰了功耗，因为运算中高耗能的浮点乘法诡计简化成了加减法运算。

相似镌汰算子也会导致大模子的精度镌汰娇妻如云TXT，不外这套三元量化的践诺弘扬照旧很强的，团队公布了从0.5B、1B、3B再到8B参数目的大模子与全精度MiniCPM4的对比，1B、3B和8B 三元版分内别保留了各自对应尺寸全精度原版模子97.1% 、97.2%和95.7%的平均性能。

0.5B小尺寸的性能圆寂固然是最大的，但也达到了90.1%的比率。

速率上的圆寂也在可采纳界限内，在昇腾910B芯片平台上，全尺寸精度的抽象量是155TFLOP/S，国产午夜无码鲁丝片专区喷水三元量化版也有148TFLOP/S，圆寂只须4.5%。

更贫窭的是，这套系融合运转即是基于昇腾平台原生建树的，作念到了端到端运行，况且开源、可全皆复现——从究诘到部署，用户不错坦然使用任性尺寸的模子。

至于这些本领的兴趣兴趣，不仅仅提高了国产AI平台的才智，更贫窭的是镌汰了对HBM等高价存储芯片的依赖，当初谷歌的阿谁TurboQuant本领亦然差未几镌汰6倍内存用量，一度激发了三星、SK海力士、好意思光等公司股价暴跌。

如今内存市集不仅价钱涨得离谱，况且厂商险些皆不会增多产能，任由缺货加价推广，改造这个局势是不成能指望三星等公司我方了，还得靠国内的公司提高内存闪存芯片产能，同期加大本领优化，让内存闪存的用量不那么虚高才行。

【本文纵容】如需转载请务必注明出处：快科技

包袱裁剪：宪瑞娇妻如云TXT

著作内容举报

]article_adlist--> 　　声明：新浪网独家稿件，未经授权不容转载。 -->