谷歌发布KV缓存压缩技术对美股存储板块的影响
26年3月25日美股盘前, 一则新闻(谷歌发布KV缓存压缩技术)开始迅速传播开来. 美股存储板块四巨头$MU, $SNDK, $STX , $WDC纷纷低开(平均跌幅在6%), 但开盘一小时内就跌幅收窄, 最终收盘时平均跌幅在3%左右.
自己认为, 谷歌发布的这项KV压缩技术, 对存储板块股价的影响, 短期会被视为利空,但中长期则必定是利好. 这和"英伟达推出新品, 性能提升数十倍”, “Deepseek对算力需求减少90%” 这样的消息带来的冲击是类似的.
===============
谷歌这篇论文(标题为 “TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate”)最早于 2025年4月28日 提交至 arXiv,但在 2026年3月随着被顶级 AI 会议 ICLR 2026 接收并由谷歌官方宣传后,才真正进入大众和开发者视野.
该压缩算法可让 AI推理速度提升 8倍,同时内存占用减少6倍。它仅在推理阶段作用于键值缓存(KVCache),能让单块 GPU产出更多推理结果。注意该技术不会影响模型权重(GPU/TPU 上的高带宽内存 HBM 占用)与训练任务。但它能让相同硬件支持 4-8 倍更长的上下文,或在内存不溢出的前提下大幅提升批处理大小。这并非内存总需求或硬件总量减少 6倍,而是通过效率提升增加单 GPU 吞吐量。
根据谷歌公告,TurboQuant可在无需模型训练或微调的前提下,将键值缓存压缩至3比特,在Gemma、Mistral等开源模型上实测达到键值内存6倍缩减效果。在英伟达H100 GPU加速器上,该算法较未量化键值方案性能提升最高达8倍。
该技术通过两步实现压缩:首先采用PolarQuant方法对数据向量进行旋转以实现高质量压缩,继而利用量化Johnson-Lindenstrauss算法消除残差误差。谷歌指出,传统向量量化方法每个数字会产生1至2比特的额外内存开销,部分抵消了压缩收益,而TurboQuant对此有所改善。
TurboQuant将于ICLR 2026发表,PolarQuant则计划在AISTATS 2026上亮相。谷歌已在LongBench、Needle In A Haystack、ZeroSCROLLS、RULER及L-Eval等多项基准测试中完成验证,并指出该技术同样适用于大规模搜索引擎的向量检索场景。
=====================
上面这段话技术性比较强, 许多人可能看不太懂, 很容易引起恐慌, 担心这是否会导致对AI存储产品需求的减少? 其实这种担心没有必要. 因为从目前发展的形势看, AI对于存储产品的需求增速是如此迅猛, 远远强于AI存储产品本身技术进步幅度. 换句话说, 这种技术进步, 完全无法达到改变产品供需失衡的地步. 而更有可能的场景是, 这种技术进步, 能让CSP(AI服务提供商)为消费者提供更多AI服务, 并促进更多AI需求的产生.
可以回想一下,当第一次听到英伟达说”我的新一代产品比之前产品性能提升了数十倍”, 你的第一反应是什么? 有的人会想” 这不是意味着未来英伟达的产品销售将大幅度下降?” . 但实际情况是, 英伟达持续不断地推出新产品, 每一代产品都相比前一代产品有数倍数十倍的提升, 但到目前为止, 其产品依然供不应求, 销售额不断突破新高. 这里的关键就在于AI的需求并不是固定, 或者仅仅小幅增长, 而是持续井喷, token消耗数量的指数级增长是最好的证明.
可以再回想一下, 当Deepseek横空出世, 宣称完成任务所需算力需求减少90%时, 市场的第一反应是什么? 那时大家是真的怕了,认为这对于提供算力基础设施的厂商是重大利空, 以英伟达为代表的AI硬件股迎来一轮暴跌. 但这轮下跌也仅仅持续了三个月, 随后英伟达为代表的AI硬件股又恢复上升形态. 为什么? 确实Deepseek的技术十分先进, 确实完成任务需要的算力减少了, 并且Deepseek也带动其他大模型厂商的效仿及技术进步, 大家随后在各自的新版大模型中都或多或少实现了效率的提升.
但是, 更关键的一点是, 大模型完成任务效率的提升, 改善了用户体验, 刺激了更多应用的产生, 并促进了用户的使用, 最终就是促进了更多任务(需求)的产生.
======================
所以我的结论就是, 无论是AI硬件(比如英伟达)自己在硬件方面的技术改进, 还是AI应用(比如Deepseek, 谷歌, Claude, OpenAI等)在软件方面的技术进步, 最终都将导致消费者(AI用户)的使用量上升, 也就是更多AI任务/需求的产生. 而AI需求的疯狂增长, 最终还是会导致对AI硬件( GPU, 内存存储)需求的增长.
由于已经有了先例, 我认为这次谷歌的消息对存储板块的”利空”影响持续也不会太久. 存储板块去年涨幅巨大(四巨头包揽了标普500成份股2025年涨幅榜前四), 今年至今涨幅仍然靠前, 目前处于技术回调阶段. 回调的理由/借口有很多, 谷歌这条新闻正逢其时, 但我认为不会成为主要理由.


