谷歌明星论文深陷抄袭华人成果疑云:900亿美元市值蒸发
3月25日,谷歌Research官方账号转发了一篇名为TurboQuant的论文,声称这项新技术可将大型语言模型推理阶段KV缓存的内存占用压缩至原来的六分之一,同时实现最高8倍的推理速度提升,且不损失模型精度。消息一出,市场迅速将其解读为对闪存和存储芯片需求的
3月25日,谷歌Research官方账号转发了一篇名为TurboQuant的论文,声称这项新技术可将大型语言模型推理阶段KV缓存的内存占用压缩至原来的六分之一,同时实现最高8倍的推理速度提升,且不损失模型精度。消息一出,市场迅速将其解读为对闪存和存储芯片需求的