AI情报Mar 17, 2026AI情报文章Nvidia研究人员开发了一种新技术,可以在不改变模型本身的情况下将大型语言模型的内存需求降低20倍。这加快了AI对话速度并降低了硬件成本。Data Cube AI 编辑部2026年3月17日来源: VentureBeat01来源简报Nvidia研究人员开发了一种新技术,可以在不改变模型本身的情况下将大型语言模型的内存需求降低20倍。这加快了AI对话速度并降低了硬件成本。02相关话题AI研究Nvidia内存优化查看本期