目录(图片来源网络,侵删) 0. 引言 1. KV Cache是啥?(图片来源网络,侵删) 2. 背景 3. 原理 4. 实现细节 5. 总结 在解码器推理加速的时候,由于解码过程是一个token一个token的生成,如果每一次解码都从输入开始拼接好解码的token