复用技术 | 汤不热吧

移动端显存复用技术详解：如何通过内存池设计让 1GB 内存跑起大参数模型

2026-02-15andy阅读(54)评论(0)

在移动端进行AI推理时，显存（通常是共享内存DRAM或专用的VRAM）往往是瓶颈。对于参数量较大的模型（如轻量级LLM或大型CV模型），其激活值和中间计算结果可能会瞬间占用数百兆甚至超过1GB的内存。本文将聚焦于推理引擎中最关键的优化技术之...