标签：权衡

大模型权重 4-bit 量化详解：深度剖析 GPTQ 与 AWQ 算法在移动端的精度权衡

2026-03-14andy阅读(78)评论(0)

如何利用 GPTQ 与 AWQ 算法实现 LLM 4-bit 量化：原理剖析与端侧适配指南大语言模型（LLM）如 Llama 3、Qwen 等动辄数十亿的参数量，让移动端和边缘侧部署面临巨大的显存挑战。4-bit 量化技术通过将模型权重从...

2026-02-26andy阅读(120)评论(0)

如何理解 Go 语言泛型：详解单态化与字典查找的性能权衡 Go 1.18 引入泛型后，开发者在享受代码复用便利的同时，也对其底层实现产生的性能影响感到好奇。Go 并没有盲目追随 C++ 的完全单态化，也没有像 Java 那样通过类型擦除导致...