标签：聚类

详解神经网络权重的聚类压缩算法：如何利用 Codebook 降低移动端内存带宽压力

2026-02-12andy阅读(205)评论(0)

详解神经网络权重的聚类压缩算法：如何利用 Codebook 降低移动端内存带宽压力在移动端和边缘设备上部署深度学习模型时，模型体积和推理时的内存带宽往往是最大的性能瓶颈。传统的量化（如INT8）可以压缩数据，但聚类压缩提供了一种更为灵活且...

2025-12-27andy阅读(465)评论(0)

在构建大规模检索增强生成（RAG）或向量相似度搜索系统时，查询结果不准确是一个常见且棘手的问题。这通常源于嵌入模型生成的高维向量空间出现了数据漂移（Data Drift）或模态塌陷（Mode Collapse）。排查这类问题最直观的方法是可...