标签：非对称

如何针对特定移动端 NPU 优化量化参数：详解对称量化与非对称量化的性能差异

2026-02-12andy阅读(213)评论(0)

模型量化（Quantization）是端侧推理加速的关键技术之一，它将浮点数（FP32）权重和激活值转换为低比特整数（如INT8），显著减少了模型大小并提高了计算效率。然而，量化方式的选择——特别是对称量化（Symmetric Quanti...

2026-02-09andy阅读(135)评论(0)

在构建大规模向量搜索系统时，我们经常面临“非对称搜索”场景：查询向量（Query Vector）通常保持高精度（浮点型），而数据库中的索引向量（Database Vector）为了节省存储和提高I/O效率，会使用量化压缩技术（如Produc...