量化基础面试题:均匀量化与非均匀量化的区别,如何计算 Scale 与 Zero Point?
模型量化是将模型权重和激活值从高精度浮点数(如FP32)转换为低精度定点整数(如INT8)的过程,以减少模型大小和计算延迟。在面试中,理解均匀量化(Uniform Quantization)的基础知识,特别是如何计算 Scale ($S$)...
模型量化是将模型权重和激活值从高精度浮点数(如FP32)转换为低精度定点整数(如INT8)的过程,以减少模型大小和计算延迟。在面试中,理解均匀量化(Uniform Quantization)的基础知识,特别是如何计算 Scale ($S$)...