怎样在不支持 Vulkan 的低端安卓机上通过指令重排优化 ncnn 的 FP16 推理精度
背景 在许多低端安卓设备上,GPU 驱动对 Vulkan 的支持不完善甚至完全缺失,迫使我们必须回到 CPU (ARM NEON) 进行推理。为了追求速度,开发者通常会开启 ncnn 的 FP16 模式,但在执行深度模型或具有全局平均池化(...
背景 在许多低端安卓设备上,GPU 驱动对 Vulkan 的支持不完善甚至完全缺失,迫使我们必须回到 CPU (ARM NEON) 进行推理。为了追求速度,开发者通常会开启 ncnn 的 FP16 模式,但在执行深度模型或具有全局平均池化(...