标签：tflite

TensorFlow 2.x 模型优化完整实战：剪枝(Pruning)、知识蒸馏(Distillation)与量化感知训练(QAT)

2026-07-08andy阅读(74)

引言：为什么需要模型优化？在深度学习模型落地到生产环境的过程中，一个常见的困境是：模型在GPU服务器上跑得飞快、精度出色，但一旦需要部署到移动设备、边缘计算节点或者高并发API服务中，就会发现推理速度跟不上、内存占用过高。这个问题的本质在...

2026-06-28andy阅读(96)

引言：为什么需要模型量化在深度学习模型从研发走向生产的过程中，模型量化（Model Quantization）是一个绕不开的关键环节。随着Transformer、LLM等大模型规模的不断增长，模型的存储体积、推理速度和能耗成为制约落地的核...

2026-02-12andy阅读(356)评论(0)

在将复杂的 TensorFlow 模型部署到端侧（如移动设备或嵌入式系统）时，我们通常需要使用 TensorFlow Lite (TFLite) 转换器。然而，当模型中包含自定义层、复杂的控制流或某些非核心 TensorFlow 算子时，转...