标签：在线

QLoRA 原理详解：如何通过 NF4 数据类型实现移动端低成本的大模型在线微调

2026-03-15andy阅读(39)评论(0)

如何通过 QLoRA 与 NF4 数据类型实现大模型低成本高效微调在大模型（LLM）落地过程中，算力成本始终是核心痛点。传统的全量参数微调（Full Fine-tuning）动辄需要数百GB显存，即便是 LoRA 技术，在处理 70B 级...

2026-03-04andy阅读(44)评论(0)

如何通过 MNN 的 WeightGrad 机制在移动端实现极致高效的本地权重在线微调在端侧 AI 场景中，为了保护用户隐私或实现个性化推荐，我们需要在移动端设备上直接对模型进行微调（Fine-tuning）。阿里巴巴开源的 MNN (M...

2026-02-21andy阅读(73)评论(0)

如何解决在线和离线特征计算中的一致性与漂移问题在机器学习系统中，训练-预测偏差（Training-Serving Skew）是最令人头疼的问题之一。其核心矛盾在于：离线训练时我们使用基于批处理（Batch）的 SQL 或 Spark 逻...

2025-11-15andy阅读(372)评论(0)

引言：为什么特征一致性是AI部署的关键瓶颈？特征平台（Feature Store）是现代机器学习管道的核心组件，它旨在标准化特征的创建、存储和提供。然而，在模型部署过程中，最大的挑战之一是“训练/服务偏差”（Training/Servin...