标签：微调

如何将大模型的分层微调（如Adapter）集成到CI/CD流程？

2026-04-05andy阅读(6)评论(0)

如何将大模型 Adapter 微调无缝集成至 CI/CD 流水线？在生成式 AI (AIGC) 时代，大语言模型 (LLM) 的全量微调成本极高且迭代缓慢。通过 Adapter（如 LoRA、Prefix Tuning）进行参数高效微调 ...

2026-03-26andy阅读(43)评论(0)

资源介绍大家好，我是正在AI领域‘摸爬滚打’的技术博主。今天发现了一个极其硬核且免费的宝藏仓库——LLM Course。这是由AI科学家Maxime Labonne精心整理的开源项目，目前在GitHub上已经斩获了超过3.5万个Star。...

2026-03-21andy阅读(51)评论(0)

如何针对座舱环境构建智能助手：指令微调与车载RAG知识库实操全解析在智能座舱（Smart Cockpit）领域，大模型（LLM）不仅要懂聊天，更要懂车载控制（HMI）和极其专业的汽车说明书。通用的基础模型往往在特定车型知识上存在“幻觉”。...

2026-03-21andy阅读(49)评论(0)

如何利用QLoRA在消费级GPU上实现大模型的高效微调在生成式AI蓬勃发展的今天，大语言模型（LLM）的参数量已从百亿迈向千亿规模。对于个人开发者和中小型初创公司而言，动辄数百GB的显存需求成为了微调大模型的巨大障碍。QLoRA（Quan...

2026-03-15andy阅读(69)评论(0)

如何通过 QLoRA 与 NF4 数据类型实现大模型低成本高效微调在大模型（LLM）落地过程中，算力成本始终是核心痛点。传统的全量参数微调（Full Fine-tuning）动辄需要数百GB显存，即便是 LoRA 技术，在处理 70B 级...

2026-03-04andy阅读(60)评论(0)

如何通过 MNN 的 WeightGrad 机制在移动端实现极致高效的本地权重在线微调在端侧 AI 场景中，为了保护用户隐私或实现个性化推荐，我们需要在移动端设备上直接对模型进行微调（Fine-tuning）。阿里巴巴开源的 MNN (M...

2026-02-12andy阅读(107)评论(0)

循环分块（Loop Tiling），也称为循环阻塞（Loop Blocking），是高性能计算中优化内存局部性（Temporal and Spatial Locality）的关键技术。通过将大型计算任务分解为可放入缓存（Cache）的小块，...

2026-02-02andy阅读(234)评论(0)

如何针对车载垂直领域构建高效的 RAG 知识库：提升座舱大模型知识准确性在汽车座舱环境中部署大模型（LLM）面临两大挑战：一是模型必须理解高度专业化的汽车术语和操作指南；二是用户对实时、准确的答案有极高要求，不能容忍“幻觉”（Halluc...

2026-01-07andy阅读(147)评论(0)

引言：LoRA微调中的数据安全挑战参数高效微调（PEFT），尤其是低秩适配（LoRA），已成为部署大型语言模型（LLM）的主流技术。LoRA通过训练少量新增的适配器（Adapter）权重，在保持基础模型（Base Model）权重不变的前...