人工智能和大数据

第28页

怎样用Hyperband或Optuna实现高效的分布式超参数搜索？

2026-02-23andy阅读(361)评论(0)

如何利用 Optuna 结合 Hyperband 算法实现高效的分布式超参数优化在深度学习模型的开发过程中，超参数搜索（HPO）往往是消耗计算资源最多的环节之一。为了在有限的时间内找到最优参数，我们需要解决两个核心问题：一是搜索算法的高效...

2026-02-23andy阅读(298)评论(0)

如何在昇腾（Ascend）平台上深度适配并优化 PyTorch 模型训练随着国产算力的崛起，昇腾（Ascend）系列芯片已成为 AI 开发者的重要选择。很多开发者习惯了 NVIDIA + CUDA 的生态，初次接触昇腾的 CANN（Com...

2026-02-23andy阅读(311)评论(0)

如何使用 NCNN 框架在移动端高效部署 PyTorch 模型在端侧 AI 落地过程中，如何让原本在服务器跑的重量级模型在手机端「跑得快、不发烫」是核心挑战。腾讯开发的 NCNN 是一个针对移动端优化的极致高性能神经网络推理框架，它无第三...

2026-02-23andy阅读(350)评论(0)

如何使用 MLflow 与 Weights & Biases 统一管理数千次实验的超参数与指标在 AI 基础设施建设中，实验追踪（Experiment Tracking）是提升研发效率的核心环。当模型训练规模从几个原型扩展到数千次...

2026-02-22andy阅读(315)评论(0)

如何通过 A/B 测试评估移动端模型性能：除了延时外，你还需要关注哪些工程指标在将深度学习模型（如基于 ncnn、mnn 或 TFLite 优化的模型）推向千万量级的移动端用户时，实验室内的 Benchmark 结果往往是“理想化”的。由...

2026-02-22andy阅读(278)评论(0)

怎么解决深度学习模型在不同手机芯片上的推理结果不一致问题在将AI模型部署到移动端（如安卓或iOS）时，开发者经常发现同样的模型在不同手机上的输出结果存在微小差异。这种现象在跨芯片平台（如从高通骁龙迁移到联发科天玑）或跨推理后端（如从CPU...

2026-02-22andy阅读(407)评论(0)

背景随着《个人信息保护法》等法规的完善，开发者在处理用户数据（如人脸、语音、健康数据）时面临巨大的合规压力。传统的云端训练需要将原始数据上传服务器，这存在严重隐私风险。端侧训练（On-device Learning）技术通过在用户手机本地...

2026-02-22andy阅读(293)评论(0)

如何利用DVC与向量数据库实现RAG文档库的严格版本化管理在生产级别的RAG（检索增强生成）系统构建中，开发者常面临一个痛点：原始文档（如PDF、Markdown）在不断迭代更新，但向量数据库（Vector DB）中的索引往往缺乏对应关系...

2026-02-21andy阅读(265)评论(0)

如何解决在线和离线特征计算中的一致性与漂移问题在机器学习系统中，训练-预测偏差（Training-Serving Skew）是最令人头疼的问题之一。其核心矛盾在于：离线训练时我们使用基于批处理（Batch）的 SQL 或 Spark 逻...

2026-02-18andy阅读(339)评论(0)

引言：为什么需要迭代标注版本管理？在现代AI模型的开发周期中，数据标注并非一蹴而就的过程。随着模型迭代、业务需求变化，我们需要对已有的数据集进行多次修正、补充或重新标注（即多轮迭代标注）。如果缺乏一个强大的版本管理系统，标签数据的可追溯性...