标签：测试

怎样将自动化测试（代码、数据、模型）融入CI/CD管道？

2026-03-10andy阅读(25)评论(0)

在机器学习工程化（MLOps）中，CI/CD 不仅仅涉及代码的构建与部署。一个完整的 AI 流水线必须包含三个核心维度的验证：代码逻辑、数据质量和模型性能。这种三位一体的测试方法能够有效防止因数据漂移或训练回归导致的生产事故。 1. 代码层...

2026-02-22andy阅读(72)评论(0)

如何通过 A/B 测试评估移动端模型性能：除了延时外，你还需要关注哪些工程指标在将深度学习模型（如基于 ncnn、mnn 或 TFLite 优化的模型）推向千万量级的移动端用户时，实验室内的 Benchmark 结果往往是“理想化”的。由...

2026-01-29andy阅读(120)评论(0)

在AI模型部署，尤其是涉及信贷、招聘或司法等高风险场景时，确保模型决策的公平性（Fairness）至关重要。传统的公平性指标（如群体平等机会或统计奇偶性）仅能发现群体偏差，但无法解释模型对特定个体的决策是否公平。反事实分析（Counter...

2025-12-24andy阅读(332)评论(0)

随着人工智能（AI）在网络安全领域（如EDR、NIDS、恶意软件检测）的广泛应用，传统的红队测试方法已不足以评估这些系统的真实防御能力。攻击者现在不仅攻击代码或配置，更开始攻击系统背后的“大脑”——机器学习模型。设计针对AI安全产品的红队测...

2025-12-19andy阅读(355)评论(0)

在自动驾驶（Autonomous Driving）或高级辅助驾驶系统（ADAS）等高动态环境中，AI模型的鲁棒性是系统安全运行的基石。传统的单元测试和集成测试难以覆盖现实世界中无限复杂的“长尾”极端案例（Corner Cases）。要确保系...