andy的文章

第14页

如何通过 CPU 亲和性绑定控制推理线程：解决安卓系统大小核切换导致的性能波动

2026-03-09andy阅读(72)评论(0)

如何通过 CPU 亲和性绑定控制推理线程：解决安卓系统大小核切换导致的性能波动在移动端部署 AI 模型（如人脸识别、实时滤镜）时，开发者常遇到一个棘手现象：同一模型在同一台手机上，有时推理仅需 20ms，有时却突然跳到 100ms。这种性...

2026-03-09andy阅读(62)评论(0)

如何利用 MLflow 构建模型资产管理系统：实现从版本控制到平滑退役的全生命周期管理在 AI 基础设施建设中，模型不仅仅是代码和权重的集合，更是核心资产。随着模型迭代速度的加快，如何有效地追踪不同版本的模型、管理其在开发/生产环境中的状...

2026-03-09andy阅读(60)评论(0)

如何理解 Android NNAPI 的算子分发逻辑：从底层架构到实战调用 Android NNAPI (Neural Networks API) 是 Android 系统中专门为机器学习推理设计的 C API。它不直接运行模型，而是作为“...

2026-03-09andy阅读(68)评论(0)

背景：为什么 AI 推理需要 TEE？在端侧 AI 场景中，模型权重和用户隐私数据（如人脸特征、生物信息）通常是最高级别的核心资产。传统的推理过程在 CPU 或 GPU 的通用内存中进行，极易受到 Root 提权攻击或恶意内存扫描。TEE...

2026-03-09andy阅读(77)评论(0)

如何利用计算图切分实现可信环境（TEE）与非安全环境（REE）协同推理在端侧AI应用中，保护模型权重或用户隐私数据至关重要。传统的全加密推理（如全同态加密）性能极差，而“计算图切分”技术提供了一种实用的平衡方案：将涉及敏感隐私的计算环节（...

2026-03-09andy阅读(71)评论(0)

如何通过自动化指标监控系统精准量化 MLOps 的实施效益在企业推进 AI 产业化的过程中，“MLOps 到底带来了多少价值”往往是管理层关注的核心问题。单纯的技术感悟不足以支撑预算申请，我们需要一套量化的评估体系。本文将借鉴 DevOp...

2026-03-08andy阅读(83)评论(0)

如何通过共享内存机制消除 TEE 内部推理的 Normal/Secure World 拷贝延迟在端侧 AI 安全推理场景中，为了保护模型权重或输入数据（如人脸特征、指纹信息），开发者通常将推理引擎部署在 TEE（可信执行环境，如 OP-T...

2026-03-08andy阅读(59)评论(0)

如何构建具备全链路可追溯性的MLOps流水线以满足AI审计与合规要求随着《欧盟AI法案》等监管条例的落地，AI系统的合规性已从“可选项”转变为“必选项”。审计机构通常要求开发者证明模型决策的可解释性、数据的合法性以及开发过程的可复现性。本...

2026-03-08andy阅读(55)评论(0)

如何在 OP-TEE 内部实现卷积算子：解决浮点运算缺失的定点化替代方案在安全领域，将深度学习模型部署到 OP-TEE (Open Portable Trusted Execution Environment) 是保护隐私数据的常见需求。...

2026-03-08andy阅读(57)评论(0)

如何基于硬件唯一密钥 (HUK) 实现 AI 模型与设备的强绑定在端侧 AI 部署场景中，模型权重往往是核心知识产权。为了防止模型文件被非法拷贝到其他设备运行，基于硬件唯一密钥（Hardware Unique Key, HUK）的“模型绑...