深度学习

第10页

怎样利用 Android 指令集特性优化：详解 armv8.2-a 带来的半精度浮点运算加速

2026-03-10andy阅读(300)评论(0)

为什么选择 FP16？在移动端 AI 推理中，内存带宽和功耗通常是最大的性能瓶颈。相比传统的 FP32（单精度浮点），FP16（半精度浮点）不仅能减少 50% 的模型内存占用和带宽需求，还能在支持 ARMv8.2-A 指令集的 CPU 上...

2026-03-09andy阅读(318)评论(0)

如何通过 CPU 亲和性绑定控制推理线程：解决安卓系统大小核切换导致的性能波动在移动端部署 AI 模型（如人脸识别、实时滤镜）时，开发者常遇到一个棘手现象：同一模型在同一台手机上，有时推理仅需 20ms，有时却突然跳到 100ms。这种性...

2026-03-09andy阅读(297)评论(0)

如何理解 Android NNAPI 的算子分发逻辑：从底层架构到实战调用 Android NNAPI (Neural Networks API) 是 Android 系统中专门为机器学习推理设计的 C API。它不直接运行模型，而是作为“...

2026-03-09andy阅读(263)评论(0)

背景：为什么 AI 推理需要 TEE？在端侧 AI 场景中，模型权重和用户隐私数据（如人脸特征、生物信息）通常是最高级别的核心资产。传统的推理过程在 CPU 或 GPU 的通用内存中进行，极易受到 Root 提权攻击或恶意内存扫描。TEE...

2026-03-09andy阅读(286)评论(0)

如何利用计算图切分实现可信环境（TEE）与非安全环境（REE）协同推理在端侧AI应用中，保护模型权重或用户隐私数据至关重要。传统的全加密推理（如全同态加密）性能极差，而“计算图切分”技术提供了一种实用的平衡方案：将涉及敏感隐私的计算环节（...

2026-03-08andy阅读(289)评论(0)

如何通过共享内存机制消除 TEE 内部推理的 Normal/Secure World 拷贝延迟在端侧 AI 安全推理场景中，为了保护模型权重或输入数据（如人脸特征、指纹信息），开发者通常将推理引擎部署在 TEE（可信执行环境，如 OP-T...

2026-03-08andy阅读(225)评论(0)

如何在 OP-TEE 内部实现卷积算子：解决浮点运算缺失的定点化替代方案在安全领域，将深度学习模型部署到 OP-TEE (Open Portable Trusted Execution Environment) 是保护隐私数据的常见需求。...

2026-03-08andy阅读(221)评论(0)

如何基于硬件唯一密钥 (HUK) 实现 AI 模型与设备的强绑定在端侧 AI 部署场景中，模型权重往往是核心知识产权。为了防止模型文件被非法拷贝到其他设备运行，基于硬件唯一密钥（Hardware Unique Key, HUK）的“模型绑...

2026-03-07andy阅读(295)评论(0)

在端侧 AI 安全领域，TEE（可信执行环境，如 ARM TrustZone）是保护模型资产的核心手段。然而，开发者面临一个物理上的‘死结’：TEE 的 Secure RAM 通常被硬件锁定在 64MB-128MB 以内，而如今即便是一个轻...

2026-03-07andy阅读(305)评论(0)

如何通过 OP-TEE 的 TA 与 CA 通信机制实现 AI 推理请求的安全转发与身份验核在端侧 AI 部署中，保护模型权重和推理请求不被恶意劫持至关重要。传统的 Linux 环境（REE）容易受到 Root 提权攻击。通过 ARM T...