标签：详解

第4页

如何利用多级可信架构：详解计算图切分技术在可信环境与非安全环境间的协同调度

2026-03-09andy阅读(77)评论(0)

如何利用计算图切分实现可信环境（TEE）与非安全环境（REE）协同推理在端侧AI应用中，保护模型权重或用户隐私数据至关重要。传统的全加密推理（如全同态加密）性能极差，而“计算图切分”技术提供了一种实用的平衡方案：将涉及敏感隐私的计算环节（...

2026-03-08andy阅读(82)评论(0)

如何通过共享内存机制消除 TEE 内部推理的 Normal/Secure World 拷贝延迟在端侧 AI 安全推理场景中，为了保护模型权重或输入数据（如人脸特征、指纹信息），开发者通常将推理引擎部署在 TEE（可信执行环境，如 OP-T...

2026-03-08andy阅读(55)评论(0)

如何在 OP-TEE 内部实现卷积算子：解决浮点运算缺失的定点化替代方案在安全领域，将深度学习模型部署到 OP-TEE (Open Portable Trusted Execution Environment) 是保护隐私数据的常见需求。...

2026-03-08andy阅读(78)评论(0)

在将 AI 模型部署到车载、手机或工业网关等边缘设备时，由于设备处于物理开放环境，开发者常面临两大安全威胁：模型文件被克隆拷贝以及模型版本被恶意降级（Rollback Attack）。本文将深入讲解如何利用 TEE（可信执行环境）中的 RP...

2026-03-07andy阅读(84)评论(0)

在端侧 AI 安全领域，TEE（可信执行环境，如 ARM TrustZone）是保护模型资产的核心手段。然而，开发者面临一个物理上的‘死结’：TEE 的 Secure RAM 通常被硬件锁定在 64MB-128MB 以内，而如今即便是一个轻...

2026-03-07andy阅读(80)评论(0)

为什么需要 TEE 可信推理？在移动端或边缘侧部署 AI 模型时，模型资产的安全性面临严峻挑战。传统的磁盘加密或混淆技术容易被 Root 权限后的攻击者通过内存镜像、侧信道分析等手段破解。ARM TrustZone 技术提供的 TEE (...

2026-03-06andy阅读(80)评论(0)

如何识别并解决推理库中的“伪 FP16”性能陷阱在移动端和边缘侧部署 AI 模型时，开发者通常会选择 FP16（半精度浮点数）来替代传统的 FP32（单精度浮点数）。直觉告诉我们，精度减半，速度应该翻倍，功耗也应该随之降低。然而，在实际开...

2026-03-05andy阅读(92)评论(0)

背景在端侧 AI 部署中，INT8 量化是性能优化的必经之路。但开发者常遇到这样的怪事：同一套浮点权重，在 ncnn 下量化后精度尚可，但在 MNN 下却出现预测结果完全不可用的“崩坏”现象。这并非框架本身的 Bug，而是由量化标准实现、...

2026-03-05andy阅读(81)评论(0)

1. 为什么 INT8 是端侧推理的王道？在移动端部署 AI 模型时，INT8 量化几乎是必选项。它能将模型体积缩小 4 倍，且在拥有硬件加速的芯片上，推理速度可提升数倍。而这种「质变」的底层核心，正是 ARMv8.2-A 引入的 Dot...

2026-03-05andy阅读(79)评论(0)

背景在深度学习模型从训练框架（如 PyTorch、TensorFlow）导出到推理引擎的过程中，模型往往会携带大量仅在训练阶段有意义的节点。其中最典型的是 Dropout（防止过拟合，推理时丢弃率为 0）和 Identity（恒等映射，通...