标签：神经网络

Android NNAPI 底层原理详解：从神经网络抽象层看跨芯片厂商的算子分发逻辑

2026-03-09andy阅读(55)评论(0)

如何理解 Android NNAPI 的算子分发逻辑：从底层架构到实战调用 Android NNAPI (Neural Networks API) 是 Android 系统中专门为机器学习推理设计的 C API。它不直接运行模型，而是作为“...

2026-02-13andy阅读(114)评论(0)

Transformer 模型，如 BERT 或其轻量化版本，在自然语言处理任务中表现出色。然而，由于其复杂的矩阵乘法和注意力机制，它们对移动端性能提出了巨大挑战。iPhone 上的神经引擎（ANE）是实现高性能端侧推理的关键，但需要模型以 ...

2026-02-12andy阅读(173)评论(0)

详解神经网络权重的聚类压缩算法：如何利用 Codebook 降低移动端内存带宽压力在移动端和边缘设备上部署深度学习模型时，模型体积和推理时的内存带宽往往是最大的性能瓶颈。传统的量化（如INT8）可以压缩数据，但聚类压缩提供了一种更为灵活且...

2026-02-02andy阅读(123)评论(0)

在复杂的AI推理加速和模型部署场景中，我们经常需要对自定义的神经网络架构进行修改、融合或适配特定的硬件加速器。PyTorch 2.0生态系统中的核心工具 torch.fx 为我们提供了强大的基础能力——符号追踪（Symbolic Traci...