标签：适配

怎样利用移动端推理库（MNN/NCNN）快速原型化车载 AI 功能：从 NDK 环境到芯片适配

2026-03-24andy阅读(54)评论(0)

如何利用 MNN 快速实现车载 AI 功能原型：从 NDK 开发到 GPU 加速适配在车载 AI 开发中，座舱视觉（如 DMS 疲劳驾驶检测、OMS 乘员监控）和辅助驾驶功能对实时性要求极高。车载芯片（如高通 8155、芯驰 X9 系列）...

2026-02-28andy阅读(97)评论(0)

在国产 NPU（如华为昇腾 Ascend、百度昆仑芯等）上进行大规模深度学习训练时，开发者常遇到一个痛点：计算单元（NPU）在等待数据，导致利用率低下。这种情况在处理海量小文件（如千万级的 ImageNet 图片）时尤为严重。由于分布式存储...

2026-02-23andy阅读(88)评论(0)

如何在昇腾（Ascend）平台上深度适配并优化 PyTorch 模型训练随着国产算力的崛起，昇腾（Ascend）系列芯片已成为 AI 开发者的重要选择。很多开发者习惯了 NVIDIA + CUDA 的生态，初次接触昇腾的 CANN（Com...

2026-02-23andy阅读(297)评论(0)

如何解决 PyTorch 模型迁移至昇腾 NPU 时的算子性能瓶颈与精度漂移在国产化替代的浪潮中，将深度学习模型从 CUDA 环境迁移到华为昇腾（Ascend）CANN 平台，绝非简单的 device=’cuda’...

2026-02-11andy阅读(130)评论(0)

在脱离了熟悉的 CUDA 生态后，针对华为昇腾（Ascend）硬件进行深度学习模型推理性能优化，是许多开发者需要面临的挑战。昇腾平台的核心是 CANN（Compute Architecture for Neural Networks）工具链...

2026-02-07andy阅读(139)评论(0)

车载信息娱乐系统（IVI）和高级驾驶辅助系统（ADAS）对低延迟AI推理的需求日益增长。传统的云端AI模型部署流程复杂且延迟高，因此轻量级的端侧推理库（如NCNN和MNN）成为车载AI功能快速原型化的理想选择。本文将聚焦于如何利用NCNN，...