第一部分:昇腾(Ascend)生态深度适配
如何在昇腾(Ascend)平台上深度适配并优化 PyTorch 模型训练 随着国产算力的崛起,昇腾(Ascend)系列芯片已成为 AI 开发者的重要选择。很多开发者习惯了 NVIDIA + CUDA 的生态,初次接触昇腾的 CANN(Com...
如何在昇腾(Ascend)平台上深度适配并优化 PyTorch 模型训练 随着国产算力的崛起,昇腾(Ascend)系列芯片已成为 AI 开发者的重要选择。很多开发者习惯了 NVIDIA + CUDA 的生态,初次接触昇腾的 CANN(Com...
如何解决 PyTorch 模型迁移至昇腾 NPU 时的算子性能瓶颈与精度漂移 在国产化替代的浪潮中,将深度学习模型从 CUDA 环境迁移到华为昇腾(Ascend)CANN 平台,绝非简单的 device=’cuda’...
在脱离了熟悉的 CUDA 生态后,针对华为昇腾(Ascend)硬件进行深度学习模型推理性能优化,是许多开发者需要面临的挑战。昇腾平台的核心是 CANN(Compute Architecture for Neural Networks)工具链...
车载信息娱乐系统(IVI)和高级驾驶辅助系统(ADAS)对低延迟AI推理的需求日益增长。传统的云端AI模型部署流程复杂且延迟高,因此轻量级的端侧推理库(如NCNN和MNN)成为车载AI功能快速原型化的理想选择。本文将聚焦于如何利用NCNN,...