标签：异构

如何利用AI编译器TVM实现异构硬件上的模型部署？

2026-04-03andy阅读(29)评论(0)

如何利用 TVM 编译器实现异构硬件上的模型部署与性能调优在 AI 基础设施领域，将训练好的模型高效部署到多样化的硬件（如 CPU、GPU、DSP、NPU）是核心挑战。Apache TVM 作为一个开源的端到端深度学习编译器，通过其多层 ...

2026-03-04andy阅读(100)评论(0)

引言在端侧推理中，为了追求极致性能，我们往往会开启 GPU (OpenCL/Vulkan) 或 NPU (NNAPI/CoreML) 加速。然而，MNN 在处理某些算子不支持的情况下，会自动回退到 CPU。这种“异构调度”如果配置不当，会...

2026-02-27andy阅读(98)评论(0)

如何利用国产分布式框架实现跨异构芯片的混合调度在国产化替代的大背景下，很多企业的数据中心不再是单一的架构，而是演变为一个包含华为昇腾（Ascend）、寒武纪（Cambricon）等多种国产AI芯片的异构算力池。如何打破厂商壁垒，在同一个集...

2026-02-02andy阅读(127)评论(0)

异构计算（Heterogeneous Computing）指的是在同一系统中使用不同类型的处理器（如 CPU、GPU、TPU 等）协同工作来完成任务。在深度学习训练中，最常见的异构模式就是让多核 CPU 专注于数据加载、预处理和增强（I/O...