标签：扩展

如何利用 Android 矢量指令集加速算子：从 NEON 优化到 SVE 扩展指令集的演进趋势

2026-03-12andy阅读(46)评论(0)

1. 为什么我们需要矢量化？在 Android 端侧推理（如 NCNN、MNN、TFLite）中，算子性能是核心。传统的标量计算（Scalar）一次只能处理一个数据，而 SIMD（Single Instruction Multiple D...

2026-02-28andy阅读(88)评论(0)

如何利用 Kubernetes、Istio 与 NVIDIA Triton 构建工业级 AI 推理微服务架构在将 AI 模型从实验室推向生产环境时，开发者往往面临三大挑战：如何高效利用 GPU 资源、如何实现无损的流量切换、以及如何根据实...

2026-02-18andy阅读(101)评论(0)

引言：为什么需要迭代标注版本管理？在现代AI模型的开发周期中，数据标注并非一蹴而就的过程。随着模型迭代、业务需求变化，我们需要对已有的数据集进行多次修正、补充或重新标注（即多轮迭代标注）。如果缺乏一个强大的版本管理系统，标签数据的可追溯性...

2026-02-13andy阅读(99)评论(0)

在分布式深度学习训练中，尤其是在使用数据并行（Data Parallel，如PyTorch DDP或Horovod）时，我们常常追求训练速度与GPU数量的线性扩展。但在使用标准万兆以太网（10GbE）作为节点间通信主干时，一旦GPU数量增加...

2026-02-13andy阅读(121)评论(0)

Sidecar 模式是云原生设计中最具影响力且最常用的模式之一。它允许我们将应用主逻辑与非功能性需求（如监控、日志、安全、服务网格代理）彻底解耦，从而极大地提升了系统的可扩展性和可维护性。什么是 Sidecar 模式？在 Kuberne...