标签：多线程

如何通过 MNN 的 BackendConfig 精确控制多线程调度：解决不同 CPU 簇之间的负载不均

2026-03-03andy阅读(44)评论(0)

1. 背景：移动端异构架构的挑战在移动端 SoC 中，常见的 ARM 架构通常采用 Big.LITTLE（大小核）设计。当运行 AI 模型推理时，如果系统将计算任务随机分配给小核，或者在大小核之间频繁切换，会导致推理耗时出现显著的“长尾效...

2026-02-15andy阅读(61)评论(0)

在 AI 模型部署到端侧设备或采用异构 CPU 架构（如 ARM big.LITTLE 或 Intel P/E 核设计）的服务器时，我们经常面临一个挑战：推理延迟（Latency）的抖动（Jitter）过大，导致 P99 延迟性能不佳。这是...

2026-02-04andy阅读(101)评论(0)

Faiss (Facebook AI Similarity Search) 是一个高效的向量相似度搜索库。然而，在将其部署到需要高并发查询的环境（例如 Web 服务）时，如果简单地使用 Python 的多线程，很快就会遇到性能急剧下降甚至不...

2026-01-31andy阅读(159)评论(0)

什么是 Python 的全局解释器锁（GIL）？ Python 的全局解释器锁（Global Interpreter Lock，简称 GIL）是 CPython 解释器中的一个互斥锁（Mutex）。它的核心作用是：保证在任何时刻，只有一个线...