标签：提升

如何通过 mmap 技术实现模型权重文件的零拷贝加载：大幅提升 App 启动速度

2026-02-16andy阅读(101)评论(0)

在端侧AI应用中，模型的权重文件（如TFLite、MNN或NCNN的bin文件）往往体积庞大。传统的模型加载方式涉及多次数据拷贝，这不仅耗时，更严重拖慢了App的启动速度。问题所在：传统文件加载的瓶颈传统的read()系统调用加载过程如...

2026-02-11andy阅读(135)评论(0)

什么是伪共享（False Sharing）？在高性能并发编程中，我们经常追求最小化锁的竞争，但即使我们避免了锁，也可能遇到一个棘手的性能瓶颈：伪共享（False Sharing）。伪共享是由于CPU缓存机制引起的现象。现代CPU有多级缓...

2026-02-03andy阅读(155)评论(0)

在处理大规模向量数据集时，内存占用往往是制约系统扩展性的瓶颈。Faiss 提供了多种索引结构来优化搜索速度和内存，其中 Scalar Quantizer (SQ) 是一种简单高效的内存优化技术，尤其适用于对精度要求不太严苛的场景。本文将深...

2026-02-02andy阅读(132)评论(0)

作为一名搜索技术专家，我们深知默认的分词器（如Standard Analyzer）在处理特定业务术语或同义词时往往力不从心，导致用户搜索词和文档内容无法精确匹配，从而造成召回率低下。解决这一问题的关键在于定制化分析过程，特别是引入同义词（S...

2026-01-29andy阅读(207)评论(0)

向量搜索技术依赖高效的近似最近邻（ANN）算法来处理大规模数据集。其中，乘积量化（Product Quantization, PQ）因其卓越的压缩比和搜索速度而广受欢迎。然而，PQ是通过将高维向量拆分为多个子向量并独立量化来工作的，这一过程...