标签：向量

Hexagon NN 部署详解：如何利用高通 DSP 的向量扩展指令实现低功耗实时目标检测

2026-03-11andy阅读(74)评论(0)

引言在移动端 AI 部署中，为了追求极致的能效比，通常会将计算任务从 CPU/GPU 卸载到专用的 DSP（数字信号处理器）上。高通 Hexagon DSP 凭借其 HVX（Hexagon Vector Extensions）指令集，能够...

2026-02-10andy阅读(98)评论(0)

引言：为什么需要向量搜索？传统的 Elasticsearch 搜索基于倒排索引，通过关键词匹配（BM25算法）来计算相关性。但在处理“语义”或“意图”时，这种方法往往力不从心。例如，搜索“大型犬”，但文档中只提到了“藏獒”。基于向量的语义...

2026-02-07andy阅读(129)评论(0)

在现代搜索系统中，用户往往需要同时考虑关键词匹配（全文搜索）和语义相似性（向量搜索）。单独使用 Elasticsearch（ES）进行全文搜索，或单独使用 Faiss 进行向量搜索，都无法满足所有需求。本文将介绍一种高效、实操性强的混合检索...

2026-02-05andy阅读(119)评论(0)

在构建任何生产级别的向量搜索系统时，数据的持久化和高效的增量更新是核心挑战。Faiss 作为一个高性能的向量库，提供了极其简单但强大的机制来处理这两个问题。本文将详细讲解如何利用 faiss.write_index 和 faiss.read...

2026-02-02andy阅读(128)评论(0)

向量搜索的性能和准确性高度依赖于输入向量的质量。在将高维向量投入索引之前，通常需要进行两个关键预处理步骤：归一化（Normalization）和主成分分析（PCA）降维。归一化确保向量处于统一的尺度，而 PCA 则能有效去除冗余信息、提...

2026-01-30andy阅读(192)评论(0)

引言：为什么需要 Faiss GPU？在处理海量向量数据（例如，数百万或数十亿个128维或更高维度的向量）时，传统的CPU计算受限于核心数量和内存带宽，查询延迟往往难以接受。Faiss通过其高度优化的GPU模块，能够充分利用NVIDIA ...

2026-01-27andy阅读(129)评论(0)

Faiss (Facebook AI Similarity Search) 是高性能向量搜索的首选库之一。IVFPQ (Inverted File Index with Product Quantization) 是Faiss中最常用和最强...

2026-01-26andy阅读(167)评论(0)

Faiss 乘积量化 (PQ) 算法详解：从向量压缩原理到实战应用在大规模向量搜索场景中，内存和带宽往往成为性能瓶颈。Faiss 提供的乘积量化（Product Quantization, PQ）算法是解决这一问题的核心技术之一。PQ 算...

2026-01-24andy阅读(149)评论(0)

Faiss (Facebook AI Similarity Search) 是目前业界公认最强大的向量搜索库之一。在 Faiss 中，最基础也是最精确的索引类型是暴力检索索引（Flat Indexes），其中最常用的是 IndexFlatL...

2026-01-16andy阅读(148)评论(0)

如何利用向量数据库的访问控制机制保护RAG中的敏感文档导语检索增强生成（RAG）系统是构建现代知识型AI应用的核心范式。然而，在企业级部署中，安全性是一个巨大的挑战。如果将敏感和非敏感文档混合存储在同一个向量索引中，没有适当的访问控制，...