标签：embedding

ChromaDB 向量数据库从入门到实战：构建高效 RAG 应用的完整指南

2026-07-02andy阅读(76)

ChromaDB 向量数据库从入门到实战：构建高效 RAG 应用的完整指南在大型语言模型（LLM）应用爆发的今天，检索增强生成（Retrieval-Augmented Generation, RAG）已成为构建知识密集型 AI 应用的核心...

2026-02-08andy阅读(320)评论(0)

在推荐系统、自然语言处理等领域，Embedding（词向量）层往往是模型中最大的组成部分。当词汇量达到千万甚至亿级别时，Embedding表的大小会轻易超出单个GPU甚至单个服务器的内存限制，并且参数更新会变得高度稀疏和低效。TensorF...

2025-12-27andy阅读(815)评论(0)

痛点：更换Embedding模型与海量数据重索引在AI基础设施中，向量数据库（Vector Database）是RAG（Retrieval-Augmented Generation）和语义搜索的核心。随着新模型（如BGE、GTE或定制模型...