如何通过设置 Faiss 的 nprobe 参数在搜索耗时与召回率之间寻找最优解
在处理大规模向量搜索时,我们通常需要在搜索速度(延迟)和搜索准确性(召回率)之间做出权衡。Faiss 的 IVF(Inverted File Index)系列索引是实现高性能搜索的关键工具,而 nprobe 参数则是控制这种权衡的核心。 本...
在处理大规模向量搜索时,我们通常需要在搜索速度(延迟)和搜索准确性(召回率)之间做出权衡。Faiss 的 IVF(Inverted File Index)系列索引是实现高性能搜索的关键工具,而 nprobe 参数则是控制这种权衡的核心。 本...
如何使用 PyTorch FSDP 解决超大模型单卡显存不足问题 随着大语言模型(LLM)的参数量突破百亿甚至万亿级别,传统的分布式训练方案(如DDP,数据并行)已经无法满足需求,因为DDP要求每张GPU都复制完整的模型权重、梯度和优化器状...
在构建大规模深度学习模型训练系统时,参数服务器(Parameter Server, PS)架构是一种常见的解决方案。它将模型参数的存储和更新集中在专用的PS节点上,而Worker节点(训练器)只负责计算梯度并发送给PS。PyTorch 提供...