“Vector search”指向量检索/向量搜索:把文本、图片、音频等数据表示成高维“向量”(embedding,嵌入向量),再通过计算向量之间的相似度(如余弦相似度、内积、欧氏距离)来找到语义上最相近的内容。常用于语义搜索、推荐系统、RAG(检索增强生成)等场景。(也可泛指在向量空间中的近邻搜索问题。)
/ˈvɛktər sɝːtʃ/
Vector search helps users find relevant documents even when the keywords don’t match exactly.
向量检索能让用户在关键词不完全匹配时,仍然找到相关文档。
By indexing embeddings in a vector database, the system can perform vector search at scale to retrieve semantically similar passages for a chatbot.
通过在向量数据库中索引嵌入向量,系统可以大规模进行向量搜索,为聊天机器人检索语义相近的段落。
vector来自拉丁语 vector(“携带者/运载者”),在数学与工程中引申为“具有大小与方向的量”,再扩展到计算机领域里“用一组数表示的特征”。search源自古法语 cerchier(“寻找”)。合起来,“vector search”字面义为“在向量表示中进行搜索”,现代多指基于嵌入向量的相似度检索。