最近邻搜索:在一组数据点(如向量、坐标、文本嵌入)中,给定一个查询点,找出与它“距离最近”(最相似)的一个或多个数据点的搜索方法。常用于相似推荐、图像检索、信息检索、机器学习(如 kNN)等。(也可扩展为找“k 个最近邻”。)
/ˌnɪərɪst ˈneɪbər sɝːtʃ/
We use nearest neighbor search to find similar images.
我们用最近邻搜索来找到相似的图片。
In high-dimensional embedding spaces, approximate nearest neighbor search can greatly speed up retrieval with only a small loss in accuracy.
在高维嵌入空间中,近似最近邻搜索可以在准确率只略有损失的情况下大幅加速检索。
这是一个由常见词组合而成的技术短语:nearest(near“近” + -est“最高级”)表示“最近的”;neighbor 源自古英语 nēahgebūr(意为“住得近的人”);search 源自古法语 cerchier(寻找、搜寻)。作为计算机/统计学习术语,“最近邻(nearest neighbor)”方法在20世纪中期的模式识别与分类研究中逐步定型,并发展出“最近邻搜索”及其高维加速变体。