k-Nearest Neighbors(k-NN,k近邻):一种常见的监督学习方法,用于分类或回归。它根据样本在特征空间中与“最近的 k 个邻居”的距离(如欧氏距离)来做预测:分类时通常用邻居的多数投票,回归时常用邻居数值的平均(或加权平均)。也常被称为“基于实例的学习/惰性学习”。
The k-nearest-neighbors model classifies this email as spam.
k近邻模型把这封邮件判定为垃圾邮件。
In high-dimensional data, k-nearest-neighbors can be sensitive to the choice of distance metric and the value of k.
在高维数据中,k近邻对距离度量方式和 k 的取值可能非常敏感。
/ˌkeɪ ˈnɪərɪst ˈneɪbərz/
该术语由三部分构成:k(表示邻居数量的参数)、nearest(最近的)、neighbors(邻居/近邻点)。作为机器学习方法的经典形式,源自统计模式识别与“最近邻”分类思想的发展;“k”用于通过取多个近邻来降低单个近邻带来的偶然性。