带有 sklearn 的机器学习：KNeighborRegressor 拟合函数卡在大数据库上

这就是 KNN 的本质。算法时间复杂度是 KNN，O(nd)其中 n 是数据点的数量，d 是维度（在您的情况下n = 25k, d = 10）KNN 将考虑所有数据点并选择K最接近的邻居。因此，如果您的数据很大，则需要更多时间。K是超参数，您可以使用GridSearchCV或RandomizedSearchCV对其进行调整您拥有的选项：缩小您的数据（即，减少数据点的数量，比如 25k 到 15K）增加系统内存大小和处理器速度或在云中运行 KNN等待 KNN 完成如果您有延迟限制，则不要使用 KNN您也可以尝试使用 RBF 内核的SVM，因为它是 KNN 的一个很好的近似，而且花费的时间更少

带有 sklearn 的机器学习：KNeighborRegressor 拟合函数卡在大数据库上

1回答