猿问

K均值仅使用带有scikit-learn的特定数据框列

我使用的k-means算法从scikit-learn库,我想集群值在大熊猫数据帧3列:ID,value_1和value_2。


我想使用value_1和来对信息进行聚类value_2,但是我也想ID与之保持关联(因此我可以ID在每个聚类中创建的列表)。


最好的方法是什么?目前,它也使用该ID数字进行聚类,这不是故意的。


我当前的代码(X是pandas数据框):


kmeans = KMeans(n_clusters=2, n_init=3, max_iter=3000, random_state=1)

(X_train, X_test) = train_test_split(X[['value_1','value_2']],test_size=0.30)

kmeans = kmeans.fit(X_train)


哔哔one
浏览 129回答 1
1回答
随时随地看视频慕课网APP

相关分类

Python
我要回答