我有一个带有答案的数据框(互联网颜色调查)。数据框是这样的:
我有一个带有答案的数据框(互联网颜色调查)。前五行如下所示:
id user r g b colorname
0 1 72 100 175 pastel blue
1 2 204 177 246 faint violet
2 3 182 226 245 baby blue
3 4 130 64 234 purple
4 5 275 49 234 blue
和
data['colorname'].nunique()
和
data.colorname.value_counts()
我可以看到有 181270 个唯一答案及其各自的数量。我想从原始数据框中删除所有不在前 100 名中的答案,但 git 卡在这里。
#libraries
import pandas as pd
import numpy as np
from numpy import array
data = pd.read_csv('color_survey_answers.csv', delimiter='\t')
data.head()
data['colorname'].nunique()
data.colorname.value_counts()
斯蒂芬大帝
相关分类