带有答案的数据框,如何仅保留前 100 个答案

我有一个带有答案的数据框(互联网颜色调查)。数据框是这样的:


我有一个带有答案的数据框(互联网颜色调查)。前五行如下所示:


id  user r   g   b   colorname

0   1    72  100 175 pastel blue

1   2    204 177 246 faint violet

2   3    182 226 245 baby blue

3   4    130 64  234 purple

4   5    275 49  234 blue


data['colorname'].nunique()


data.colorname.value_counts() 

我可以看到有 181270 个唯一答案及其各自的数量。我想从原始数据框中删除所有不在前 100 名中的答案,但 git 卡在这里。


#libraries

import pandas as pd

import numpy as np

from numpy import array


data = pd.read_csv('color_survey_answers.csv',  delimiter='\t')

data.head()


data['colorname'].nunique()


data.colorname.value_counts()


Qyouu
浏览 149回答 1
1回答

斯蒂芬大帝

您可以尝试以下操作:data[data.colorname.isin(data.colorname.value_counts()[:100].index)]
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python