我有一个dataframe名为 train 的列“质量”。
>>>train['quality'].unique()
array([5, 6, 7, 4, 8, 3], dtype=int64)
现在get_dummies有train[['quality']]给
>>>pd.get_dummies(train[['quality']]).head()
quality
0 5
1 5
2 5
3 6
4 5
但与 train['quality']
>>>pd.get_dummies(train['quality']).head()
3 4 5 6 7 8
0 0 0 1 0 0 0
1 0 0 1 0 0 0
2 0 0 1 0 0 0
3 0 0 0 1 0 0
4 0 0 1 0 0 0
的数据类型train[['quality']]和train['quality']主要有: -
>>>print(type(train['quality']))
<class 'pandas.core.series.Series'>
>>>print(type(train[['quality']]))
<class 'pandas.core.frame.DataFrame'>
该get_dummies()文档指出:data : array-like, Series, or DataFrame
因此,如果我可以同时提供一个系列,或者 DataFrame为什么输出不同?
料青山看我应如是
潇潇雨雨
相关分类