规整化处理
股票数据规整化处理
数据查看:head()前X行 tail()后X行 shape查看行列形状 describe()描述性的统计 info()信息查看是否有缺失值
缺失值处理:isnull()是不是有缺失值.T.any() notnull()是不是没有缺失值 dropna(axis=0删除包含缺失值的行=1时表示列,how='all'全为缺失值才删除='any'只要有缺失值就删除) fillna(method='ffill'行或列的上面来填充缺失值,'bfill'则为下面),akis=0表示在列方向上,inplace=True改变原dataframe
parse_data:False时,行索引第一列为字符串类型;true时,解析为本身格式
获取csv数据
df_csvload=pd.read_csv("*.csv","parse_dates=True,index_col=0,encoding='gb2312'")
print df_csvload.head(3) 前三行
print df_csvload.tail(3) 最后三行
print df_csvload.info() 查看缺失值
print df_csvload.isnull() 查看缺失值true,false
print df_csvload.isnull().T.any()缺失值的位置
股票数据规整化处理的方法:
股票数据内容概况查看: head():df_csvload.head(3)查看前三行 tail():df_csvload.tail(3)查看后三行 shape:df_csvload.shape查看数据有几行几列 describe():df_csvload.describe()各列数据的统计情况df_csvload.info()查看缺失的情况 df_csvload.isnull()的返回的值True代表缺失,False代表未缺失 df_csvload[df_csvload.isnull().T.any()]可以筛选出有数据缺失的行
缺失值的处理: df_csvload=df_csvload.dropna(axis=0,how='all')0代表行,1代表列,'all'代表如果该行全是缺失值则删除该行,'any'代表如果该行存在缺失值则删除该行。还有一个参数可以设置成如果该行的缺失值大于多少个时删除该行。
df_csvload=df_csvload.fiillna(method='ffill',akis=0,inplace=True),其中'ffill'表示以该列的上一个值填充,'bfill'表示以该列的下一个值填充。0表示列,1表示行。True表示改变原dataframe,False表示不改变
股票数据的处理
股票数据的规整化处理方法
股票数据信息查看的方法:head() tail() shape describe() info
缺失值的处理方法:isnull() notnull() dropna() fillna()