#encoding=utf-8
import numpy as np
import pandas as pd
def main():
#Data structure
s=pd.Series([i*2 for i in range(1,11)])
print(type(s))
dates=pd.date_range('20170301',periods=8)
df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
print(df)
# basic
print(df.head(3)) # head()打印出前几行
print(df.tail(3)) # tail()打印出后几行
print(df.index) # index()打印出索引
print(df.values) # values()打印出values
print(df.T) # T 转置
print(df.sort_values("C")) # 第C列的values按从小到大的顺序排序
print(df.sort_index(axis=1, ascending=False)) # 将index进行降序排序
print(df.describe()) # 打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
#select
print(type(df["A"]))
print(df[:3])
print(df.loc[dates[0]])
print(df.iloc[1:3])
print(df[df.B>0][df.A<0])
if __name__ == '__main__':
main()
head打印前几行
tail打印后几行
index打印主键
values打印数据
sort排序,直接指定按那个标签排序
describe可以大致分析数据的一些特征,平均值,标准差等
可以通过[]直接下标索引切片
多个series组成dataframe
print(df.head(5)) # 前5行
#Basic print(df.head(3)) #head()打印出前几行 print(df.tail(3)) #tail()打印出后几行 print(df.index) #index()打印出索引 print(df.values) #values()打印出values print(df.T) #T 转置 print(df.sort(columns="C")) #第C列的values按从小到大的顺序排序 print(df.sort_index(axis=1,ascending=False)) #将index进行降序排序 print(df.describe()) #打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
print(df.head(3)) print(df.tail(3)) print(df.index) print(df.values) print(df.T) print(df.sort(columns=“C”)) print(df.sort_index(axis=1,ascending=False)) print(df.describe()) print(df["A"]) print(df[:3]) print(df["20170301":"20170304"]) print(df.loc[dates[0]]) print(df.loc["20170301":"20170304",["B","D"]]) print(df[df.B>0][df.A<0])
插眼, pandas 真不错
print(df.sort_values(by="C"))