jupyter notebook默认输出该类和该类的信息,并没有把该类的图像作为结果输出。
matplotlib简介
数据可视化流程。。
data1=[......]
data2=[......]
data3=[......]
name=[......]
# 绘制柱状图
plt.figure(figsize=(20,10)) #调整画布大小,以免文字堆积在一起
plt.bar(range(1,len(data1)+1),data1)
plt.xticks(range(1,len(data1)+1),name)
# 设置标题、标签
plt.show()
# 绘制饼图
plt.figure(figsize=(15,15))
plt.pie(data1,labels=name,autopct="%1.1f%%") # 设置标签和百分比符号
# 设置标题
plt.show()
# 绘制气泡图
data3=[item/20 for item in data3] # 调整data的大小,以免气泡图的气泡过大或过小
plt.scatter(data1,data2,s=data3)
# 设置标题、标签
data1=[......]
data2=[......]
data3=[......]
name=[......]
# 计算最大值,使用python的内置函数max()
data1_max=max(data1)
data2_max=max(data2)
data3_max=max(data3)
# 计算均值,统计数据的总量并除以其数量可得到其均值
data1_mean=sum(data1)/len(data1)
data2_mean=sum(data2)/len(data2)
data3_mean=sum(data3)/len(data3)
# 计算中位数,对数据进行排序,如果数据长度为奇数,取中间的那个数,如果数据长度为偶数,取中间两个数的均值
def median(List):
List=sorted(List)
if len(List)%2==1:
return List[len(List)//2]
else:
return (List[len(List)//2]+List[len(List)//2-1])/2
data1_median=median(data1)
data2_median=median(data2)
data3_median=median(data3)
# 计算标准差,需要提前导入math模块
def stdev(List):
mean=sum(List)/len(List)
sum=0
for item in List:
sum+=(item-mean)**2
sum/=len(List)
return math.sqrt(sum)
data1_stdev=stedv(data1)
data2_stdev=stedv(data2)
data3_stdev=stedv(data3)
# 三个维度的数据
x=[......]
y=[......]
z=[......]
plt.scatter(x,y,s=z) # 气泡大小设置为z,能够同时显示三个维度之间的关系
name_list=['name1','name2',name3']
data1=[......]
data2=[......]
data3=[......]
width=0.4 # 每个柱状图的宽度
x1=[1,3,5]
plt.bar(x1,c1,label='name1',fc='r',width=width)
x2=[......] # x1加上宽度
plt.bar(x2,c1,label='name2',fc='g',width=width)
x3=[......] # x2加上宽度
plt.bar(x3,c1,label='name3',fc='b',width=width)
plt.xticks(x2,name_list) # 在x2的底部显示出name
plt.legend() # 将每个name对应的颜色体现在图像中
# 添加标题、xy轴标签
n=5
number=['1','2','3','4','5']
data1=[......]
data2=[......]
data3=[......]
data4=[data2[i]+data1[i] for i in range(5)] #data4是data1加上data2的数据,作为data3的底部
x=np.arange(n)
plt.bar(x,data1,color='r',label='标签1')
plt.bar(x,data1,bottom=data1,color='g',label='标签2') # bottom的参数是设置底部数据
plt.bar(x,data3,bottom=data4,color='c',label='标签3')
plt.ylim(0,300) #这里设置y轴的区间
plt.title(标题)
plt.legend(loc='upper right')
plt.grid(axis='y',color='gray',linestyle=':',linewidth=2)
plt.xticks(x,number)
plt.xlabel(x轴标签)
x=[1,2,3]
name=['name1','name2','name3']
y=[data1,data2,data3]
plt.bar(x,y)
plt.title(标题) # 设置标题
plt.xlabel(x轴标签) # 设置x轴标签
plt.ylabel(y轴标签) # 设置y轴标签
plt.xticks(x,name) # 将x轴上的数字替换成对应的名字
for i in range(1,len(name)+1):
plt.text(i,y[i-1]+1,y[i-1]) # 在固定位置添加文本,text的参数分别为x,y,数据。
plt.rcParams['font.sans-serif']=['SimHei']#中文支持 plt.rcParams['axes.unicode_minus']=False #正常显示负号 plt.rcParams['lines.linewidth']=5 #设置线条宽度 plt.rcParams['lines.color']='red' #设置线条颜色 plt.rcParams['lines.linestyle']='-' #设置线条样式
收集数据-信息提取-形成结论
指定画布大小
plt.figure(figsize=(20,10)) 横长为20,纵宽为10
plt.xlabel() x坐标名
plt.ylabel() y坐标名
plt.title() 图标题
plt.show()显示图片,之后画布会被清空
中位数的计算
标准差的计算
综合案例
气泡图绘制
分块图的绘制
堆积图
直方图,条形图,折线图及饼图
散点图和箱线图
常见的可视化形式及工具:
比散点图多了一个维度
https://matplotlib.org/stable/api/matplotlib_configuration_api.html
通过搜索关键字,rcParams,查询文章
配置~~~~~~~~~~~~~~~~~
改变横坐标:x。ticks
111:代表1行1列其中的第一张字符(字图)
指定坐标轴为极坐标轴
调用绘图函数:plot
import matplotlib.pyplot as plt
%matplotlib inline
r = [1,2,3,4,5,6]
thera = [0.0, 1.5248756,2.54788762,5.14525889,2.331458,3.554411223]
ax=plt.subplot(111,projection='polar')
ax.plot(theta,r)
统计图分为:直方图 折线图 饼图
分布图分为:热力图 散点图 气泡图
预处理:数据清洗——数据一致性(单位统一)、缺失值