时间:2021-05-22
不得不说使用python库matplotlib绘图确实比较丑,但使用起来还算是比较方便,做自己的小小研究可以使用。这里记录一些统计作图方法,包括pandas作图和plt作图。
前提是先导入第三方库吧
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np然后以下这两句用于正常显示中文标签什么的。
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号当然还有一些最基本的步骤:
plt.xticks(x,xtk,size=12,rotation=50) #设置字体大小和字体倾斜度plt.xlabel(u'城市') # x轴标签plt.ylabel(u'数量')plt.title(u'朋友所在城市') # 图的名称plt.legend() # 正常显示标题plt.show() # 显示图像plt.close() # 绘图后养成习惯性的关掉对于pandas中的二维数据框,可以直接作图(Series类型),简单的折线图或者曲线图如下:
sdata.plot(color='r', style='-o')plt.show()如果没有用pandas,直接作曲线图,可以这样写:
plot(x,y, color ='blue', linewidth=2.5, linestyle="--")数据样例如下,名称为va,类型为Series,左边为职位名称,右边为数量:
sales 4140technical 2720support 2229IT 1227product_mng 902marketing 858RandD 787accounting 767hr 739management 630作图:
fr = pd.Series(va.values.cumsum() / va.values.sum())va.plot(kind='bar')fr.plot(color='r',secondary_y=True, style='-o')plt.annotate(format(fr[7], '.2%'), xy=(7, fr[7]), xytext=(7*0.9, fr[7]*0.9), arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=.2')) # 用于注释图形指标# plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签# plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号# plt1 = plt.pie(va.values,# labels=va.index,# autopct='%1.1f%%')plt.xticks(rotation=50) # 设置字体大小和字体倾斜度plt.show()左边为出现的频率,右边为累积百分比(这里数据以降序排列较好,便于直观地观察),效果如下:
在pandas中,曲线图可以直接画,比如data中有多个属性,可以直接使用data.plot()。使用plt,若各个属性需要共用XY轴,那么可以重复plot即可。
使用pandas画箱型图简单方便,但是注释比较麻烦,可以用annotate添加异常点的注释。若使用之前的数据va,则先创建二维数据框再画图。如果有多个列为数字类型,那么可以画每个列的箱型图,这里只有一列数据,如下:
pd.DataFrame(va).boxplot()plt.show()使用plt直接进行作图:
plt.boxplot(data,labels=[], sym='o',whis=1.5)其中,data可以是一维的,也可多维,若为多维则lables为每一维度的标签。sym为异常值的形状,whis为调节垂直线段的长度。效果如下:
使用plt:
plt.subplot(221)plt.plot(x, y1,'r-', lw=2) plt.subplot(222)plt.plot(x,y2)使用pandas:
data.plot(subplots=True, color=['r','b'], style=['-o','-'])plt.show()排版方式有不同,pandas是垂直排列,plt可以自己指定位置。pandas效果如下:
补充:Python DataFrame 多条件筛选 使用&
我就废话不多说了,大家还是直接看代码吧~
DF6Out[42]: B C D0 1 B 10.7501 3 C 8.8752 2 T 58.0003 2 L 57.0004 3 Y 46.000DF6[(DF6.B>1) & (DF6.D > 10)]Out[45]: B C D2 2 T 58.03 2 L 57.04 3 Y 46.0以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Python之绘图和可视化1.启用matplotlib最常用的Pylab模式的IPython(IPython--pylab)2.matplotlib的图像都位于
本文研究的主要是python可视化包Bokeh的相关内容,具体如下。问题:需要把pandas的数据绘图并通过网页显示,matplotlib需要先保存图像,不合适
Numpy、Pandas是Python数据处理中经常用到的两个框架,都是采用C语言编写,所以运算速度快。Matplotlib是Python的的画图工具,可以把之
Matplotlib的概念这里就不多介绍了,关于绘图库Matplotlib的安装方法:点击这里小编之前也和大家分享过python使用matplotlib实现的折
通常绘制二维曲线的时候可以使用matplotlib,不过如果电脑上安装了pandas的话可以直接使用Series的绘图方法进行图像的绘制。pandas绘制图像其