Python数据可视化,Pandas作图分析,你会吗?
数据可视化是为了使得数据更高效地反应数据情况,便于让读者更高效阅读,而不单是自己使用,通过数据可视化突出数据背后的规律,以此突出数据中的重要因素,并且,数据可视化可以将数据变得更加直观。
精美的图表可以方便用户解读数字之间的关系,相比起枯燥的表格来讲,有助于发现容易被忽视的趋势和规律。通过对趋势和规律的分析,可以帮助用户做出正确的判断。 本文使用工具:Python 3.7.0
本文使用的函数:pandas
适用范围:pandas普通作图Pandas
本文介绍pandas作图,日常使用pandas库做一些数据清洗的工作,原来pandas还可以作图,并且做图时,使用一行代码就可以轻松作图,详细的作图方法可以看代码中的注释。 #导入pandas库 import pandas as pd #生成一个Series s=pd.Series([1,3,3,4], index=list("ABCD")) #括号内不指定图表类型,则默认生成直线图 s.plot()
#条形图 s.plot(kind="bar")
#水平条形图 s.plot.barh()
#饼图 s.plot.pie()
#直方图 s.plot.hist()
#密度图 import numpy as np #生成一列随机数 s=pd.Series(np.random.randn(1000)) s.plot.kde() s.plot.density()
#散点图 import numpy as np #生成一个DataFrame df=pd.DataFrame(np.random.randn(1000,2),columns=["X1","Y"]) df.plot.scatter(x="X1",y="Y")
#六角箱图 df.plot.hexbin(x="X1",y="Y",gridsize=8)
#箱型图 df=pd.DataFrame(np.random.rand(10,2),columns=["A","B"]) df.plot.box()
#面积图 df=pd.DataFrame(np.random.randint(10,size=(4,4)), columns=list("ABCD"), index=list("WXYZ")) df.plot.area()