241249,1767,166750]
plt.figure(figsize=(10,6.18),dpi=100)
bar_width = 0.25
x_09 = list(range(len(x)))
x_10 = list(i + bar_width for i in range(len(x)))
x_11 = list(i + bar_width * 2 for i in range(len(x)))
plt.barh(x_09,y_09,height=bar_width,label="2009年")
plt.barh(x_10,y_10,height=bar_width,label="2010年")
plt.barh(x_11,y_11,height=bar_width,label="2011年")
plt.legend(prop=my_font, fontsize=12)
plt.grid(alpha=0.5,linestyle="--")
plt.yticks(x_10,x,fontproperties=my_font)
plt.xlabel("数量(所)",fontproperties=my_font,fontsize=12)
plt.title("2009年、2010年及2011年各级各类学校数情况",fontproperties=my_font,fontsize=18)
plt.show()
2.4 绘制图形结果
运行上述代码,结果如下。
3.直方图
3.1 什么是直方图
以下引用自百度百科
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。
为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。 间隔必须相邻,并且通常是(但不是必须的)相等的大小。
3.2 准备数据
数据选用上一篇随笔:爬取豆瓣电影信息中爬取到的电影的时长。去除无效数据后,从下图可以看出总共有2247条数据,最大值为170,最小值为3。
3.3 绘制完善图形
代码如下:
plt.figure(figsize=(10,6.18),dpi=100)
plt.hist(df["running_time"],range(0,171,10),color="#009900")
plt.xticks(range(0,171,10))
plt.yticks(range(0,650,50))
plt.grid(alpha=0.5,linestyle="--")
plt.xlabel("时长(分钟)",fontproperties=my_font,fontsize=12)
plt.ylabel("数量", fontproperties=my_font,fontsize=12)
plt.title("电影片长分布情况", fontproperties=my_font,fontsize=18)
plt.show()
3.4 绘制图形结果
运行上述代码,结果如下。
四、结语
开心一点,人间不值得