使用pyplot绘图,一般的导入方法import matplotlib.pyplot as plt
以下代码均在Jupyter Notebook中运行
先看一个简单的例子
图如下,可以看到x轴太密了,甚至都有小数。
如果想x轴只出现我们的样本值,可以使用tick_params
函数修改刻度标记的大小。把上面代码中的倒数第二行取消注释,得到下面的图像。
plt.tick_params(axis='both', labelsize=15)
,其中axis=both
表示同时影响x、y轴的刻度,labelsize
指定了刻度的字号,字号变大,同一长度下显示的坐标点数越少,反之亦反。由于将labelsize
设置得比默认大了,故x、y轴显示的坐标点数变少。更符合这个例子。
还是上面的平方例子。这次使用散点图绘制。
可以看到,只是将plt.plot
换成了plt.scatter
,其余的代码基本没变。
若输入和输出的点比较多,可使用列表推导式。同时可以指定点的颜色及点的轮廓颜色。默认点的颜色为蓝色,轮廓为黑色。
颜色的自定义还可以使用RGB的模式,传递一个元组给参数c。元组里面包含三个[0, 1]之间的数,分别代表(R, G, B),数字越靠近0颜色越淡,越靠近1颜色越深。比如c=(0, 0 , 0.6)
表示的是一种浅蓝色。
依然是平方的图,人懒就不写标题了。
颜色映射通常是一系列颜色的渐变。在可视化中,颜色映射可反应数据的规律,比如颜色浅的值比较小,颜色深的值比较大。
看一个很简单的例子,以y轴坐标值的大小映射。
可以看到,y值小的点,颜色很浅,几乎看不到了;随着y值则增大,颜色越来越深。
先写一个随机漫步的类,目的是随机选择前进的方向
开始绘制
生成的图片,密密麻麻的点。远远看去还挺好看。绿色的是漫步起点,红色的是漫步的终点。
但是图片有点不清晰,把rw.fill_walk()
的下面一行注释取消。通常在绘图前调用。
plt.figure(dpi=300, figsize=(10, 6))
,dpi=300
即是300像素/英寸,这个适当调高可获得清晰的图片。figsize=(10, 6)
传入的参数是元组,表示绘图窗口的尺寸,也就是图片的尺寸了,单位英寸。
高清大图,爽不爽?
我们也许需要分析别人提供的数据。一般是json和csv两种格式的文件。这里有个天气的数据sitka_weather_2014.csv
,是2014年美国锡特卡的天气数据。这里用matplotlib来处理csv文件,json文件的处理放到pygal中。
下载该数据sitka_weather_2014.csv
csv文件的第一行通常是是表头,真正的数据从第二行开始。我们先看下表头包含哪些数据。
打印如下
我们对最高温度和最低温度感兴趣,只需要获得第1列和第3列的数据就行。另外日期数据在第1列。
接下来不难了。从第二行开始,将最高气温放入highs列表,最低气温放入lows列表,日期放入dates列表我们想要在x轴显示日期,引入datetime模块。
看以看出,7月到9月都很热,但是5月出现过非常高的气温!
上面的代码有一行date = datetime.strptime(row[0], '%Y-%m-%d')
。注意%Y-%m-%d
要和row[0]
字符串的格式一致。举个例子
%Y
指的是四位的年份, %y
是两位年份,%m
是数字表示的月份,%d
数字表示的月份中的一天。