得到很多人的反响,很多粉丝留言,快点出一版分析教程,找找其中的规律。说不定哪天头等奖就是你,从此迎娶白富美,走上人生巅峰!
今天,就满足大家的要求,对其2005-2018年期间,14年的双色球数据进行分析可视化,看看能否找到一些规律可循(在我看来,彩票规律就是没有规律)。不过,通过此案例,你可以学习到关于matplotlib如何画直方图、气泡图以及更好看的气泡图,同时也能明白一些道理,如为什么穷人更爱买彩票。
2005-2018年,双色球的数据统计
看完视频,说说很多网友自作聪明,彩票开奖是抽出现次数最少的组合。这样的想法是完全错误的。
其实,每期的奖金总数是固定的,让两个人分,还是十个人分,都是一样的!如果说每一期一等奖奖金都是一千万,有作弊的意义,抽个被买的最少的组合!
但为什么每期双色球一等奖奖金不是固定的呢!就是因为其奖金机制,双色球当期销售额的51%作为当期奖金!它分为当期奖金(49%)和调节基金(2%)两部分。比如说,某期双色球销量为3亿元,那么,就有1.47亿元成为当期奖金,600万元成为调节基金。
接下来,我们通过Python对2005-2018年期间的数据进行分析下,主要是通过此案例学习如何用matplotlib画直方图、气泡图以及更好看的气泡图。
一、直方图解读历年中奖注数
利用matplotlib画直方图,主要涉及到两个函数:
1.matplotlib.pyplot.bar(left, height, alpha=1, width=0.8, color=, edgecolor=, label=, lw=3)
参数含义:
left:x轴的位置序列,一般采用arange函数产生一个序列;
height:y轴的数值序列,也就是柱形图的高度,一般就是我们需要展示的数据;
alpha:透明度
width:为柱形图的宽度,一般这是为0.8即可;
color或facecolor:柱形图填充的颜色;
edgecolor:图形边缘颜色
label:解释每个图像代表的含义
linewidth or linewidths or lw:边缘or线的宽度
2.matplotlib.pyplot.legend()
plt.legend()函数主要的作用就是给图加上图例,plt.legend([x,y,z])里面的参数使用的是list的的形式,默认情况下是将label值赋给它。
详细代码:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
def DrawHistogram(read_name):
#读取数据
read_name = r"C:\Users\Administrator\Desktop\ssq.csv"
fp = pd.read_csv(read_name)
first_prize = fp.first_prize
second_prize = fp.second_prize
#配置图形参数
ind = np.arange(len(first_prize))
width = 0.5
fig, ax = plt.subplots()
rects1 = ax.bar(ind - width/2, first_prize, width, color='SkyBlue', label='First')
rects2 = ax.bar(ind + width/2, second_prize, width,color='IndianRed', label='Second')
ax.set_ylabel('Stakes')
ax.set_title('Stakes by year and rank')
plt.xticks(ind,(18,17,16,15,14,13,12,11,10,9,8,7,6,5))
ax.legend()
plt.show()
if __name__=='__main__':
DrawHistogram(r"C:\Users\Administrator\Desktop\ssq.csv")
效果图如下:
历年一等奖、二等奖中奖数
由上图可看出,13、14年是获奖注数Top的一年,同时13、14年的销售额也是最多的,分别高达549亿、573亿元。这其实与当年中国经济稳中向好也有关系,2013年时中国经济关键的一年。这一年,全球经济风云变幻,美国经济增速回落,欧元区继续萎缩,巴西、俄罗斯、印度物价连续上涨,比特币升值近百倍……在这个全球经济一片哀鸣的2013 里,我国采取了多项措施来促进经济的稳定增长,在“黑天鹅”满天飞的2013年里,我国又发生了很多割接、牵动人心的改革事件。如上海自贸区挂牌、中国大妈炒金成为热门词汇,地王的记录频频被刷新等。
二、气泡图解读销售额的大小,与一等奖的占比率并没有关系
气泡图主要用到scatter()函数,具体用法如下:
-
scatter(x,y)&nbs