设为首页 加入收藏

TOP

监督学习笔记(三)
2017-12-24 06:07:04 】 浏览:980
Tags:监督 学习 笔记
rtances(ab_regressor.feature_importances_,'dt',housing_data.feature_names)

2.评估共享单车

采用随机森立回归器(random forest regressor);随机森林是一个决策树集合,基本上是用一组有数据集的若干子集构建的决策树构成,再用决策树平均值改善整体学习效果。使用例子如下:

# 评估共享单车重要因素
import csv
from sklearn.ensemble import RandomForestRegressor

# 1、读取数据,该数据是从文件中读取
def load_datasets(filename):
    file_reader=csv.reader(open(filename,'r'),delimiter=',')
    X=[]
    y=[]
    for row in file_reader:
        X.append(row[2:13])
        y.append(row[-1])

    feature_name=np.array(X[0])

    return np.array(X[1:]).astype(np.float32),np.array(y[1:]).astype(np.float32),feature_name

# 2、获取数据并将文件打乱放入X,y中
X,y,feature_name=load_datasets('bike_day.csv')
X,y=shuffle(X,y,random_state=7)
# 3、将数据分成0.9训练和0.1的测试数据
num_training=int(len(X)*0.9)
X_train,y_train=X[:num_training],y[:num_training]
X_test,y_test=X[num_training:],y[num_training:]
# 4、训练回归
# #n_estimators指评估器的数量,则决策树数量,min_samples_split指决策树分裂一个节点需要用到的最小数据样本量
rf_regressor=RandomForestRegressor(n_estimators=1000,max_depth=10,min_samples_split=2)
rf_regressor.fit(X_train,y_train)
# 5、评价随机森林回归的效果
y_pre=rf_regressor.predict(X_test)
print('均方差:',mean_squared_error(y_test,y_pre))
print('解释方差:',explained_variance_score(y_test,y_pre))

plot_feature_importances(rf_regressor.feature_importances_,'rf',feature_name)
首页 上一页 1 2 3 4 下一页 尾页 3/4/4
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Python2.7.14安装和pip配置安装及.. 下一篇python 初学之账户登录

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目