1.概述
1.1 集成学习概述
本身不是一个单独的机器学习算法,
而是通过在数据上构建多个模型,集成所有模型的建模结果
随机森林,梯度提升树(GDBT),Xgboost常见
1.2 集成算法类型
1.2.1 single
单个模型,一次迭代
1.2.2 bagging
模型独立,互相平行;
多数表决,对预测进行平均,或者进行投票表决
1.2.3 boosting
模型有序,逐渐提升
结合弱评估器的力量一次次对难以评估的样本就行预测;
形成一个强的评估器;
1.3 sklearn中的集成算法
ensemble
ensemble.RandomForestClassifier #随机森林分类
ensemble.RandomForestRegressor #随机森林回归