百面读书笔记十二

　　第12章　集成学习
　　将多个分类器的结果统一成一个最终的决策。使用这类策略的机器学习方法统称为集成学习。其中的每个单独的分类器称为基分类器。
　　12.1 集成学习分哪几种？他们有何异同？
　　Boosting主要思想：迭代式学习
　　Bagging主要思想：集体投票决策
　　我们再从消除基分类器的偏差和方差的角度来理解Boosting和Bagging方法的差异。基分类器，有时又被称为弱分类器，因为基分类器的错误率要大于集成分类器。基分类器的错误，是偏差和方差两种错误之和。偏差主要是由于分类器的表达能力有限导致的系统性错误，表现在训练误差不收敛。方差是由于分类器对于样本分布过于敏感，导致在训练样本数较少时，产生过拟合。
　　Boosting方法是通过逐步聚焦于基分类器分错的样本，减小集成分类器的偏差。Bagging方法则是采取分而治之的策略，通过对训练样本多次采样，并分别训练出多个不同模型，然后做综合，来减小集成分类器的方差。假设所有基分类器出错的概率是独立的，在某个测试样本上，用简单多数投票方法来集成结果，超过半数基分类器出错的概率会随着基分类器的数量增加而下降。
　　12.2 集成学习有哪些基本步骤？请举几个集成学习的例子
　　12.3 常用的基分类器是什么？
　　最常用的基分类器是决策树，主要有以下3个方面的原因。  决策树可以较为方便地将样本的权重整合到训练过程中，而不需要使用过采样的方法来调整样本权重。  决策树的表达能力和泛化能力，可以通过调节树的层数来做折中。  数据样本的扰动对于决策树的影响较大，因此不同子样本集合生成的决策树基分类器随机性较大，这样的＂不稳定学习器＂更适合作为基分类器。此外，在决策树节点分裂的时候，随机地选择一个特征子集，从中找出最优分裂属性，很好地引入了随机性。
　　除了决策树外，神经网络模型也适合作为基分类器，主要由于神经网络模型也比较＂不稳定＂，而且还可以通过调整神经元数量、连接方式、网络层数、初始权值等方式引入随机性。
　　12.4 可否将随机森林中的基分类器，由决策树替换为线性分类器或K-近邻？请解释为什么？
　　随机森林属于Bagging类的集成学习。
　　Bagging的主要好处是集成后的分类器的方差，比基分类器的方差小。
　　Bagging所采用的基分类器，最好是本身对样本分布较为敏感的（即所谓不稳定的分类器），这样Bagging才能有用武之地。
　　线性分类器或者K-近邻都是较为稳定的分类器，本身方差就不大，所以以它们为基分类器使用Bagging并不能在原有基分类器的基础上获得更好的表现，甚至可能因为Bagging的采样，而导致他们在训练中更难收敛，从而增大了集成分类器的偏差。
　　12.5 什么是偏差和方差？
　　在有监督学习中，模型的泛化误差来源于两个方面——偏差和方差，具体来讲偏差和方差的定义如下：
　　偏差指的是由所有采样得到的大小为m的训练数据集训练出的所有模型的输出的平均值和真实模型输出之间的偏差。偏差通常是由于我们对学习算法做了错误的假设所导致的，比如真实模型是某个二次函数，但我们假设模型是一次函数。由偏差带来的误差通常在训练误差上就能体现出来。
　　方差指的是由所有采样得到的大小为m的训练数据集训练出的所有模型的输出的方差。方差通常是由于模型的复杂度相对于训练样本数m过高导致的，比如一共有100个训练样本，而我们假设模型是阶数不大于200的多项式函数。由方差带来的误差通常体现在测试误差相对于训练误差的增量上。
　　上面的定义很准确，但不够直观，为了更清晰的理解偏差和方差，我们用一个射击的例子来进一步描 述这二者的区别和联系。假设一次射击就是一个机器学习模型对一个样本进行预测。射中靶心位置代表预测准确，偏离靶心越远代表预测误差越大。 我们通过n次采样得到n个大小为m的训练样本集合，训练出n个模型，对同一个样本做预测，相当于我们做了n次射击，射击结果如图12.4所示。我们最期望的结果就是左上角的结果，射击结果又准确又集中，说明模型的偏差和方差都很小；右上图虽然射击结果的中心在靶心周围，但分布比较分散，说明模型的偏差较小但方差较大；同理，左下图说明模型方差较小，偏差较大；右下图说明模型方差较大，偏差也较大。
　　12.6 如何从减小方差和偏差的角度解释Boosting和Bagging的原理？
　　Bagging能够提高弱分类器性能的原因是降低了方差，Boosting能够提升弱分类器性能的原因是降低了偏差。为什么这么讲呢？
　　12.7 GBDT的基本原理是什么？
　　梯度提升决策树（Gradient Boosting Decision Tree，GBDT）是Boosting算法中非常流行的模型，也是近来在机器学习竞赛、商业应用中表现都非常优秀的模型。GBDT非常好地体现了＂从错误中学习＂的理念，基于决策树预测的残差进行迭代的学习。GBDT几乎是算法工程师的必备技能，也是机器学习面试中常考察的内容。
　　本章第一节提到Bagging和Boosting两大集成学习的框架。相比于Bagging中各个弱分类器可以独立地进行训练，Boosting中的弱分类器需要依次生成。在每一轮迭代中，基于已生成的弱分类器集合（即当前模型）的预测结果，新的弱分类器会重点关注那些还没有被正确预测的样本。
　　Gradient Boosting是Boosting中的一大类算法，其基本思想是根据当前模型损失函数的负梯度信息来训练新加入的弱分类器，然后将训练好的弱分类器以累加的形式结合到现有模型中。算法1描述了Gradient Boosting算法的基本流程，在每一轮迭代中，首先计算出当前模型在所有样本上的负梯度，然后以该值为目标训练一个新的弱分类器进行拟合并计算出该弱分类器的权重，最终实现对模型的更新。Gradient Boosting算法的伪代码如图12.6所示。
　　12.8 梯度提升和梯度下降的区别和联系是什么？
　　12.9 GBDT的优点和局限性有哪些？
　　■ 优点
　　（1）预测阶段的计算速度快，树与树之间可并行化计算。
　　（2）在分布稠密的数据集上，泛化能力和表达能力都很好，这使得GBDT在Kaggle的众多竞赛中，经常名列榜首。
　　（3）采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性，能够自动发现特征间的高阶关系，并且也不需要对数据进行特殊的预处理如归一化等。
　　■ 局限性
　　（1）GBDT在高维稀疏的数据集上，表现不如支持向量机或者神经网络。
　　（2）GBDT在处理文本分类特征问题上，相对其他模型的优势不如它在处理数值特征时明显。
　　（3）训练过程需要串行训练，只能在决策树内部采用一些局部并行的手段提高训练速度。
　　12.10 XGBoost与GBDT的联系和区别有哪些？

看衰你的人其实能力都不如你不是每个人都能幸运地拥有一群好的亲友。无论是出于关心还是恶意，看衰别人，都不是很好的行为。你可以提醒可以建议，但不该用负面的言语去眨低别人正在做的事。当我们听到这样的话时，自己内心我和傻憨憨cookie的故事前言黑小子cookie是我两年多前收养的流浪狗。那是一窝被遗弃的小奶狗，一共是母子五个。一个好心的小姐姐暂时收留了它们，并在朋友圈发了求收养的信息。那时，cookie大约两个月吧，佛说凡事皆有定数缘分聚散，分分合合，被人误解，不说，有人离开，不求，看人改变，不念。留人间多少爱，迎浮世千重变。和有情人，做快乐事，别问是劫是缘。别问，谁的行为伤了你，别问，谁的冷落苦了你，别问，大地，在那些苍翠的路上历遍了多少创伤在那些苍翠的路上历遍了多少创伤在那张苍老的面上亦记载了风霜秋风秋雨的度日是青春少年时迫不得已的话别没说再见回望昨日在异乡那门前唏嘘的感慨一年年但日落日出永没变迁这刻在望着父亲笑容时学会接纳自己打卡美好生活每个人都是独立的，一个人接纳另一个人很难，但一个人接纳自己更难。我们时常对自己不满，为自己的缺点懊恼与烦网，千方百计想掩饰。自己面对自己时我们常常会陷人惧怕与悔恨中不能不想佔別人便宜的人，生活總不會讓你吃虧的兩碗麵，一碗麵條上面有雞蛋，端上桌子之後，父親問兒子兒子，你吃哪一碗？結果兒子就指著那一碗說我要吃有蛋的那碗。父親說兒子，讓我吧，孔融七歲能讓梨，你都十歲了，你應該讓爸爸吃有蛋的那（莲衣）对不起，我爱你那天抬头时，不小心撞见你的目光，从此以后，开始想念，从此以后，不忘一生，画地为牢。少年的我自负非凡，从来都是一个孤傲的人，眼里除了学习和兄弟，没有哪一个女生我放在眼里。你穿着一般相（莲衣）死敌众人散开时，眼前出现一个黑衣杀手，他手持快刀，步履矫健，站在五米开外，对我露出微笑。是他，白天的影子，睡梦中的梦魇，看着那五颗白牙，怒不可竭，作为死敌，你怎能对我微笑，不可原谅，不（莲衣）水岸高僧你们认识她吗？她是晶莹剔透的一滴荷露，在水岩寺门前的荷塘，面无表情朝着太阳的方向，一缕东边的紫霞凝聚于她的内心，那时，早课的经书正在诵读。她化形于寂静的深夜，听说，她是由不闲的相思（连衣）白桦林一白桦林是我读大学的口琴练习曲，我一直想吹好，起码自己能听的下去。很遗憾，口琴已经被我搁置多年了。只是还记得歌词天空依然阴霾，依然有鸽子在飞翔，谁来证明那些没有墓碑的爱情和生命一早上（莲衣）白桦林二吉他放在床头几年没动了。一次偶然的机会，我才知道，不用的吉他，要把琴弦松下来。但是事已如此，我也只是叹息一声，收拾后事。我也只是喜欢吉他的声音，会弹的人抱着吉他就像抱着情人，停车霜

<<<<<<－>>>>>>

以梦为马莫负韶华我一直很喜欢海子的那句以梦为马莫负韶华，这句话像是给我们青春的定义，一直奋斗，不负韶华，不负青春。十几岁的我们，眼里有着对着世间的不屑，有着对着世间的好奇，憧憬，还有着我们青春特有自暴自弃，没有人能让你崛起在泥泞中跌倒，不是等待别人扶你走出困境，勇敢理性的人总是自己爬起。很多时候，成功并不是第一个起跑的人，而是在跌倒后爬起来继续坚持的人，挫折是对人生的一种鞭策，一种激励。不要把失败当情绪与健康哲人说健康是为我们的事业和我们的福利所必需的，没有健康，就不可能有什么幸福可言。健康就像倒立金字塔底端的基石，什么财富名利地位享受依次叠加在上，一旦健康基石消失了，所有一切也就随之奋斗年华不能躺平每一代人都有每一代人的成长机遇和无奈处境。当年的5060后，正当读书年华，遇上了社会流行的读书无用论，大多数人都随波逐流去了，只有那些仍然坚持看书学习的孩子，在后来的人生中，得到了散文摇下心窗，方见美丽人生，不过是一场结局不一样的旅行，生命的欢愉，是不放过每一处风景。为何不能忘怀，跋涉中那一场刻骨铭心的惊喜？那是你在岁月里，偶尔摇下心窗，因为刹那的发现，而没有辜负旅程。每个人都这散文最美的相逢，在清秋清晨，一丝淡雅的桂花清香，从窗户偷偷地不知不觉地随一缕秋风而悄然入室。在清秋的清晨伴着凉爽的清风别有番醉迷的味道。寻香而出，院内桂花树仿佛一夜间商议好似的，忽如一夜秋风来，千树万树慢半拍等于慢一生慢半拍，总是有人慢半拍！为什么呢？生活中我们或多或少的都会听到家长对孩子，或者领导对下属说你总是比别人慢半拍。对啊！慢半拍这个词很好理解，就是速度或者反应慢了一点点。那么究竟这一点逐梦精彩在过程青春梦想，犹如美丽的鲜花，五彩纷呈，活力四射。但鲜花最终能否结出丰满果实，无法预测。不过，无论是现在正开放着的鲜花，还是已经过了花季留下缺憾的果，都不必焦虑。因为人生的精彩不仅仅表生活的选择就像迷宫，需要你懂得如何找到出口有时候生活中的选择就像迷宫那样，不同的路通往不一样的天地。有时候，你走的那一条路，尽头未必就有出口，也许是个死胡同。我们在这样的生活状态下，仿佛就像在迷宫中来来回回的转圈圈，直到找取人之长，补己之短一个人从呱呱落地到长大成人，甚至一生都在不断学习模仿和超越。孔子曰三人行必有我师焉。无论在自然优胜劣汰选择中，还是人类社会发展进步中，取人之长，补己之短，方为生存之道，也是恒古不变摆脱冷气，砥砺前行曾几何时，佛系青年一词一夜间在朋友圈内刷屏。所谓佛系青年指的是对万事万物秉持漠不关心的态度。没有太大的自我抱负的一个群体。虽说这一新词汇只是当下某些青年对于自身生活方式的一种调侃，