范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

十种机器学习算法的预测分析

  摘要
  机器学习算法被描述为学习一个目标函数 (f),它最好地将输入变量 (X) 映射到输出变量 (Y):Y = f(X)
  最常见的机器学习类型是学习映射 Y = f(X) 以针对新 X 预测 Y。这称为预测建模或预测分析,目标就是要做出最准确的预测。
  十种机器学习算法
  TOP MACHINE LEARNING ALGORITHMS YOU SHOULD KNOWLinear Regression 线性回归Logistic Regression 逻辑回归Linear Discriminant Analysis 线性判别分析Classification and Regression Trees 分类和回归树Naive Bayes 朴素贝叶斯K-Nearest Neighbors (KNN) K-最近邻 (KNN)Learning Vector Quantization (LVQ) 学习向量量化 (LVQ)Support Vector Machines (SVM) 支持向量机 (SVM)Random Forest Bagging 和随机森林Boosting BoostingAdaBoost AdaBoost一、线性回归
  线性回归是统计和机器算法中最容易理解的算法之一。
  线性回归的表示是一个方程,它通过找到称为系数 (B) 的输入变量的特定权重来描述最适合输入变量 (x) 和输出变量 (y) 之间关系的直线。
  例如:y = B0 + B1 * x 我们将在给定输入 x 的情况下预测 y,线性回归学习算法的目标是找到系数 B0 和 B1 的值。
  可以使用不同的技术从数据中学习线性回归模型,例如普通最小二乘的线性代数解决方案和梯度下降优化。二、逻辑回归
  逻辑回归是机器学习从统计学领域借用的另一种技术。它是二进制分类问题(具有两个类值的问题)的首选方法。
  逻辑回归类似于线性回归,其目标是找到加权每个输入变量的系数值。与线性回归不同,输出的预测是使用称为逻辑函数的非线性函数转换的。
  逻辑函数看起来像一个大 S,会将任何值转换为 0 到 1 的范围。这很有用,因为我们可以将规则应用于逻辑函数的输出以将值捕捉到 0 和 1(例如,如果小于 0.5 则输出 1) 并预测一个类值。
  由于模型的学习方式,逻辑回归所做的预测也可以用作给定数据实例属于 0 类或 1 类的概率。这对于需要给出更多理由的问题是很有用一个预测。
  与线性回归一样,当您删除与输出变量无关的属性以及彼此非常相似(相关)的属性时,逻辑回归的效果会更好。这是一个快速学习的模型,并且对二元分类问题有效。三、线性判别分析
  逻辑回归是一种传统上仅限于两类分类问题的分类算法。如果您有两个以上的类别,则线性判别分析算法是首选的线性分类技术。
  LDA 的表示非常简单。它由您的数据的统计属性组成,为每个类计算。对于单个输入变量,这包括:每个类别的平均值。跨所有类计算的方差。
  通过计算每个类别的判别值并针对具有最大值的类别进行预测。假设数据具有高斯分布(钟形曲线),因此最好事先从数据中删除异常值。它是分类预测建模问题的一种简单而强大的方法。四、分类和回归树
  决策树是预测建模机器学习的一种重要算法。
  决策树模型的表示是二叉树。这是来自算法和数据结构的二叉树,没什么花哨的。每个节点代表一个输入变量 (x) 和该变量上的一个分割点(假设变量是数字)。
  树的叶节点包含一个输出变量 (y),用于进行预测。通过遍历树的分裂直到到达叶节点并在该叶节点处输出类值来进行预测。
  树的预测速度也很快。它们通常对于广泛的问题也很准确,并且不需要对数据进行任何特殊准备。五、朴素贝叶斯
  朴素贝叶斯是一种简单但功能强大的预测建模算法。
  该模型由两种类型的概率组成,可以直接从您的训练数据中计算出来:每个类别的概率;给定每个 x 值得每个类的条件概率。 计算后,概率模型可用于使用贝叶斯定理对新数据进行预测。当数据是实值时,通常假设高斯分布(钟形曲线),以便可以轻松估计这些概率。
  朴素贝叶斯被称为朴素,因为它假设每个输入变量都是独立的。这是一个强有力的假设,对于真实数据来说是不现实的,然而,该技术在处理大量复杂问题时非常有效。六、K-最近邻 (KNN)
  KNN算法非常简单,非常有效。KNN 的模型表示是整个训练数据集。
  通过在整个训练集中搜索 K 个最相似的实例(邻居)并汇总这些 K 个实例的输出变量,对新数据点进行预测。
  对于回归问题,这可能是平均输出变量,对于分类问题,这可能是模式(或最常见的)类值。
  诀窍在于如何确定数据实例之间的相似性。
  KNN 可能需要大量内存或空间来存储所有数据,但仅在需要预测时才及时执行计算(或学习)。这个期间你可以随着时间的推移更新和管理训练实例,以保持预测的准确性。七、学习向量量化 (LVQ)
  K-Nearest Neighbors 的一个缺点是需要保留整个训练数据集。
  学习向量量化算法(或简称 LVQ)是一种人工神经网络算法,它允许选择要挂起的训练实例数量并准确了解这些实例的外观。
  LVQ 的表示是码本向量的集合。这些是在开始时随机选择的,并适合在学习算法的多次迭代中最好地总结训练数据集。学习后,码本向量可以像 K-Nearest Neighbors 一样用于进行预测。通过计算每个码本向量与新数据实例之间的距离,找到最相似的邻居(最佳匹配码本向量)。然后返回最佳匹配单元的类值或(回归情况下的实际值)作为预测。 如果重新调整数据以具有相同的范围,例如在 0 和 1 之间,则可以获得最佳结果。
  如果发现 KNN 在你的数据集上提供了良好的结果,可以尝试使用 LVQ 来减少存储整个训练数据集的内存需求。八、支持向量机 (SVM)
  支持向量机可能是最受欢迎和谈论最多的机器学习算法之一。
  超平面是分割输入变量空间的线。
  在 SVM 中,选择一个超平面来最好地将输入变量空间中的点按它们的类(类 0 或类 1)分开。在二维中,你可以将其可视化为一条线,假设我们所有的输入点都可以被这条线完全隔开。SVM 学习算法通过超平面找到导致类的最佳分离的系数。
  超平面和最近数据点之间的距离称为边距。 可以分离这两个类的最佳或最优超平面是具有最大边距的线。
  只有这些点与定义超平面和构建分类器有关。这些点称为支持向量。它们支持或定义超平面。在实践中,使用优化算法来找到最大化边际的系数值。九、Bagging 和随机森林
  随机森林是最流行和最强大的机器学习算法之一。它是一种集成机器学习算法。称为 Bootstrap Aggregation 或 bagging。
  Bootstrap是一种强大的统计方法,用于从数据样本中估计数量。
  在 bagging 中,使用相同的方法,但用于估计整个统计模型,最常见的是决策树。
  获取训练数据的多个样本,然后为每个数据样本构建模型。当你需要对新数据进行预测时,每个模型都会进行预测,并对预测进行平均以更好地估计真实输出值。
  随机森林是对这种方法的一种调整,其中创建了决策树,因此不是选择最佳分割点,而是通过引入随机性来进行次优分割。
  因此,为每个数据样本创建的模型与其他模型相比更加不同,但仍然以其独特和不同的方式准确。结合他们的预测可以更好地估计真实的潜在输出值。十、Boosting 和 AdaBoost Boosting
  Boosting是一种集成技术,它试图从多个弱分类器中创建一个强分类器。
  这是通过从训练数据构建模型,然后创建第二个模型来尝试纠正第一个模型中的错误来完成的。添加模型直到训练集被完美预测或添加最大数量的模型。
  AdaBoost 是为二进制分类开发的第一个真正成功的提升算法。这是理解 boosting 的最佳起点。
  AdaBoost 与短决策树一起使用。 在创建第一棵树后,树在每个训练实例上的性能用于衡量下一棵创建的树应该对每个训练实例的关注程度。难以预测的训练数据被赋予更高的权重,而易于预测的实例被赋予更少的权重。
  模型一个接一个地按顺序创建,每个模型都会更新训练实例上的权重,这些权重会影响序列中下一棵树执行的学习。
  在构建完所有树之后,将对新数据进行预测,并且每棵树的性能取决于它在训练数据上的准确程度。
  由于算法非常重视纠正错误,因此拥有干净的数据并删除异常值非常重要。如何实践?
  如果想要验证机器学习在金融上的应用,可以来BigQuant上实践,以上算法都有,还有海量的金融数据任君挑选。
  如何抵达:百度BigQuant。

旗舰扫拖机器人选购指南科沃斯T20与石头G20实测对比去年我给家里购入的自己的第二台扫地机器人,也是我家的第一台全能扫拖机器人,不得不说在导航避障清洁能力使用方便程度等多个方面,新款的全能扫拖机器人相比多年之前我家的第一台基础扫拖款扫消博会期间海口市秀英区将推出系列文旅活动消费日报网讯(记者郑红梅)第三届中国国际消费品博览会(简称消博会)将于4月11日至15日在海口举行。在消博会期间,海口市秀英区将推出一系列硬核文旅活动专属优惠为市民和游客奉上诚意满手把手教你选一加手机!从2000到4000价位,这3台用几年不后悔认准一个手机品牌的用户,在换手机的时候,大概率是不会去选择其他手机厂商的产品。也正因为如此,很多果粉都在期待9月份发布的拍iPhone15系列华为P60系列在上个月发布之后,也让花张忆东现在不用追涨AI,决战6月底,中特估值得配,同时关注银行开始中特估时,行情即结束核心观点1中小银行问题只是厨房里的一只蟑螂,是短暂的平息,但是它并没有结束。过去十年美国万事不决,靠放水,现在已经开始反噬。未来美国进入还债期,替过去十年还债。2今年下半年美国的经盛大的樱花季即将结束,你确定不再看一眼吗?樱花烂漫几多时?柳绿桃红两未知。樱花下落的速度是每秒5厘米,花期只有两周左右,盛大的樱花季,你确定不再看一眼吗?顾村公园听说,顾村公园飘雪了。染井吉野樱随风舞动,花瓣落地成诗,像极港媒与亚洲旅游市场其他竞争对手相比,粤菜仍使香港独具优势来源环球时报香港南华早报4月8日文章,原题香港作为购物天堂的地位正在消退,它能指望粤菜吸引游客吗?香港正在丧失其作为购物天堂的全球声誉,但来自中国内地和海外的游客表示,与亚洲旅游市山西省鼓励A级景区预售首道门优惠门票!65家景区获补贴资金4921万元山西日报记者任志霞报道4月10日,记者从省财政厅获悉,在我省今年推出的A级景区预售首道门优惠门票活动中,65家景区获省级财政补贴4921万元。2022年12月,针对旅游行业发展面临月亮岛街道小手牵大手倡导文明出行湖南日报新湖南客户端4月10日讯(通讯员吴舟钟可)4月9日,长沙市望城区月亮岛街道组织辖区幼儿园开小手牵大手学榜样倡文明活动,深入宣传交通安全知识,提高辖区居民文明出行观念。活动现金立还活着?金立F1Plus新机发布,国产芯片加持,外观复刻苹果提起金立手机,你最深刻的印象是什么?相信大多数人会回答金品质,立天下,刘德华作为代言人喊出这句广告词让人印象深刻,可惜金立手机自己不争气,早在五六年前已经退出主流市场。在大多数人印MKBHD发布2023上半年热门手机奖项三星OPPO成最大赢家!文名动科技在过去的数月时间中,除了苹果以外,各大手机厂商基本都带来了旗下的新一代旗舰机,全新升级的配置设计引起了众多用户的关注,也让手机圈好不热闹。而在最近,海外数码博主Marqu华为2025年出货2亿台智能手机,外媒先把芯片解决了再说吧根据相关消息,华为正在重整消费者事业群,把智能手机定位为主业,为2025年发货2亿台手机做准备。一年2亿台什么概念?2022年全年手机出货量为13。5亿台,5G手机占一半。三星出货
李小冉李乃文我们的日子强势开播,演绎温情故事,超级好看2月9日,由李小冉和李乃文主演的我们的日子在CCTV1黄金时间强势开播。该剧跨越近三十年的岁月里描绘了时代变迁里几个家庭之间的温情幸福故事,最典型的中国邻里街坊之间在平凡的生活中奔90年代的港台片好看还有福利,梁家辉全果,李立群激情戏为什么现在的美剧这么流行?很简单的一个原因就是剧情好看,画面流畅,还时不时的给观众送福利,这样的合理安排怎不让人喜欢?其实,这种设定,或者说表现手法,早在三十年前,港台电影已经玩过人一生最重要的,是做真实的自己幸福自在,才是生活的本质。一辈子,什么最重要?有人认为是财富,有人认为是名利。于是生活中,有的人为了金钱,勾心斗角为了地位名誉,一辈子都在思虑算计。很多时候,人们只顾着向前追逐,却中国最爱吃甜的省份,日子过得太滋润了本文转自极物头图食妞广州封面夏半夜花花极物君语广东,中国糖水第一大省,一半天生一半热爱。某日,昆明上空响起一短一长的汽笛声。联大的学子们又开始了一日的跑警报。但在大部队中,却有一个三亚希弗音乐餐吧三亚椰林风格餐酒吧还去什么巴厘岛啊三亚有一家椰林风格的餐厅,可以假装置身于巴黎岛白天拍照蓝天白云,照片出来的效果特别清楚,颜色鲜艳晚上拍出来的效果跟白天感觉完全不同,晚上氛围感更强烈一点适合朋友情侣山西老哥25年前为女儿存下5箱茅台,如今爱女出嫁,酒却拿不出?女儿红的传说众人皆知。一个家庭,喜得爱女,众人皆乐,父母视其为珍宝,于是在女儿出生之日,存下几箱好酒,待出嫁之日,或赠宾客饮用,或作为陪嫁,意义重大。山西的刘哥也给自己的女儿存过5酒吧旺了三里屯一酒吧和服务局的关系我就是一个小羊汤。说清楚一个小羊汤得从老羊汤说起,老羊汤就是从小就在外国人圈里混饭吃(到死)的主儿,1961年北京外交人员服务局成立(BDS)。凡是从那时进入外滴滴企业文化待改进滴滴现在如此疯狂了么,客服居然如此践踏滴滴车主的尊严。滴滴无论以前还是现在都是中国网约车龙头老大,巅峰时期占据百分之九十的份额,哪怕就是现在也给百分之七十的份额,依然处于龙头地位,重新定义国人K歌方式乐趣牛移动共享KTV正式上市2月11日,乐趣牛移动共享KTV新品发布会在东莞举行。乐趣牛创始人马安军先生龙燕芳女士郭传武先生李良先生,广州市音乐文学协会主席兰刚先生,东莞市郴州商会秘书长谢玉珍先生等多位重量级独眼妈妈的牺牲(含音频的配套文章)LearnEnglishThroughStory看完这个故事,我哭了。如果您没有准备好纸巾,慎重阅读!!!借此机会,向我的妈妈表示最崇高的敬意,向她说一声妈妈我爱您!英语部分有音频,需要的朋友请点击上面的音频Mymomonlyh老公疑似出轨事件后,Chompoo首露面这件事会让我们手牵得很紧关于女神Chompoo,最近有两条非常火爆的消息,一个是老公Hisonott疑似出轨年下24岁年轻女性,另一个是Hisonott已经签好了遗嘱,如果自己发生意外,那么名下的所有财产