专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

论文主分量分析和线性判别分析在分类问题中的应用

  【摘要】对于维数较多的研究对象,为了研究的方便,总希望先将维数降低。主分量分析(PCA)和Fisher线性判别分析(FDA)是广泛应用于模式识别各个领域的两种常用方法。本文先利用主分量分析,将原始数据维数降低,然后再利用Fisher线性判别分析将维数再次降低,得到低维的数据,实验结果表明了两种方法结合的有效性。
  【关键词】主分量分析;Fisher线性判别;距离判别法
  【Abstract】Astoanobjectofmultidimension,wealwayshopetomakeitsdimensionreducedinordertofacilitatethestudyonit。PrincipalcomponentanalysisandFisherlineardiscriminantanalysisaretwocommonmethodswidelyusedinvariousfieldsofpatternrecognition。Thisarticlereducedthedimensionoforiginaldata,bytheprincipalcomponentanalysisatfirst,andthenuseFisherlineardiscriminantanalysistoreducethedimensiononceagain,obtaininglowerdimensionaldata,finallyexperimentalresultsdemonstratedtheeffectivenessoftwomethods’combination。
  【Keywords】Principlecompomentanalysis;Fisherlineardiscriminantanalysis;Amethodofdifferentiatingdistances
  引言
  在生产p科研和日常生活中我们经常会遇到判别分类问题,在这些问题中,已经知道研究对象可以分为几个类,而且对这些类别也已经作了一些观测,取得了一批样本数据。我们需要对这些数据进行处理,找到不同类别之间的显著性区别和判别方法。
  1主分量分析和线性判别分析的原理
  主分量分析的基本原理:把原来多个变量划为少数几个综合指标的一种统计分析方法,是一降维处理技术。主分量分析的基本思想:主分量分析是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标〔3〕。
  Fisher线性判别分析的基本原理:将高维空间中的类映射到低维空间,并且要求在低维空间类与类之间较好区分,是一降维处理技术。Fisher线性判别分析的基本思想:对于多个类来讲,我们希望类内离散度越小越好,类间离散度越大越好。对于原始的类,我们想通过将其投影到低维空间,并且要求经过投影后达到类内离散度最小,类间离散度最大。在投影的过程中,如果投影到一维空间效果不是很好,我们可以将其维数增多〔4〕。
  2实例
  现对三类品种的鸢尾属(Iris)植物进行研究,希望通过研究鸢尾属植物的几个主要指标,可以将一个未知样本进行归类。对鸢尾属植物的四个指标进行了统计。对统计数据作如下变换:
  对所有样本数据X进行中心化标准化。
  对处理后的数据求解相关系数矩阵R得
  求解R的特征值i和特征向量ei。
  由上表可以看出,前三个特征值的累积贡献率已达到99。485,所以我们选取前三个特征值所对应的特征向量为主成分,这样我们就将四维空间降到三维空间。原始数据经过主分量分析,位数降低,得到变换YXE。
  经过主分量分析,原始数据已经降到三维,我们将对得到的三维空间里的数据再次进行降维处理。我们选取各类中的前40个样本代表该类进行研究。
  分别计算出各类的样本均值mk和所有样本的均值m
  计算类内离散度矩阵Sw和类间离散度矩阵Sb
  计算Sb和Sw的广义特征值和特征向量
  对Y进行Fisher线性判别,得到变换ZYW。
  计算经过变换后所得到的类的。均值
  通过主分量分析和Fisher线性判别,我们将样本由四维空间降到一维空间。由上面的计算,我们可以得到公式ZXEW。
  随机选取45个样本得到样本组x,在选取样本时,前15个样本是从第一类中抽取的,中间15个样本是从第二类中抽取的,最后15个样本是从第三类中抽取的。我们首先对需要判别的样本进行变换,然后分别计算这45个样本到三类均值的距离
  表2中加粗的数字表示该样本距离某类均值距离最小,也就是样本属于这个类。判别结果为前15个样本判为第一类,中间16个样本判为第二类,最后14个样本判为第三类。其中第31个样本通过距离判别判为第二类,而这个样本是从第三类中抽取的;其他样本判别均正确。在这次判别中,错误率为145,我们认为判别是比较合理的。对所有的样本都进行分类判别,其错误率为4150,我们认为对数据的处理以及距离判别的方法是比较合理的。
  3小结
  我们在研究鸢尾属植物的三个品种时,首先运用主分量分析,在这个过程中维数降低了一维,但我们保留了99。485的原有信息,可以说这一数据变换很有意义。在主分量分析之后,我们再运用Fisher线性判别分析,将数据进行投影,投影到一维空间。然后我们选取了45个样本进行分类判别时,判别结果比较理想,从而验证了两次降维处理的有效性和距离判别的可行性。

电子商务论文4篇电子商务属于信息网络时代新型的商务活动,主要借助现代化的信息技术通信网络以及计算机装置等替代传统营销中的传递存储等环节,以实现企业经营管理发展等相关活动的全程在线交易。接下来小编搜电子商务论文1000字电子商务是以信息网络技术为手段,以商品交换为中心的商务活动,下面一起来看看电子商务论文的相关论文吧!希望大家喜欢!电子商务论文摘要电子商务在经济全球化和全球信息化过程中得到飞速发展导师式课堂教学法论文摘要新一轮课程改革以来,课堂教学面貌发生了根本性的变化,教师的角色发生了根本性的转变。改革课堂教学模式,符合学生认知的规律,要以学生的发展为本,大胆放手,给每一个学生自主学习和探索冰糖葫芦的包装设计研究论文一冰糖葫芦及其包装现状冰糖葫芦的历史文化内涵。冰糖葫芦堪称最原始最传统的糖果之一,它的历史十分悠久,是我国特色民俗食品之一。山楂富含多种营养物质膳食纤维和活性物质,是一种养生食品。直播油菜田选用除草剂有讲究论文近年来,随着稻茬免耕直播油菜田面积的不断扩大,草害问题显得更加突出。与翻耕移栽油菜相比,免耕田的杂草出土早数量大长势旺迅速上升,危害更加严重。因此,直播油菜除草剂的合理选用显得尤为浅析大学体育教育与当代大学生健全人格的培养教育教学论文大学体育教育与当代大学生健全人格的培养张强,邓世平(湖南工业大学体育学院,湖南株洲412008)摘要当代大学生正处在一个社会转型加快社会矛盾凸出的特殊时期,他们在面对更多机遇的同时控制工程毕业论文提纲范文3篇机械控制工程基础是机械工程类学生一门重要的专业基础课。下面是小编为大家整理的控制工程毕业论文提纲范文3篇,供大家参考。控制工程毕业论文提纲范文一摘要56Abstract67第1章绪大学生网上购物论文大学生是新新人类,对新鲜事物比较好奇,网上购物已经慢慢地从一个新鲜的事物逐渐变成大学生日常生活的一部分,下面小编带来的是大学生网上购物论文,希望对你有帮助。摘要网络的发展带动了电子浅谈想象在声乐教学的作用论文一想象意蕴对于想象,不同学者有不同的认识,并且有不同的意涵,但对这些意涵进行梳理,我们会发现大体是相同或相似的,在此基础上再归纳总结,就会得出想象的意涵,即,是人脑对已有表象进行加科幻式景观设计理论初探论文摘要科幻式景观是从景观当中分立出来的一种类型,既具备景观形态的基本特征,又在造型形式上有别于平常的景观形态。文中重点分析和阐述了科幻式景观产生的根源和概念的界定。归纳总结了科幻式景大学生就业和创业论文导语大学生就业和创业论文要怎么写?下面是由准备整理的关于大学生就业和创业论文范文。欢迎阅读!大学生就业创业论文摘要近年来,中国高校毕业生数量逐年增多,大学生面临严峻的就业形势,加之
大连旅顺口区自然旅游资源开发研究大连旅顺口区自然旅游资源开发研究大连旅顺口区自然旅游资源开发研究大连旅顺口区自然旅游资源开发研究摘要旅顺口区是大连市所属的六区之一,位于大连市最南部,自然旅游资源在大连市占有突出的未来适合游客旅游方式的探讨未来适合游客旅游方式的探讨未来适合游客旅游方式的探讨未来适合游客旅游方式的探讨1游客旅游方式的起源随着人类社会由原始社会进入奴隶社会,生产力的发展所带来的劳动剩余物归奴隶主占有,他中国经济发展中的环境问题中国经济发展中的环境问题中国经济发展中的环境问题中国经济发展中的环境问题更多内容源自幼儿论文关健词经济发展环境污染环境保护论文摘要本文从中国经济发展的角度,阐述了中国现存的环境状况关于当代中国流浪乞讨群体的成因解析与救助建议论文关键词流浪乞讨群体社会问题社会救助论文摘要我国流浪乞讨群体于当代形成的原因,主要包括贫困及资源配置失衡流动失范造成生存状况恶劣边缘地位遭受多重剥夺,边缘人格强化了乞讨心理家庭贫论乡村民主政治的发展兼论中国乡村的民主政治改革一引论中国乡村民主自治是史无前例的事件。我们几乎没有现代国家的直接经验作为参照系来对这一事件进行评论,因为没有一个国家的民主政治制度是从农村开始的,更没有在与中国相似的历史条件下从关于中国村落共同体的论战内容提要当今的中国农村正处于剧烈的阶层分化之中,村干部与村民之间常常处于对立状态。要搞清出现这些问题的历史根源,需要深刻认识中国村落的社会结合性质究竟是建立在合理打算基础之上的结社中国建构现代乡镇行政管理体制的理论探讨摘要中国在整个20世纪的现代国家政权建设中,出现了4种新型的乡镇管理模式即晚清至民国时期的所谓乡镇自治,中国共产党建立的议行合一制乡镇基层政权政社合一的人民公社体制和乡政村治二元治中国农村研究摘要目前正在进行的农村税费改革,虽然取得了一定的成效,但是由于配套措施没有跟上,农民负担反弹的诱因依然存在。本文以河南省三门峡市为例,通过对该市农村税费改革情况的调查,以此作为个案试论当前中国农民走向市场经济的主要障碍80年代以来,从农村开始的由农民们首先掀起的这场具有革命意义的中国经济改革,震撼华夏大地,给中国带来了勃勃生机。然而,当中国经济改革的目标最终定位于建立社会主义市场经济体制之后,社试论国家在农村医疗卫生保障中的作用中国在工业化城市化的过程中,对如何解决占人口绝大多数的农民的医疗保障问题,曾经创造出足资大多数发展中国家借鉴的经验。通过建立各种不同层次的医疗卫生保健机构,积极开展合作医疗,促进了中国近代农村土地交易中的契约习惯与国家法(1)ABSTRACTThisessayinvestigatesthelandtransactioncustomsandcontractsthatprevailedinthevillag
友情链接:快好知快生活快百科快传网中准网文好找聚热点快软网