范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

百面读书笔记四

  第4章 降维
  在机器学习中,数据通常需要被表示成向量形式以输入模型进行训练,但对向维向量进行处理和分析时,会极大地消耗系统资源,甚至产生维度灾难。因此,对高维数据要进行降维,即用一个低维度的向量表示原始高维度的特征就显得尤为重要。
  常见的降维方法有主成分分析、线性判别分析、等距映射、局部线性嵌入、拉普拉斯特征映射、局部保留投影等。
  为什么要降维?
  在机器学习领域中,我们对原始数据进行特征提取,有时会得到比较高维的特征向量。在这些向量所处的高维空间中,包含很多的冗余和噪声。我们希望通过降维的方式来寻找数据内部的特性,从而提升特征表达能力,降低训练复杂度。
  主成分分析(Principal Components Analysis,PCA) :属于一种线性、非监督、全局的降维算法。
  4.1 如何定义主成分?
  PCA旨在找到数据中的主成分,并利用这些主成分表征原始数据,从而达到降维的目的。
  举一个简单的例子,在三维空间中有一系列数据点,这些点分布在一个过原点的平面上。如果我们用自然坐标系x,y,z三个轴来表示数据,就需要使用三个维度。而实际上,这些点只出现在一个二维平面上,如果我们通过坐标系旋转变换使得数据所在平面与x,y平面重合,那么我们就可以通过x′,y′两个维度表达原始数据,并且没有任何损失,这样就完成了数据的降维。而x′,y′两个轴所包含的信息就是我们要找到的主成分。
  4.2 从这种定义出发,如何设计目标函数使得降维达到提取主成分的目的?
  数据分布得更为分散,这也意味着数据在这个方向上方差更大。在信号处理领域,我们认为信号具有较大方差,噪声具有较小方差,信号与噪声之比称为信噪比。信噪比越大意味着数据的质量越好,反之,信噪比越小意味着数据的质量越差 。由此我们不难引出PCA的目标,即最大化投影方差,也就是让数据在主轴上投影的方差最大。
  4.3 针对这个目标函数,如何对PCA问题进行求解?
  4.4 PCA求解的其实是最佳投影方向,即一条直线,这与数学中线性回归问题的目标不谋而合,能否从回归的角度定义PCA的目标并相应地求解问题呢?
  上面求解得到一条直线使得样本点投影到该直线上的方差最大。从求解直线的思路出发,很容易联想到数学中的线性回归问题,其目标也是求解一个线性函数使得对应直线能够更好地拟合样本点集合。如果我们从这个角度定义PCA的目标,那么问题就会转化为一个回归问题。顺着这个思路,在高维空间中,我们实际上是要找到一个d维超平面,使得数据点到这个超平面的距离平方和最小。以d=1为例,超平面退化为直线,即把样本点投影到最佳直线,最小化的就是所有点到直线的距离平方之和,
  线性判别分析(Linear Discriminant Analysis,LDA) :一种有监督学习算法,同时经常被用来对数据进行降维。相比于PCA,LDA可以作为一种有监督的降维算法。在PCA中,算法没有考虑数据的标签(类别),只是把原数据映射到一些方差比较大的方向上而已。
  LDA有如下两个假设:原始数据根据样本均值进行分类。不同类的数据拥有相同的协方差矩阵。
  4.5 对于具有类别标签的数据,应当如何设计目标函数使得降维的过程中不损失类别信息?在这种目标下,应当如何进行求解?
  4.6 LDA和PCA作为经典的降维算法,如何从应用的角度分析其原理的异同?从数学推导的角度,两种降维算法在目标函数上有何区别与联系?
  从PCA和LDA两种降维方法的求解过程来看,它们确实有着很大的相似性,但对应的原理却有所区别。
  首先从目标出发,PCA选择的是投影后数据方差最大的方向。由于它是无监督的,因此PCA假设方差越大,信息量越多,用主成分来表示原始数据可以去除冗余的维度,达到降维。而LDA选择的是投影后类内方差小、类间方差大的方向。其用到了类别标签信息,为了找到数据中具有判别性的维度,使得原始数据在这些方向上投影后,不同类别尽可能区分开。
  举一个简单的例子,在语音识别中,我们想从一段音频中提取出人的语音信号,这时可以使用PCA先进行降维,过滤掉一些固定频率(方差较小)的背景噪声。但如果我们的需求是从这段音频中区分出声音属于哪个人,那么我们应该使用LDA对数据进行降维,使每个人的语音信号具有区分性。
  另外,在人脸识别领域中,PCA和LDA都会被频繁使用。基于PCA的人脸识别方法也称为特征脸(Eigenface)方法,该方法将人脸图像按行展开形成一个高维向量,对多个人脸特征的协方差矩阵做特征值分解,其中较大特征值对应的特征向量具有与人脸相似的形状,故称为特征脸。Eigenface for Recognition一文中将人脸用7个特征脸表示(见图4.7),于是可以把原始65536维的图像特征瞬间降到7维,人脸识别在降维后的空间上进行。然而由于其利用PCA进行降维,一般情况下保留的是最佳描述特征(主成分),而非分类特征。如果我们想要达到更好的人脸识别效果,应该用LDA方法对数据集进行降维,使得不同人脸在投影后的特征具有一定区分性。
  持续关注,惊喜不断。
  更多资料,私聊我哦。

原创从熟悉到陌生人文罗丹尼(中国唯美诗派)几年不见,在头条竟然又见到你隽永的诗句于是回忆开始打开闸门泄出点点滴滴那时一起隔屏谈笑风声争强好胜的你与我经常切磋斗诗一直到三更的深夜说是红颜知己并不过份曾一个人,越干净越有福,一个人真正干净的三个表现很喜欢诗人顾城说过的一句话一个人应该活得是自己并且干净。干净,对于一个人而言是一种宝贵的品质,外表干净,会让人对你产生好感圈子干净,往往会促使你的生活,你这个人变得更好内心干净,活6月最佳旅行地清单,这14个被初夏偏爱地方,第一个就想出发时间过得好快啊,转眼就到6月,转眼年将过半,转眼又将迎来端午小长假,转眼是毕业季也是旅行季在这个特殊的月份,让人总想出去放松休息几天。图虫晓舟摄影这个时候,草原绿了大海也鲜活了起来做人干干净净,做事有始有终(好文推荐)感谢茫茫人海能与你相遇点击上方关注做人干干净净,做事有始有终,是做人的两条底线。有了这两条线,我们才能守住本心,以一个平和的心态,宽容的姿态,坚定的神态,为过好这一生奠定坚实的基础回语音和文字哪个更密切?现在很多人都讨厌听语音,浪费时间不说,在不方便的状态下,如果普通话不是很标准,还没办法转文字。但是对于恋人而言,语音倒是可以传递一种亲密,只不过一连好几个60s的语音,不管你们再怎今夜,我遇见了童年露从今夜白,月是故乡明举头望明月,低头思故乡,这些缓缓流淌的诗句,无不诉说着对故乡的思念。今夜,一个没有月亮的冬日寒夜,我也坐在窗前,看窗外灯火阑珊,任思绪随意游走,心去旅行。今夜莫让等待白了少年头聆听你的爱痛在我胸口文落落我是聒噪的,每天每次,都是我先打call,问你在干嘛?吃饭了吗?穿得够暖不?有时很快,有时很久才会等到你的回复。有时更久,久到我忘了曾问过你什么。我最亲爱亲爱的人,你是我的梦韩国庆诗歌我随诗行(组诗)1这个深秋树,终于松开了手最后一枚叶子,坠落一切,悄无声息深秋的表白是第一场雪树木,麻木如我季节还在重复我还在陌生的人群中行走中途,开始冰冷打开一瓶雪碧摇了摇,装在心底发泄开始逆行花园就是菜园,这才是种花的最高境界城市里高楼林立寸土寸金如果能够在城郊拥有一个带院子的房子那简直是太幸福了因为这样就可以种出一个菜园子DIY菜园变成花园再也不用担心买的菜打农药了做个造型即赏心悦目又可以在午后来看看爱的最高境界,是爱自己爱是不会老的,它留着的是永恒的火焰与不灭的光辉,世界的存在,就以它为养料。这是一个充满了爱的世界,可生活在这个世界里的我们,却依然还在寻找着爱的踪迹。寻寻觅觅,究竟谁才是谁的最终归想要做真实的自己,从学会独处开始,这是一个人最高的境界新来的朋友,记得点击右上方红色关注独处,作为成年人最好的奢侈品,它既是一种价值取向,也是生活方式的一种境况。人们经常把好人缘,朋友成群,当成一种了不起的能力,但实际上,脱离群体的独
打碗花牵牛花甘薯花打碗花牵牛花甘薯花打碗花牵牛花甘薯花很像,它们都是一个家族旋花科的植物。打碗花的名字有个凄美的传说。一财主家的丫头,偷点冷饭给讨饭的老婆婆吃,被财主打死。后来这丫头的坟头上开出了这创业者难创业须谨慎!1hr上个礼拜,路过老家的生态园开发区,我央求家人绕过去,也好带孩子去看看开发区的游乐园。听说那边新开发了人工鱼塘,里边放养了许多红鲤,还有小船可以租坐。隆起的假山丘陵,可以供孩子我是一颗无人知道的小草地锦看到地锦,我就想起了年轻时候喜欢听的歌曲我是一颗无人知道的小草没有花香,没有树高我是一棵无人知道的小草从不寂寞,从不烦恼你看我的伙伴遍及天涯海角地锦是一年生匍匐草本,生活在田野路旁秋分日,惊喜相遇杠板归秋分之日,秋雨洋洋洒洒飘了一上午。下午在家磨磨蹭蹭,等走出家门太阳近落山。散步路上偶遇几位转山归来的友人,问这么晚出来!答就那么随心所欲了呲牙一个人走着不知走了多少遍的路,看着因岁名不副实的扁担木扁担木属椴树科,灌木或者小乔木。茎细有韧性,据说是做人造棉的好原料,与我们担水挑物的扁担没有一点关联,不知何因有这样的名字。扁担木的叶子互生,长卵圆形,前端锐尖,基部钝圆。两面均有构树植物中霸占地盘的强者构树,别名构桃树构乳树楮树楮实子沙纸树谷木谷浆树假杨梅。我的小外孙女给它起名叫红冠病毒。因为构树具有极强的萌蘖性和根孽性,加上耐干耐湿,对土壤要求也不高,繁殖力极强。看着路边一片片过好每一天,人生也就没那么难了1hr不做无谓的烦恼,开心快乐的过好每一天,这个道理人人都懂得,若是回归生活,安放在每一个当下,似乎又难了。我身边就不乏如此的家人朋友,沒事总爱聚在一起吐吐槽,相互吹侃一番,满腹的那些年,那些事前段时间我报名了杨小米的写作班,连续37天的打卡写文,每天都是激情满满。一个月的课程眨眼间就结束了,可我的写作生涯也仅仅只是开了个头。激情退去,静心当下,每每翻开自己写下的一篇篇心深深爱,浅浅藏1hr前段时间家人身体不适,我陪他一起去合肥看病,事先联系好的姐夫,也应允第二天陪同我们一道去。这边放下手机,家人就央及我安排好孩子,准备往合肥赶赴。出行的时候已经是晚间六时,抵达秋风中,那清冷的紫菊可是谁?走进十月,入了深秋。这个万物开始凋零的时节,路边那清冷的紫菊在优雅地绽放。多年来,我心中默认这紫菊就是马兰。不敢确认,便去查找资料。原来有三种菊都开这样的花,分别是马兰紫菀狗娃花。牻牛儿苗,你见过吗?在路边,我偶尔会见到它,不知为何它有如此奇怪的名字,叫牻牛儿苗。我一朋友说,因为它的蒴果像啄木鸟的嘴巴,方言叫喰的么子,你们那里叫什么呢?确实,它的蒴果中轴延长就像鸟喙一样。成熟时