K近邻算法在医学影像中的应用

　　一、 K近邻算法基本概念
　　K-近邻算法（KNN, K-Nearest Neighbor）是模式识别中最古老的机器学习方法之一。KNN算法能够灵活地融合不同类型的数据，并且能够适应不规则的特征空间。在模式识别这个领域中， k 最近邻算法（KNN）是一种主要用于分类以及回归的非参数统计方法 ，是一种惰性学习的算法。惰性学习在最开始的时候不会根据已有的样本创建目标函数,只是简单的把训练用的样本储存好,后期需要对新进入的样本进行判断的时候才开始分析新进入样本与已存在的训练样本之间的关系,并据此确定新实例(新进入样本)的目标函数值。KNN分类的基本原理如下图所示，
　　图3.4.1 K近邻算法原理图
　　上图中，所有样本可以使用一个二维向量表征。图中，蓝色方形样本和红色三角形样本为已知分类样本。若使用KNN对图中未知分类样本A进行分类，当K=3时，其三近邻中有2个红色样本和1个蓝色样本，因此预测该待分类样本为红色样本；当K=5时，其三近邻中有3个红色样本和2个蓝色样本，因此预测该待分类样本为蓝色样本。
　　KNN算法有以下几个要素：数据集 （data set）；样本的向量表示 （Vector representation of samples），即不管是当前已知的样本数据集，还是将来可能出现的待分类样本，都必须可以用向量的形式加以表征。样本的向量表现形式，构筑了问题的解空间，即囊括了样本所有可能出现的情况。向量的每一个维度，刻画样本的一个特征，必须是量化的，可比较的；样本间距离的计算方法 （The calculation method of sample distance），包括欧式距离， 余弦距离,曼哈顿距离
　　K是一个重要参数，当k选不同值时会产生不同的结果。通常，k值的设定采用交叉检验的方式（以k=1为基准）
　　选择较小的K值，就相当于用较小的领域中的训练实例进行预测，＂学习＂近似误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是＂学习＂的估计误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生过拟合；
　　选择较大的K值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少学习的估计误差，但缺点是学习的近似误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单。
　　K=N（N为训练样本个数），则完全不足取，因为此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的类，模型过于简单，忽略了训练实例中大量有用信息。
　　在实际应用中，K值一般取一个比较小的数值，例如采用交叉验证法（简单来说，就是把训练数据在分成两组:训练集和验证集）来选择最优的K值。
　　二、 K近邻算法在医学影像中的应用
　　KNN算法在医学图像处理领域应用更加广泛，对于乳腺癌的检测、脑部图像分类与检测
　　以及脑卒中检测有着很好的分类效果。主要是应用于医学图像分类包括MRI分类、指纹真假识别、心率检测分类等。
　　1、基于 K -最近邻规则的磁共振颅脑图像分割算法
　　一种简单实用的磁共振颅脑图像分割算法 K-最近邻( 简称 K-NN) 规则, 并利用该算法对磁共振颅脑图像进行分割研究。首先利用边界跟踪法对磁共振颅脑图像进行预处理, 将 MRI 图像转换为二值图像，利用边界跟踪得到大脑结构的边界线，根据边界线提取大脑结构，剔除颅骨和肌肉等非脑组织, 只留大脑结构。
　　图3.4.2用边界跟踪法进行预处理
　　然后利用 K-NN 规则对大脑结构进行分割, 根据解剖学的知识, 从原始图像的不同区域 中选取部分象素并给出标记作为训练样本, 把该训练样本记作集合，
　　确定未分象素 z 的最近邻数k 的值，选择欧氏距离 d 作为距离测度，对每个未分类像素 z 进行归类处理,即根据像素间的欧氏距离基于简单多数投票原则对像素分类到即 WM 、GM 、CSF 和背景四个区域中。分割算法在预处理步中能精确地分割出大脑结构, 在 K-NN 分割步中能很好地从大脑结构中分割出白质(WM) 、灰质(GM) 和脑脊液(CSF)。
　　图3.4.3 用KNN算法进行分割
　　2、利用K近邻算法对视网膜眼底图像微动脉瘤进行自动检测
　　糖尿病性视网膜病变(DR)是导致新失明的主要原因之一。早期准确地发现微动脉瘤对糖尿病视网膜病变的诊断和分级具有重要意义。然而，眼科医生手动诊断糖尿病患者是一项耗时的工作，而且容易出错。因此，糖尿病患者视网膜的自动分析是眼科医生筛查更大人群的迫切需要。微动脉瘤是糖尿病视网膜病变的重要病变。在眼底图像中，MAs表现为微小血管附近的小而圆的点。它们可能是唯一的病变，存在于DR的最早阶段，并在疾病的发展过程中一直存在。因此，在计算机辅助筛选系统中MAs的检测是必不可少的。
　　提出了一种眼底图像中MAs（微动脉瘤）的自动检测方法。该方法包括四个主要步骤:预处理、候选特征提取、特征提取和分类。在KNN分类器中提取了27个包含局部特征和轮廓特征的特征，用于区分真MAs和伪MAs。该方法已在两个公共数据库(ROC和e-optha)上进行了评估。实验结果证明了该方法的有效性和有效性，具有应用于临床诊断的潜力。
　　图3.4.5 预处理流程
　　视网膜眼底图像往往是光照不均匀、对比度差和噪声图像。MAs在低亮度和低对比度区域几乎不可见。为了减少这些缺陷，制作出适合MA候选图像和特征提取的图像。文章采用了照明均衡、限制对比度的自适应平均直方图和降噪三个步骤对原始图像进行了预处理。 接着进行候选提取步骤在整个检测过程中起着重要的作用。该步骤的主要目标是减少与MAs不相似的对象的数量。但是，在这一步中丢失的任何真实的MAs都不能在以后恢复。
　　Lazar提出的特征源自剖面分析。本文将这些特征定义为轮廓特征。并添加了三个新的轮廓特征来提高性能。但这些剖面特征不能很好地反映MAs的整体特征。因此也研究了MA及其周围环境，并提出在分类中加入局部特征。因此，在该分类器中，除了形状和强度特征与 轮廓特征外，还使用了局部特征。
　　最后将第二步中提取到的特征用一个27维的特征向量来表示，然而，不同的特征fi具有不同的范围和值，这对于一些分类器来说是不利的。这些特征的均值和单位方差都归一化为，其是特征向量的均值，是标准差。为了为特征集选择合适的分类器，我们选择了三个监督分类器作为底层分类器:K近邻(K Nearest Neighbor ,KNN)、朴素贝叶斯(Naive Bayes ,NB)和Adaboost。在ROC数据库上测试了这三个分类器。结果表明，KNN (k = 14)和Adaboost有相似的性能，都优于NB分类器。文章选择KNN (k = 14)分类器进行分类，分类效果如下图所示。
　　图3.4.6 三种分类器的ROC曲线

231米，新纪录！海牛二号深海海底钻机成功，可燃冰开采领先全球南海可燃冰开采，对于我国的科研团队来说是一件重要的事情。前段时间，中国地质调查局勘探技术研究所一种海底钻井井口稳定装置获国家实用新型专利，累计在吸力锚技术领域获得实用新型专利9项。慎重！解读日本决定核污水排入大海的危害专家只有排放，才知道日本首相菅义伟表示将决定核废水排海的决定，一时间在网络上引起了非常大的争议。他声称专家经过6年的谈论，做出这个决定，难道在日本专家的心中，这样的核废水难道是不会造成环境污染吗？听到脸皮厚！被中国多次拒绝后，美国又来了！最近发现火星有冰火星一直以来是各个国家太空探索的重要的里程碑，我也去年发射的天问一号火星探测器，标志我国已经加入到火星探测任务。虽然我国天问一号相对美国毅力号出发时间早，但美国的毅力号已经成功着陆4。2万吨！全球最大蓝鲸1号钻井平台中国创造世界第一提到可燃冰，大家都会引以为傲，我国可燃冰储备量全球第一，可燃冰开采供全国可以使用上千年。但是可燃冰的开采一直以来都是一个世界难题，而我国可燃冰开采已经取得突破性成就，成功开采可燃冰自主研制！中国首台单机7兆瓦海上风电机组未来漂浮式海上风电中国最大直径叶轮！能得到如此称号的风轮必定有它的过人之处，拥有足足186米长扫风面积，相当于四个足球场面积。它的出现加快推进我国海上风电的绿色能源的发展，该项目可以解决广东省煤炭资国产芯片弯道超车？中国碳基芯片领域突破关键技术不用光刻机？提到芯片，很多人都会相当美国对我国芯片的卡脖子，导致我国目前的芯片急剧匮乏，华为麒麟芯片出现严重不足，就连高通的芯片进入中国市场，也设下了层层阻碍。其中主要的原因中国科技水平已经实全球最远距离！中国发明透视眼1。43公里，全球仅中国做到了提到透视眼，大家最想了解的都是在喜剧电影里面看到过。一直以来科学家们都在研发这样的科学技术，最近我国科学家已经实现了1。43公里远距离隔墙观物技术，这项技术被称为非视域成像。从字面中国又一个全球第一！中国3。5亿启动120米脉冲星专属望远镜提到射电望远镜，大家应该会第一个想到的是中国天眼FAST，FAST的口径为500米的球面射电望远镜，让中国天眼成为了世界巨眼。中国天眼FAST自建立成功截止目前已经发现宇宙中3001亿摄氏度！全球最大的人造太阳6月试运行中国做了什么？说起人造太阳，相信大家并不陌生。在全世界上，除了中国实际上还有许多国家都在进行人造太阳的设计研发。其中最具代表性的是，全球最大的核聚变反应堆ITER，位于法国南部，目前已经安装调试经济学家能把美国的大危机包装成大好事，不过你会信吗？袁岚峰关注风云之声提升思维层次导读不是忽悠的人厉害，而是人自己就想被忽悠。视频链接西瓜视频httpswww。ixigua。com6932309244964241927本视频发布于2021美军事基地被炸成火海，联合四国剑指伊朗，最高领袖戳穿对方目的一直以来，很多人就对美国和以色列针对伊朗一事感到困惑，实际上，以色列之所以执着打压伊朗，主要就是想瓦解对方核力量，以保证本国安全，而美国则是想要进一步提升自身在中东的地位，而打着反

<<<<<<－>>>>>>

855光年外，系外行星温度高达3000K，铁蒸汽到处飘去年夏天，全世界经历了一场恐怖的高温，许多地区突破40甚至50摄氏度。包括美国死亡谷，追平了54。4的地球最高气温纪录。在太阳系内，地球并不算是最炎热的行星。距离我们最近的行星金星造价百亿美元的最强天空之眼究竟值不值赛先生天文詹姆斯韦伯空间望远镜的金镜，图片来源NASA导读FirstFrost詹姆斯韦伯空间望远镜（JamesWebbSpaceTelescope）于2021年圣诞成功发射，宣告人类天文探索巡天，我们到底是在巡找什么？银河画卷启动二期巡天，预计持续10年巡天，我们到底是在巡找什么？在青海省海西州德令哈市以东35公里，海拔3200米的戈壁滩上，一只巨大的白色圆球耸立在苍凉的群山之间。13。7米毫米牛顿对万有引力理论的解释，究竟错在哪里牛顿从1665年至1685年，花了整整20年的时间，才沿着离心力向心力重力万有引力概念的演化顺序，才提出万有引力这个概念和词汇。自然哲学的数学原理第三卷中写道最后，如果由实验和天文高分三号02星入列刘锦洋张未刘庆丰科技日报记者付毅飞记者从国家航天局获悉，2021年11月23日7时45分，我国在酒泉卫星发射中心用长征四号丙遥三十七运载火箭成功发射高分三号02星。该卫星的成功发射圆周率的尽头是什么？本人前一篇的文章中，记录了蜥蜴人火星地球等往事，这一篇重点记录蜥蜴人的武器之一混沌及圆周率。圆周率同样的，本文奇思妙想，各位仅当故事观看。蜥蜴人X蜥蜴人X一行4人到达地球后，发现由远望6号船护送高分三号02星顺利入轨11月23日清晨，搭载着高分三号02星的长征四号丙运载火箭在酒泉卫星发射中心点火升空，火箭平稳飞行一段时间后，在印度洋预定海域待命的远望6号船准确捕获目标，接过陆海测控接力棒，顺利看得更久更清更快揭秘高分三号02星来源新华网新华全媒看得更久更清更快揭秘高分三号02星新华社北京11月23日电题看得更久更清更快揭秘高分三号02星新华社记者胡喆11月23日，我国在酒泉卫星发射中心用长征四号丙运载火我们在缅甸琥珀里都能看见什么？多样世界生生不息缅甸琥珀形成于地球生命发生重大变化的时代。被子植物发生迅速辐射，这对昆虫动物群来说具有相当大的影响。反映在琥珀中就是，这些琥珀所包含昆虫的科既有延续到现代的，也有已哺乳动物的崛起泥盆纪末期，由鱼类演化成的螈类，爬上陆地，进化出四足，鳃呼吸进化成肺呼吸，成为最原始的陆生脊椎动物，回水中产卵，称两栖类。一亿年后，两栖类完全脱离水，心脏更先进，3。2亿年前，羊膜航天员为何要出舱，太空出舱的难点在哪，中国在国际上属什么水平关于载人航天来说，中国不是最早的，但是也却掌握的相当成熟。我国的航天成就在最近这些年有了很大的发展，航天发射计划接连不断，载人航天任务的更替时间也比之前更加频繁。在神舟十二号刚返回