范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

python5种正态性检验方法

  写在前面的话:码字不易,点个赞关注一下作者再走吧[呲牙]
  ================================================================1.描述性统计方法(直观)
  1.直方图
  由于正态分布具有非常典型的中间高,两边低的图形特征,如果样本数据并不服从正态分布,我们可以通过直方图很快地分辨出来。更进一步地,Python可以辅助生成基于样本数据估计的正态曲线,这样就容易辅助我们进行判断。
  图形观察虽然直观,但是部分研究者认为单纯观察图形过于主观,因此我们也可以选择使用统计检验的方法去研究数据是否服从正态分布。
  操作步骤:
  导入相关的包及数据  import pandas as pd import matplotlib.pyplot as plt import seaborn as sns #用来显示中文标签 plt.rcParams["font.sans-serif"]=["SimHei"] #用来正常显示负号 plt.rcParams["axes.unicode_minus"]=False  #导入数据 data = pd.read_excel("年龄_收入.xlsx") #绘制年龄的频率直方图,20个箱体 plt.hist(data.年龄,bins = 20) #绘制年龄带正态曲线的频率直方图 sns.distplot(data.年龄)
  2 P-P图及Q-Q图
  直方图是最长用于观察数据分布的常用图形选项,尤其是带正态曲线的直方图,可以非常直观地看到实际数据分布和正态曲线的对比,而P-P图及Q-Q图则是另一种选择,它可以直观给出实际数据分布和理论的差距。
  值得注意的是,虽然P-P图及Q-Q图常用用于判断数据样本是否服从正态分布,但实际上它们也能判断数据样本是否服从其他的分布
  P-P图:反映的是数据的实际累积概率与假定所服从分布的理论累积概率的符合程度。在此处,我们所假定的分布就是正态分布,如果数据样本是服从正态分布的话,那么实际的累积概率与理论的累积概率应该是相对一致的,放映在图形中就是数据点应该沿着图形的对角线分布。
  Q-Q图的原理与P-P图几乎一致。P-P图考察的是实际分布与理论分布的累积概率分布差异,而Q-Q图考察的是实际百分位数与理论百分位数的差异。同理在此处,我们所假定的分布就是正态分布,如果数据样本是服从正态分布的话,那么实际的分布应该是相对一致的,反映在图形中就是数据点应该沿着图形的对角线分布。
  在Python中,statsmodels包中目前主要提供的是Q-Q图的绘制  import statsmodels.api as sm import pylab sm.qqplot(data.年龄, line="s") pylab.show() sm.qqplot(data.收入, line="s") pylab.show() 2.K-S检验
  柯尔莫戈洛夫-斯米诺夫检验(Kolmogorov-Smirnov test),一般又称K-S检验,是一种基于累计分布函数的非参数检验,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。
  K-S检验的原假设是"样本数据来自的分布与正态分布无显著差异",因此一般来说,KS检验最终返回两个结果,分别是检验统计量及P值,检验结果P>0.05才是我们的目标。  from scipy.stats import kstest #cdf中可以指定要检验的分布,norm表示我们需要检验的是正态分布 #常见的分布包括norm,logistic,expon,gumbel等 kstest(data.年龄,cdf = "norm")
  实际上,GraphPad不推荐使用单纯的Kolmogorov-Smirnov test方法  3. W检验
  夏皮洛-威尔克检验(Shapiro—Wilk test),一般又称W检验。W检验是一种类似于利用秩进行相关性检验的方法。同样需要注意的是,W检验与K-S检验一样,原假设是"样本数据来自的分布与正态分布无显著差异",因此一般来说,W检验最终返回两个结果,分别是检验统计量及P值。,检验结果P>0.05才是我们的目标。
  当数据集中的数据无重复值时,该方法的检验效果比较好,但是当数据集中有些数据不是独一无二的,即有些数据的数值是相同的,那么该方法的检验效果就不是很好  from scipy.stats import shapiro shapiro(data.年龄) 4.D"Agostino and Pearson omnibus normality test
  GraphPad官方推荐使用该方法。
  首先计算 偏度和峰度以便在不对称和形状方面量化分布离高斯分布的距离。然后,其计算这些值中的每一个与高斯分布的预期值之间的差异,并基于这些差异的总和,计算各P值。这是一种通用和强大的正态性检验,推荐使用。请注意,D"Agostino开发了几种正态性检验。Prism使用的其中一个是"综合K2"检验。  import scipy.stats from scipy import stats stats.normaltest(data)#normaltest中pvalue>0.05符合正态分布 5.安德森-达令检验(Anderson-Darling test)
  安德森-达令检验样本数据是否来自特定分布,包括分布:"norm", "expon", "gumbel", "extreme1" or "logistic".
  原假设 H0:样本服从特定分布; 备择假设 H1:样本不服从特定分布  ##用Anderson-Darling检验生成的数组是否服从正态分布 import scipy.stats as stats stats.anderson(data_norm, dist="norm") """输出AndersonResult(statistic=0.18097695613924714,                        critical_values=array([ 0.555,  0.632,  0.759,  0.885,  1.053]),                        significance_level=array([ 15. ,  10. ,   5. ,   2.5,   1. ])) 如果输出的统计量值statistic < critical_values,则表示在相应的significance_level下, 接受原假设,认为样本数据来自给定的正态分布。"""
  实际上,从已有的文献表明,对于数据分布的正态性研究,首选方法是图形观察,即利用直方图、P-P图或Q-Q图进行观察,如果分布严重偏态和尖峰分布则建议进行进一步的假设检验。如果图形分布结果不好判断,则再进行正态性检验。
  实际上,从已有的文献表明,对于数据分布的正态性研究,首选方法是图形观察,即利用直方图、P-P图或Q-Q图进行观察,如果分布严重偏态和尖峰分布则建议进行进一步的假设检验。如果图形分布结果不好判断,则再进行正态性检验。
  其次,对于检验方法来说,对于K-S检验及W检验结果来说,有文献采用蒙特卡罗模拟方法进行多次验证,结果表明W检验结果相比于大部分方法都有较大的检验功效,而K-S方法的检验结果相对不佳。并且部分学者认为,K-S检验的实用性远不如图形工具,因为在样本量少时,该检验不太敏感,但是在样本量大时,该检验却过于敏感。因此正常情况下,我们更常采用W检验的结果。
  值得注意的是,虽然说K-S检验结果相对不佳,但是不同检验方法对于样本量的敏感度是不一样的。在样本量较小的情况下(小于50个样本的情况下),请优先选择W检验;在样本量50-5000的情况下,可以酌情使用W检验及K—S检验;在样本量大于5000的情况下,请使用K-S检验结果,尤其是在SPSS中,当样本量大于5000的情况下,将只显示K-S检验结果,而不显示W检验结果。

HMS3。0麒麟90005G,华为Mate新机稳了,最快4月份发布都在感叹这几年华为在手机行业的路不好走,不仅仅是供应链和核心技术的打压,华为在海外的市场也被封锁了,对于华为来说,手机业务的巅峰状态已经不复存在,但大部分花粉消费者对于华为还有很大华为悄然推出2万元新机,麒麟90005G,能买两部iPhone13ProMax尽管困难重重,华为也没打算放弃手机业务,今年还会继续发布Mate50系列新机,而且大概率还是4G手机。在虎年春晚上,演员和观众使用的手机,就是华为提供的,比如两款折叠屏MateX2全球市场份额跌破20!为什么华为没了,消费者还是不买三星呢?三星三星作为全球智能手机市场的霸主,最近的形势却是每况愈下,作为主打的S21系列在半年时间内仅销售出了不到1400万台,创下了历代最差销量而曾经风光无限的Note系列更是被直接砍掉Linux内核源码分析之进程概要及调度时机这篇文章从Linux内核层面分析进程概要及调度时机。0。1进程概要进程是对物理世界的建模抽象,每个进程对应一个taskstruct数据结构,这个数据结构包含了进程的所有的信息。在L升级鸿蒙系统后,来看看大家评价如何?没想到口碑崩了但我不同意这两年的华为,处境相信大家都心知肚明,逆流中奋进,虽然发布的手机产品周期变长,但是像华为mate40系列和P50还是获得了消费者的一致好评。而且华为还发布了自家鸿蒙系统,主打万物互iPhone14渲染图曝光14仍用刘海屏14Pro改用打孔屏按照惯例,新一代的iPhone14系列将在今年9月份推出,目前算起来仍有大约7个月的时间。随着时间的推进,网上有关iPhone14系列的爆料信息也在持续增加,目前iPhone14系索尼新无线耳机曝光,8字环状设计,开放式听音体验据我爱音频网了解到,索尼将推出新款Linkbuds(ANC)无线耳机,其型号可能为WFL900,别名LinkBuds。这款新型耳机跟我爱音频网此前跟小伙伴们分享的索尼ambie新形他们有大动作立讯精密牧原股份汇顶科技温氏股份松塔财经最及时有效中立客观的财经公告和公开讯息解读。1立讯精密买票上车?公司控股股东拟100亿买奇瑞相关股份。概述松塔财经获悉,2月11日,立讯精密(002475。SZ)公告1公司oppofindx5真机曝光OPPOFindX5真机曝光,机身流线型,摄像模组和find3完全不同,也有着一些小凸起,全面屏,你期待吗?1。OPPOFindX5普通版屏幕将采用6。7英寸的OLED曲面屏,左上华为的光环,能支持AITO问界M5走多远?在新能源汽车几乎占据主角位置的时代,一款车的成功标准除了可以量化以外,最主要的还有它的销量以及它在市场上的定位。简单的说,消费者在购买车辆的时候,有太多的因素可以决定是否买单,譬如太给力了!第三代半导体光刻机被攻克,国产芯片迎来曙光据报道,全球缺芯已经波及到了169个行业。并且多位芯片行业人士表示,短期内芯片短缺依然难以缓解,至少会持续到今年下半年,甚至2023年都有可能持续存在。因此,芯片越来越受到重视。为
苹果华为加码智能手表主动健康管理或将成为现实每经记者王晶每经编辑文多多年来,功能单一的智能手表始终被认为是智能手机可有可无的补充,但长期不懈的技术投入或终将让它成为和智能手机一样不可或缺的产品。精密传感和数据分析能力的跃升,百度当今社会的地主百度,中国知名互联网,我们了解信息,收集信息的平台之一,是搜索引擎。搜索引擎的出现,给人创造了了解信息的便利,这是事实。今天要说的是百度凭什么商家在百度(互联网)上付费推广后,我作京东001号员工,月薪600却跟了刘强东23年不曾在你巅峰时慕名而来,也未曾在你低谷时背身离开!京东001号员工张奇,用自己在京东23年的坚守实践了这句话。京东001号员工说起国内真正白手起家的企业家,京东创始人刘强东应该是最为何要入坑TypeScript?前端有完没完?Vue3一个很大特点就是能够更好的支持typeScript。TypeScript有啥优点?为什么需要使用它呢?这篇文章带你简单了解一下TypeScript是什么?本文将从两个不同的2022年让人期待的三大旗舰手机,苹果华为堪称神仙打架新的一年马上就要到来,手机圈也传来了不少新机的消息,这三款即将发布的旗舰手机,每一款都很强,非要做对比的话那就是堪称神仙打架!第一款iPhone14Pro最令人期待第一名应该就是i同时使用华为Mate40pro和iPhone13pro两个月后,憋了很多话想说说起苹果和华为,我们不得不去承认他们的实力。苹果算是比较特殊的存在,凭借自研发的ios系统和处理器,从早期进入到国内市场就获得了大家的关注和认可。而华为则是最近几年的时间才被人们慢想买华为P50Pocket,请先接受这4个缺点粉丝看了华为新品P50Pocket折叠屏手机,非常喜欢,好看又轻巧,打算把自己的iphone13pro卖了,换一台华为折叠屏。我和他说了P50Pocket折叠屏手机的4个缺点,他瞬iPhone6S终于要被淘汰了?iOS16升级名单公布,最低iPhone7iOS的支持机型一直是行业内最全的,最新的iOS15。2,就连2015年的iPhone6s都支持升级。不过到了iOS16,情况或许会有所改变。近日苹果关闭了iOS15。1。1的验证华为发布折叠屏手机,8988起吉林支持最高提供20万婚育消费贷款佳华云链企业赋能平台,关注科技工业互联网能源碳达峰碳中和等领域,欢迎关注。一世界首条35千伏公里级超导电缆投运12月22日,世界首条35千伏公里级超导电缆示范工程在上海正式投运。这天玑9000杀疯了!或将成为安卓芯片之王天玑9000上市后,各种评测和跑分接踵而来,作为台积电4nm工艺首发的Soc,把消费者的期待拉开,各项数据表明它全方位压制骁龙8,它还采用了ARMv9公版架构,各方评测显示,天玑9小米自研芯片即将上线,有了它一切问题都解决了?提起芯片设计这个话题,相信对大多数品牌来说都是不轻松的,尤其还是自研,就更难了。而这次小米却放下了一个重磅炸弹,即将推出的小米12会采用自研芯片,这个话题一推出可谓是抓住了不少人的