范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

统计学重要支柱正态分布

  今天发扬一下科学精神,我们聊一聊正态分布。
  1801年1月,意大利天文学家朱塞普-皮亚齐在天空中发现了一颗新星,但这哥们在夜空中出现6个星期、扫过8度角之后,就在太阳光下彻底消失了,再也观测不到。遗憾的是,当时皮亚齐留下的观测数据极为有限,所以也计算不出来新星的轨道,天文学家甚至无法确定这颗新星到底是行星还是彗星。不过天文学家虽然搞不定,但有一位数学家却对这个问题产生了兴趣,他就是数学王子——高斯。为了重新发现这颗新星,高斯直接创立了一种全新的星体轨道计算方法,短短一个小时之内,就计算出了星体的轨道,并预言了它在夜空中出现的时间和位置。算的对不对呢?1801年12月31日夜晚,德国天文学家奥伯斯在高斯预言的时间里,把望远镜对准了预言的位置,果不其然,这颗新星重新回到了人类视野,它就是人类发现的第一颗矮行星——谷神星。
  皮亚齐
  谷神星
  如果说高斯之前只是在数学界如雷贯耳的话,那么从此开始,高斯在整个欧洲名声大震。而他所用到的数据分析方法,正是正态分布。事实上,高斯并不是发现正态分布的第一人,但正态分布无疑是因为高斯才被世人所知,于是正态分布也被称为"高斯分布"。当然了对于高斯这种数学天才来说,他的发现不胜枚举,一个正态分布算不上什么大事儿,但后人显然不这么认为,因为正态分布确实成为了一个强有力的数学工具,于是我们就发现,在10马克高斯头像的旁边,印的正是正态分布,而不是他引以为傲的正十七边形。那么正态分布究竟是个什么东西呢?不用慌,它其实非常简单。
  10马克
  其实客观地说,正态分布这个名字起的不是很好,让人有一种敬而远之的感觉,当然了这是翻译的问题,事实上,它的英文非常简单,就叫normal distribution,你听听咱这个苏格兰调情发音,直接翻译过来就是正常的分布,所以台湾省的翻译就比较直观了,人家就叫"常态分布"。也就是说,除了正态分布以外,其他分布都是特殊的,只有正态分布才是一般的、正常的和普遍的,既然如此,它的重要性就可见一斑了。
  从形态上看,正态分布就十分简单,无非就是一条对称的钟形曲线,中间很高、两边下降,就像一个鼓起来的山包,或是鼓起来的其他东西,你懂的。横坐标代表随机变量的取值范围,越往右,随机变量的值就越大,越往左,随机变量的值就越小。而纵坐标则代表概率的大小,最下面的概率是0,越往上概率就越大。如此一来,在曲线上随便找一点,确定它的横坐标与纵坐标,我们就可以知道这个值出现的概率是多少。由于这条曲线是左右对称的,所以中间的最高点,就代表平均值出现的概率最大,数据最多,而两边呈陡峭下降趋势,就意味着越是靠近平均值,数据就越多,反之,数据就越少。可以说对于很多数值的统计,都呈现为典型的正态分布,比如说人的身高、体重、智商、考试分数、股票基金收益、公司收入,还比如说节目的收看数量,都符合正态分布,像是咱2049每期节目的播放量,估计就是在这条钟形曲线的最左边那部分,那些富有科学精神的,自然就在最右边,我们知道,左代表无产阶级,右代表资产阶级,他们是不具备革命性的。当然了这是我胡扯的。
  正态分布曲线
  好了接下来我们再进一步整点高端的。整体来看,正态分布有三大数学性质。
  第一个性质是:均值就是期望值。也就是说,正态分布曲线中间最高点的横坐标,不仅代表着随机变量的平均值,而且也代表着它的数学期望,这一点已经得到了数学上的严格证明,至于是怎么证明的,打死我也不告诉你。我们知道,数学期望代表着长期价值,而现在平均是又是数学期望,所以在正态分布中,平均值就代表着随机事件的价值。
  比如说一个小妹妹和我网聊,在没有奔现之前,她是不知道我身高几何的,于是她对我身高的期望值就是174cm,因为174cm正是辽宁省男性的平均身高。还比如说我们常用高考的平均分,来衡量一所高中的教学质量,为什么,原因也在于平均值就代表期望值,而期望值正代表着随机事件的长期价值,一个学校平均分总是600,那这个学校肯定不会差,但如果它只告诉你最高分,对平均分避而不谈,这就很有问题了。当然了还需要注意的是,只有在正态分布中,平均值才具有这样的意义,如果不是正态分布,平均值基本就不能说明什么问题了,比如说现在10个人组成一个团伙,我、黄博士、潘博士、张博士、再加5个要饭的和一个比尔-盖茨,这个群体的个人资产,显然不呈正态分布,那我告诉你,我们的平均资产是50亿美元,就没有任何意义。
  正态分布的第二个性质是:极端值非常少。也就是说,大多数数据都集中在平均值附近,比如说还是刚才网聊那个例子,小妹妹对我身高的期望是174cm,那么在174cm上下浮动正是我最有可能的身高。同时也正是因为极端值非常少,所以极端值对平均值的影响也非常小,也就是说,正态分布非常稳定,不管姚明和潘长江是不是辽宁人,辽宁男人174cm的平均身高并不会产生什么变化,除非你像珠穆朗玛一样高,但这显然是不可能的,这还叫人么?这么高只能是科普人。
  正态分布的第三个特征是:标准差或是说方差决定形状。可以发现,正态分布虽然都是钟形曲线,但形状是各不相同的,有的会矮胖一些,有的会高瘦一些,而造成这种差异的原因,正在于标准差的不同。高中数学告诉我们,标准差或是方差,可以描述随机变量的波动情况,标准差越大,数据波动越剧烈,反之,数据波动就越平缓。具体到正态分布中也一样,标准差越大,数据越是分散,波动越是剧烈,钟形曲线看起来就会更加矮胖。而标准差越小,数据就会更加集中,波动不怎么剧烈,钟形曲线就会更加高瘦。当然了这可能与你直观看上去有点出入,不过你仔细想想我想应该可以想明白,如果绞尽脑汁还是想不明白,简单,漂亮小妹妹可以来问我,我手把手教给你,嘴对嘴告诉你,那是一发入魂、终生难忘。
  总之通过以上三大特征我们可以发现,平均值决定了正态分布曲线的最高点,平均差或是方差,决定了曲线的弯曲度,两个数据就可以确定曲线的形状,实在是不知道高到哪里去了。
  好了一个正态分布我们可以对其进行分析,那么不同的正态分布曲线可不可以进行比较呢?当然是可以的。具体来看就是三种情况,一是方差相同、平均值不同,在这种情况下可以比较好坏,这很简单,比如说两所高中的高考分数,标准差一样,自然是平均分越高,教学质量越高。
  第二种情况是平均值相同、方差不同,这种情况可以比较波动,比如有统计显示,男女智商的平均值是差不多的,但在正态分布曲线上,男性智商的曲线要矮胖一些,女性智商的曲线要高瘦一些,这就说明,虽然整体上看,男女智商没有高低之分,但男性智商值显然更加分散,波动比较大,极端数据存在的情况比较多。也就是说,男性智商超群的人要比女性更多,同样的,傻X也是男人更多,比如说我和黄博士,还有那些特别喜欢抬杠和认死理的键盘侠,我看基本都是男性,而在我接触的无数女性中,我就没有发现什么低智商。
  第三种情况就是方差和平均值都不同,这就可以比较专业和业余了。比如说我和许海峰比赛射击,人家许海峰肯定是9环、10环、11环来回转,波动十分小,平均值非常高,直观表现就是正态分布曲线非常高瘦。我就完了,一会1环、一会2环,偶尔还能蒙个9环、10环,有时候还能打到裁判,所以我的成绩波动就十分大,同时平均值也非常小,直观表现就是曲线非常矮胖,恨不得平了。
  好了最后一个问题,正态分布这玩意究竟有什么用?简单来说就是,它可以为我们提供一个估算个体在整体中位置的便捷方法,像智商、身高、体重、考试成绩等,只要服从正态分布,我们就可以快速得到答案。比如说我表弟今天高考,估分估了560,然后网上就会告诉他预计排名,那么哪些网站是怎么做到的呢?你可能会认为,它一定是收集了所有人的估分数据,然后得出答案,其实根本不用这么麻烦,再说了它也得不到所有人的数据,事实上,它只要得到一部分数据,然后通过平均值和方差构建出一个正态分布模型,就可以大致得出560分在全省的排名。还有一个应用我估计你每天都会遇到,这就是在电脑开机的时候,都会告诉你,啊,你的电脑太快了,打败了全国百分之90几的用户,用到的办法也是正态分布。再见。

传感器技术的突破为绘制地下世界地图铺平道路利用量子技术找到一个隐藏在地下的物体这是一个期待已久的里程碑,对工业人类知识和国家安全具有深远的影响。英国国家量子技术中心的伯明翰大学研究人员在自然上报告了他们的成就。这是世界上第MaxSys900激光气体分析仪的工作原理MaxSys900激光气体分析仪是一种使用了单行分子吸收光谱的气体分析仪。一个激光二极管发出一束接近红外激光,它被传送通过过程气体并被一个接收器单元检测到。激光二极管发出的激光波长时间是什么?时间如何在宇宙运作?宇宙中的一切都在发生变化,时间是少数拥有规律,而且难以改变的事物之一。时间具有稳定向前发展的特性,因此时间可以帮助我们探索过去体验现在预测未来,时间的本质非常复杂,但是时间的作用非春天来了新的证据表明当恐龙杀手小行星撞击时结束恐龙统治的希克苏鲁伯小行星是地球历史上最重大的撞击灾难之一,科学家们现在已经确定了这一致命事件发生的时间。新的证据表明,小行星在北半球的春季撞击,而对于南半球的撞击,这将是秋季熵增与时间地球也是个熵增的整体,动物的意识也是熵增过程中化学反应的宏观体现。想象一下,冰山河流湖泊海洋连成一线。冰山是太阳,河流类似光子的能量传输,湖泊是能量的蓄水池,逆熵过程就类比河流在某乘坐哈雷彗星直播太阳系(附哈雷彗星所有出现时间)乘哈雷彗星旅游太阳系华夏2060年新闻联播我国科学家制造的天宇1号飞船将于近期接近哈雷彗星,并择机释放瓜瓜探测器登陆彗星表面。该探测器是我国著名科学家北极狼先生呕心沥血研制的,可以科学研究的世界是越来越明朗了吗?并不是,无止境的科学等着我们对于科学素养稍有认识的朋友都知道,我们现代的科学技术越来越发达,我们所探索的领域也越来越广阔。在宏观领域,人类正在探寻我们可观测宇宙的边缘,宇宙尺度的空间成为研究的目标,甚至多宇宙原子内部99都是真空的?里面到底隐藏了哪些秘密?世界之大,无奇不有,在我们所认知的世界中,隐藏着很多我们不知道的秘密,曾经人类以为地球就是唯一的世界,但是随着人类科技的进步,现在人类知道了地球并不是唯一的世界,在地球的外面还有宇100万年后的人类多强大?科学家拟出草图,人类不再惧怕死亡综述我们的地球有着46亿年的历史,但是人类只在这个蓝色的星球上生存了几十万年,这个跨度差是相当大的,但是就是在这几十万年里,人类从饮毛茹血的原始动物逐渐进化成了一个有着相当实力的文这个奇怪倾斜的黑洞可能会颠覆我们对它们如何形成的理解黑洞可以成为整个宇宙中最迷人的现象的有力证明,科学家们不断发现更多关于它们工作和行为方式的信息包括它们最初是如何产生的。现在,一项对距地球约10,000光年的异常错位的新研究提供了影响世界科学的10个顶级物理学家,中国只占1位人类是地球上最有智慧的生命,人类从诞生以后就开始探索世界的奥秘,经过几千年的探索,人类终于对宇宙有了大概的认识,不过这一切都离不开伟大的科学家,在人类历史上,有很多伟大的科学家,他
如果乘坐飞船以10亿倍光速朝一个方向飞行,能到达宇宙边界吗?先说答案即使10亿倍光速的飞船也不会到达宇宙边界。你认为朝宇宙一个方向飞行会到达宇宙边界,但最后很有可能回到出发点。下面详细谈一下。一,首先,10亿倍光速的飞船是不会存在的,你不考太阳系是怎样形成的?我们的太阳系大部分也可以视为三个作用定律的产物,分别是能量守恒动量守恒和引力。能量守恒定律说的是能量既不能创生也不能消灭,只能转换形式。常见的例子包括化学能转换成火的热能,跳伞时势太阳系究竟有多大?人类不革新技术,几百年都不可能飞出太阳系太阳系,一个熟悉又陌生的名词,我们之所以熟悉它,是因为我们就生活在其中,它是我们的家,我们之所以又感到陌生,是因为它太大了,目前我们对它知之甚少。太阳系运动轨迹人类的好奇心,是促使盘点太阳系中的巅峰最高的山峰不在地球上在古代中国的诗经小雅车舝(念xi)中,对高山的崇敬之情有过这样的描述高山仰止!原意为高大的山峰,令人叹为观止。后经司马迁引用于对孔子的评价高山仰止,景行行止,虽不能至,心向往之。高编程与数学无符号二进制数递增演示二进制数递增(就是加1)是CPU(计算机的中央处理器)的基本操作之一。这里先演示无符号数的递增。程序是先随机产生一个四位无符号二进制数,你用鼠标点一下加1按钮,这个数就加1。你会发中国地貌的东西差异中国东西部具有完全不同的地貌景观。东西分界大致以贺兰山六盘山龙门山和横断山脉为界。西部地区山脉和盆地延伸以北西西向为主,高山耸立,中间隔以盆地,形成山系与盆地并列的面貌。西部自北向最全地球气候与地质年代梳理侏罗纪大冰期中国地貌形成原因地球隐生宙时代(前寒武纪)太古宙,距今3825亿年。起始于太阳系后期重轰炸期(又名月球灾难),结束于25亿年前的大氧化事件(地球氧气突然增多)。这时候的地壳和大气还处于原始状态。虽运动的大地,奇特的地貌,与火山和地震有关系吗?我们脚下的大地每天都会动。因为地球内动力的作用,地壳会时刻不停地机械运动,我们称之为构造运动。地震就是一种快速构造运动,但在平常,构造运动很慢,我们很难察觉。比如喜马拉雅山在不断变那些发生在身边的不可描述的事件小时候遇到一件事,亲身经历的。那是03年的时候,我11岁,我爸在外地忙生意很少回家,我妈夜班特别多,一般都是凌晨3点下班,一天也是我妈夜班我在家睡觉,晚上来了个电话,我妈工厂里老板四川为什么会发生强震四川,简称川或蜀,省会成都,被誉为天赋之国。位于我国西南部,青藏高原边缘,其东西长1075公里,南北宽921公里,面积48。6万平方公里,人口8341万,GDP生产总值为46615四川凉山为何一而再,再而三的发生火灾凉山,别名凉山州,隶属于四川省西南部,川滇交界高原,横断山脉中部,面积6。01万平方公里,人口521万人左右,GDP生产总值1481亿人民币,下辖地区1个县级市,15个县,1个自治