范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

常见的8个概率分布公式和可视化

  概率和统计知识是数据科学和机器学习的核心; 我们需要统计和概率知识来有效地收集、审查、分析数据。
  现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等)。 这意味着在某些情况下,我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。
  "概率分布是一个数学函数,它给出了实验中不同可能结果的发生概率。"
  了解数据的分布有助于更好地模拟我们周围的世界。 它可以帮助我们确定各种结果的可能性,或估计事件的可变性。 所有这些都使得了解不同的概率分布在数据科学和机器学习中非常有价值。
  在本文中,我们将介绍一些常见的分布并通过Python 代码进行可视化以直观地显示它们。均匀分布
  最直接的分布是均匀分布。 均匀分布是一种概率分布,其中所有结果的可能性均等。 例如,如果我们掷一个公平的骰子,落在任何数字上的概率是 1/6。 这是一个离散的均匀分布。
  但是并不是所有的均匀分布都是离散的——它们也可以是连续的。 它们可以在指定范围内取任何实际值。 a 和 b 之间连续均匀分布的概率密度函数 (PDF) 如下:
  让我们看看如何在 Python 中对它们进行编码:import numpy as np  import matplotlib.pyplot as plt from scipy import stats # for continuous  a = 0 b = 50 size = 5000 X_continuous = np.linspace(a, b, size) continuous_uniform = stats.uniform(loc=a, scale=b) continuous_uniform_pdf = continuous_uniform.pdf(X_continuous) # for discrete X_discrete = np.arange(1, 7) discrete_uniform = stats.randint(1, 7) discrete_uniform_pmf = discrete_uniform.pmf(X_discrete)  # plot both tables fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(15,5)) # discrete plot ax[0].bar(X_discrete, discrete_uniform_pmf) ax[0].set_xlabel("X") ax[0].set_ylabel("Probability") ax[0].set_title("Discrete Uniform Distribution") # continuous plot ax[1].plot(X_continuous, continuous_uniform_pdf) ax[1].set_xlabel("X") ax[1].set_ylabel("Probability") ax[1].set_title("Continuous Uniform Distribution") plt.show()
  高斯分布
  高斯分布可能是最常听到也熟悉的分布。 它有几个名字:有人称它为钟形曲线,因为它的概率图看起来像一个钟形,有人称它为高斯分布,因为首先描述它的德国数学家卡尔·高斯命名,还有一些人称它为正态分布,因为早期的统计学家 注意到它一遍又一遍地再次发生。
  正态分布的概率密度函数如下:
  σ 是标准偏差,μ 是分布的平均值。 要注意的是,在正态分布中,均值、众数和中位数都是相等的。
  当我们绘制正态分布的随机变量时,曲线围绕均值对称——一半的值在中心的左侧,一半在中心的右侧。 并且,曲线下的总面积为 1。mu = 0 variance = 1 sigma = np.sqrt(variance) x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100) plt.subplots(figsize=(8, 5)) plt.plot(x, stats.norm.pdf(x, mu, sigma)) plt.title("Normal Distribution") plt.show()
  对于正态分布来说。 经验规则告诉我们数据的百分比落在平均值的一定数量的标准偏差内。 这些百分比是:
  68% 的数据落在平均值的一个标准差内。
  95% 的数据落在平均值的两个标准差内。
  99.7% 的数据落在平均值的三个标准差范围内。对数正态分布
  对数正态分布是对数呈正态分布的随机变量的连续概率分布。 因此,如果随机变量 X 是对数正态分布的,则 Y = ln(X) 具有正态分布。
  这是对数正态分布的 PDF:
  对数正态分布的随机变量只取正实数值。 因此,对数正态分布会创建右偏曲线。
  让我们在 Python 中绘制它:X = np.linspace(0, 6, 500) std = 1 mean = 0 lognorm_distribution = stats.lognorm([std], loc=mean) lognorm_distribution_pdf = lognorm_distribution.pdf(X) fig, ax = plt.subplots(figsize=(8, 5)) plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=1") ax.set_xticks(np.arange(min(X), max(X))) std = 0.5 mean = 0 lognorm_distribution = stats.lognorm([std], loc=mean) lognorm_distribution_pdf = lognorm_distribution.pdf(X) plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=0.5") std = 1.5 mean = 1 lognorm_distribution = stats.lognorm([std], loc=mean) lognorm_distribution_pdf = lognorm_distribution.pdf(X) plt.plot(X, lognorm_distribution_pdf, label="μ=1, σ=1.5") plt.title("Lognormal Distribution") plt.legend() plt.show()
  泊松分布
  泊松分布以法国数学家西蒙·丹尼斯·泊松的名字命名。 这是一个离散的概率分布,这意味着它计算具有有限结果的事件——换句话说,它是一个计数分布。 因此,泊松分布用于显示事件在指定时期内可能发生的次数。
  如果一个事件在时间上以固定的速率发生,那么及时观察到事件的数量(n)的概率可以用泊松分布来描述。 例如,顾客可能以每分钟 3 次的平均速度到达咖啡馆。 我们可以使用泊松分布来计算 9 个客户在 2 分钟内到达的概率。
  下面是概率质量函数公式:
  λ 是一个时间单位的事件率——在我们的例子中,它是 3。k 是出现的次数——在我们的例子中,它是 9。这里可以使用 Scipy 来完成概率的计算。from scipy import stats print(stats.poisson.pmf(k=9, mu=3)) """ 0.002700503931560479 """
  泊松分布的曲线类似于正态分布,λ 表示峰值。X = stats.poisson.rvs(mu=3, size=500) plt.subplots(figsize=(8, 5)) plt.hist(X, density=True, edgecolor="black") plt.title("Poisson Distribution") plt.show()
  指数分布
  指数分布是泊松点过程中事件之间时间的概率分布。指数分布的概率密度函数如下:
  λ 是速率参数,x 是随机变量。X = np.linspace(0, 5, 5000) exponetial_distribtuion = stats.expon.pdf(X, loc=0, scale=1) plt.subplots(figsize=(8,5)) plt.plot(X, exponetial_distribtuion) plt.title("Exponential Distribution") plt.show()
  二项分布
  可以将二项分布视为实验中成功或失败的概率。 有些人也可能将其描述为抛硬币概率。
  参数为 n 和 p 的二项式分布是在 n 个独立实验序列中成功次数的离散概率分布,每个实验都问一个是 - 否问题,每个实验都有自己的布尔值结果:成功或失败。
  本质上,二项分布测量两个事件的概率。 一个事件发生的概率为 p,另一事件发生的概率为 1-p。
  这是二项分布的公式:
  可视化代码如下:X = np.random.binomial(n=1, p=0.5, size=1000) plt.subplots(figsize=(8, 5)) plt.hist(X) plt.title("Binomial Distribution") plt.show()
  学生 t 分布
  学生 t 分布(或简称 t 分布)是在样本量较小且总体标准差未知的情况下估计正态分布总体的均值时出现的连续概率分布族的任何成员。 它是由英国统计学家威廉·西利·戈塞特(William Sealy Gosset)以笔名"student"开发的。
  PDF如下:
  n 是称为"自由度"的参数,有时可以看到它被称为"d.o.f." 对于较高的 n 值,t 分布更接近正态分布。import seaborn as sns from scipy import stats X1 = stats.t.rvs(df=1, size=4) X2 = stats.t.rvs(df=3, size=4) X3 = stats.t.rvs(df=9, size=4) plt.subplots(figsize=(8,5)) sns.kdeplot(X1, label = "1 d.o.f") sns.kdeplot(X2, label = "3 d.o.f") sns.kdeplot(X3, label = "6 d.o.f") plt.title("Student"s t distribution") plt.legend() plt.show()
  卡方分布
  卡方分布是伽马分布的一个特例; 对于 k 个自由度,卡方分布是一些独立的标准正态随机变量的 k 的平方和。
  PDF如下:
  这是一种流行的概率分布,常用于假设检验和置信区间的构建。
  让我们在 Python 中绘制一些示例图:X = np.arange(0, 6, 0.25) plt.subplots(figsize=(8, 5)) plt.plot(X, stats.chi2.pdf(X, df=1), label="1 d.o.f") plt.plot(X, stats.chi2.pdf(X, df=2), label="2 d.o.f") plt.plot(X, stats.chi2.pdf(X, df=3), label="3 d.o.f") plt.title("Chi-squared Distribution") plt.legend() plt.show()
  掌握统计学和概率对于数据科学至关重要。 在本文展示了一些常见且常用的分布,希望对你有所帮助。
  作者:Kurtis Pykes

夏天穿黑裤子,想摆脱沉闷感?建议从这3点入手,显瘦显高不拖沓黑裤子可以说是一年四季都非常常见的一种裤装单品了,不过也正因为它如此经典,才导致我们很难把它穿出与她人不同的时髦感和气质感。而且,夏季穿黑裤子,还容易显得沉闷呆板!那么,在这个夏天很抱歉,你的配色力该升级了!15套深蓝色穿搭,堪称教学模板文洛薇Hi,我是洛薇,继续我们的时尚穿搭之旅,变美永远不迷路。职场中的深蓝色,如何穿?今天,是实操分享。暮春初夏,绿意渐浓,以始发青蓝为代表的自然风光,将被一派绿意盎然所取代。四季舌头有裂纹,多是身体出现了这两种问题,教你两招,帮你改善大家好,我是李医生。如果你发现你的舌头上出现了很多裂纹,中医上把这种舌象叫做裂纹舌,有的人比较浅,一条裂痕,有些人的裂痕很深很长,有的人的裂纹是横着排列的,有还有些人是竖着或是斜着百病因寒起,被寒气入侵的人,身体会出现这4种变化,是在提示你在群体中,你是否过于与众不同,别人早已换成了半袖,而你却长衣长裤,甚至还要觉得冷。此时的你又是否认为是寒性体质导致的现象?你又知不知道寒气从何而来?对于大家经常说的寒性体质,主要是碘盐是甲状腺结节发物?不想甲状腺报废,3种食物应撤下餐桌碘盐是甲状腺结节发物?实际上,甲状腺患者能不能吃碘盐,这个要根据自己的实际情况进行分析如果患者伴有甲亢,那么碘盐最好不要吃,因为本身甲状腺激素分泌就比较多,如果是患者伴有甲减,那么饭后就躺着,对身体还有好处?但要躺得对,学起来有人说饭后百步走,活到九十九也有人说饭后不能站,会有下垂胃那到底是躺着,还是站着,怎么吃完饭还有这么多的讲究?想做一个健康的人可真难。茶余饭饱过后,肚子里满满的食物,就会懒得动弹一被家长误解的食物,家长们中招了几个?对于宝妈宝爸来说,孩子衣食住行中的每一样都会让父母特别操心,尤其是孩子入口的东西,很多家长都会十分谨慎,一再强调让孩子远离垃圾食品。在父母眼中,垃圾食品对于孩子的危害是非常大的,而31岁刘诗雯将面临无球可打,未来转型方向曝光,或追寻张继科步伐近日有球迷都在关注中国乒乓球队的最新情况,在结束隔离之后,球员们原地解散,很多球员都回到了各自的省队,而孙颖莎这位球星则是独自一人前往四川成都进行了一些集训训练,想要成为更加优秀的转氨酶高不必非吃保肝药来源生命时报航空总医院药学部主任副主任药师席庆陈群前两天,门诊来了一位体格强壮的小伙子,开口就说大夫,我要开你们这最好的保肝药。原来小伙子因为工作需要,经常要喝酒应酬,最近体检发现助眠食物真的有用吗人的一生有13的时间都是在睡眠中度过的。有人说睡觉太浪费时间,大好青春都睡过去了,其实不然。只有把这13的时间睡好,才能让你另外23时间活得更长更好更多姿多彩。失眠是上班族最常见的喝白酒时,建议多吃这3道菜,爽口开胃,更甚酒力导语喝白酒时,建议多吃这3道菜,爽口开胃,更甚酒力成年人避免不了喝酒,朋友小聚的时候来几杯更尽兴,逢喜事的时候更要喝几杯,就连应酬也少不了陪客户领导喝酒。如此多的喝酒场合,你是否经
美元加息收割,下一个斯里兰卡出现?货币贬值,股市大跌18韩国公布了最新的贸易数据。到8月份为止,已经连续5个月出现贸易逆差。进口额大幅度的攀升,但是出口额却维持小幅度的增长。既受到贸易逆差的影响也受到美元升值的影响,韩元的贬值速度越来越中国恒大于8月30日接获联交所的额外复牌指引9月1日,中国恒大在港交所公告称,本公司于2022年8月30日接获联交所的额外复牌指引,包括管理层的诚信及或对本公司管理及运营有重大影响的任何人的诚信,或会对投资者构成风险,并损害美元暴涨刷新20年新高,日元贬值超21,美欧中日谁受益?汇率贬值这个事最近是众说纷纭,有人觉得贬值是好事,它扩大中国商品的竞争力,有助于稳定外贸局面有人觉得你就是瞎说,明明是老美在割韭菜的世界,美联储的疯狂加息正在伤害所有人。那到底美元成品油调价最新消息9月2日,油价预测约涨0。18元升成品油零售价或要上涨,车主提前加油油价最新消息今日2022年9月2日星期五,第17轮国内成品油计价周期已经超过半,以国际原油持续下跌下,零售价预测涨幅再一次缩水,不过依旧高达上调预用积极情绪给自己充电积极情绪可以恢复被耗损的自我。这也就意味着,由于奋力工作消耗大量的脑细胞生活中芜杂的情绪对自我的批评这些东西所损耗的内部动能,可以用积极情绪恢复,让你保持心理健康,维护健康的躯体,文案好好生活,好好爱自己1。跨过星河,迈过月亮,还会有满天星辰。2。万家灯火与群星,人间值得的又一刻。3。爱自己是终身浪漫的开始。4。热爱自己是好好生活的前提。5。当我在追光,我与光同行。6。不必借光而行致自己秋天励志短句文案,不辜负时光的人生感悟说说,正能量满满高质量5万条经典文案资料库,关注我,让发朋友圈配文案,写动态,写心情,上热门更简单。如果有那句话触动你,就复制下来,粘贴到评论区,释放你的心声吧,任何尝试勇敢迈出第一步都是艰难的,对一个人最狠的报复,莫过于这三个字,说到底这才是不简单人海漫漫,浮世如梦。这一辈子我们会遇到各种各样的人,有人与你惺惺相惜志同道合,还有人将你当作眼中钉,处处与你过不去,费尽心思诋毁算计你,每每想起就会让人心烦意乱。说实话,林子大了什20句精选摘抄短句,专治各种心情不好1对自己好点,因为一辈子不长,对身边的人好点,因为下辈子不一定能遇见。2凡是挣扎过来的人都是真金不怕火炼的,他们从一开始就知道信仰之路和幸福之路全然不同。3余生,不期待,不假设,不散文地瓜中午上班,路过一小摊,我居然在摊位的角落里看到了一堆地瓜,被摊主和黄瓜西红柿辣椒放在一起。地瓜,真的是地瓜,我惊喜到。在我的记忆中,自从自己离开家乡,已经好多年没有见到过地瓜了。虽一秒落泪的伤感文案,简短扎心的说说句子!收藏加关注,谢谢你们一你说要敬往事一杯酒,再爱也不回头。实际就算你醉到黄昏独自愁,如果那人伸出手,你还是会跟他走。二有人让你喜欢,有人让你讨厌,有人让你耿耿于怀,有人让你念念不忘,这就是生活。三我生活