最后,有人解释了正态分布和80/20规则。

 2024-03-13 00:10:45  阅读 0

概率分布函数怎么来的_概率分布函数来源于什么_概率分布函数来源于

如果你是一名程序员,你在编程时一定使用过()函数。 它的作用是随机生成一些特定取值范围内的数字。 很多编程语言都预设了这个函数,可以直接调用。

例如,如果要随机生成一个1到100的整数,那么在编写程序时需要预先定义一个1到100的取值范围,然后调用函数在该范围内等概率地得到一个随机数。取值范围,即这100个数字中任意一个数字出现的概率为1/100。

习惯随机函数的程序员可能会错误地认为“随机”代表均匀分布的数据,即等概率事件。 这是一个误解。 在现实生活中,绝大多数随机性并不是均匀分布的。

举个例子,我们知道抛硬币两面落地的概率是一半,但是如果你实际抛硬币10次,你会发现硬币正好5次正面朝上的概率既不是50%,也不是50%。 50%。 不是10%,而是25%左右。 因为在自然界中,最常见的“随机”就是正态分布(也叫高斯分布),它的分布曲线是“钟形”的,如图1-1所示。

概率分布函数来源于_概率分布函数来源于什么_概率分布函数怎么来的

▲图1-1 正态分布数学函数图

正态分布是一组数据处于正态状态的概率分布。 描述这种分布只需要两个参数:一个是这组数据的平均值,通常用希腊字母μ表示,位于函数图像中间的坐标位置。 其次是标准差,通常用希腊字母σ表示,代表这组数据的分散程度。 标准差越小,说明数据越集中,反之,说明数据越分散。

如果一组数据服从正态分布,根据分布特征,68%的数字将集中在距均值正负1个标准差的范围内,95%的数字将集中在该范围内与平均值的正负 2 个标准差。 其中,99.7% 的数字将集中在与平均值正负 3 个标准差的范围内。 由于3个标准差区间几乎涵盖了大部分数据,因此在数学中应用广泛,适用于很多场景下的推导和估计。

综上所述,正态分布说明了“一般的多,极端的少”的现象。 这种现象在生活中很常见。 例如,大多数人的身高都落在一定的范围内,太高或太矮的人并不多。 如果你仔细观察你周围的人,你会发现很少有非常聪明或非常愚蠢的人。 全社会收入统计显示,中等收入者增多,特别贫困、特富者减少。

人们常说的80-20法则(也称为帕累托法则)只不过是描述正态分布现象的另一种方式。 80/20法则告诉我们,20%的富人拥有世界80%的财富; 只要掌握词典中20%的单词,就能理解文章80%的内容; 80%的人口居住在20%的大城市,等等。

正态分布的性质还有其他广泛的应用。 我们知道,使用多重抽样可以从相对少量的数据中得出令人信服的总体结论。 例如,通过调查100个人,可以大致了解人类的一般心理认知。 只要随机抽查100个项目,就可以得出该批货物的质量结论。

这些民意调查和商品抽样都是利用抽样样本来估计总体。 它们背后的数学原理是中心极限定理。 中心极限定理从理论上证明,无论随机变量整体呈现何种分布,只要采样次数足够大,样本的平均值都会近似服从正态分布。

也就是说,虽然每个人或者每个产品都会受到大量随机因素的影响,从而对最终的状态产生一定的影响,但是我们不必关心这些因素的细节,而只需要看看个人或产品作为一个整体。 总体统计规律服从正态分布。

上述情况在现实世界中都是“随机”的。

作者简介:徐胜,某商业银行IT技术总监,毕业于上海交通大学,在IT技术领域工作十余年。 对技术发展和人工智能有着独特的见解,专注于智能运维(AIOps)和数据可视化、容量管理等方面的工作。

本文节选自《机器智能大话:一本看懂AI底层运行逻辑的书》,经出版社许可发布。 (国际标准书号:)

概率分布函数来源于什么_概率分布函数怎么来的_概率分布函数来源于

《聊机器智能:一本看懂AI底层运行逻辑的书》

推荐词:什么是AI? 机器如何变得“智能”? “智能”如何发挥作用? 本书以通俗易懂的方式勾勒出人工智能的整体图景,展示了人工智能的底层运行逻辑,即人工智能是如何工作的。

标签: 分布 概率 区间

如本站内容信息有侵犯到您的权益请联系我们删除,谢谢!!


Copyright © 2020 All Rights Reserved 京ICP5741267-1号 统计代码