使用 Python 实现和解释概率图形

2024-02-25 02:06:13 阅读 0

使用线性回归时，您可能遇到过概率图 - 图 (-)。拟合模型后，我们应该检查回归的残差是否服从正态分布。并且可以通过如下图的QQ图来直观地验证。

概率图模型理论与方法_概率图模型基于r语言_概率图模型基于r语言pdf

QQ图表示例

概率函数曲线的一些定义

为了充分理解概率图的概念，我们可以快速浏览一下概率论中的一些定义：

概率图模型基于r语言_概率图模型基于r语言pdf_概率图模型理论与方法

高斯分布 PDF

CDF的一般公式，X-随机变量，x-评估点

下图显示了从标准正态分布以及PDF和CDF中提取的随机变量的分布。

概率图模型理论与方法_概率图模型基于r语言_概率图模型基于r语言pdf

在本文中我将使用另外两个案例进行比较：

我采用偏态正态分布，并通过调整 alpha 参数（同时将比例和位置保留为默认值）来控制分布的偏度。随着 alpha 的绝对值增加，skew 的绝对值也增加。下面我们可以通过查看从分布中提取的随机变量的直方图来检查分布的差异。

概率图模型基于r语言pdf_概率图模型理论与方法_概率图模型基于r语言

概率图

我们使用概率图直观地比较来自不同数据集的数据。可能的比较包括：

当我们将观测数据与特定理论分布的数据进行比较时，最常见的概率图是中间的概率图。我将使用这种变体来解释下面的特定类型的图，但是，它也可以应用于其他两种情况。

PP图

简而言之，PP 图 (-) 是一种可视化效果，绘制了两个分布（经验分布和理论分布）相对的 CDF。

概率图模型基于r语言_概率图模型理论与方法_概率图模型基于r语言pdf

用于比较 N(0,1) 与标准正态的完美匹配随机数的 PP 图示例

有关 PP 图的一些关键信息：

概率图模型理论与方法_概率图模型基于r语言pdf_概率图模型基于r语言

N(1,2.5) 与 N(5,1) 比较得出的随机变量

QQ图

与 PP 图类似，图 (-) 允许我们通过比较分位数来比较分布。

QQ图的一些关键信息：

中的示例

我使用一个库来创建类的概率图。

PP图

当我开始使用 PP 创建一些 PP 图时，我注意到一个问题：因为我正在将 N(1,2.5) 的随机抽取与标准法线进行比较，所以这些图完全吻合，但它们不应该吻合。我试图研究这个问题，并找到了一篇关于的文章，它解释了为什么当前的实现总是尝试估计理论分布的位置和尺度参数，即使我们提供了一些值。所以在上面的例子中，经验数据来自正态分布，而不是我们指定的。

这就是为什么我编写了一个函数，直接将经验数据与提供参数的理论分布进行比较。

我们首先尝试使用从 N(1,2.5) 到 N(0,1) 的随机抽取来与 pp 图进行比较。我们看到，在的情况下，它是完美拟合，因为该函数估计正态分布的位置和尺度参数。当检查 pp 图的结果时，我们发现分布存在显着差异，这也可以在直方图上观察到。

概率图模型基于r语言pdf_概率图模型基于r语言_概率图模型理论与方法