Python用PyMC3实现贝叶斯线性回归模型

892 阅读3分钟

原文链接:tecdat.cn/?p=5263

原文出处:拓端数据部落公众号

 

在本文中,我们将在贝叶斯框架中引入回归建模,并使用PyMC3 MCMC库进行推理。

 

我们将首先回顾经典频率论的多重线性回归方法。然后讨论贝叶斯如何考虑线性回归。

用PyMC3进行贝叶斯线性回归

在本节中,我们将对统计实例进行一种经典的方法,即模拟一些我们知道的属性的数据,然后拟合一个模型来推算这些原始属性。

什么是广义线性模型?

在我们开始讨论贝叶斯线性回归之前,我想简要地概述广义线性模型(GLM)的概念,因为我们将使用它们来在PyMC3中建立我们的模型。

广义线性模型是将普通线性回归扩展到更一般形式的回归的灵活方法,包括逻辑回归(分类)和泊松回归(用于计数数据)以及线性回归本身。

GLM允许具有除正态分布以外的误差分布的因变量

用PyMC3模拟数据并拟合模型

在我们使用PyMC3来指定和采样贝叶斯模型之前,我们需要模拟一些噪声线性数据。

输出如下图所示:

 

通过Numpy,pandas和seaborn模拟噪声线性数据

现在我们已经进行了模拟,我们想要对数据拟合贝叶斯线性回归。这是glm方法。

然后我们将找到MCMC采样器的最大后验概率(MAP)估计值。最后,我们将使用No-U-Turn Sampler(NUTS)来进行实际推理,然后绘制模型的曲线,将前500个样本丢弃为“burn in”预烧过程。

traceplot如下图所示:

 

使用PyMC3将贝叶斯GLM线性回归模型拟合到模拟数据

 

首先我们使用seaborn lmplot方法,fit_reg参数设置False,不绘制频数回归曲线。然后我们绘制100个采样的后验预测回归线。最后,我们绘制使用原始的“真实”回归线和β1=2的参数。

我们可以在下图中看到回归线的抽样范围:

 

 

有问题欢迎联系我们!

 


最受欢迎的见解

1.matlab使用贝叶斯优化的深度学习

2.matlab贝叶斯隐马尔可夫hmm模型实现

3.R语言Gibbs抽样的贝叶斯简单线性回归仿真

4.R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

5.R语言中的Stan概率编程MCMC采样的贝叶斯模型

6.Python用PyMC3实现贝叶斯线性回归模型

7.R语言使用贝叶斯 层次模型进行空间数据分析

8.R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

9.matlab贝叶斯隐马尔可夫hmm模型实现