1 算法介绍
logistics 方程由比利时数学家Pierre François Verhulst提出,是一个对S型曲线进行数学描述的模型。这个方程应用于一些特殊的领域建模与预测,例如单位面积内某种生物的数量、人口数量等社会经济指标、某种商品(例如手机)的普及率等。
2 原理
logistics 方程定义:
xt=c+aebt1(1)
其中,t 表示时间变量,a,b,c 为模型的参数;当趋势比较完整时, a>0,b<0,c>0 。其曲线如下图:

根据方程和图像可知:
当 t→−∞,x(t)→1/c。为研究 Logistics 曲线好的增长特性,对 Logistics 方程求一阶导数:
dtdx=(c+aebt)2−abebt>0
2.1 Yule 算法
根据方程 (1),微分写成差分式:
xt+1xt+1−xt
=1−xt+1xt
=1−c+aebtc+aeb(t+1)
=c+aebt(aebt+c−c)(1−eb)
=(1−eb)−c(1−eb)xt
设 zt=xt+1xt+1−xt,γ=1−eb,β=−c(1−eb),那么上面的方程可以写成线性方程:
zt=γ+βxt
利用最小二乘法(OLS)可以得到这个方程参数的估计值,进而 b 和 c 的估计值也可以进一步得到。
为了得到 a 的估计值,Logistics 方程两边同时取对数:
ln(xt1−c^)=lna^+b^t(2)
左右分别对 t 求和:
t=1∑nln(xt1−c^)=nlna^−2n(n+1)b^(3)
可以很容易得到 a 的估计值:
a^=exp(n1(t=1∑nln(xt1−c^−2n(n+1)b^)))(4)
2.2 Rhodes 算法
根据 Logistics 方程可以得到:
xt+11
=c+aeb(t+1)
=c−ceb+ceb+aeb(t+1)
=c(1−eb)+xteb
设 zt=xt+11、st=xt1、γ=c(1−eb)、β=eb,那么该方程可以写成线性方程:
zt=γ+βst
利用最小二乘法(OLS)可以得到这个方程参数的估计值,进而 b 和 c 的估计值也可以进一步得到。利用方程 (2)-(4) 可以得到 a 的估计值。
2.3 Nair 算法
Yule 算法的差分式结果可以进一步写成:
xt+1xt+1−xt=(1−eb)(1−cxt)
1−eb1=xt+1−xtxt+1(1−cxt)
1−eb1+eb=1−eb2−1
=xt1−xt+11xt1+xt+11−2c
进一步整理得到;
xt1−xt+11=1+eb1−eb(xt1+xt+11)−1+eb2c(1−eb)(5)
设 zt=xt1−xt+11、st=xt1+xt+11、γ=1+eb2c(1−eb)、β=1+eb1−eb ,那么方程 (5) 可以写成线性方程:
zt=γ+βst
利用最小二乘法(OLS)可以得到这个方程的参数估计值,进而 b 和 c 的估计值也可以得到,利用方程 (2)-(4) 可以得到 a 的估计值。
3 Logistics 模型与 Logistics 回归理解与使用
Logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。Logistic回归的因变量可以是二分类的,也可以是多分类的。
3.1 Logistic回归跟多元线性回归差不多,但是有区别
- 线性回归:y是一个定量的变量,这时y对于不同的自变量来说有相应的值。
- Logistic回归:y是一个定性的变量,比如y只能等于0或1。
3.2 模型的基本形式
P(Y=1∣x1,x2,...,xn)=1+exp(β0+β1x1+...+βnxn)exp(β0+β1x1+...+βnxn)
在实际应用该模型的时候,常常不是不是直接对P进行回归,而是先 定义单调连续概率函数 π :
π=P(Y=1∣x1,x2,...,xn),0<π<1
于是Logistic模型就可以变形为:
ln1−ππ=β0+β1x1+...+βnxn,0<π<1
即:
ln1−ππ=β0+β1x1+...+βnxn,0<π<1(1)
π=1+exp(β0+β1x1+...+βnxn)exp(β0+β1x1+...+βnxn)(2)
P={01π≤Aπ≥1−A(3)
通过多元线性回归解出 β0,β1,...,βn ,带入求得 π ,根据 π 的值判断 P 的取值。