[一起面试AI]NO.9 如何判断函数凸或非凸

1,445 阅读2分钟

首先定义凸集,如果x,y属于某个集合M,并且所有的θx+(1-θ)f(y)也属于M,那么M为一个凸集。如果函数f的定义域是凸集,并且满足

f(θx+(1-θ)y)≤θf(x)+(1-θ)f(y)

则该函数为凸函数。

如果函数存在二阶导并且为正,或者多元函数的Hessian矩阵半正定则均为凸函数。

注意:中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在某些中国大陆的数学书中指凹函数。Concave Function指凸函数。但在中国大陆涉及经济学的很多书中,凹凸性的提法和其他国家的提法是一致的,也就是和数学教材是反的。举个例子,同济大学高等数学教材对函数的凹凸性定义与本条目相反,本条目的凹凸性是指其上方图是凹集或凸集,而同济大学高等数学教材则是指其下方图是凹集或凸集,两者定义正好相反。

为什么要求是凸函数呢?因为如果是下图这样的函数,则无法获得全局最优解。

img
img

为什么要求是凸集呢?因为如果可行域不是凸集,也会导致局部最优

img
img

实际建模中判断一个最优化问题是不是凸优化问题一般看以下几点:

  • 目标函数f如果不是凸函数,则不是凸优化问题

  • 决策变量x中包含离散变量(0-1变量或整数变量),则不是凸优化问题

  • 约束条件写成g(x)≤0时,g如果不是凸函数,则不是凸优化问题

之所以要区分凸优化问题和非凸的问题原因在于凸优化问题中局部最优解同时也是全局最优解,这个特性使凸优化问题在一定意义上更易于解决,而一般的非凸最优化问题相比之下更难解决。

非凸优化问题如何转化为凸优化问题的方法:

1)修改目标函数,使之转化为凸函数

2)抛弃一些约束条件,使新的可行域为凸集并且包含原可行域

求个关注~谢谢啦