持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第13天,点击查看活动详情
简单来说,引入拉格朗日乘子是为了强制要求所有的约束条件必须被满足,当x违反约束条件时,L(x,α,β)→ +∞, 当x满足约束条件时,L(x,α,β)=f(x)。
假设f(x),ci(x),hj(x)是定义在Rn上的连续可微函数。考虑约束最优化问题(极大化问题可以简单地转换为极小化问题,这里仅讨论极小化问题):
x∈Rnmins.t.f(x)mi(x)≤0,i=1,2,⋯,knj(x)=0,j=1,2,⋯,l
引入拉格朗日乘子后,得到拉格朗日函数
L(x,α,β)=f(x)+∑i=1kαici(x)+∑j=1lβjhj(x)
如果x违反mi(x)约束,即mi(x)>0,那么λmax L→ +∞
如果x符合mi(x)约束,即mi(x)≤0,那么λmax L=+∞
因此有
xmin λmax L=xmin {符合约束maxL,违反约束+∞}=xmin λmax L
如果x违反nj(x)约束,即nj(x)=0,那么βmax L→+∞
如果x符合nj(x)约束,即nj(x)=0,那么βmax L=+∞
因此有
xmin λmax L=xmin {maxL,+∞}=xmin λmax L
所谓弱对偶性,指的是对偶问题≤原问题,即:
minmaxf≥maxminf
对于L(x,λ,η)这个函数,我们知道下面这个不等式一定成立
xmin L(x,λ,η)≤L(x,λ,η)≤λ,ηmax L(x,λ,η)
中间L(x,λ,η)我们可以理解为L的值域,值域里面的任何一个数,必然是大于等于它对x的最小值,小于等于它对λ,η的最大值。
令
A(λ,η)=xmin L,B(x)=λ,ηmax L
因此有
A(λ,η)A(λ,η)maxA(λ,η)≤B(x)≤minB(x)≤minB(x)
因此
maxminL≤minmaxL
后面还有对偶关系之几何解释、对偶关系之slater condition、对偶关系之KKT条件,以后会补上的