优化问题笔记(2)

目录

  • 3. 约束优化问题的全局解
    • 3.1 凸优化问题
    • 3.2 二次优化问题
    • 3.3 无约束二次优化问题
    • 3.4 一个典型的二次等式约束二次优化问题
  • Reference

3. 约束优化问题的全局解

3.1 凸优化问题

局部解成为全局解的一类重要的优化问题是所谓凸优化问题. 我们称优化问题 ( f , D ) (f,\mathcal{D}) (f,D) 是凸的/拟凸的,是指 f : D → R ‾ f:\mathcal{D}\to\overline{\mathbb{R}} f:DR 是凸函数/拟凸函数. 称优化问题 { min ⁡ f 0 ( x ) s.t. f i ( x ) ≤ 0 , i = 1 , ⋯   , p , h j ( x ) = 0 , j = 1 , ⋯   , q , x ∈ Ω , \begin{cases}\min f_0(x)\\[1ex]\text{s.t.} f_i(x)\le0,\quad i=1,\cdots,p,\\[1ex]h_j(x)=0,\quad j=1,\cdots,q,\\[1ex]x\in\Omega,\end{cases} minf0(x)s.t.fi(x)0,i=1,,p,hj(x)=0,j=1,,q,xΩ,是凸的/拟凸的, 是指它满足如下条件:

( i ) (i) (i) f 0 f_0 f0 是凸函数/拟凸函数;

( i i ) (ii) (ii) { f i } i = 1 p \{f_{i}\}_{i=1}^{p} {fi}i=1p是凸函数;

( i i i ) (iii) (iii) { h j } j = 1 q \{h_j\}_{j=1}^q {hj}j=1q 是仿射函数;

( i v ) (iv) (iv) Ω \Omega Ω R n \mathbb{R}^n Rn 中凸集.

显然,此时可行集 D \mathcal{D} D 是凸集,( f 0 , D ) f_0,\mathcal{D}) f0,D) 是凸问题/拟凸问题.

命题 3.1.1 (凸问题的局部解是全局解)

(1) 凸优化问题 ( f , D ) (f,\mathcal{D}) (f,D) 的局部解必为全局解.

(2) 拟凸问题 ( f , D ) (f,\mathcal{D}) (f,D) 的严格局部解必为严格全局解.

.(1) 反证法:若 x ∗ x^* x 是凸优化问题 ( f , D ) (f,\mathcal{D}) (f,D) 的局部解而不是全局解,则必存在 x ∈ D x\in\mathcal{D} xD, 使得 f ( x ) < f ( x ∗ ) f(x)<f(x^*) f(x)<f(x).对任意的 θ ∈ ( 0 , 1 ) \theta\in(0,1) θ(0,1),令 x θ : = x ∗ + θ ( x − x ∗ ) x_\theta:=x^*+\theta(x-x^*) xθ:=x+θ(xx).显然 x θ ∈ D x_\theta\in\mathcal{D} xθD,且当 θ \theta θ 充分小时, x θ x_{\theta} xθ 充分接近 x ∗ x^* x,从而 f ( x ∗ ) ≤ f ( x θ ) f(x^*)\leq f(x_\theta) f(x)f(xθ).于是 f ( x ∗ ) ≤ f ( x θ ) ≤ ( 1 − θ ) f ( x ∗ ) + θ f ( x ) < ( 1 − θ ) f ( x ∗ ) + θ f ( x ∗ ) = f ( x ∗ ) . \begin{aligned}f(x^*)\leq f(x_\theta)\leq(1-\theta)f(x^*)+\theta f(x)<(1-\theta)f(x^*)+\theta f(x^*)=f(x^*).\end{aligned} f(x)f(xθ)(1θ)f(x)+θf(x)<(1θ)f(x)+θf(x)=f(x).矛盾.(上式中第二个不等号利用了凸函数的定义.)所以 x ∗ x^* x 是全局解.

(2) 若 x ∗ x^* x 是拟凸优化问题的 ( f , D ) (f,\mathcal{D}) (f,D) 的严格局部解而不是严格全局解,则存在 x ∈ D x\in\mathcal{D} xD 使得 f ( x ) ≤ f ( x ∗ ) f(x)\leq f(x^*) f(x)f(x).沿用上面的符号,类似地,当 θ > 0 \theta>0 θ>0 充分小时,有 f ( x ∗ ) < f ( x θ ) ≤ max ⁡ { f ( x ∗ ) , f ( x ) } = f ( x ∗ ) . f(x^*)<f(x_\theta)\leq\max\{f(x^*),f(x)\}=f(x^*). f(x)<f(xθ)max{f(x),f(x)}=f(x).矛盾. (上式中第二个不等号利用了拟凸函数的定义.)

:对于拟凸问题,非严格局部解未必是全局解. 例如函数 f ( x ) : = { x + 1 x ≤ − 1 0 x ∈ ( − 1 , 1 ) x − 1 x ≥ 1 f(x):=\begin{cases}x+1&x\leq-1\\0&x\in(-1,1)\\x-1&x\geq1\end{cases} f(x):= x+10x1x1x(1,1)x1位于区间 (-1,1) 中每一点都是 ( f , R ) (f,\mathbb{R}) (f,R) 的局部最优解,但它们都不是全局最优解,如下图所示:

在这里插入图片描述
命题 3.1.2 (全局解与平稳点的等价性) 设凸优化问题 ( f , D ) (f,\mathcal{D}) (f,D) 的目标函数 f f f x ∗ ∈ D x^*\in\mathcal{D} xD 处一阶可微, x ∗ ∈ D x^*\in\mathcal{D} xD,那么 x ∗ x^* x ( f , D ) (f,\mathcal{D}) (f,D) 的一个全局最优解当且仅当
∇ f ( x ∗ ) T ( x − x ∗ ) ≥ 0 , ∀ x ∈ D . \begin{align}\nabla f(x^*)^T(x-x^*)&\ge0,\quad\forall x\in\mathcal{D}.\end{align} f(x)T(xx)0,xD.
. 必要性. x ∗ ∈ D x^*\in\mathcal{D} xD 是一个最优解,因为 D \mathcal{D} D 是凸集,由优化问题笔记 (1)中的命题 1.2.1 ∇ f ( x ∗ ) T d = 0 , d T ∇ 2 f ( x ∗ ) d ≥ 0 , ∀ d ∈ V D \nabla f(x^{*})^{T}d=0,\quad d^{T}\nabla^{2}f(x^{*})d\geq0,\quad\forall d\in V_{\mathcal{D}} f(x)Td=0,dT2f(x)d0,dVD,以及由引理 1.2.2 ξ T ( x − x ∗ ) ≥ 0 , ∀ x ∈ D    ⟺    ξ T d ≥ 0 , ∀ d ∈ S F D ( x ∗ ) \xi^T(x-x^*)\ge0,\forall x\in\mathcal{D} \iff \xi^Td\ge0,\forall d\in\mathbf{SFD}(x^*) ξT(xx)0,xDξTd0,dSFD(x),于是可以推出(1)成立.

充分性. 设(1)成立. 则 ∀ x ∈ D \forall x\in\mathcal{D} xD,利用凸函数笔记 (1)中的命题 2.2.1,(下文直接引用,不再以链接形式给出笔记出处) f  是凸函数当且仅当 f ( y ) ≥ f ( x ) + ∇ f ( x ) T ( y − x ) , ∀ x , y ∈ d o m ( f ) . f\text{ 是凸函数当且仅当}f(y)\geq f(x)+\nabla f(x)^T(y-x),\quad\forall x,y\in\mathbf{dom}(f). f 是凸函数当且仅当f(y)f(x)+f(x)T(yx),x,ydom(f).

于是有 f ( x ) ≥ f ( x ∗ ) + ∇ f ( x ∗ ) T ( x − x ∗ ) ≥ f ( x ∗ ) . \begin{aligned}f(x)\geq f(x^*)+\nabla f(x^*)^T(x-x^*)\geq f(x^*).\end{aligned} f(x)f(x)+f(x)T(xx)f(x).所以 x ∗ x^* x ( f , D ) (f,\mathcal{D}) (f,D) 的一个最优解.

:当 x ∗ ∈ r i ( D ) x^*\in\mathbf{ri}(\mathcal{D}) xri(D) 时,由引理 1.2.2 可知 (1)等价于 ∇ f ( x ∗ ) ⊥ V D \nabla f(x^*)\perp V_\mathcal{D} f(x)VD. 这意味着 x ∗ x^* x 约束在 V D V_\mathrm{D} VD上是 f f f 的一个平稳点( 满足 ∇ f ( x ∗ ) = 0 \nabla f(x^*)=0 f(x)=0 的点称为 f f f 的平稳点).这一性质在优化问题的数值计算中非常重要,因为判断一个点是否为平稳点比判断其为局部极小点要容易得多.

例 3.1.1 A ∈ R m × n , b ∈ R m A\in\mathbb{R}^{m\times n},\quad b\in\mathbb{R}^m ARm×n,bRm 使得集合 { x ∈ R n ∣ A x = b } \{x\in\mathbb{R}^n|Ax=b\} {xRnAx=b} 非空. 又设函数 f : R n → R f:\mathbb{R}^n\to\mathbb{R} f:RnR 是可微的凸函数.那么, x ∗ ∈ R n x^*\in\mathbb{R}^n xRn 是等式约束凸优化问题 { min ⁡ f ( x ) s . t A x = b \begin{align} \begin{cases}\min f(x)\\\mathrm{s.t}\quad Ax=b\end{cases}\end{align} {minf(x)s.tAx=b的解当且仅当 ∇ f ( x ∗ ) ∈ r a n ( A T ) , A x ∗ = b . \nabla f(x^*)\in\mathbf{ran}(A^T),\quad Ax^*=b. f(x)ran(AT),Ax=b..在 例 1.2.1 中已证明该可行集 D \mathcal{D} D 满足: r i ( D ) = D \mathbf{ri}(D)=\mathcal{D} ri(D)=D V D = n u l l ( A ) = r a n ( A T ) ⊥ . V_D=\mathbf{null}(A)=\mathbf{ran}(A^T)^\perp. VD=null(A)=ran(AT).命题 3.1.2 可知, x ∗ ∈ D x^*\in\mathcal{D} xD 是优化问题 (2)的一个最优解当且仅当 ∇ f ( x ∗ ) ∈ V D ⊥ \nabla f(x^*)\in V_\mathcal{D}^\perp f(x)VD, 即 ∇ f ( x ∗ ) ∈ r a n ( A T ) . \nabla f(x^*)\in\mathbf{ran}(A^T). f(x)ran(AT).

3.2 二次优化问题

当目标函数和约束函数都是二次 (不超过二次) 函数时, L ( x , λ , µ ) L(x, λ, µ) L(x,λ,µ) 关于 x x x也是二次函数,因而其 Taylor 展开式展开到二次项时余项为 0. 此时, 有如下全局解的充分条件.

命题 3.2.1 (二次优化问题全局解的充分条件) 对于不含约束集的约束优化问题 { min ⁡ f 0 ( x ) s . t f i ( x ) ≤ 0 , i = 1 , ⋯   , p , h j ( x ) = 0 , j = 1 , ⋯   , q . \begin{cases}\min f_0(x)\\\mathrm{s.t}\quad f_i(x)\leq0,\quad i=1,\cdots,p,\\h_j(x)=0,\quad j=1,\cdots,q.&\end{cases} minf0(x)s.tfi(x)0,i=1,,p,hj(x)=0,j=1,,q., 设 { f i } i = 0 p , { h j } j = 1 q \{f_i\}_{i=0}^p,\{h_j\}_{j=1}^q {fi}i=0p,{hj}j=1q 均为二次函数, x ∗ ∈ R n x^*\in\mathbb{R}^n xRn,存在 λ ∗ ∈ R p , μ ∗ ∈ R q \lambda^*\in\mathbb{R}^p,\mu^*\in\mathbb{R}^q λRp,μRq,满足 K K T KKT KKT 条件 { x ∗ ∈ D ; λ i ∗ ≥ 0 , i = 1 , ⋯   , p ; λ i ∗ f i ( x ∗ ) = 0 , i = 1 , ⋯   , p ; ∇ x L ( x ∗ , λ ∗ , μ ∗ ) = 0. \begin{cases}x^*\in\mathcal{D};\\\lambda_i^*\geq0,\quad i=1,\cdots,p;\\\lambda_i^*f_i(x^*)=0,\quad i=1,\cdots,p;\\\nabla_xL(x^*,\lambda^*,\mu^*)=0.\end{cases} xD;λi0,i=1,,p;λifi(x)=0,i=1,,p;xL(x,λ,μ)=0.,且有下式: ( x − x ∗ ) T ∇ x 2 L ( x ∗ , λ ∗ , μ ∗ ) ( x − x ∗ ) ≥ 0 , ∀ x ∈ D \begin{align} (x-x^*)^T\nabla_x^2L(x^*,\lambda^*,\mu^*)(x-x^*)\geq0,\quad\forall x\in\mathcal{D}\end{align} (xx)Tx2L(x,λ,μ)(xx)0,xD x ∗ x^* x 是一个全局最优解.

.对任意的 x ∈ D x\in\mathcal{D} xD,记 d : = x − x ∗ d:=x-x^* d:=xx,那么
f 0 ( x ) ≥ L ( x , λ ∗ , μ ∗ ) = L ( x ∗ , λ ∗ , μ ∗ ) + d T ∇ x L ( x ∗ , λ ∗ , μ ∗ ) + 1 2 d T ∇ x 2 L ( x ∗ , λ ∗ , μ ∗ ) T d ≥ L ( x ∗ , λ ∗ , μ ∗ ) = f 0 ( x ∗ ) . \begin{aligned} \begin{aligned}f_0(x)\geq L(x,\lambda^*,\mu^*)\end{aligned}& =L(x^*,\lambda^*,\mu^*)+d^T\nabla_xL(x^*,\lambda^*,\mu^*)+\frac12d^T\nabla_x^2L(x^*,\lambda^*,\mu^*)^Td \\ &\geq L(x^{*},\lambda^{*},\mu^{*})=f_{0}(x^{*}). \end{aligned} f0(x)L(x,λ,μ)=L(x,λ,μ)+dTxL(x,λ,μ)+21dTx2L(x,λ,μ)TdL(x,λ,μ)=f0(x). 所以 x ∗ x^* x 是一个全局最优解.

:当 x ∗ x^* x 是一个正则点时,根据 定义 2.1.3 T ( x ∗ ) ∩ ∂ B ( 0 , 1 ) ⊂ L F D ( x ∗ ) = S F D ( x ∗ ) ‾ \mathcal{T}(x^*)\cap\partial B(0,1)\subset\mathbf{LFD}(x^*)=\mathbf{SFD}(\overline{x^*)} T(x)B(0,1)LFD(x)=SFD(x).根据 引理 1.2.2 可知,本命题的条件(3) 比局部解的二阶必要条件 d T ∇ x 2 L ( x ∗ , λ ∗ , μ ∗ ) d ≥ 0 , ∀ d ∈ T ( x ∗ ) d^T\nabla_x^2L(x^*,\lambda^*,\mu^*)d\geq0,\quad\forall d\in\mathcal{T}(x^*) dTx2L(x,λ,μ)d0,dT(x) 要强.

3.3 无约束二次优化问题

命题 3.3.1 (二次函数之最优解的条件) 设 f ( x ) : = 1 2 x T A x + b T x f(x):=\frac12x^TAx+b^Tx f(x):=21xTAx+bTx, 其中 A A A n n n 阶实对称矩阵, x ∗ ∈ R n x^*\in\mathbb{R}^n xRn.那么,对于无约束优化问题 ( f , R n ) (f,\mathbb{R}^n) (f,Rn),即问题 { min ⁡ f 0 ( x ) s . t f i ( x ) ≤ 0 , i = 1 , ⋯   , p , h j ( x ) = 0 , j = 1 , ⋯   , q . \begin{cases}\min f_0(x)\\\mathrm{s.t}\quad f_i(x)\leq0,\quad i=1,\cdots,p,\\h_j(x)=0,\quad j=1,\cdots,q.&\end{cases} minf0(x)s.tfi(x)0,i=1,,p,hj(x)=0,j=1,,q.,如下三条相互是等价的:

( 3.3.1.1 )   x ∗ (3.3.1.1)\:x^* (3.3.1.1)x f f f 的一个全局极小点;

( 3.3.1.2 )   x ∗ (3.3.1.2)\:x^* (3.3.1.2)x f f f 的一个局部极小点;

( 3.3.1.3 ) A (3.3.1.3)A (3.3.1.3)A 是半正定矩阵且 A x ∗ + b = 0. Ax^*+b=0. Ax+b=0.

.根据全局最小点和局部极小点的定义可以知道, (3.3.1.1) 蕴含 (3.3.1.2). 对 f f f 计算可得 ∇ f ( x ∗ ) = A x ∗ + b , ∇ 2 f ( x ∗ ) = A . \begin{align} \begin{aligned}\nabla f(x^*)=Ax^*+b,\quad\nabla^2f(x^*)=A.\end{aligned}\end{align} f(x)=Ax+b,2f(x)=A.因此,若 (3.3.1.2) 成立,那么,由 必要性命题 1.2.1:若 f f f x ∗ x^* x 处二阶连续可微,且 x ∗ ∈ r i ( D ) x^*\in\mathbf{ri}(\mathcal{D}) xri(D),则 ∇ f ( x ∗ ) T d = 0 , d T ∇ 2 f ( x ∗ ) d ≥ 0 , ∀ d ∈ V D . \nabla f(x^{*})^{T}d=0,\quad d^{T}\nabla^{2}f(x^{*})d\geq0,\forall d\in V_{\mathcal{D}}. f(x)Td=0,dT2f(x)d0,dVD.即知 (3.3.1.3) 成立.

设 (3.3.1.3)成立. 利用(4)可知 ∇ f ( x ∗ ) = 0 \nabla f(x^*)=0 f(x)=0,且 ∇ 2 f ( x ∗ ) \nabla^2f(x^*) 2f(x) 半正定. 于是, ∀ x ∈ R n \forall x\in\mathbb{R}^n xRn,做Taylor 展开,有 f ( x ) = f ( x ∗ ) + 1 2 ( x − x ∗ ) T A ( x − x ∗ ) ≥ f ( x ∗ ) . f(x)=f(x^*)+\frac12(x-x^*)^TA(x-x^*)\geq f(x^*). f(x)=f(x)+21(xx)TA(xx)f(x).所以 x ∗ x^* x f f f R n \mathbb{R}^n Rn 上的最小点. 即(3.3.1.1) 成立.

:二次函数 f ( x ) : = 1 2 x T A x + b T x f(x):=\frac12x^TAx+b^Tx f(x):=21xTAx+bTx 未必总存在极小值点. 事实上,当 A A A 不是半正定矩阵时,或者 A A A半正定但 A x + b = 0 Ax+ b= 0 Ax+b=0 无解时, f ( x ) f(x) f(x) 就不存在极小值点. 此时, inf ⁡ x ∈ R n f ( x ) = − ∞ \inf_{x\in\mathbb{R}^n}f(x)=-\infty infxRnf(x)=.例如,对于 A = [ 0 0 0 1 ] , b : = [ b 1 0 ] , c = 0 , A=\begin{bmatrix}0&0\\0&1\end{bmatrix},\quad b:=\begin{bmatrix}b_1\\0\end{bmatrix},\quad c=0, A=[0001],b:=[b10],c=0, f ( x ) = 1 2 x 2 2 + b 1 x 1 ,   x : = ( x 1 , x 2 ) T ∈ R 2 f(x)=\frac12x_2^2+b_1x_1,\:x:=(x_1,x_2)^T\in\mathbb{R}^2 f(x)=21x22+b1x1,x:=(x1,x2)TR2.当 b 1 ≠ 0 b_1\neq0 b1=0 时, f ( x ) f(x) f(x) 不存在最小值点.

推论 3.3.1 (二次函数之全局最优解存在的条件) 设 A A A n n n 阶实对称矩阵,那么,二次函数 f ( x ) : = 1 2 x T A x + b T x f(x):=\frac12x^TAx+b^Tx f(x):=21xTAx+bTx R n \mathbb{R}^n Rn 上有最小值点当且仅当 f ( x ) f(x) f(x) R n \mathbb{R}^n Rn 上有下界.

.将 A A A做特征分解 A = U Λ U T A=U\Lambda U^T A=UΛUT ,其中 U U U 是一个 n n n 阶正交矩阵, Λ = d i a g ( λ 1 , . . . , λ n ) \Lambda=\mathbf{diag}(\lambda_1,...,\lambda_n) Λ=diag(λ1,...,λn), 其中 λ 1 ≥ . . . ≥ λ n \lambda_1\geq...\geq\lambda_n λ1...λn A A A 的全部特征值. 令 y : = U T x ,   q : = U T b y:=U^Tx,~q:=U^Tb y:=UTx, q:=UTb, 那么
f ( x ) = 1 2 y T Λ y + q T y = 1 2 ∑ i = 1 n ( λ i y i 2 + 2 q i y i ) . f(x)=\frac12y^T\Lambda y+q^Ty=\frac12\sum_{i=1}^n(\lambda_iy_i^2+2q_iy_i). f(x)=21yTΛy+qTy=21i=1n(λiyi2+2qiyi).所以 f ( x ) f(x) f(x) R n \mathbb{R}^n Rn 上有下界当且仅当对每一个 1 ≤ i ≤ n 1\leq i\leq n 1in, 单变量函数 g i ( y ) : = λ i y 2 + 2 q i y g_i(y):=\lambda_iy^2+2q_iy gi(y):=λiy2+2qiy在 R 上有下界.即 λ i ≥ 0 \lambda_i\geq0 λi0 λ i = 0 \lambda_i=0 λi=0 时,有 q i = 0 q_i=0 qi=0. 此时,当 y i : = { − q i λ i λ i > 0 , 任意值 λ i = 0 , i = 1 , . . . , n . y_i:=\begin{cases}-\frac{q_i}{\lambda_i}&\lambda_i>0,\\\text{任意值}&\lambda_i=0,&\end{cases}\quad i=1,...,n. yi:={λiqi任意值λi>0,λi=0,i=1,...,n.时, x = U y x= Uy x=Uy f ( x ) f(x) f(x) R n \mathbb{R} ^n Rn 上的一个最小值点.

例 3.3.1 (最小二乘问题 (LSP: Least Square Problem)) 给定矩阵 A ∈ R m × n A\in\mathbb{R}^{m\times n} ARm×n 和向量 b ∈ R m b\in\mathbb{R}^m bRm, 如下无约束优化问题 min ⁡ ∥ A x − b ∥ 2 2 \begin{align} \min\|Ax-b\|_2^2\end{align} minAxb22称为最小二乘问题. x ∗ x^* x 是其最优解当且仅当 ( A T A ) x ∗ = A T b (A^TA)x^*=A^Tb (ATA)x=ATb. 该问题的解一定存在且构成一个 n − r n-r nr 维仿射空间,其中 r : = r a n k ( A ) r: = \mathbf{rank}( A) r:=rank(A)

.计算可得 ∥ A x − b ∥ 2 2 = x T ( A T A ) x − 2 b T A x + ∥ b ∥ 2 2 , \|Ax-b\|_2^2=x^T(A^TA)x-2b^TAx+\|b\|_2^2, Axb22=xT(ATA)x2bTAx+b22,根据线性代数的内容,假设 A A A 的列向量分别是 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn,那么有: ∣ A X 0 − b ∣  最小 ⟺ 对于任意的  X  都有  ∣ A X 0 − b ∣ ≤ ∣ A X − b ∣ ⟺ A X 0 − b ⊥ U  其中  U = { A X ∣ X ∈ R n } = L ( α 1 , ⋯   , α n ) ⟺ A X 0 − b ⊥ α i ( i = 1 , 2 , ⋯   , n ) ⟺ α i ′ ( A X 0 − b ) = 0 ( i = 1 , 2 , ⋯   , n ) ⟺ ( α 1 ′ ⋮ α n ′ ) ( A X 0 − b ) = 0 ⟺ A ′ ( A X 0 − b ) = 0 ⟺ A ′ A X 0 = A ′ b . \begin{aligned} |AX_{0}-b|\text{ 最小}& \Longleftrightarrow\text{对于任意的 }X\text{ 都有 }|AX_0-b|\leq|AX-b| \\ &\Longleftrightarrow AX_0-b\perp U\text{ 其中 }U=\{AX|X\in\mathbb{R}^n\}=L(\alpha_1,\cdots,\alpha_n) \\ &\Longleftrightarrow AX_0-b\perp\alpha_i(i=1,2,\cdots,n) \\ &\Longleftrightarrow\alpha_i'(AX_0-b)=0(i=1,2,\cdots,n) \\ &\left.\Longleftrightarrow\left(\begin{array}{c}\alpha_1'\\\vdots\\\alpha_n'\end{array}\right.\right)(AX_0-b)=0 \\ &\Longleftrightarrow A^{\prime}(AX_{0}-b)=0 \\ &\Longleftrightarrow A^{\prime}AX_{0}=A^{\prime}b. \end{aligned} AX0b 最小对于任意的 X 都有 AX0bAXbAX0bU 其中 U={AXXRn}=L(α1,,αn)AX0bαi(i=1,2,,n)αi(AX0b)=0(i=1,2,,n) α1αn (AX0b)=0A(AX0b)=0AAX0=Ab. r : = r a n k ( A ) r: = \mathbf{rank}( A) r:=rank(A),即 r r r表示矩阵的秩

一方面 r ( A ′ A , A ′ b ) = r ( A ′ ( A , b ) ) ≤ r ( A ′ ) = r ( A ) . r(A^{\prime}A,A^{\prime}b)=r(A^{\prime}(A,b))\leq r(A^{\prime})=r(A). r(AA,Ab)=r(A(A,b))r(A)=r(A).另一方面 r ( A ′ A , A ′ b ) ≥ r ( A ′ A ) = r ( A ) , r(A^{\prime}A,A^{\prime}b)\geq r(A^{\prime}A)=r(A), r(AA,Ab)r(AA)=r(A),这就说明 r ( A ′ A , A ′ b ) = r ( A ) = r ( A ′ A ) . r(A^{\prime}A,A^{\prime}b)=r(A)=r(A^{\prime}A). r(AA,Ab)=r(A)=r(AA).

所以线性方程组 ( A T A ) x   =   A T b (A^TA)x\:=\:A^Tb (ATA)x=ATb 有解,且其解就是上述最小二乘问题的解.

根据上面的推导可以知道,该线性方程组的增广矩阵 ( A T A , A T b ) = A T ( A , b ) (A^TA,A^Tb)=A^T(A,b) (ATA,ATb)=AT(A,b) 的秩就等于 r a n k ( A T ) = r = r a n k ( A T A ) , \mathbf{rank}(A^T)=r=\mathbf{rank}(A^TA), rank(AT)=r=rank(ATA), 所以该线性方程组有解,其有 n − r n-r nr 个基向量,且解空间构成一个 n − r n-r nr 维仿射空间.

3.4 一个典型的二次等式约束二次优化问题

给定 n n n阶对称矩阵 A , B A,B AB,考虑如下的优化问题: { min ⁡ x T A x s . t   x T x = 1 , x T B x = 1. \begin{align}\begin{cases}\min x^TAx\\\mathrm{s.t~}x^Tx=1,\\x^TBx=1.&\end{cases}\end{align} minxTAxs.t xTx=1,xTBx=1. D : = { x ∈ R n ∣ x T x = 1 , x T B x = 1 } \mathcal{D}:=\{x\in\mathbb{R}^n|x^Tx=1,x^TBx=1\} D:={xRnxTx=1,xTBx=1},当 D \mathcal{D} D 非空时, 根据函数的连续性可知该优化问题的全局最优解是存在的.

x ∗ ∈ D x^∗ ∈ \mathcal{D} xD 是问题(6)的全局解, 且 { x ∗ , B x ∗ } \left \{ x^∗, Bx^∗ \right \} {x,Bx} 线性无关, 根据局部解的二阶必要条件 (命题 2.2.5),存在 α ∗ , β ∗ ∈ R \alpha^*,\beta^*\in\mathbb{R} α,βR, 使得 H x ∗ = 0 , d T H d ≥ 0 , ∀ d ∈ T ( x ∗ ) , \begin{align} Hx^*=0,\quad d^THd\geq0,\quad\forall d\in\mathcal{T}(x^*),\end{align} Hx=0,dTHd0,dT(x),其中, T ( x ∗ ) : = ( s p a n { x ∗ , B x ∗ } ) ⊥ \mathcal{T}(x^*):=\left(\mathbf{span}\{x^*,Bx^*\}\right)^\perp T(x):=(span{x,Bx}) 是问题(6) 的约束条件的切空间,而根据命题 3.2.1 H x ∗ = 0 , d T H d ≥ 0 , ∀ d ∈ D − x ∗ , \begin{align} Hx^*=0,\quad d^THd\geq0,\quad\forall d\in\mathcal{D}-x^*,\end{align} Hx=0,dTHd0,dDx,时, x ∗ x^* x 是问题(6)全局解.

下面命题则可以说明必要条件可以加强为 H x ∗ = 0 ,   H ⪰ 0. Hx^*=0,~H\succeq0. Hx=0, H0.

命题 3.4.1 (Bar-on and Grasse) 设 x ∗ ∈ D x^*\in\mathcal{D} xD,且使得 { x ∗ , R x ∗ } \{x^*,Rx^*\} {x,Rx} 线性无关,则 x ∗ x^* x 是问题(6)的全局解当且仅当存在 α ∗ , β ∗ ∈ R \alpha^*,\beta^*\in\mathbb{R} α,βR, 使得(8)所定义的 H H H 满足: H x ∗ = 0 , H ⪰ 0. \begin{align} Hx^*=0,\quad H\succeq0.\end{align} Hx=0,H0.

Reference

包括但不限于以下内容:

(1)Stephen Boyd, Stephen P Boyd, and Lieven Vandenberghe. Convex
optimization. Cambridge university press, 2004.

(2) JR Bar-On and KA Grasse. Global optimization of a quadratic functional with quadratic equality constraints. Journal of Optimization Theory and Applications, 82(2):379–386, 1994.

(3) JR Bar-On and KA Grasse. Global optimization of a quadratic functional with quadratic equality constraints, part 2. Journal of Optimization Theory and Applications, 93(3):547–556, 1997.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/257641.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

性能测试之全链路压测流量模型你了解多少

前言 现在全链路越来越火&#xff0c;各大厂商也纷纷推出了自己的全链路压测测试方案。特别是针对全链路压测流量模型&#xff0c;各家方案都有所不同。最近我看了一些这方面的资料&#xff0c;有一些感悟。分享给大家。 全链路压测流量模型的梳理呢&#xff0c;这里就先不讲…

Gemini Pro API 详细申请步骤

Gemini Pro API 详细申请步骤 什么是 Gemini ? 上周&#xff0c;谷歌发布了 Gemini&#xff08;双子座&#xff09;&#xff0c;它是谷歌最新、最强大的人工智能模型&#xff0c;旨在迎头痛击 OpenAI 的 GPT。Gemini 在构建时考虑到了多模态性&#xff0c;这意味着它能够理解…

【日常总结】连接Mysql,打开数据表非常慢

问题 Navicat 连接mysql时&#xff0c;第二次打开非常慢 原因 Mysql服务器端会定时清理长时间不活跃空闲的数据库连接&#xff0c;以此优化数据库的性能。 解决方案 数据库右键---编辑连接--高级---保持连接间隔30秒 带来的问题 每次打开Navicat时&#xff0c;设置设置自动…

2023-南京荣耀Honor最新探访-OPEN DAY,实况记录!

前言 金九银十的秋招季缓缓落幕&#xff01; 接完offer&#xff0c;博主也回归啦&#xff01;有幸带着公开公平的心态&#xff0c;给大家分享一波南京荣耀总部的实况解密&#xff01; 最基础的环境状况&#xff0c;有图有真相&#xff01;~上图~ 民以食为天-南京荣耀食堂&…

issue阶段的选择电路的实现

1-of-M的仲裁电路 为什么要实现oldest-first 功能的仲裁呢&#xff1f; 这是考虑到越是旧的指令&#xff0c;和它存在相关性的指令也就越多&#xff0c;因此优先执行最旧的指令&#xff0c;则可以唤醒更多的指令&#xff0c;能够有效地提高处理器执行指令的并行度,而且最旧的指…

MapReduce和Yarn部署+入门

看的黑马视频记的笔记 目录 1.入门知识点 分布式计算&#xff1a; 概念&#xff1a; 两种模式&#xff1a; MapReduce&#xff08;分布式计算&#xff0c;分散汇总模式&#xff09; 概念 执行原理 注&#xff1a; Yarn&#xff08;分布式资源调度&#xff09; 概述 Y…

Linux Mint 21.3 代号为“Virginia”开启下载

Linux Mint 团队今天放出了 Linux Mint 21.3 Beta ISO 镜像&#xff0c;正式版计划在今年圣诞节发布。 支持 在实验性支持 Wayland 之外&#xff0c;Cinnamon 6.0 版 Linux Mint 21.3 Beta 镜像还带来了其它改进&#xff0c;Nemo 文件夹管理器右键菜单支持下载相关操作。 Cin…

SpringBoot之分层解耦以及 IOCDI的详细解析

### 3.2 分层解耦 刚才我们学习过程序分层思想了&#xff0c;接下来呢&#xff0c;我们来学习下程序的解耦思想。 解耦&#xff1a;解除耦合。 #### 3.2.1 耦合问题 首先需要了解软件开发涉及到的两个概念&#xff1a;内聚和耦合。 - 内聚&#xff1a;软件中各个功能模块内…

机器学习---聚类(原型聚类、密度聚类、层次聚类)

1. 原型聚类 原型聚类也称为“基于原型的聚类” (prototype-based clustering)&#xff0c;此类算法假设聚类结构能通过一 组原型刻画。算法过程&#xff1a;通常情况下&#xff0c;算法先对原型进行初始化&#xff0c;再对原型进行迭代更新求解。著 名的原型聚类算法&#…

OneBlog Shiro 反序列化漏洞复现

0x01 产品简介 OneBlog 是一个简洁美观、功能强大并且自适应的Java博客。使用springboot开发,前端使用Bootstrap。支持移动端自适应,配有完备的前台和后台管理功能。 0x02 漏洞概述 OneBlog v2.2.2 及之前的版本存在 shiro 反序列化漏洞,该漏洞源于软件存在硬编码的 shir…

【数据结构和算法】盛最多水的容器

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、题目描述 二、题解 2.1 方法一&#xff1a;暴力枚举 2.2 方法二&#xff1a;双指针 三、代码 3.1 方法一&#xff1a;暴力…

递归实现归并排序与测试各类排序的性能

目录 基本思想 代码实现 时空复杂度 测试各排序性能 基本思想 将待排序的数组不断二分&#xff0c;直到每个子数组只包含一个元素或为空。然后通过合并操作将这些子数组逐步合并成较大的有序数组&#xff0c;最终得到完全有序的结果&#xff1a; 下面是递归版本的归并排序…

Linux(4)-LAMP

L-LinuxA-apache/nginxM-mysqlp-php 搭建LAMP以及使用discuz搭建论坛网站 安装apache yum install httpd -y // 安装service httpd start // 启动Apache通过netstat -tunlp查看apache运行的端口&#xff0c;然后打开虚拟机ip 80端口能看到以下页面 或者 安装Mysql centOS6…

Python Pandas 重复值处理(第12讲)

Python Pandas 重复值处理(第12讲)         🍹博主 侯小啾 感谢您的支持与信赖。☀️ 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔…

基于JAVA的农村物流配送系统 开源项目

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统登录、注册界面2.2 系统功能2.2.1 快递信息管理&#xff1a;2.2.2 位置信息管理&#xff1a;2.2.3 配送人员分配&#xff1a;2.2.4 路线规划&#xff1a;2.2.5 个人中心&#xff1a;2.2.6 退换快递处理&#xff1a;…

yolov5障碍物识别-雪糕筒识别(代码+教程)

简介 这是一个检测交通锥并识别颜色的项目。我使用 yolov5 来训练和检测视锥细胞。此外&#xff0c;我使用 k 均值来确定主色&#xff0c;以对锥体颜色进行分类。目前&#xff0c;支持的颜色为红色、黄色、绿色和蓝色。其他颜色被归类为未知。 数据集和注释 我使用了一个自收…

SpringCloudAliBaba篇之Seata:分布式事务组件理论与实践

1、事务简介 事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元(unit)。在关系数据库中&#xff0c;一个事务由一组SQL语句组成&#xff0c;事务具有4个属性&#xff1a;原子性、一致性、隔离性、持久性。这四个属性通常称为ACID原则。 原子性(atomici…

开源学习项目推荐

文章目录 koodo-reader凤凰架构学习项目NPS 内网穿透客户端 koodo-reader 项目地址&#xff1a;https://github.com/koodo-reader/koodo-reader 介绍&#xff1a;一个开源的阅读器&#xff0c;阅读pdf也有目录&#xff0c;作为epub阅读器和pdf阅读器看资料挺好 凤凰架构 项…

前端视角看 Docker :在国内的基础配置教程(含国内镜像源)

引言 在国内使用Docker时&#xff0c;直接从Docker Hub拉取镜像可能会遇到网络速度慢的问题。配置国内的镜像加速器可以显著提升拉取速度。本教程将指导您完成安装Docker后的基础配置&#xff0c;特别是设置国内镜像加速器。 1. 安装Docker 确保您已在系统上安装Docker。根…

基于Tkinter制作简易的CAN bootloader上位机

文章目录 1.前言2.测试设备3.上位机3.1 参考资料3.2 上位机主要功能3.3 上位机发送流程 升级测试例程分享 1.前言 之前基于S32K144EVB和Tkinter编写了一个简易的串口bootloader上位机&#xff0c;链接如下&#xff1a; 基于Tkinter制作简易的串口bootloader上位机 (qq.com) …
最新文章