您的位置:首页 > 编程语言 > Go语言

Proximal Algorithms--Fixed points

2016-07-19 16:03 387 查看

2.3 Fixed points

近端操作:

proxf(v)=argminx(f(x)+(1/2)||x−v||22)(1.1)

当前仅当:

x∗=proxf(x∗)

即一个点经过近端操作后是其本身,那么点x∗最小化函数f,我们称x∗是proxf的一个固定点(a fixed point).

Fiex point algorithms.固定点算法

因为函数f的最小化点是proxf的固定点,因此我们可以找到函数近端操作的固定点来最小化函数f。如果proxf是收缩操作(if proxf were a contraction ),也就是说,Lipschitz continuous 中的常数小与1,那么重复的应用proxf可以找到一个的固定点(在这里是唯一的)。实际上,proxf没有必要是一个收缩操作(除非函数f是强凸的),其拥有一个不同的属性:firm nonexpansiveness(严格非增大),对于固定点的迭代该条件是足够的:

||proxf(x)−proxf(y)||22≤(x−y)T(proxf(x)−proxf(y))

对于所有的x,y∈Rn.

Firmly nonexpansiveness operators是nonexpansiveness operators(其Lipschitz continuous常数为1)的一个特例。一般的非增大操作的迭代不一定收敛到一个固定的点,如I或者旋转。然而,实际上,如果N是非增大的,那么操作T=(1−α)I+αN和N拥有同样的固定点,并且随着T的简单的迭代将收敛到T的一个固定点(N也是这个),其中α∈(0,1),也就是说,序列:

xk+1:=(1−α)xk+αN(xk)

将收敛到N的一个固定点。换句话说,一个非增大操作的阻尼迭代将收敛到其的一个固定点。

α−averaged perators:

操作符形式为:

(1−α)I+αN

其中N是非增大(非扩展)的,α∈(0,1)

averaged,contraction,firm nonexpansions,三个operators的关系:

1. contraction和firm nonexpansions是averaged operator的子集。

2. 这三个都是 nonexpansive operator的子集。

Averaged operator:

averaged操作很有用,因为它们满足一些属性,这些属性适合设计固定点方法,并且因为平均操作是contraction和firm nonexpansion的一个common father。例如:averaged操作满足组合操作的闭合性,而firm nonexpansions不满足组合操作的闭合性。也就是说firm nonexpansions的组合操作不一定是firm nonexpansion,但是总是averaged。上面提到,一个averaged 操作的迭代将收敛到一个固定点(如何存在的话,其是Krasnoselskii-Mann理论的一个结论)。那么假定T是一个avergaed操作,并且存在一个固定点,定义任意初始点x0的迭代:

xk+1:=T(xk)

那么随着k→∞,||T(xk)−xk||→0,并且xk收敛到T的一个固定点。

那么我们可以得到最简单近端算法:

xk+1:=proxλf(xk)

其称为proximal minimization或者proximal point algorithm.

2.4 Proximal average

令f1,...,fm是一些适当的闭凸函数。那么我们有:

1m∑i=1mproxfi=proxg

其中函数g称为f1,...,fm的proximal average.话句话说,一组函数近端操作的平均是某个函数本身的近端操作。该操作很基础,通常出现在并行近端算法中。

Moreau decomposition-莫罗分解

莫罗分解描述了近端操作和对偶之间的关系。

下面的关系总是成立的:

v=proxf(v)+proxf∗(v)(2.4)

其中f∗(y)=supx(yTx−f(x)),是函数f的convex conjugate(凸共轭).公式(2.4)称为莫罗分解。

莫罗分解可以看做是通过一个子空间导出的正交分解的推广。如果L是一个子空间,那么它的正交补(orthogonal complement)是:

L⊥={y|yTx=0 for all x∈L}

并且,对于任意的v,我们有:

v=ΠL(v)+ΠL⊥(v)

推导

将公式(1.1)带入到公式(2.4):

v=proxf(v)+proxf∗(v)

=argminx(f(x)+(1/2)||x−v||22)+argminy(supx(yTx−f(x))+(1/2)||x−v||22)

令函数f(x)为示性函数,并且假设x与y正交,则上面的公式变为:

=argminx(12||x−v||22)+argminy(12||y−v||22)

=ΠL(v)+ΠL⊥(v)

类似地,当函数f是闭凸锥K上的示性函数时,我们有:

v=ΠK(v)+ΠK∘(v)

其中:

K∘={y|yTx≤0 for all x∈K}

是polar cone,其是dual cone的negative(相反部分),其中dual cone如下:

K∗={y|yTx≥0 for all x∈K}

莫罗分解给出了一个简单的根据f∗的近端操作来获得函数f的近端操作的方式。例如,f=||⋅||是一个普通的范数,那么f∗=IB,其中:

B={x|||x||∗≤1}

是对偶函数||⋅||∗的单位球,定义如下:

||z||∗=sup{zTx| ||x||≤1}

通过莫罗分解,其变为:

v=proxf(v)+ΠB(v)

换句话说,如果我们知道如何投影到B,那么可以很容易的计算proxf.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: