Otimização/Método da lagrangiana aumentada
Origem: Wikilivros, livros abertos por um mundo aberto.
| Otimização |
O problema a ser resolvido é:
Sabe-se que se for aplicado o método da lagrangiana, será considerada a função:
dada por
.
e também
, dada por
A grande dificuldade seria saber quando o valor de β é finito. Uma idéia seria modificar um pouco a lagrangiana (aumentando-a, com um termo extra), da seguinte maneira:
Com isso, seria necessário garantir que a idéia de fato resolve o problema. Por este motivo, é preciso desenvolver alguns resultados teóricos. Para fazer a análise deste método, um primeiro resultado importante é o seguinte:
- Lema (Finsler-Debreu)
Seja
uma matriz simétrica e
. As seguintes afirmações são equivalentes:
- Se Bx = 0, com
, então
; - Existe r > 0 tal que a matriz
é definida positiva; - Existe s > 0 tal que a matriz
é definida positiva para todo r > s.
| Demonstração |
|---|
| Primeiramente, será mostrado que a afirmação (2) é equivalente à afirmação (3).
Obviamente, (3) implica em (2). Por outro lado, supondo que se tem (2), existe algum s > 0, tal que a matriz Assim, (2) também implica (3). Agora, será mostrado que de (2) se conclui (1). De fato, se Bx = 0, para algum Finalmente, será garantido que se vale (1) então vale (3) (ver também página 25, de Izmailov & Solodov (2007)). Isso será mostrado por contradição, ou seja, supondo que vale (1) e que mesmo assim, não seja válido (3). Se disso seguir uma contradição, a implicação desejada é verdadeira. Supondo que para todo Neste caso, dividindo por Como todos os uk estão na esfera unitária, que é compacta, a sequência {uk} tem algum ponto de acumulação, por exemplo
Neste caso, só é possível se contradizendo a hipótese (1). |
- Exercício
Prove a seguinte variante do lema anterior:
- Seja
uma matriz simétrica e semi-definida positiva, e
. As seguintes afirmações são equivalentes:
- Se Bx = 0, com
, então
; - Existe r > 0 tal que a matriz
é definida positiva; - Para todo r > 0, a matriz
é definida positiva.
- Se Bx = 0, com
A partir de agora, o problema será:
onde se supõe que
são funções de classe
e que para todo
, o conjunto
é compacto (em inglês costuma-se usar a expressão inf-compact para descrever tais funções).
Sabe-se que a lagrangiana associada ao problema (P) é:
dada por
.
e ainda, em uma notação mais sintética, considerando a função H dada por:
definida por
tem-se a lagrangiana expressa da seguinte maneira:
Para o método da lagrangiana aumentada serão assumidas as seguintes hipóteses:
- Se
é solução, então existe
tal que
; - Para todo
, o jacobiano de H satizfaz:
Note que a segunda hipótese tem exatamente a mesma forma de uma das condições que aparece no lema de Finsler-Debreu.
- Definição
Dado ρ > 0, se define a lagrangiana aumentada para o problema (P) como:
dada por
Observe que é justamente a aparição do termo
sendo somado à lagrangiana que justifica o nome lagrangiana aumentada.
Esse conceito possui algumas interpretações:
- Exercício
Verifique que a lagrangiana aumentada lρ é justamente a lagrangiana do problema (P) penalizado, ou seja, de
| Demonstração |
|---|
| Basta notar que dentro do conjunto viável as funções objetivos são iguais. |
- Exercício
Verifique que a função dual βρ (o ínfimo da lagrangiana aumentada em relação à primeira componente), dada por
, com
é solução de (P)| Demonstração |
|---|
E a segunda desigualdade
|
- Exercício
Verifique que
é compacto, qualquer que seja
e
.
| Resolução |
|---|
| A resolução deste exercício é deixada a cargo do leitor. Sinta-se livre para melhorar a qualidade deste texto, incluindo-a neste módulo. |
- Proposição
Se
é solução de (P), então existe algum ρ0 > 0, algum δ0 > 0 e alguma vizinhança X0 de
tais que
é fortemente convexa com parâmetro δ0.
| Demonstração |
|---|
Conforme o lema de Finsler-Debreu, a hipótese (2), segundo a qual para todo , o jacobiano de H satizfaz:
equivale a dizer que existe algum ρ0 > 0 tal que Mas a Hessiana de Considere agora a função Logo, para qualquer Pela continuidade da função δ, existe uma vizinhança X0 de Assim, tomando o ínfimo, pode-se definir δ0 como Então quaisquer que sejam Portanto, ou seja, os auto-valores de Para concluir que
Com isso, Isso significa que há um único mínimo local para tal função, e que consequentemente ele é um mínimo global. Das hipóteses 1 e 2 colocadas no início da discussão sobre a lagrangiana aumentada, segue que |
Com essas condições, mostrou-se que em um ponto que seja solução, a lagrangiana aumentada é fortemente convexa.
Antes de apresentar o algoritmo, será fixada mais uma notação:
[editar] Algoritmo da lagrangiana aumentada
Dados ρ > 0 e
.
Início: Tomee k = 0. Iteração: Calcule xk, solução de
. Se H(xk) = 0, pare:
. Senão, faça uk + 1 = uk + εH(xk) k = k + 1
Este é um dos algoritmos mais usados e mais eficientes para problemas de programação não linear. A garantia de convergência segue dos próximos teoremas.
- Teorema
Sejam ρ0, δ0 e X0 como na proposição anterior. Se U é uma vizinhança de
, existe algum ρU > ρ0 tal que:

e 
Observações:
- X(ρ,u) denota as soluções do problema;
- A igualdade
significa que não há salto de dualidade. - Já foi mostrado que a função é fortemente convexa em uma vizinhança. Logo, os minimizadores devem estar em tal vizinhança.
- A prova é um pouco técnica, e usa as condições de KKT, mostrando que o cone linearizado é igual ao cone tangente.
| Prova |
|---|
| Esta prova é deixada a cargo do leitor. Sinta-se livre para melhorar a qualidade deste texto, incluindo-a neste módulo. |
O segundo teorema é:
- Teorema
Se ρ é suficientemente grande e δ suficientemente pequeno, então:


- {uk} é limitada
Observações:
- A propriedade 2 praticamente segue do fato de não haver salto de dualidade.
| Justificativa |
|---|
| Fica a cargo do leitor justificar este fato. Sinta-se livre para melhorar a qualidade deste texto, incluindo a justificativa neste módulo. |
Com esses resultados, tem-se a garantia de que o algoritmo realmente converge para uma solução, desde que os parâmetros sejam tomados adequadamente. A questão que ainda permanece é como identificar os valores adequados de ρ e de δ para que tal convergência ocorra.
- Exercício
Argumente porque as hipóteses 1, 2 e 3 garantem que a iteração do algoritmo da Lagrangiana aumentada para problemas de minimização com restrições de igualdade tem uma única solução, sendo:
- Todas as funções são de classe
e a função objetivo tem todos os seus subníveis compactos. - Se
é solução do problema, então existe
tal que o gradiente da Lagrangiana não aumentada com respeito a variável primal se anula em
. - A hessiana da Lagrangiana não aumentada com respeito a variável primal é definida positiva sob a variedade ortogonal de todos os gradientes no ponto
das restrições.


é definida positiva. Logo, para concluir a outra implicação, basta notar que para qualquer 


, e denotando
, segue que para cada
, existe algum
, com
, tais que
(pois
e

, ou seja, se
. Logo,




.
é definida positiva.
é dada por
. Logo, a hipótese equivale a dizer que
é definida positiva.
definida por
, tem-se
, e qualquer que seja
.

![d^\top \left[\nabla_x^2 l_{\rho_0} (x,\bar{u})\right] d \ge \delta_0 \|d\|^2](http://upload.wikimedia.org/math/a/4/1/a41ec23eb03f90501e181d2d0d395b17.png)
são todos positivos.
é fortemente convexa, basta recordar-se de dois fatos:
é semidefinida positiva;
é convexa, ou seja,
.![d^\top \left[\nabla_x^2 l_{\rho_0} (x,\bar{u})\right] d - \delta_0 \|d\|^2 \ge 0](http://upload.wikimedia.org/math/a/2/c/a2c1776e8d2f71dfd4b7f20e8c18fd44.png)

e
.
Se
.
Senão, faça