Otimização/KKT
Origem: Wikilivros, livros abertos por um mundo aberto.
| Otimização |
Neste capítulo o objetivo é desenvolver algumas ideias e provar o teorema de Karush–Kuhn–Tucker (também chamado simplesmente de teorema KKT) que será utilizado no capítulo seguinte para explorar os métodos duais. O teorema KKT é bem útil para resolver problemas do tipo
Índice |
[editar] Cones
- Definição
Um conjunto
é um cone quando
Em outras palavras, a propriedade que caracteriza um cone é que este tipo de conjunto contém todos os múltiplos não nulos de qualquer de seus elementos.
- Definição
Dado um subconjunto
, o cone dual de C é o conjunto definido por
.
Observações:
- C * é um cone: Se
tem-se que
. Logo, para qualquer
, vale
. Disto segue que
, mostrando que C * é um cone. - Sempre se tem que
(Verifique).
Na segunda propriedade a igualdade pode não ocorrer (exemplo?). Para o objetivo deste texto, o ideal seria que a igualdade valesse. Mas será que isso ocorre para algum conjunto? A resposta é sim e, conforme o próximo lema, basta que C seja um cone convexo fechado.
| Este livro tem a seguinte tarefa pendente: Incluir a definição de projeção antes deste ponto, pois ela será usada durante a demonstração |
- Lema (Farkas)
Se
um cone convexo fechado, então C = (C * ) * .
| Demonstração |
|---|
Seja e w = projC(y). Sabendo que a projeção de um ponto sobre um conjunto convexo é única, será mostrado que w = y e então ficará provada a inclusão . Disto seguirá a igualdade entre os dois conjuntos, já que C é sempre um subconjunto de (C * ) * .
Pelo teorema da projeção (ver Izmailov & Solodov (2007)), tem-se que
Dessas desigualdades, conclui-se que De Usando a definição de cone dual, isso implica que Uma vez que Desses fatos acima se conclui que Isso mostra que y = w. |
- Definição
Dado
, se diz que
é uma direção viável em x, com respeito a C, quando existe ε > 0 tal que
-
.
- O conjunto de todas as direções viáveis em x, com respeito ao conjunto C, será denotado por VC(x).
Esse conjunto VC(x) é o cone das direções viáveis em x, com respeito a C.
- Definição
Uma direção
é uma direção de descida da função f em x, se existe ε > 0 tal que
-
.
- O conjunto das direções de descida será denotado por D(x).
[editar] Caracterização das direções de descida
- Lema
Seja
uma função diferenciável em
. Então
.
satisfaz
.
| Demonstração |
|---|
1) Seja . Então, tem-se f(x + td) < f(x).
Usando a série de Taylor, tem-se Sendo
Passando o limite com 2) Novamente aplicando Taylor em f(x + td) − f(x) tem-se
Como
Pela hipótese
Pelo teorema da conservação do sinal, existe ε > 0 tal que Portanto,
Conclui-se então que |
[editar] O cone viável linearizado
- Definição
Dado
, a desigualdade
é uma restrição ativa em x se gi(x) = 0.
- Observações
- O conjunto formado pelos índices das restrições de desigualdade ativas é denotado por I(x). Assim,
- I(x) = {i:gi(x) = 0}
- Definição
Dado um ponto
e o conjunto I(x), se define o cone viável linearizado de C a partir de x como
.
L(x,C) é um cone não-vazio convexo e fechado pois,
. E se
, tem-se
e
.
Portanto
mostrando que L(x,C) é convexo.
Para mostrar que L(x,C) é fechado, pode-se pegar uma sequência convergente
e mostrar que o ponto de acumulação dela esta em L(x,C).
Tem-se que
.
Passando o limite com
, obtem-se
e
.
Isso mostra que L(x,C) é fechado.
- Lema (Caratheodory)
Sejam
. Seja
com
e
escalares tais que
e
.
e escalares
com
e
tais que
e os vetores
são linearmente independentes.
| Demonstração |
|---|
Sem perda de generalidade, suponha que e . Considere que sejam linearmente dependentes.
Portanto existem escalares λi com Multiplicando a igualdade acima por t e subtraindo de
Para t = 0 certamente nenhum dos coeficientes acima se anula. Seja Assim, se escreve x como combinação linear de no máximo m + p − 1 vetores já que Repetindo esse processo obtem-se uma combinação linearmente independente. |
- Definição
Dado um ponto
, se define o cone G(x) por
-
.
A seguir, serão mostradas algumas propriedades deste cone.
- Lema
Para qualquer
, G(x) é um cone convexo e fechado.
| Demonstração |
|---|
Primeiro será mostrado que G(x) é de fato um cone. Seja e . Então tem-se
Como Agora, será provado que G(x) é convexo. Para isso seja
Logo tem-se,
Como Para mostrar que G(x) é fechado, toma-se uma sequência convergente em G(x) e se mostra que o ponto de acumulação dela pertence a G(x). Para isso seja Escrevendo G(x) em forma matricial tem-se Pelo Lema de Caratheodory podemos assumir que Uma vez que Uma vez que Passando o limite obtem-se,
Isso mostra que Agora passando o limite em zk = CΩk obtém-se z = CΩ, mostrando que |
- Lema
Para qualquer
, G(x) = L(x,C) * .
| Demonstração |
|---|
| Como L(x,C) e G(x) são convexos e fechados, tem-se que L(x,C) = (L(x,C) * ) * e G(x) = (G(x) * ) * . Será mostrado então que L(x,C) = G(x) * .
Seja Mas Conclui-se então que Agora a volta, seja Em particular, uma vez que Além disso, uma vez que Logo |
[editar] O cone tangente
- Definição
Um vetor
é chamado direção tangente em C a partir de
quando ou d = 0 ou
tal que
e
.
- Observações
- O conjunto de todas as direções tangentes no ponto
, é denominado cone tangente, e denotado por T(x,C). - Se
, então T(a,C) também pode ser descrito como
- Exercício
Verifique que T(a,C) é de fato um cone (e portanto merece ser chamado de "cone tangente").
| Resolução |
|---|
| A resolução deste exercício é deixada a cargo do leitor. Sinta-se livre para melhorar a qualidade deste texto, incluindo-a neste módulo. |
[editar] Exemplo de cone tangente
Determinar o cone tangente ao ponto a = (0,0) do quadrado unitário com vértices (0,0), (0,1), ( − 1,1) e ( − 1,0).
| Resolução |
|---|
|
Dado qualquer ponto d = (d0,d1) do 2º quadrante (formado pelos pontos (x,y) tais que x < 0 e y > 0), pode-se definir:
Com essas escolhas, tem-se: Logo, |
[editar] Propriedades do cone tangente
O cone tangente definido anteriormente tem as seguintes propriedades:
- T(a,C) é fechado e

- Se
então 
- Se V é uma vizinhança de a, então

- Observação
A terceira propriedade indica que o cone tangente só depende do que ocorre bem perto de a, no conjunto C.
- Lema
Para qualquer
, T(x,C) é fechado.
| Demonstração |
|---|
Seja com . Será mostrado que .
Caso d = 0, Neste caso, sem perda de generalidade pode-se considerar que Fixando Assim para Em particular, tomando j = jk tem-se
Tomando o limite quando
Logo Isso mostra que |
- Exercício
Verificar que:
.- Se
e a = (0,0), então
.
- Lema
Se
é um mínimo local do problema (P), então
.
| Demonstração |
|---|
| Por Taylor tem-se
Passando o limite quando Donde |
[editar] Teorema KKT
- Teorema (Condições de KKT)
Seja
e considere
um minimizador local do problema
e
tais que:


.
| Demonstração |
|---|
Considere a um minimizador local do problema (P). Então . Pela definição de cone dual isso significa que .
Pela hipotése tem-se Como foi visto acima G(a) é um cone convexo e fechado. Portanto usando o Lema de Farkas obtem-se que Pela definição de G(a), existem escalares δi com
Como Como Com isso fica provado o Teorema de KKT. |


.
e
. Disto seguirá a igualdade entre os dois conjuntos, já que
. Usando o fato de que
e
e substituindo isto na equação acima obtem-se
e
.
.
, tem-se que
.
.
.
. Então,
tem-se 
,
.
tem-se que
.
.
.
, com isto
.
.
.
e
. Considere que
sejam linearmente dependentes.
e
não todos nulos tais que

o 
.
e
. Então tem-se
.
tem-se que
.
, isto é,
e
e
.
.
visto que
e
. Com isso concluímos que
mostrando que
com
. Será mostrado que
.
.
tem colunas linearmente independentes, e portanto
é não singular.
com
tais que
.
com
.
.
. Assim, dado
tem-se

e
e
.
. Como
.
.
e
, tem-se que
, tem-se que 



.
com
. Será mostrado que
.
.
, pois
.
tem-se que
. Portanto, existe
tal que
e
quando
.
existe
tal que para
, tal que
e
.
e
.
.
,
,
e
.
.
logo pode-se dividir e obtem-se
.
.
tem-se

.
.


.
. Pela definição de cone dual isso significa que
.
. Como
.
.
e
tais que
com
.
, define-se
e 
obtem-se
.