Esta é a versão para impressão de Análise real
Se você for imprimir esta página, escolha "Visualizar impressão" no seu navegador, ou clique em Versão para impressão , você irá ver esta página sem esse aviso, sem os elementos de navegação a esquerda ou acima, e sem as TOC's de cada página.
Atualize esta página para ter certeza de que está imprimindo a versão mais atual.
Para maiores informações sobre a versão para impressão, incluindo como fazer arquivos PDF realmente adequados para a impressão, veja Wikilivros:Versões para impressão .
Análise real
Este livro é resultado do conhecimento, do empenho e da dedicação de várias pessoas, que acreditam que o conhecimento deve ser de todos os que aspiram obtê-lo, sendo a doação um ato que é recompensado pela satisfação em difundir o saber.
Wikilivristas que cooperaram com o desenvolvimento e manutenção deste wikilivro:
Esses nomes não estão na ordem de importância e sim na ordem com que foram aparecendo para ajudar.
Caso ajudou a fazê-lo sinta-se a vontade em registrar seu nome acima
O objetivo principal deste livro é que qualquer pessoa que tenha feito um bom curso de cálculo , e que esteja interessado em aprender análise, fique satisfeito depois de uma longa leitura desses textos. É claro que, às vezes, uma única leitura é insuficiente, pois se trata de conceitos abstratos. Abaixo temos o que chamamos de requisitos básicos . O que temos que saber primeiro para que entendamos tudo quanto está escrito no livro de análise.
Quando o livro-texto já estiver quase pronto, colocar a disposição exercícios e também suas resoluções.
Buscar ser o melhor livro na área, pois ele será auto-explicativo.
Evitar a trivialidade. Conforme os leitores forem tendo dúvidas, comunicarão pelas discussões para que possamos melhorar o texto para que ele se torne auto-explicativo.
Sempre que alguém ver alguma falha , erro , equívoco ou algo que falte do livro-texto sempre estará aberto a novas opiniões.
Existe um grande pulo entre fazer um simples curso de cálculo (na licenciatura ou áreas práticas , como engenharias, física, ...) e fazer um rigoroso curso de cálculo no bacharelado nos livros rigorosos como Guidorizzi.
Assim em vez de fazermos um livro só para desfazer essa diferença, no final do livro de análise, estaremos colocando certos conceitos que o leitor tem que ter em mãos, esta que é a diferença citada acima.
Talvez algum dia, esses conceitos possam ser separados num novo livro.
A análise real é uma área da análise matemática que estuda o conjunto dos números reais e, principalmente, as propriedades analíticas das funções reais a valores reais. Entre os seus objetos de estudo, estão:
Convergência de seqüências;
Limite de funções;
Continuidade de funções;
Diferenciação;
Integração.
Sendo assim, este livro começa definindo de forma precisa o que são "números reais" e o que se pode fazer com eles, ou seja, quais são as operações definidas sobre este conjunto numérico, e quais as suas propriedades. A presença de tais formalismos em um livro de análise é essencial. Uma razão muito simples para isso é que não se pode começar a provar teoremas sobre números reais, sem que se tenha deixado claro sobre o que exatamente está sendo falado. Essa é uma das grandes diferenças entre um livro de cálculo e um livro de análise : Em cálculo o mais importante é aprender a aplicar os conceitos e teoremas (da análise matemática), realizando cálculos . Na análise, procura-se desenvolver formalmente toda a teoria que garante o funcionamento daqueles teoremas, fazendo-se uma análise dessa teoria, levando em conta toda a estrutura lógica que interliga tais teoremas. Em certo sentido, em cálculo usam-se os teoremas para fazer contas, e na análise usa-se a lógica para fazer teoremas.
Com o conhecimento adquirido na formação escolar, tem-se ainda apenas uma idéia intuitiva do que são os números reais. Às vezes não se tem a familiaridade necessária com esse conceito para poder responder com segurança questões como:
"Por que não se extrai raiz quadrada de números negativos, como
−
1
{\displaystyle {\sqrt {-1}}}
?" e
"Por que não se pode dividir por zero, e escrever
1
0
{\displaystyle {\frac {1}{0}}}
?"
Mesmo que a verdade fosse dita, alguns alunos não ficariam satisfeitos com a explicação. Mesmo que a resposta possa não ser útil para muitas pessoas, para os futuros matemáticos, e professores de matemática, é preciso oferecer alguma explicação convincente. No caso:
Pode-se, sim, extrair raiz quadrada de números negativos, mas o resultado será um número complexo.
Mesmo que alguém quisesse definir a segunda expressão como sendo algum número real (e admita, até você já quis fazer isso, não?), imediatamente seriam deduzidos fatos contraditórios.
Um exemplo (talvez um pouco informal) de uma tentativa frustrada de definir essa última expressão, mas que oferece alguma intuição a respeito é:
Se
1
0
{\displaystyle {\frac {1}{0}}}
fosse igual a
10
{\displaystyle 10}
, ou seja,
1
0
=
10
{\displaystyle {\frac {1}{0}}=10}
então ao multiplicar ambos os membros pelo denominador (às vezes chamado de passar o zero para a direita) seria concluído que
1
=
0
{\displaystyle 1=0}
. Nada é mais absurdo que isso!
Sendo assim, já que qualquer tentativa de escolher um valor real para atribuir à expressão
1
0
{\displaystyle {\frac {1}{0}}}
leva a uma contradição como a anterior, é muito mais útil deixar tal expressão indefinida, do que estudar uma teoria cheia de contradições!
Neste livro, a abordagem escolhida para a construção da teoria é aquela em que se procura definir os números a partir de alguns axiomas (uma teoria axiomática). Em termos leigos, os axiomas correspondem às propriedades que se acredita que os números reais deveriam ter. Com base nessas propriedades, demonstram-se muitas outras (leia-se "todas as outras"), de forma que tudo aquilo que se pode fazer com os números reais esteja bem justificado.
Faça uma boa leitura e, se encontrar algum erro ao longo do texto, seja audaz: Faça você mesmo a correção! Melhorias no texto sempre serão bem vindas, e em caso de dúvida pode-se ainda consultar os autores .
todos os quadrados são retângulos
qualquer losango é um quadrilátero.
alguns triângulos são equilátero.
É uma sentença resultante de uma sentença que pode ser uma afirmação ou uma negação.
Duas retas r e s são paralelas. Isso quer dizer que o coeficiente angular da reta r é igual ao coeficiente angular da reta s.
r
:
y
=
m
r
⋅
x
+
n
r
e
s
:
y
=
m
s
⋅
x
+
n
s
.
S
e
r
/
/
s
,
l
o
g
o
m
r
=
m
s
{\displaystyle r:y=m_{r}\cdot x+n_{r}\;e\;s:y=m_{s}\cdot x+n_{s}.Se\;r//s,\;logo\;m_{r}=m_{s}}
Definição de Conjunto
Um Conjunto é constítuidos de objetos denominados de elementos.
Quando um elemento x pertence a um conjunto X, escrevemos:
x
∈
X
{\displaystyle x\in X\;}
.
Quando um elemento x não pertence a um conjunto X, escrevemos:
x
∉
X
{\displaystyle x\not \in X\;}
.
Uma forma de caracterizar um conjunto é através da lista dos seus elementos, escrevendo-os separados por vírgulas “,” no interior de duas chaves “{” e “}”.
Exemplo: Seja
A
{\displaystyle A\;}
um conjunto cujos elementos são 1, 2, 3 e 4;
B
{\displaystyle B\;}
é o conjunto dos quatro primeiros impares naturais. Temos que
A
=
{
1
,
2
,
3
,
4
}
,
B
=
{
1
,
3
,
5
,
7
}
,
logo
2
∈
A
,
2
∉
B
{\displaystyle A=\{1,2,3,4\},B=\{1,3,5,7\},{\mbox{ logo }}2\in A,2\not \in B}
.
Repetidas vezes usamos expressões do tipo “existe”, “para todo”, “qualquer que seja”, etc. Para simplificar a escrita destas expressões introduziremos alguns símbolos que as representam, a saber:
∃
{\displaystyle \exists }
significa “existe”;
∃
!
{\displaystyle \exists !}
significa “existe um único”;
∀
{\displaystyle \forall }
significa “para todo” ou “qualquer que seja”;
⇒
{\displaystyle \Rightarrow }
significa “se ... então ...” ou “implica que”;
⇔
{\displaystyle \Leftrightarrow }
significa “se, e somente se,”.
O Conjunto
N
=
{
1
,
2
,
3
,
.
.
.
}
{\displaystyle \mathbb {N} =\{1,2,3,...\}}
O Conjunto
Z
=
{
.
.
.
,
−
2
,
−
1
,
0
,
1
,
2
,
.
.
.
}
{\displaystyle \mathbb {Z} =\{...,-2,-1,0,1,2,...\}}
O Conjunto
Q
=
{
a
b
;
a
∈
Z
,
b
∈
Z
}
{\displaystyle \mathbb {Q} =\{{a \over b};a\in \mathbb {Z} ,b\in \mathbb {Z} \}}
R
−
Q
=
{
x
∉
Q
;
x
≠
a
b
,
∀
a
,
b
Z
}
{\displaystyle \mathbb {R} -\mathbb {Q} =\{x\not \in \mathbb {Q} ;x\neq {a \over b},\forall \;a,b\;\mathbb {Z} \}}
O Conjunto dos reais
R
{\displaystyle \mathbb {R} }
são todos os números racionais e os irracionais.
R
=
Q
∪
(
R
−
Q
)
{\displaystyle \mathbb {R} =\mathbb {Q} \cup (\mathbb {R} -\mathbb {Q} )}
R
=
{
x
;
a
x
2
+
b
x
+
c
=
0
e
b
2
≥
4
a
c
}
{\displaystyle \mathbb {R} =\{x;ax^{2}+bx+c=0\;e\;b^{2}\geq 4ac\}}
R
=
{
x
∈
C
;
a
x
2
+
b
x
+
c
=
0
e
b
2
≥
4
a
c
}
{\displaystyle \mathbb {R} =\{x\in \mathbb {C} ;ax^{2}+bx+c=0\;e\;b^{2}\geq 4ac\}}
(visto como subconjunto dos complexos)
O Conjunto
C
=
{
x
;
a
x
2
+
b
x
+
c
=
0
:
a
,
b
,
c
∈
Z
}
=
{
a
+
b
i
;
a
,
b
∈
R
}
{\displaystyle \mathbb {C} =\{x;ax^{2}+bx+c=0:a,b,c\in \mathbb {Z} \}=\{a+bi;a,b\in \mathbb {R} \}}
Y
=
{
y
;
y
q
u
e
s
a
t
i
s
f
a
z
e
m
a
s
p
r
o
p
r
i
e
d
a
d
e
s
P
1
,
.
.
.
,
P
n
}
{\displaystyle Y=\{y;y\;que\;satisfazem\;as\;propriedades\;P_{1},...,P_{n}\}}
Exemplo:
Y
=
{
y
;
y
s
e
j
a
n
a
t
u
r
a
l
,
y
s
e
j
a
m
a
i
o
r
q
u
e
3
,
y
s
e
j
a
m
e
n
o
r
o
u
i
g
u
a
l
a
8
}
=
{
4
,
5
,
6
,
7
,
8
}
{\displaystyle Y=\{y;y\;seja\;natural,y\;seja\;maior\;que\;3,y\;seja\;menor\;ou\;igual\;a\;8\}=\{4,5,6,7,8\}}
O exemplo anterior deve ser escrito assim:
Y
=
{
y
∈
N
;
3
<
y
≤
8
}
=
{
4
,
5
,
6
,
7
,
8
}
{\displaystyle Y=\{y\in \mathbb {N} ;3<y\leq 8\}=\{4,5,6,7,8\}}
Um conjunto que não têm elementos é chamado de conjunto nulo e representado pelo símbolo
∅
{\displaystyle \varnothing }
. Mas é mais conhecido como conjunto vazio . Podemos dizer que é um conjunto que não possui elemento. Na prática é um conjunto definidos por propriedades, mas que elemento nenhum satisfaz as propriedades desse conjunto.
exemplo:
A
=
{
x
;
x
{\displaystyle A=\{x;x}
seja natural positivo
}
{\displaystyle \}}
e
B
=
{
y
;
y
{\displaystyle B=\{y;y}
seja inteiro negativo
}
{\displaystyle \}}
. Vamos tomar
C
=
{
{\displaystyle C=\{}
elementos que estão no conjunto A e estão no conjunto B
}
{\displaystyle \}}
. Logo C é vazio, pois nenhum elemento que seja natural positivo é inteiro negativo.
A maneira matemática formal de escrever o que foi enunciado no exemplo anterior:
A
=
{
x
∈
N
;
x
>
0
}
e
B
=
{
y
∈
Z
;
y
<
0
}
{\displaystyle A=\{x\in \mathbb {N} ;x>0\}{\mbox{ e }}B=\{y\in \mathbb {Z} ;y<0\}}
. Vamos tomar
C
=
A
∩
B
{\displaystyle C=A\cap B}
. Logo
C
=
∅
{\displaystyle C=\varnothing }
, pois nenhum elemento que seja natural positivo é inteiro negativo.
Um Conjunto ordenado é um grupo de objetos com um sentido definido de quem é maior. Para dar uma definição abstrata de ordem, iremos dar alguns exemplos de conjuntos ordenados e explorar algumas relações básicas. Nosso primeiro e mais importante conjunto é o conjunto dos números naturais.
O conjunto dos números naturais
N
=
{
1
,
2
,
3
,
…
}
{\displaystyle \mathbb {\mathbb {N} } =\{1,2,3,\ldots \}}
(Alguns autores tomam
{
0
,
1
,
2
,
…
}
{\displaystyle \{0,1,2,\ldots \}}
— quando nós desejarmos nos referir a esse conjunto, usaremos
N
0
{\displaystyle \mathbb {N} _{0}}
). O conjunto dos números naturais são todos os números que usamos para contar. Este conjunto é definido por propriedades. A primeira propriedade do conjunto dos números naturais
N
{\displaystyle \mathbb {N} }
é que têm uma relação de equivalência
=
{\displaystyle =\ }
satisfazendo as relações de equivalência seguintes:
Reflexividade
Qualquer que seja
n
∈
N
,
n
=
n
;
{\displaystyle n\in \mathbb {N} ,\ n=n;}
Simétrico
Qualquer que seja
n
,
m
∈
N
,
n
=
m
⇒
m
=
n
{\displaystyle n,m\in \mathbb {N} ,\ n=m\Rightarrow m=n}
;
Transitividade
Qualquer que seja
n
,
m
,
l
∈
N
{\displaystyle n,m,l\in \mathbb {N} }
se
n
=
m
{\displaystyle n=m}
e
m
=
l
{\displaystyle m=l}
, então
n
=
l
{\displaystyle n=l}
;
Estes termos afirmativos matemáticos podem ser escritos de uma maneira menos rigorosa.
A primeira relação simplesmente significa que qualquer número natural é igual a si mesmo.
A segunda relação significa que igualdade vale para qualquer ordem que você disser.
A última relação diz que quando dois números naturais são iguais e um destes é igual a outro então todos os três são iguais.
Associados com essas relações de equivalência está uma ordem significando que os axiomas adicionais são satisfeitos:
Tricotomia
Qualquer que seja
m
,
n
∈
N
{\displaystyle m,n\in \mathbb {N} }
, um e somente um, destes abaixo é verdadeiro:
m
<
n
{\displaystyle m<n}
m
=
n
{\displaystyle m=n}
m
>
n
{\displaystyle m>n}
A notação
m
≤
n
{\displaystyle m\leq n}
significa que
m
<
n
{\displaystyle m<n}
ou
m
=
n
{\displaystyle m=n}
, e a notação
m
≥
n
{\displaystyle m\geq n}
significa que
m
>
n
{\displaystyle m>n}
ou
m
=
n
{\displaystyle m=n}
.
Transitividade de < and > .
Qualquer que seja
n
,
m
,
l
∈
N
{\displaystyle n,m,l\in \mathbb {N} }
, se
n
<
m
{\displaystyle n<m}
e
m
≤
l
{\displaystyle m\leq l}
, então
n
<
l
{\displaystyle n<l}
.
Qualquer que seja
n
,
m
,
l
∈
N
{\displaystyle n,m,l\in \mathbb {N} }
, se
n
>
m
{\displaystyle n>m}
e
m
≥
l
{\displaystyle m\geq l}
, então
n
>
l
{\displaystyle n>l}
.
Tricotomia significa que qualquer dois números naturais tomados, ou eles são iguais ou um deles é maior que o outro. Transitividade diz que, se existe um terceiro número que é maior que o maior de dois primeiros, então ele é maior que o menor deles. Com isto nós temos uma definição concisa de que temos uma ordem para nossos números. Finalmente os números naturais
N
{\displaystyle \mathbb {N} }
têm uma operação de associatividade chamada adição. O conjunto
N
{\displaystyle \mathbb {N} }
e as operações de adição
+
{\displaystyle +}
satisfazem o seguinte axioma:
Fechamento
Qualquer que seja
n
,
m
∈
N
,
n
+
m
∈
N
{\displaystyle n,m\in \mathbb {N} ,n+m\in \mathbb {N} }
.
Comutatividade
Qualquer que seja
n
,
m
∈
N
,
n
+
m
=
m
+
n
{\displaystyle n,m\in \mathbb {N} ,\ n+m=m+n}
.
Associatividade
Qualquer que seja
n
,
m
,
l
∈
N
,
n
+
(
m
+
l
)
=
(
n
+
m
)
+
l
{\displaystyle n,m,l\in \mathbb {N} ,\ n+(m+l)=(n+m)+l}
.
Significa que podemos escrever sem ambiguidade
n
+
m
+
l
{\displaystyle n+m+l}
Compatibilidade com ordem
Qualquer que seja
n
,
m
∈
N
,
n
<
n
+
m
{\displaystyle n,m\in \mathbb {N} ,\ n<n+m}
Significa que se adicionarmos dois naturais o resultado é um natural. A ordem na qual adicionamos não é importante e se eu adicionar dois naturais a soma é tão grande se somar de outro modo.
Fechamento
Qualquer que seja
n
,
m
∈
N
,
n
×
m
∈
N
{\displaystyle n,m\in \mathbb {N} ,\ n\times m\in \mathbb {N} }
.
Identidade
Qualquer que seja
n
∈
N
,
n
×
1
=
n
{\displaystyle n\in \mathbb {N} ,\ n\times 1=n}
.
Commutatividade
Qualquer que seja
n
,
m
∈
N
,
n
×
m
=
m
×
n
{\displaystyle n,m\in \mathbb {N} ,\ n\times m=m\times n}
.
Associatividade
Qualquer que seja
n
,
m
,
l
∈
N
,
(
n
×
m
)
×
l
=
n
×
(
m
×
l
)
{\displaystyle n,m,l\in \mathbb {N} ,\ (n\times m)\times l=n\times (m\times l)}
,
significa que podemos escrever ambiguosamente
n
×
m
×
l
{\displaystyle n\times m\times l}
.
Distributividade
Qualquer que seja
n
,
m
,
l
∈
N
,
n
×
(
m
+
l
)
=
n
×
m
+
n
×
l
{\displaystyle n,m,l\in \mathbb {N} ,\ n\times (m+l)=n\times m+n\times l}
.
Compatibilidade com ordernados
Qualquer que seja
n
,
m
∈
N
,
m
≤
n
×
m
{\displaystyle n,m\in \mathbb {N} ,\ m\leq n\times m}
.
Quando um conjunto
Y
{\displaystyle Y\;}
é parte de uma certa coleção
X
{\displaystyle X\;}
dizemos que Y é subconjunto de X e escrevemos
Y
⊂
X
{\displaystyle Y\subset X}
.
Ex:
X
=
{
x
∈
R
;
x
>
2
}
,
Y
=
{
y
∈
R
;
4
<
y
<
10
}
{\displaystyle X=\{x\in \mathbb {R} ;\;x>2\},Y=\{y\in \mathbb {R} ;\;4<y<10\}}
. Como
X
=
(
2
,
∞
)
,
Y
=
(
4
,
10
)
,
(
4
,
10
)
⊂
(
2
,
∞
)
logo
Y
⊂
X
{\displaystyle X=(2,\infty ),Y=(4,10),(4,10)\subset (2,\infty ){\mbox{ logo }}Y\subset X}
, isto é, todo elemento que pertence a
Y
{\displaystyle Y\;}
, pertence a
X
{\displaystyle X\;}
, por isso dizemos que
Y
{\displaystyle Y\;}
é subconjunto de
X
{\displaystyle X\;}
.
Mais formalmente, se
y
∈
Y
,
Y
⊂
X
⇒
y
∈
X
{\displaystyle y\in Y,Y\subset X\Rightarrow y\in X}
, também
Y
⊂
X
⇔
X
⊃
Y
{\displaystyle Y\subset X\Leftrightarrow X\supset Y}
Consideremos os seguintes conjuntos
A
=
{
2
n
;
n
∈
N
}
,
B
=
{
4
n
;
n
∈
N
}
.
{\displaystyle A=\{2n;n\in \mathbb {N} \},B=\{4n;n\in \mathbb {N} \}.}
Provaremos que
B
⊂
A
.
{\displaystyle B\subset A.}
De fato, seja
x
∈
B
,
{\displaystyle x\in B,}
então
x
=
4
n
para algum
n
∈
N
{\displaystyle x=4n{\mbox{ para algum }}n\in \mathbb {N} }
, sendo que pode ser escrito na forma
x
=
2
(
2
n
)
=
2
m
{\displaystyle x=2(2n)=2m}
, onde claramente
m
=
2
n
∈
N
{\displaystyle m=2n\in \mathbb {N} }
, logo
x
∈
A
{\displaystyle x\in A}
Agora vejamos que
∃
x
∈
A
tal que
x
∈
B
;
tomamos
x
=
2
=
2
(
1
)
∈
A
{\displaystyle \exists x\in A{\mbox{ tal que }}x\in B;{\mbox{ tomamos }}x=2=2(1)\in A}
provaremos que este não pertence a B. Assim usando o argumento do absurdo (ou contradição), isto é, suponhamos que
x
=
2
∈
B
{\displaystyle x=2\in B}
então existe
n
∈
N
{\displaystyle n\in \mathbb {N} }
tal que
2
=
4
n
{\displaystyle 2=4n}
, porém esta igualdade somente é satisfeita se n for o número racional
n
=
1
/
2
{\displaystyle n=1/2}
o qual não pertence a
N
{\displaystyle \mathbb {N} }
, fato que nos fornece uma contradição. Portanto
A
⊂
B
.
{\displaystyle A\subset B.}
Y
⊂
X
{\displaystyle Y\subset X}
significa que todos os elementos de
Y
{\displaystyle Y\;}
estão em
X
{\displaystyle X\;}
.
Y
⊂
X
{\displaystyle Y\subset X}
lê-se
Y
{\displaystyle Y\;}
está contido em
X
{\displaystyle X\;}
.
Podemos definir
Y
⊂
X
{\displaystyle Y\subset X}
como
Y
=
{
a
;
a
∈
X
e
a
s
a
t
i
s
f
a
z
a
p
r
o
p
r
i
e
d
a
d
e
P
1
}
{\displaystyle Y=\{a;a\in X\;e\;a\;satisfaz\;a\;propriedade\;P_{1}\}}
, considerando que
P
1
{\displaystyle P_{1}\;}
não é uma das propriedades que definem os elementos de X.
Y
{\displaystyle Y\;}
é subconjunto próprio de
X
⇔
Y
≠
X
{\displaystyle X\Leftrightarrow Y\neq X}
e
Y
⊂
X
,
m
a
s
X
⊄
Y
{\displaystyle Y\subset X,mas\;X\not \subset Y}
.
O
∅
⊂
X
{\displaystyle \varnothing \subset X}
, isto é, o conjunto vazio é subconjunto de qualquer conjunto.
Para mostrar que X não seja subconjunto de Y, isto é,
X
⊄
Y
{\displaystyle X\not \subset Y\;}
, basta exibir um
x
∈
X
{\displaystyle x\in X\;}
e provar que
x
∉
Y
{\displaystyle x\not \in Y}
.
Exemplo: X é o conjunto dos naturais e Y é o conjunto dos naturais impares. Vamos mostrar que
X
⊄
Y
{\displaystyle X\not \subset Y\;}
. Segue que
2
∈
X
{\displaystyle 2\in X\;}
, mas
2
∉
Y
{\displaystyle 2\not \in Y\;}
. Logo
X
⊄
Y
{\displaystyle X\not \subset Y\;}
.
X
⊂
X
{\displaystyle X\subset X}
Ao tomarmos um elemento do primeiro conjunto, este elemento também pertence ao segundo conjunto. Assim todo conjunto é subconjunto de si mesmo.
X
⊂
Y
,
Y
⊂
X
⇒
X
=
Y
{\displaystyle X\subset Y,Y\subset X\Rightarrow X=Y}
prova: tome
x
∈
X
,
como
X
⊂
Y
⇒
x
∈
Y
,
ou tome
y
∈
Y
,
como
Y
⊂
X
⇒
y
∈
X
⇒
X
=
Y
{\displaystyle x\in X,{\mbox{ como }}\;X\subset Y\Rightarrow x\in Y,{\mbox{ ou tome }}y\in Y,{\mbox{ como }}Y\subset X\Rightarrow y\in X\Rightarrow X=Y}
X
⊂
Y
,
Y
⊂
Z
⇒
X
⊂
Z
{\displaystyle X\subset Y,Y\subset Z\Rightarrow X\subset Z}
prova: dado
x
∈
X
,
c
o
m
o
X
⊂
Y
⇒
x
∈
Y
,
m
a
s
Y
⊂
Z
⇒
x
∈
Z
⇒
X
⊂
Z
{\displaystyle x\in X,como\;X\subset Y\Rightarrow x\in Y,mas\;Y\subset Z\Rightarrow x\in Z\Rightarrow X\subset Z}
Um conjunto é igual ao outro se um conjunto é subconjunto do outro. Não podendo ser subconjunto próprio.
Y
=
X
⇔
Y
⊂
X
e
X
⊂
Y
{\displaystyle Y=X\Leftrightarrow Y\subset X\;e\;X\subset Y}
.
Dois conjuntos são disjuntos quando a intersecção dos conjuntos é o conjunto vazio, ou seja, quando seus elementos são distintos .
S
e
j
a
A
,
B
⊂
K
,
A
∩
B
=
∅
⇒
A
,
B
{\displaystyle Seja\;A,B\subset K,A\cap B=\varnothing \Rightarrow A,B}
são disjuntos.
Exemplos:
A
∩
A
=
A
{\displaystyle A\cap A=A}
. Logo A não é disjunto dele próprio.
A
∩
B
=
B
{\displaystyle A\cap B=B}
. Logo A,B não são disjuntos.
S
e
j
a
A
=
{
.
.
.
,
−
4
,
−
3
,
−
2
,
−
1
}
,
B
=
{
1
,
2
,
3
,
4
,
.
.
.
}
;
A
∩
B
=
∅
{\displaystyle Seja\;A=\{...,-4,-3,-2,-1\},B=\{1,2,3,4,...\};A\cap B=\varnothing }
. Logo A,B são disjuntos.
É comum definirmos um conjunto usando alguma propriedade:
S
e
j
a
X
⊂
K
,
X
=
{
x
∈
K
;
x
g
o
z
a
d
a
p
r
o
p
r
i
e
d
a
d
e
P
}
{\displaystyle Seja\;X\subset K,X=\{x\in K;x\;goza\;da\;propriedade\;P\}}
Ex:
K
=
{
.
.
.
,
−
3
,
−
2
,
−
1
,
0
,
1
,
.
.
.
}
,
X
=
{
x
∈
K
;
x
>
0
}
=
{
1
,
2
,
3
,
4
,
.
.
.
}
{\displaystyle K=\{...,-3,-2,-1,0,1,...\},X=\{x\in K;x>0\}=\{1,2,3,4,...\}}
Observe que K é o conjunto dos inteiros e que X é o conjunto dos naturais
A união de dois conjuntos é a reunião dos seus elementos, se algum elemento estiver repetido na inclusão, será contado uma única vez, assim:
S
e
j
a
A
,
B
⊂
K
,
A
∪
B
=
{
x
∈
K
;
x
∈
A
o
u
x
∈
B
}
{\displaystyle Seja\;A,B\subset K,A\cup B=\{x\in K;x\in A\;ou\;x\in B\}}
Veremos mais para frente que
A
∪
B
=
(
A
−
B
)
∪
(
B
−
A
)
∪
(
A
∩
B
)
{\displaystyle A\cup B=(A-B)\cup (B-A)\cup (A\cap B)}
ao qual são três conjuntos disjuntos
Temos que
A
,
B
⊂
A
∪
B
{\displaystyle A,B\subset A\cup B}
.
Propriedades Básicas:
NULO:
A
∪
∅
=
A
{\displaystyle A\cup \varnothing =A}
Basta verificarmos que
A
∪
∅
⊂
A
{\displaystyle A\cup \varnothing \subset A}
e depois que
A
⊂
A
∪
∅
{\displaystyle A\subset A\cup \varnothing }
. Assim
∀
x
∈
A
∪
∅
⇔
x
∈
A
{\displaystyle \forall \;x\in A\cup \varnothing \Leftrightarrow x\in A}
IDENTIDADE:
A
∪
A
=
A
{\displaystyle A\cup A=A}
∀
x
∈
A
∪
A
⇔
x
∈
A
o
u
x
∈
A
⇔
x
∈
A
{\displaystyle \forall \;x\in A\cup A\Leftrightarrow x\in A\;ou\;x\in A\Leftrightarrow x\in A}
COMUTATIVIDADE:
A
∪
B
=
B
∪
A
{\displaystyle A\cup B=B\cup A}
∀
x
∈
A
∪
B
⇔
x
∈
A
o
u
x
∈
B
⇔
x
∈
B
o
u
x
∈
A
⇔
x
∈
B
∪
A
{\displaystyle \forall \;x\in A\cup B\Leftrightarrow x\in A\;ou\;x\in B\Leftrightarrow x\in B\;ou\;x\in A\Leftrightarrow x\in B\cup A}
SUBCONJUNTO:
A
∪
B
=
A
⇔
B
⊂
A
{\displaystyle A\cup B=A\Leftrightarrow B\subset A}
⇒:
A
∪
B
⊂
A
⇒
∀
x
∈
B
,
t
e
r
e
m
o
s
x
∈
A
⇒
B
⊂
A
.
{\displaystyle \Rightarrow :A\cup B\subset A\Rightarrow \forall \;x\in B,\;teremos\;x\in A\Rightarrow B\subset A.}
⇐:
∀
x
∈
A
⇒
x
∈
A
o
u
x
∈
B
⇒
x
∈
A
∪
B
⇒
x
∈
A
∪
B
,
l
o
g
o
{\displaystyle \Leftarrow :\forall \;x\in A\Rightarrow x\in A\;ou\;x\in B\Rightarrow x\in A\cup B\Rightarrow x\in A\cup B,\;logo\;}
A
⊂
A
∪
B
{\displaystyle A\subset A\cup B}
.
∀
x
∈
A
∪
B
⇒
x
∈
A
o
u
x
∈
B
,
c
o
m
o
B
⊂
A
⇒
x
∈
A
⇒
A
∪
B
⊂
A
.
P
o
r
t
a
n
t
o
A
∪
B
=
A
{\displaystyle \forall \;x\in A\cup B\Rightarrow x\in A\;ou\;x\in B,\;como\;B\subset A\Rightarrow x\in A\Rightarrow A\cup B\subset A.\;Portanto\;A\cup B=A}
ASSOCIATIVA:
(
A
∪
B
)
∪
C
=
A
∪
(
B
∪
C
)
.
{\displaystyle (A\cup B)\cup C=A\cup (B\cup C).}
∀
x
∈
(
A
∪
B
)
∪
C
⇔
(
x
∈
A
o
u
x
∈
B
)
o
u
x
∈
C
⇔
x
∈
A
o
u
x
∈
B
o
u
x
∈
C
⇔
x
∈
A
o
u
(
x
∈
B
o
u
x
∈
C
)
⇔
x
∈
A
∪
(
B
∪
C
)
.
{\displaystyle \forall \;x\in (A\cup B)\cup C\Leftrightarrow (x\in A\;ou\;x\in B)\;ou\;x\in C\Leftrightarrow x\in A\;ou\;x\in B\;ou\;x\in C\Leftrightarrow x\in A\;ou\;(x\in B\;ou\;x\in C)\Leftrightarrow x\in A\cup (B\cup C).}
A
⊂
B
e
C
⊂
D
⇒
A
∪
C
⊂
B
∪
D
{\displaystyle A\subset B\;e\;C\subset D\Rightarrow A\cup C\subset B\cup D}
∀
x
∈
A
∪
C
⇒
x
∈
A
o
u
x
∈
C
,
c
o
m
o
A
⊂
B
,
C
⊂
D
,
l
o
g
o
x
∈
B
o
u
x
∈
D
⇔
x
∈
B
∪
D
.
{\displaystyle \forall \;x\in A\cup C\Rightarrow x\in A\;ou\;x\in C,\;como\;A\subset B,C\subset D,\;logo\;x\in B\;ou\;x\in D\Leftrightarrow x\in B\cup D.}
A intersecção de dois conjuntos é a reunião dos elementos que estão em ambos, assim:
S
e
j
a
A
,
B
⊂
K
,
A
∩
B
=
{
x
∈
K
;
x
∈
A
e
x
∈
B
}
,
o
u
s
e
j
a
,
x
∈
A
∩
B
⇒
x
∈
A
e
x
∈
B
{\displaystyle Seja\;A,B\subset K,A\cap B=\{x\in K;x\in A\;e\;x\in B\},\;ou\;seja\;,x\in A\cap B\Rightarrow x\in A\;e\;x\in B}
Exemplos:
NULO:
A
∩
∅
=
∅
.
{\displaystyle A\cap \varnothing =\varnothing .}
∀
x
∈
A
∩
∅
⇔
x
∈
A
e
x
∈
∅
⇔
x
∈
∅
.
{\displaystyle \forall x\in A\cap \varnothing \Leftrightarrow x\in A\;e\;x\in \varnothing \Leftrightarrow x\in \varnothing .}
IDENTIDADE:
A
∩
A
=
A
.
{\displaystyle A\cap A=A.}
∀
x
∈
A
∩
A
⇔
x
∈
A
e
x
∈
A
⇔
x
∈
A
.
{\displaystyle \forall x\in A\cap A\Leftrightarrow x\in A\;e\;x\in A\Leftrightarrow x\in A.}
COMUTATIVIDADE:
A
∩
B
=
B
∩
A
.
{\displaystyle A\cap B=B\cap A.}
∀
x
∈
A
∩
B
⇔
x
∈
A
e
x
∈
B
⇔
x
∈
B
e
x
∈
A
⇔
x
∈
B
∩
A
.
{\displaystyle \forall x\in A\cap B\Leftrightarrow x\in A\;e\;x\in B\Leftrightarrow x\in B\;e\;x\in A\Leftrightarrow x\in B\cap A.}
SUBCONJUNTO:
A
∩
B
=
B
⇔
B
⊂
A
.
{\displaystyle A\cap B=B\Leftrightarrow B\subset A.}
⇒:
∀
x
∈
B
,
c
o
m
o
B
⊂
A
∩
B
⇒
x
∈
A
∩
B
⇒
x
∈
A
⇒
B
⊂
A
.
{\displaystyle \Rightarrow :\forall x\in B,\;como\;B\subset A\cap B\Rightarrow x\in A\cap B\Rightarrow x\in A\Rightarrow B\subset A.}
⇐:
C
o
m
o
B
⊂
A
⇒
∀
x
∈
B
⇒
x
∈
A
⇒
x
∈
A
e
x
∈
B
⇒
x
∈
A
∩
B
,
l
o
g
o
{\displaystyle \Leftarrow :\;Como\;B\subset A\Rightarrow \forall \;x\in B\Rightarrow x\in A\Rightarrow x\in A\;e\;x\in B\Rightarrow x\in A\cap B,\;logo\;}
B
⊂
A
∩
B
{\displaystyle B\subset A\cap B}
.
∀
x
∈
A
∩
B
⇒
x
∈
A
e
x
∈
B
⇒
x
∈
B
⇒
A
∩
B
⊂
B
.
P
o
r
t
a
n
t
o
A
∩
B
=
B
.
{\displaystyle \forall x\in A\cap B\Rightarrow x\in A\;e\;x\in B\Rightarrow x\in B\Rightarrow A\cap B\subset B.\;Portanto\;A\cap B=B\;.}
ASSOCIATIVA:
(
A
∩
B
)
∩
C
=
A
∩
(
B
∩
C
)
.
{\displaystyle (A\cap B)\cap C=A\cap (B\cap C).}
∀
x
∈
(
A
∩
B
)
∩
C
⇔
x
∈
A
∩
B
e
x
∈
C
⇔
(
x
∈
A
e
x
∈
B
)
e
x
∈
C
⇔
x
∈
A
e
x
∈
B
e
x
∈
C
⇔
{\displaystyle \forall \;x\in (A\cap B)\cap C\Leftrightarrow x\in A\cap B\;e\;x\in C\Leftrightarrow (x\in A\;e\;x\in B)\;e\;x\in C\Leftrightarrow x\in A\;e\;x\in B\;e\;x\in C\Leftrightarrow }
⇔
x
∈
A
e
(
x
∈
B
e
x
∈
C
)
⇔
x
∈
A
e
x
∈
B
∩
C
⇔
x
∈
A
∩
(
B
∩
C
)
.
{\displaystyle \Leftrightarrow x\in A\;e\;(x\in B\;e\;x\in C)\Leftrightarrow x\in A\;e\;x\in B\cap C\Leftrightarrow x\in A\cap (B\cap C).}
A
⊂
B
e
C
⊂
D
⇒
A
∩
C
⊂
B
∩
D
{\displaystyle A\subset B\;e\;C\subset D\Rightarrow A\cap C\subset B\cap D}
∀
x
∈
A
∩
C
⇒
x
∈
A
e
x
∈
C
,
c
o
m
o
A
⊂
B
,
C
⊂
D
,
l
o
g
o
x
∈
B
e
x
∈
D
⇔
x
∈
B
∩
D
.
{\displaystyle \forall x\in A\cap C\Rightarrow x\in A\;e\;x\in C,\;como\;A\subset B,C\subset D,\;logo\;x\in B\;e\;x\in D\Leftrightarrow x\in B\cap D.}
A diferença de dois conjuntos é o conjunto dos elementos do primeiro com a exclusão dos elementos do segundo conjunto, assim:
S
e
j
a
A
,
B
⊂
K
,
A
−
B
=
{
x
∈
K
;
x
∈
A
e
x
∉
B
}
{\displaystyle Seja\;A,B\subset K,A-B=\{x\in K;x\in A\;e\;x\not \in B\}}
.
A
∖
B
e
A
−
B
{\displaystyle A\setminus B\;e\;A-B}
significam a mesma coisa.
A
∖
B
=
A
∩
B
C
{\displaystyle A\setminus B=A\cap B^{C}}
T
o
m
e
x
∈
A
∖
B
⇒
x
∈
A
∧
x
∉
B
⇒
x
∈
A
∧
x
∈
B
C
⇒
x
∈
A
∩
B
C
⇒
A
∖
B
⊂
A
∩
B
C
{\displaystyle Tome\;x\in A\setminus B\Rightarrow x\in A\land x\not \in B\Rightarrow x\in A\land x\in B^{C}\Rightarrow x\in A\cap B^{C}\Rightarrow A\setminus B\subset A\cap B^{C}}
.
T
o
m
e
x
∈
A
∩
B
C
⇒
x
∈
A
∧
x
∈
B
C
⇒
x
∈
A
∧
x
∉
B
⇒
x
∈
A
∖
B
⇒
A
∩
B
C
⊂
A
∖
B
{\displaystyle Tome\;x\in A\cap B^{C}\Rightarrow x\in A\land x\in B^{C}\Rightarrow x\in A\land x\not \in B\Rightarrow x\in A\setminus B\Rightarrow A\cap B^{C}\subset A\setminus B}
.
A
∖
B
=
A
∖
(
A
∩
B
)
{\displaystyle A\setminus B=A\setminus (A\cap B)}
T
o
m
e
x
∈
A
∖
B
⇒
x
∈
A
∧
x
∉
B
⇒
x
∈
A
∧
x
∈
B
C
{\displaystyle Tome\;x\in A\setminus B\Rightarrow x\in A\land x\not \in B\Rightarrow x\in A\land x\in B^{C}}
.
C
o
m
o
A
∩
B
⊂
B
⇒
B
C
⊂
(
A
∩
B
)
C
{\displaystyle Como\;A\cap B\subset B\Rightarrow B^{C}\subset (A\cap B)^{C}}
. Logo
x
∈
B
C
⇒
x
∈
(
A
∩
B
)
C
{\displaystyle x\in B^{C}\Rightarrow x\in (A\cap B)^{C}}
.
P
o
r
t
a
n
t
o
x
∈
A
∧
x
∈
B
C
⇒
x
∈
A
∧
x
∈
(
A
∩
B
)
C
⇒
x
∈
A
∩
(
A
∩
B
)
C
⇒
x
∈
A
∖
(
A
∩
B
)
⇒
A
∖
B
⊂
A
∖
(
A
∩
B
)
{\displaystyle Portanto\;x\in A\land x\in B^{C}\Rightarrow x\in A\land x\in (A\cap B)^{C}\Rightarrow x\in A\cap (A\cap B)^{C}\Rightarrow x\in A\setminus (A\cap B)\Rightarrow A\setminus B\subset A\setminus (A\cap B)}
.
T
o
m
e
x
∈
A
∖
(
A
∩
B
)
⇒
x
∈
A
∧
x
∉
(
A
∩
B
)
⇒
x
∈
A
∧
x
∈
(
A
∩
B
)
C
{\displaystyle Tome\;x\in A\setminus (A\cap B)\Rightarrow x\in A\land x\not \in (A\cap B)\Rightarrow x\in A\land x\in (A\cap B)^{C}}
.
(
A
∩
B
)
C
=
A
C
∪
B
C
.
L
o
g
o
x
∈
(
A
∩
B
)
C
⇒
x
∈
A
C
∪
B
C
⇒
x
∉
A
∨
x
∉
B
{\displaystyle (A\cap B)^{C}=A^{C}\cup B^{C}.Logo\;x\in (A\cap B)^{C}\Rightarrow x\in A^{C}\cup B^{C}\Rightarrow x\not \in A\lor x\not \in B}
A
s
s
i
m
x
∈
A
∧
x
∈
(
A
∩
B
)
C
⇒
x
∈
A
∧
(
x
∉
A
∨
x
∉
B
)
⇒
(
x
∈
A
∧
x
∉
A
)
∨
(
x
∈
A
∧
x
∉
B
)
⇒
(
x
∈
A
∧
x
∉
B
)
⇒
x
∈
(
A
∖
B
)
⇒
{\displaystyle Assim\;x\in A\land x\in (A\cap B)^{C}\Rightarrow x\in A\land (x\not \in A\lor x\not \in B)\Rightarrow (x\in A\land x\not \in A)\lor (x\in A\land x\not \in B)\Rightarrow (x\in A\land x\not \in B)\Rightarrow x\in (A\setminus B)\Rightarrow }
⇒
A
∖
(
A
∩
B
)
⊂
A
∖
B
{\displaystyle \Rightarrow A\setminus (A\cap B)\subset A\setminus B}
.
A
,
B
⊂
K
;
t
a
l
q
u
e
A
∩
B
=
∅
,
A
∪
B
=
K
⇒
K
−
A
=
B
∧
K
−
B
=
A
{\displaystyle A,B\subset K;tal\;que\;A\cap B=\varnothing ,A\cup B=K\Rightarrow K-A=B\land K-B=A}
.
A
−
A
=
∅
{\displaystyle A-A=\varnothing }
.
Suponha que
A
−
A
≠
∅
⇒
∃
x
∈
A
−
A
⇒
∃
x
∈
A
e
x
∉
A
{\displaystyle A-A\neq \varnothing \Rightarrow \exists \;x\in A-A\Rightarrow \exists \;x\in A\;e\;x\not \in A}
. Mas isso é um absurdo. Um elemento pertence ou não a um conjunto, ele não pode pertencer e não pertencer.
A
∖
B
=
∅
⇔
A
⊂
B
{\displaystyle A\setminus B=\varnothing \Leftrightarrow A\subset B}
.
⇒:
A
∖
B
=
∅
⇒
∀
x
∈
A
,
x
∈
B
⇒
A
⊂
B
{\displaystyle \Rightarrow :A\setminus B=\varnothing \Rightarrow \forall x\in A,x\in B\Rightarrow A\subset B}
.
⇐:
S
u
p
o
n
h
a
q
u
e
A
−
B
≠
∅
⇒
∃
x
∈
A
∖
B
⇒
∃
x
∈
A
,
x
∉
B
.
A
b
s
u
r
d
o
,
p
o
i
s
A
⊂
B
,
⇒
∀
x
∈
A
,
x
∈
B
{\displaystyle \Leftarrow :Suponha\;que\;A-B\neq \varnothing \Rightarrow \exists \;x\in A\setminus B\Rightarrow \exists \;x\in A,x\not \in B.\;Absurdo,\;pois\;A\subset B,\Rightarrow \forall x\in A,x\in B}
.
A
−
B
=
A
⇔
A
∩
B
=
∅
{\displaystyle A-B=A\Leftrightarrow A\cap B=\varnothing }
.
⇒:
A
=
A
−
B
⇒
A
⊂
A
−
B
⇒
∀
x
∈
A
,
x
∈
A
−
B
⇒
∀
x
∈
A
,
x
∉
B
⇒
A
∩
B
=
∅
{\displaystyle \Rightarrow :A=A-B\Rightarrow A\subset A-B\Rightarrow \forall x\in A,x\in A-B\Rightarrow \forall x\in A,x\not \in B\Rightarrow A\cap B=\varnothing }
.
⇐:
A
∩
B
=
∅
⇒
∀
x
∈
A
,
x
∉
B
⇒
∀
x
∈
A
,
x
∈
A
−
B
⇒
A
⊂
A
−
B
{\displaystyle \Leftarrow :A\cap B=\varnothing \Rightarrow \forall x\in A,x\not \in B\Rightarrow \forall x\in A,x\in A-B\Rightarrow A\subset A-B}
.
∀
x
∈
A
−
B
⇒
x
∈
A
,
x
∉
B
⇒
A
−
B
⊂
A
{\displaystyle \forall x\in A-B\Rightarrow x\in A,x\not \in B\Rightarrow A-B\subset A}
.
∴
A
=
A
−
B
{\displaystyle \therefore A=A-B}
.
A
−
B
=
∅
=
B
−
A
⇔
A
=
B
{\displaystyle A-B=\varnothing =B-A\Leftrightarrow A=B}
.
⇒:
A
−
B
⊂
B
−
A
⇒
∀
x
∈
A
,
x
∈
B
⇒
A
=
B
{\displaystyle \Rightarrow :A-B\subset B-A\Rightarrow \forall x\in A,x\in B\Rightarrow A=B}
.
⇐:
A
=
B
⇒
d
a
d
o
x
∈
A
−
B
,
x
∈
A
,
x
∉
B
⇒
x
∈
B
e
x
∉
B
⇒
A
−
B
=
∅
{\displaystyle \Leftarrow :A=B\Rightarrow \;dado\;x\in A-B,x\in A,x\not \in B\Rightarrow x\in B\;e\;x\not \in B\Rightarrow A-B=\varnothing }
. Analogamente
B
−
A
=
∅
{\displaystyle B-A=\varnothing }
.
A
∖
(
B
∖
C
)
=
(
A
∖
B
)
∖
C
⇔
A
∩
C
=
∅
{\displaystyle A\setminus (B\setminus C)=(A\setminus B)\setminus C\Leftrightarrow A\cap C=\varnothing }
A
∖
(
B
∖
C
)
=
A
∖
(
B
∖
(
B
∩
C
)
)
=
A
∖
(
B
∖
(
(
B
∩
C
)
∩
A
)
∪
(
(
B
∩
C
)
∖
A
)
)
=
A
∖
(
B
∖
(
(
A
∩
B
∩
C
)
∪
(
(
B
∩
C
)
∖
A
)
)
)
=
.
.
.
{\displaystyle A\setminus (B\setminus C)=A\setminus (B\setminus (B\cap C))=A\setminus (B\setminus ((B\cap C)\cap A)\cup ((B\cap C)\setminus A))=A\setminus (B\setminus ((A\cap B\cap C)\cup ((B\cap C)\setminus A)))=...}
.
.
.
=
{
x
∈
(
A
∖
B
)
∪
(
A
∩
B
∩
C
)
}
{\displaystyle ...=\{x\in (A\setminus B)\cup (A\cap B\cap C)\}}
. Como
A
∩
B
∩
C
⊂
A
∩
C
⊂
A
⇒
A
∖
(
B
∖
C
)
=
{
x
∈
(
A
∖
B
)
∪
(
A
∩
C
)
}
{\displaystyle A\cap B\cap C\subset A\cap C\subset A\Rightarrow A\setminus (B\setminus C)=\{x\in (A\setminus B)\cup (A\cap C)\}}
(
A
∖
B
)
∖
C
=
(
A
∖
B
)
∖
(
A
∩
C
)
{\displaystyle (A\setminus B)\setminus C=(A\setminus B)\setminus (A\cap C)}
∴
A
∖
(
B
∖
C
)
=
(
(
A
∖
B
)
∖
C
)
∪
(
A
∩
C
)
{\displaystyle \therefore A\setminus (B\setminus C)=((A\setminus B)\setminus C)\cup (A\cap C)}
Definição 1:
A
Δ
B
=
(
A
∪
B
)
∖
(
A
∩
B
)
=
{
x
∈
U
;
x
∈
A
∪
B
e
x
∉
A
∩
B
}
{\displaystyle A\Delta B=(A\cup B)\setminus (A\cap B)=\{x\in U;x\in A\cup B\;e\;x\not \in A\cap B\}}
Definição 2:
A
Δ
B
=
(
A
∖
B
)
∪
(
A
∖
B
)
{\displaystyle A\Delta B=(A\setminus B)\cup (A\setminus B)}
Teorema: Mostrar que
(
A
∖
B
)
∪
(
B
∖
A
)
=
(
A
∪
B
)
∖
(
A
∩
B
)
{\displaystyle (A\setminus B)\cup (B\setminus A)=(A\cup B)\setminus (A\cap B)}
Prova:
T
o
m
e
x
∈
(
A
∖
B
)
∪
(
B
∖
A
)
⇒
x
∈
(
A
∖
B
)
∨
x
∈
(
B
∖
A
)
⇒
(
x
∈
A
∧
x
∉
B
)
∨
(
x
∈
B
∧
x
∉
A
)
⇒
{\displaystyle Tome\;x\in (A\setminus B)\cup (B\setminus A)\Rightarrow x\in (A\setminus B)\lor x\in (B\setminus A)\Rightarrow (x\in A\land x\not \in B)\lor (x\in B\land x\not \in A)\Rightarrow }
⇒
[
(
x
∈
A
∧
x
∉
B
)
∨
x
∈
B
]
∧
[
(
x
∈
A
∧
x
∉
B
)
∨
x
∉
A
]
⇒
[
(
x
∈
A
∨
x
∈
B
)
∧
(
x
∉
B
∨
x
∈
B
)
]
∧
[
(
x
∈
A
∨
x
∉
A
)
∧
(
x
∉
B
∨
x
∉
A
)
]
⇒
{\displaystyle \Rightarrow [(x\in A\land x\not \in B)\lor x\in B]\land [(x\in A\land x\not \in B)\lor x\not \in A]\Rightarrow [(x\in A\lor x\in B)\land (x\not \in B\lor x\in B)]\land [(x\in A\lor x\not \in A)\land (x\not \in B\lor x\not \in A)]\Rightarrow }
⇒
[
(
x
∈
A
∨
x
∈
B
)
∧
(
x
∉
B
∨
x
∈
B
)
]
∧
[
(
x
∈
A
∨
x
∉
A
)
∧
(
x
∉
B
∨
x
∉
A
)
]
⇒
{\displaystyle \Rightarrow [(x\in A\lor x\in B)\land (x\not \in B\lor x\in B)]\land [(x\in A\lor x\not \in A)\land (x\not \in B\lor x\not \in A)]\Rightarrow }
⇒
[
x
∈
(
A
∪
B
)
]
∧
[
x
∈
B
C
∨
x
∈
A
C
]
⇒
[
x
∈
(
A
∪
B
)
]
∧
[
x
∈
(
B
C
∪
A
C
)
]
⇒
[
x
∈
(
A
∪
B
)
]
∧
[
x
∈
(
B
∩
A
)
C
]
⇒
[
x
∈
(
A
∪
B
)
]
∧
[
x
∉
(
B
∩
A
)
]
⇒
{\displaystyle \Rightarrow [x\in (A\cup B)]\land [x\in B^{C}\lor x\in A^{C}]\Rightarrow [x\in (A\cup B)]\land [x\in (B^{C}\cup A^{C})]\Rightarrow [x\in (A\cup B)]\land [x\in (B\cap A)^{C}]\Rightarrow [x\in (A\cup B)]\land [x\not \in (B\cap A)]\Rightarrow }
[
x
∈
(
A
∪
B
)
∖
(
A
∩
B
)
]
{\displaystyle [x\in (A\cup B)\setminus (A\cap B)]}
⇒
(
A
∖
B
)
∪
(
B
∖
A
)
⊂
(
A
∪
B
)
∖
(
A
∩
B
)
{\displaystyle \Rightarrow (A\setminus B)\cup (B\setminus A)\subset (A\cup B)\setminus (A\cap B)}
Existe duas importantes propriedades usando união e intersecção, são elas:
A
∩
(
B
∪
C
)
=
(
A
∩
B
)
∪
(
A
∩
C
)
{\displaystyle A\cap (B\cup C)=(A\cap B)\cup (A\cap C)}
∀
x
∈
A
∩
(
B
∪
C
)
⇔
x
∈
A
e
x
∈
B
∪
C
⇔
x
∈
A
e
(
x
∈
B
o
u
x
∈
C
)
⇔
{\displaystyle \forall x\in A\cap (B\cup C)\Leftrightarrow x\in A\;e\;x\in B\cup C\Leftrightarrow x\in A\;e\;(x\in B\;ou\;x\in C)\Leftrightarrow }
⇔
(
x
∈
A
e
x
∈
B
)
o
u
(
x
∈
A
e
x
∈
C
)
⇔
x
∈
A
∩
B
o
u
x
∈
A
∩
C
⇔
x
∈
(
A
∩
B
)
∪
(
A
∪
C
)
{\displaystyle \Leftrightarrow (x\in A\;e\;x\in B)\;ou\;(x\in A\;e\;x\in C)\Leftrightarrow x\in A\cap B\;ou\;x\in A\cap C\Leftrightarrow x\in (A\cap B)\cup (A\cup C)}
A
∪
(
B
∩
C
)
=
(
A
∪
B
)
∩
(
A
∪
C
)
{\displaystyle A\cup (B\cap C)=(A\cup B)\cap (A\cup C)}
∀
x
∈
A
∪
(
B
∩
C
)
⇔
x
∈
A
o
u
x
∈
B
∩
C
⇔
x
∈
A
o
u
(
x
∈
B
e
x
∈
C
)
⇔
{\displaystyle \forall x\in A\cup (B\cap C)\Leftrightarrow x\in A\;ou\;x\in B\cap C\Leftrightarrow x\in A\;ou\;(x\in B\;e\;x\in C)\Leftrightarrow }
⇔
(
x
∈
A
o
u
x
∈
B
)
e
(
x
∈
A
o
u
x
∈
C
)
⇔
x
∈
A
∪
B
e
x
∈
A
∪
C
⇔
x
∈
(
A
∪
B
)
∩
(
A
∩
C
)
{\displaystyle \Leftrightarrow (x\in A\;ou\;x\in B)\;e\;(x\in A\;ou\;x\in C)\Leftrightarrow x\in A\cup B\;e\;x\in A\cup C\Leftrightarrow x\in (A\cup B)\cap (A\cap C)}
A
∪
(
B
∩
C
)
=
(
A
∪
B
)
∩
C
⇔
A
−
C
=
∅
{\displaystyle A\cup (B\cap C)=(A\cup B)\cap C\Leftrightarrow A-C=\varnothing }
⇒:
A
∪
(
B
∩
C
)
=
(
A
−
C
)
∪
(
A
∩
C
)
∪
(
B
∩
C
)
=
(
A
−
C
)
∪
(
(
A
∪
B
)
∩
C
)
{\displaystyle \Rightarrow :A\cup (B\cap C)=(A-C)\cup (A\cap C)\cup (B\cap C)=(A-C)\cup ((A\cup B)\cap C)}
. Para satisfazer a hipótese temos que uma condição necessária seja a de que
A
−
C
=
∅
{\displaystyle A-C=\varnothing }
.
A
o
o
b
s
e
r
v
a
r
a
i
g
u
a
l
d
a
d
e
A
∪
(
B
∩
C
)
=
(
A
−
C
)
∪
(
(
A
∪
B
)
∩
C
)
{\displaystyle Ao\;observar\;a\;igualdade\;A\cup (B\cap C)=(A-C)\cup ((A\cup B)\cap C)}
, que vimos ser verdadeira, percebermos que a nossa hipótese,
A
−
C
=
∅
{\displaystyle A-C=\varnothing }
, é suficiente para dizermos que
A
∪
(
B
∩
C
)
=
(
A
∪
B
)
∩
C
{\displaystyle A\cup (B\cap C)=(A\cup B)\cap C}
Seja
A
⊂
K
⇒
K
−
A
=
∁
K
A
=
{
x
∈
K
;
x
∉
A
}
{\displaystyle A\subset K\Rightarrow K-A=\complement _{K}A=\{x\in K;x\not \in A\}}
. (O complementar de um subconjunto sobre um conjunto é um modo diferente de ver a diferença entre um conjunto e seu subconjunto.)
Dado
x
∈
K
,
A
⊂
K
{\displaystyle x\in K,A\subset K}
. Temos que só uma é verdadeira
x
∈
A
ou
x
∉
A
{\displaystyle x\in A{\mbox{ ou }}x\not \in A}
.
Quando é claro quem é o conjunto K, podemos omiti-lo, assim o complementar de A em relação a K fica somente
A
C
{\displaystyle A^{C}}
(
A
C
)
C
=
A
{\displaystyle (A^{C})^{C}=A}
Considere Dado
x
∈
(
A
C
)
C
⇒
x
∉
A
C
⇒
x
∈
A
{\displaystyle x\in (A^{C})^{C}\Rightarrow x\not \in A^{C}\Rightarrow x\in A}
. Analogamente seja,
x
∈
A
⇒
x
∉
A
C
⇒
x
∈
(
A
C
)
C
{\displaystyle x\in A\Rightarrow x\not \in A^{C}\Rightarrow x\in (A^{C})^{C}}
.
Sejam
A
,
B
⊂
K
{\displaystyle A,B\subset K}
.
A
∪
B
=
K
,
A
∩
B
≠
∅
⇒
A
−
B
=
∁
A
B
=
K
−
B
=
∁
K
B
{\displaystyle A\cup B=K,A\cap B\neq \varnothing \Rightarrow A-B=\complement _{A}B=K-B=\complement _{K}B}
.
D
a
d
o
x
∈
K
=
A
∪
B
⇒
x
∈
A
ou
x
∈
B
ou
x
∈
A
∩
B
{\displaystyle Dado\;x\in K=A\cup B\Rightarrow x\in A{\mbox{ ou }}x\in B{\mbox{ ou }}x\in A\cap B}
A
∪
B
=
K
,
A
∩
B
=
∅
⇒
dado
x
∈
K
⇒
x
∈
A
ou
x
∈
B
{\displaystyle A\cup B=K,A\cap B=\varnothing \Rightarrow {\mbox{ dado }}x\in K\Rightarrow x\in A{\mbox{ ou }}x\in B}
.
A
⊂
B
⇒
B
C
⊂
A
C
{\displaystyle A\subset B\Rightarrow B^{C}\subset A^{C}}
.
Dado
x
∈
B
C
⇒
x
∉
B
⇒
1
x
∉
A
⇒
x
∈
A
C
{\displaystyle x\in B^{C}\Rightarrow x\not \in B\Rightarrow ^{1}x\not \in A\Rightarrow x\in A^{C}}
. 1 Suponha que
A
−
B
≠
∅
⇒
∃
x
∈
K
;
x
∈
A
,
x
∉
B
⇒
A
⊄
B
{\displaystyle A-B\neq \emptyset \Rightarrow \exists x\in K;x\in A,x\not \in B\Rightarrow A\not \subset B}
que opõe-se da nossa hipótese.
A
∪
B
=
B
⇔
1
A
⊂
B
⇔
2
A
∩
B
=
A
{\displaystyle A\cup B=B\Leftrightarrow _{1}A\subset B\Leftrightarrow _{2}A\cap B=A}
⇒
1
:
D
e
f
a
t
o
A
⊂
A
∪
B
.
C
o
m
o
A
∪
B
=
B
⇒
A
∪
B
⊂
B
.
L
o
g
o
A
⊂
A
∪
B
⊂
B
⇒
A
⊂
B
.
{\displaystyle \Rightarrow _{1}:De\;fato\;A\subset A\cup B.\;Como\;A\cup B=B\Rightarrow A\cup B\subset B.\;Logo\;A\subset A\cup B\subset B\Rightarrow A\subset B.}
⇐
1
:
D
e
f
a
t
o
A
,
B
⊂
A
∪
B
.
C
o
m
o
A
⊂
B
,
l
o
g
o
A
∪
B
⊂
B
.
P
o
r
t
a
n
t
o
A
∪
B
=
B
.
{\displaystyle \Leftarrow _{1}:De\;fato\;A,B\subset A\cup B.\;Como\;A\subset B,\;logo\;A\cup B\subset B.\;Portanto\;A\cup B=B.}
⇒
2
:
D
e
f
a
t
o
A
∩
B
⊂
A
.
C
o
m
o
A
⊂
B
,
l
o
g
o
A
⊂
A
∩
B
.
{\displaystyle \Rightarrow _{2}:De\;fato\;A\cap B\subset A.\;Como\;A\subset B,\;logo\;A\subset A\cap B.}
⇐
2
:
C
o
m
o
A
∩
B
=
A
⇒
A
⊂
A
∩
B
.
D
e
f
a
t
o
A
∩
B
⊂
B
⇒
A
⊂
B
.
{\displaystyle \Leftarrow _{2}:Como\;A\cap B=A\Rightarrow A\subset A\cap B.\;De\;fato\;A\cap B\subset B\Rightarrow A\subset B.}
(
A
∪
B
)
C
=
A
C
∩
B
C
{\displaystyle (A\cup B)^{C}=A^{C}\cap B^{C}}
∀
x
∈
(
A
∪
B
)
C
⇒
x
∉
A
∪
B
.
C
o
m
o
A
∪
B
=
(
A
−
B
)
∪
(
B
−
A
)
∪
(
A
∩
B
)
,
d
i
s
j
u
n
t
o
s
⇒
x
∉
A
−
B
,
x
∉
B
−
A
e
x
∉
A
∩
B
⇒
{\displaystyle \forall x\in (A\cup B)^{C}\Rightarrow x\not \in A\cup B.\;Como\;A\cup B=(A-B)\cup (B-A)\cup (A\cap B),\;disjuntos\Rightarrow x\not \in A-B,x\not \in B-A\;e\;x\not \in A\cap B\Rightarrow }
⇒
x
∉
A
e
x
∉
B
⇒
x
∈
A
C
e
x
∈
B
C
⇒
x
∈
A
C
∩
B
C
⇒
(
A
∪
B
)
C
⊂
A
C
∩
B
C
{\displaystyle \Rightarrow x\not \in A\;e\;x\not \in B\Rightarrow x\in A^{C}\;e\;x\in B^{C}\Rightarrow x\in A^{C}\cap B^{C}\Rightarrow (A\cup B)^{C}\subset A^{C}\cap B^{C}}
(1)
∀
x
∈
A
C
∩
B
C
⇒
x
∈
A
C
e
x
∈
B
C
⇒
x
∉
A
e
x
∉
B
⇒
x
∉
A
−
B
,
x
∉
B
−
A
e
x
∉
A
∩
B
⇒
x
∉
A
∪
B
⇒
x
∈
(
A
∪
B
)
C
⇒
A
C
∩
B
C
⊂
(
A
∪
B
)
C
{\displaystyle \forall x\in A^{C}\cap B^{C}\Rightarrow x\in A^{C}\;e\;x\in B^{C}\Rightarrow x\not \in A\;e\;x\not \in B\Rightarrow x\not \in A-B,x\not \in B-A\;e\;x\not \in A\cap B\Rightarrow x\not \in A\cup B\Rightarrow x\in (A\cup B)^{C}\Rightarrow A^{C}\cap B^{C}\subset (A\cup B)^{C}}
(2)
Por (1) e (2), temos que
(
A
∪
B
)
C
=
A
C
∩
B
C
{\displaystyle (A\cup B)^{C}=A^{C}\cap B^{C}}
(
A
∩
B
)
C
=
A
C
∪
B
C
{\displaystyle (A\cap B)^{C}=A^{C}\cup B^{C}}
∀
x
∈
(
A
∩
B
)
C
⇒
x
∉
A
∩
B
⇒
x
∉
A
e
x
∉
B
⇒
x
∈
A
C
e
x
∈
B
C
⇒
x
∈
A
C
∪
B
C
{\displaystyle \forall x\in (A\cap B)^{C}\Rightarrow x\not \in A\cap B\Rightarrow x\not \in A\;e\;x\not \in B\Rightarrow x\in A^{C}\;e\;x\in B^{C}\Rightarrow x\in A^{C}\cup B^{C}}
∀
x
∈
A
C
∩
B
C
⇒
x
∈
A
C
e
x
∈
B
C
⇒
x
∉
A
e
x
∉
B
⇒
x
∉
A
∩
B
⇒
x
∈
(
A
∩
B
)
C
{\displaystyle \forall x\in A^{C}\cap B^{C}\Rightarrow x\in A^{C}\;e\;x\in B^{C}\Rightarrow x\not \in A\;e\;x\not \in B\Rightarrow x\not \in A\cap B\Rightarrow x\in (A\cap B)^{C}}
∅
∈
∅
{\displaystyle \varnothing \in \varnothing }
Considere K, um conjunto qualquer e
A
=
K
∩
K
C
{\displaystyle A=K\cap K^{C}}
. Suponha que
∅
∈
A
{\displaystyle \varnothing \in A}
. Como A é a intersecção disjunta de dois conjuntos, logo
∅
∈
K
e
∅
∈
K
C
{\displaystyle \varnothing \in K\;e\;\varnothing \in K^{C}}
. Mas não existe um elemento que pertença a um conjunto e ao seu complementar ao mesmo tempo. Portanto
∅
∉
∅
{\displaystyle \varnothing \not \in \varnothing }
∅
⊂
∅
{\displaystyle \varnothing \subset \varnothing }
Por contradição
∅
A
⊄
∅
B
⇒
∃
x
∈
∅
A
;
x
∉
∅
B
⇒
∅
A
−
∅
B
≠
∅
{\displaystyle \varnothing _{A}\not \subset \varnothing _{B}\Rightarrow \exists x\in \varnothing _{A};x\not \in \varnothing _{B}\Rightarrow \varnothing _{A}-\varnothing _{B}\neq \varnothing }
. O que é um absurdo, pois estamos dizendo que um conjunto vazio tenha algum elemento.
Suponha um conjunto A qualquer e que
∅
⊄
A
{\displaystyle \varnothing \not \subset A}
, isso implica que o conjunto vazio têm um elemento que o A não tenha. Mas o conjunto vazio não têm elementos. Portanto o conjunto vazio é subconjunto de qualquer conjunto, inclusive de si mesmo.
∅
∈
{
∅
}
{\displaystyle \varnothing \in \{\varnothing \}}
O conjunto das partes do conjunto
{
}
{\displaystyle \{\}}
, é
{
∅
}
{\displaystyle \{\varnothing \}}
. Portanto o conjunto vazio pertence ao conjunto das partes do conjunto vazio.
∅
⊂
{
∅
}
{\displaystyle \varnothing \subset \{\varnothing \}}
Tomemos as parte do conjunto
{
}
{\displaystyle \{\}}
, que é
{
∅
}
{\displaystyle \{\varnothing \}}
. Todo conjunto é subconjunto de si mesmo, assim:
{
∅
}
⊂
{
∅
}
{\displaystyle \{\varnothing \}\subset \{\varnothing \}}
Considere
A
=
{
x
∈
U
;
P
o
c
o
r
r
e
}
,
B
=
{
x
∈
U
;
Q
o
c
o
r
r
e
}
e
C
=
{
x
∈
U
;
R
o
c
o
r
r
e
}
{\displaystyle A=\{x\in U;P\;ocorre\},B=\{x\in U;Q\;ocorre\}\;e\;C=\{x\in U;R\;ocorre\}}
.
Determine a relação entre as condições P, Q e R, onde
A
∩
B
C
⊂
C
{\displaystyle A\cap B^{C}\subset C}
∀
x
∈
A
∩
B
C
⇒
x
∈
A
e
x
∈
U
−
B
⇒
x
∈
C
.
{\displaystyle \forall x\in A\cap B^{C}\Rightarrow x\in A\;e\;x\in U-B\Rightarrow x\in C.}
∴
P
∧
¬
Q
⇒
R
{\displaystyle \therefore P\land \lnot Q\Rightarrow R}
. Isto é, todo elemento do conjunto U que possui a propriedade P e não possui a propriedade Q, possui a propriedade R.
Devemos aqui ter bem claro que
x
∈
U
−
A
{\displaystyle x\in U-A}
significa que temos um elemento do conjunto U que não pertence ao conjunto A, isto é, não possui a propriedade P.
A
C
∪
B
C
⊂
C
{\displaystyle A^{C}\cup B^{C}\subset C}
∀
x
∈
A
C
∪
B
C
⇒
x
∈
U
−
A
o
u
x
∈
U
−
B
⇒
x
∈
C
{\displaystyle \forall x\in A^{C}\cup B^{C}\Rightarrow x\in U-A\;ou\;x\in U-B\Rightarrow x\in C}
∴
¬
P
∨
¬
Q
⇒
R
{\displaystyle \therefore \lnot P\lor \lnot Q\Rightarrow R}
. Isto é, todo elemento do conjunto U que não possui a propriedade P ou não possui a propriedade Q, possui a propriedade R.
A
C
∪
B
⊂
C
C
{\displaystyle A^{C}\cup B\subset C^{C}}
∀
x
∈
A
C
∪
B
⇒
x
∈
U
−
A
o
u
x
∈
B
⇒
x
∈
U
−
C
{\displaystyle \forall x\in A^{C}\cup B\Rightarrow x\in U-A\;ou\;x\in B\Rightarrow x\in U-C}
∴
¬
P
∨
Q
⇒
¬
R
{\displaystyle \therefore \lnot P\lor Q\Rightarrow \lnot R}
. Isto é, todo elemento do conjunto U que não possui a propriedade P ou possui a propriedade Q, não possui a propriedade R.
A
C
⊂
B
C
∪
C
{\displaystyle A^{C}\subset B^{C}\cup C}
∀
x
∈
A
C
⇒
x
∈
U
−
A
⇒
x
∈
U
−
B
o
u
x
∈
C
{\displaystyle \forall x\in A^{C}\Rightarrow x\in U-A\Rightarrow x\in U-B\;ou\;x\in C}
∴
¬
P
⇒
¬
Q
∨
R
{\displaystyle \therefore \lnot P\Rightarrow \lnot Q\lor R}
. Isto é, todo elemento do conjunto U que não possui a propriedade P, não possui a propriedade Q ou possui a propriedade R.
A
⊂
B
C
∪
C
C
{\displaystyle A\subset B^{C}\cup C^{C}}
∀
x
∈
A
⇒
x
∈
B
C
∪
C
C
⇒
x
∈
U
−
B
o
u
x
∈
U
−
C
{\displaystyle \forall x\in A\Rightarrow x\in B^{C}\cup C^{C}\Rightarrow x\in U-B\;ou\;x\in U-C}
∴
P
⇒
¬
Q
∨
¬
R
{\displaystyle \therefore P\Rightarrow \lnot Q\lor \lnot R}
. Isto é, todo elemento do conjunto U que possui a propriedade P, não possui a propriedade Q ou não possui a propriedade R.
Seja X um conjunto cujos objetos sejam conjuntos, nesse caso os objetos são denominados membros e o conjunto coleção.
Ex.:
C
=
{
N
,
Z
,
Q
,
R
}
{\displaystyle C=\{\mathbb {N} ,\mathbb {Z} ,\mathbb {Q} ,\mathbb {R} \}}
Ex.:
P
=
{
A
,
B
,
C
,
D
}
,
onde
A
=
∅
,
B
=
{
1
}
,
C
=
{
2
}
,
D
=
{
1
,
2
}
{\displaystyle P=\{A,B,C,D\},{\mbox{ onde }}A=\varnothing ,B=\{1\},C=\{2\},D=\{1,2\}}
. Nesse caso P é o conjunto dos subconjuntos de D, essa família tem o nome de conjunto das partes de D e é geralmente escrita como P(D), de forma que
P
(
D
)
=
{
X
;
X
⊂
D
}
{\displaystyle P(D)=\{X;X\subset D\}}
.
O Conjunto das partes P(A) de um conjunto A é o conjunto formado por todos os subconjuntos do conjunto A.
Ex.: Seja
X
=
{
a
,
b
,
c
}
{\displaystyle X=\{a,b,c\}}
, logo
P
(
X
)
=
{
∅
,
{
a
}
,
{
b
}
,
{
c
}
,
{
a
,
b
}
,
{
a
,
c
}
,
{
b
,
c
}
,
X
}
=
{
Y
;
Y
⊂
X
}
{\displaystyle P(X)=\{\varnothing ,\{a\},\{b\},\{c\},\{a,b\},\{a,c\},\{b,c\},X\}=\{Y;Y\subset X\}}
.
Se A é um conjunto, não existe uma função
f
:
A
→
P
(
A
)
{\displaystyle f:A\rightarrow P(A)}
que seja sobrejetiva.
Seja C uma família cujos membros são
A
1
,
.
.
.
,
A
n
{\displaystyle A_{1},...,A_{n}}
. Assim
C
=
{
A
1
,
.
.
.
,
A
n
}
,
{\displaystyle C=\{A_{1},...,A_{n}\},}
onde n é quantidade de membros da família C.
Geralmente não nos referimos a essa quantidade n, e dizemos apenas que os membros são do "tipo" A e que
A
∈
C
{\displaystyle A\in C}
.
A união dos membros da família C é escrita assim:
⋃
A
∈
C
A
=
A
1
∪
A
2
∪
.
.
.
∪
A
n
{\displaystyle \bigcup _{A\in C}A=A_{1}\cup A_{2}\cup ...\cup A_{n}}
.
Como em geral não nos referimos a essa quantidade n, diremos apenas
⋃
A
∈
C
A
{\displaystyle \bigcup _{A\in C}A}
.
Definiremos
⋃
A
∈
C
A
=
{
x
;
x
∈
A
para algum
A
∈
C
}
{\displaystyle \bigcup _{A\in C}A=\{x;x\in A{\mbox{ para algum }}A\in C\}}
onde x são os elementos dos membros de C.
{\displaystyle }
Seja C uma família cujos membros são
A
1
,
.
.
.
,
A
n
{\displaystyle A_{1},...,A_{n}}
. Assim
C
=
{
A
1
,
.
.
.
,
A
n
}
,
{\displaystyle C=\{A_{1},...,A_{n}\},}
onde n é quantidade de membros da família C.
Geralmente não nos referimos a essa quantidade n, e dizemos apenas que os membros são do "tipo" A e que
A
∈
C
{\displaystyle A\in C}
.
A intersecção dos membros da família C é escrita assim:
⋂
A
∈
C
A
=
A
1
∩
A
2
∩
.
.
.
∩
A
n
{\displaystyle \bigcap _{A\in C}A=A_{1}\cap A_{2}\cap ...\cap A_{n}}
.
Como em geral não nos referimos a essa quantidade n, diremos apenas
⋂
A
∈
C
A
{\displaystyle \bigcap _{A\in C}A}
.
Definiremos
⋂
A
∈
C
A
=
{
x
;
x
∈
A
para todo
A
∈
C
}
{\displaystyle \bigcap _{A\in C}A=\{x;x\in A{\mbox{ para todo }}A\in C\}}
onde x são elementos de todos os membros de C.
Uma família de conjuntos
F
{\displaystyle {\mathfrak {F}}}
, denomina-se um anel de conjuntos, se satisfaz as seguintes propriedades:
S
e
A
,
B
∈
F
,
l
o
g
o
A
△
B
,
A
∩
B
∈
F
{\displaystyle Se\;A,B\in {\mathfrak {F}},logo\;A\triangle B,A\cap B\in {\mathfrak {F}}}
{\displaystyle }
Unidade de uma família de subconjuntos
F
{\displaystyle {\mathfrak {F}}}
:
E
∈
F
{\displaystyle E\in {\mathfrak {F}}}
é a unidade de
F
,
s
e
∀
A
∈
F
,
i
m
p
l
i
c
a
r
q
u
e
A
∩
E
=
A
{\displaystyle {\mathfrak {F}},se\forall \;A\in {\mathfrak {F}},implicar\;que\;A\cap E=A}
Considere
F
{\displaystyle {\mathfrak {F}}}
a família de subconjuntos de um conjunto com 1 elemento, onde
F
{\displaystyle {\mathfrak {F}}}
é um anel de conjuntos.
S
e
j
a
F
=
{
∅
,
{
a
}
}
{\displaystyle Seja\;{\mathfrak {F}}=\{\varnothing ,\{a\}\}}
, onde a é um elemento qualquer.
Assim
∅
,
{
a
}
∈
F
⇒
∅
∩
∅
,
∅
∩
{
a
}
,
{
a
}
∩
{
a
}
,
∅
△
∅
,
∅
△
{
a
}
,
{
a
}
△
{
a
}
∈
F
{\displaystyle \varnothing ,\{a\}\in {\mathfrak {F}}\Rightarrow \varnothing \cap \varnothing ,\varnothing \cap \{a\},\{a\}\cap \{a\},\varnothing \triangle \varnothing ,\varnothing \triangle \{a\},\{a\}\triangle \{a\}\in {\mathfrak {F}}}
Mas
∅
∩
∅
=
∅
∩
{
a
}
=
∅
△
∅
,
{
a
}
△
{
a
}
=
∅
{\displaystyle \varnothing \cap \varnothing =\varnothing \cap \{a\}=\varnothing \triangle \varnothing ,\{a\}\triangle \{a\}=\varnothing }
.
Também
{
a
}
∩
{
a
}
=
∅
△
{
a
}
=
{
a
}
{\displaystyle \{a\}\cap \{a\}=\varnothing \triangle \{a\}=\{a\}}
A unidade de
F
{\displaystyle {\mathfrak {F}}}
é
{
a
}
,
{\displaystyle \{a\},}
pois:
{
a
}
∩
∅
=
∅
e
{
a
}
∩
{
a
}
=
{
a
}
{\displaystyle \{a\}\cap \varnothing =\varnothing \;e\;\{a\}\cap \{a\}=\{a\}}
Considere
F
{\displaystyle {\mathfrak {F}}}
a família de subconjuntos de um conjunto com 2 elementos, onde
F
{\displaystyle {\mathfrak {F}}}
é um anel de conjuntos.
S
e
j
a
F
=
{
∅
,
{
a
}
,
{
b
}
,
{
a
,
b
}
}
{\displaystyle Seja\;{\mathfrak {F}}=\{\varnothing ,\{a\},\{b\},\{a,b\}\}}
, onde a,b são elementos qualquer.
Assim
∅
,
{
a
}
,
{
b
}
,
{
a
,
b
}
∈
F
⇒
{\displaystyle \varnothing ,\{a\},\{b\},\{a,b\}\in {\mathfrak {F}}\Rightarrow }
:
∅
∩
∅
,
∅
∩
{
a
}
,
∅
∩
{
b
}
,
∅
∩
{
a
,
b
}
,
{
a
}
∩
{
a
}
,
{
a
}
∩
{
b
}
,
{
a
}
∩
{
a
,
b
}
,
{
b
}
∩
{
b
}
,
{
b
}
∩
{
a
,
b
}
,
{
a
,
b
}
∩
{
a
,
b
}
{\displaystyle \varnothing \cap \varnothing ,\varnothing \cap \{a\},\varnothing \cap \{b\},\varnothing \cap \{a,b\},\{a\}\cap \{a\},\{a\}\cap \{b\},\{a\}\cap \{a,b\},\{b\}\cap \{b\},\{b\}\cap \{a,b\},\{a,b\}\cap \{a,b\}}
∅
△
∅
,
∅
△
{
a
}
,
∅
△
{
b
}
,
∅
△
{
a
,
b
}
,
{
a
}
△
{
a
}
,
{
a
}
△
{
b
}
,
{
a
}
△
{
a
,
b
}
,
{
b
}
△
{
b
}
,
{
b
}
△
{
a
,
b
}
,
{
a
,
b
}
△
{
a
,
b
}
{\displaystyle \varnothing \triangle \varnothing ,\varnothing \triangle \{a\},\varnothing \triangle \{b\},\varnothing \triangle \{a,b\},\{a\}\triangle \{a\},\{a\}\triangle \{b\},\{a\}\triangle \{a,b\},\{b\}\triangle \{b\},\{b\}\triangle \{a,b\},\{a,b\}\triangle \{a,b\}}
A unidade de
F
{\displaystyle {\mathfrak {F}}}
é
{
a
,
b
}
,
{\displaystyle \{a,b\},}
pois:
{
a
,
b
}
∩
∅
=
∅
,
{
a
,
b
}
∩
{
a
}
=
{
a
}
,
{
a
,
b
}
∩
{
b
}
=
{
b
}
e
{
a
,
b
}
∩
{
a
,
b
}
=
{
a
,
b
}
{\displaystyle \{a,b\}\cap \varnothing =\varnothing ,\{a,b\}\cap \{a\}=\{a\},\{a,b\}\cap \{b\}=\{b\}\;e\;\{a,b\}\cap \{a,b\}=\{a,b\}}
Dados dois objetos a e b definimos o par ordenado (a, b) cuja primeira coordenada é "a" e a segunda é "b". Dois pares ordenados (a, b) e (c, d) são iguais se eles forem iguais coordenada por coordenada, i.e.,
(
a
,
b
)
=
(
c
,
d
)
⇔
a
=
c
e
b
=
d
{\displaystyle (a,b)=(c,d)\Leftrightarrow a=c{\mbox{ e }}b=d}
.
Repare que
(
a
,
b
)
≠
(
b
,
a
)
{\displaystyle (a,b)\neq (b,a)}
salvo se a = b e que
(
a
,
a
)
≠
a
{\displaystyle (a,a)\neq a}
. De maneira análoga definimos triplas ordenadas
(
a
,
b
,
c
)
{\displaystyle (a,b,c)}
ou n-uplas ordenadas
(
a
1
,
.
.
.
,
a
n
)
{\displaystyle (a_{1},...,a_{n})}
.
Dados dois conjuntos A e B existe um conjunto chamado de produto cartesiano de A e B (denotado
A
×
B
{\displaystyle A\times B}
) formado pelos pares ordenados (a, b) tais que
a
∈
A
e
b
∈
B
{\displaystyle a\in A\;e\;b\in B}
. Em símbolos:
A
×
B
=
{
(
a
,
b
)
;
a
∈
A
e
b
∈
B
}
{\displaystyle A\times B=\{(a,b);a\in A\;e\;b\in B\}}
.
Ex.:
A
×
A
=
{
(
a
,
b
)
;
a
∈
A
e
b
∈
A
}
{\displaystyle A\times A=\{(a,b);a\in A\;e\;b\in A\}}
e, por simplicidade, o denotamos
A
2
{\displaystyle A^{2}}
.
Ex.: De maneira análoga definimos
A
×
B
×
C
=
{
(
a
,
b
,
c
)
;
a
∈
A
,
b
∈
B
e
c
∈
C
}
,
{\displaystyle A\times B\times C=\{(a,b,c);a\in A,b\in B\;e\;c\in C\},}
Ex.:
A
3
=
A
×
A
×
A
,
A
n
=
A
×
.
.
.
×
A
⏟
n
v
e
z
e
s
{\displaystyle A^{3}=A\times A\times A,A^{n}={\begin{matrix}\underbrace {A\times ...\times A} \\nvezes\end{matrix}}}
Ex: Sejam
A
=
{
1
,
2
,
3
,
4
}
e
B
=
{
a
,
b
,
c
}
⇒
A
×
B
=
{
(
1
,
a
)
,
(
1
,
b
)
,
(
1
,
c
)
,
(
2
,
a
)
,
(
2
,
b
)
,
(
2
,
c
)
,
(
3
,
a
)
,
(
3
,
b
)
,
(
3
,
c
)
,
(
4
,
a
)
,
(
4
,
b
)
,
(
4
,
c
)
}
{\displaystyle A=\{1,2,3,4\}{\mbox{ e }}B=\{a,b,c\}\Rightarrow A\times B=\{(1,a),(1,b),(1,c),(2,a),(2,b),(2,c),(3,a),(3,b),(3,c),(4,a),(4,b),(4,c)\}}
Exemplos importantes de Planos Cartesianos:
N
2
=
N
×
N
;
Z
2
=
Z
×
Z
;
Q
2
=
Q
×
Q
;
R
2
=
R
×
R
{\displaystyle \mathbb {N} ^{2}=\mathbb {N} \times \mathbb {N} ;\mathbb {Z} ^{2}=\mathbb {Z} \times \mathbb {Z} ;\mathbb {Q} ^{2}=\mathbb {Q} \times \mathbb {Q} ;\mathbb {R} ^{2}=\mathbb {R} \times \mathbb {R} }
.
A diagonal mais simples é do quadrado
A
2
:
Δ
(
A
2
)
=
{
(
a
,
a
)
;
a
∈
A
}
{\displaystyle A^{2}:\Delta (A^{2})=\{(a,a);a\in A\}}
. Da mesma forma temos a diagonal do quadrado
A
n
:
Δ
(
A
n
)
=
{
(
a
,
a
,
.
.
.
,
a
)
⏟
n
v
e
z
e
s
;
a
∈
A
}
{\displaystyle A^{n}:\Delta (A^{n})=\{{\begin{matrix}\underbrace {(a,a,...,a)} \\nvezes\end{matrix}};a\in A\}}
Mas temos outras diagonais que exigem um pouco mais de elaboração como a de um retângulo
A
×
B
{\displaystyle A\times B}
. Supondo que o
min
(
A
)
,
min
(
B
)
,
max
(
A
)
,
max
(
B
)
<
∞
:
{\displaystyle \min(A),\min(B),\max(A),\max(B)<\infty :}
Δ
(
A
×
B
)
=
{
(
min
(
A
)
,
min
(
B
)
)
+
c
(
max
(
A
)
−
min
(
A
)
,
max
(
B
)
−
min
(
B
)
)
;
c
∈
[
0
,
1
]
}
{\displaystyle \Delta (A\times B)=\{(\min(A),\min(B))+c(\max(A)-\min(A),\max(B)-\min(B));c\in [0,1]\}}
Ex.:
A
=
[
2
,
12
]
,
B
=
[
1
,
15
]
:
Δ
(
A
×
B
)
=
{
(
2
,
1
)
+
c
(
10
,
14
)
;
c
∈
[
0
,
1
]
}
{\displaystyle A=[2,12],B=[1,15]:\Delta (A\times B)=\{(2,1)+c(10,14);c\in [0,1]\}}
Dois pares ordenados são iguais se são iguais coordenada a coordenada, assim
(
a
,
b
)
=
(
c
,
d
)
⇔
a
=
c
e
b
=
d
{\displaystyle (a,b)=(c,d)\Leftrightarrow a=c\;e\;b=d}
Podemos definir equação como uma sentença matemática que possui uma igualdade entre duas expressões algébricas e uma ou mais incógnitas (valores desconhecidos) que são expressadas por letras.
a idéia de uma equação é determinar o valor de cada incógnita.
a
=
b
,
c
=
d
⇔
a
+
c
=
b
+
d
e
a
−
c
=
b
−
d
{\displaystyle a=b,c=d\Leftrightarrow a+c=b+d\;e\;a-c=b-d}
a
=
b
,
c
=
d
⇔
a
⋅
c
=
b
⋅
d
e
a
/
c
=
b
/
d
{\displaystyle a=b,c=d\Leftrightarrow a\cdot c=b\cdot d\;e\;a/c=b/d}
a
=
b
⇔
a
⋅
a
=
b
⋅
b
⇔
a
2
=
b
2
{\displaystyle a=b\Leftrightarrow a\cdot a=b\cdot b\Leftrightarrow a^{2}=b^{2}}
x
=
4
⇔
x
⋅
x
=
4
⋅
4
⇔
x
=
16
{\displaystyle {\sqrt {x}}=4\Leftrightarrow {\sqrt {x}}\cdot {\sqrt {x}}=4\cdot 4\Leftrightarrow x=16}
x
+
x
=
2
⇔
x
+
x
−
x
=
2
−
x
⇔
x
=
2
−
x
⇔
x
⋅
x
=
(
2
−
x
)
⋅
(
2
−
x
)
⇔
x
=
4
−
4
x
+
x
2
⇔
{\displaystyle {\sqrt {x}}+x=2\Leftrightarrow {\sqrt {x}}+x-x=2-x\Leftrightarrow {\sqrt {x}}=2-x\Leftrightarrow {\sqrt {x}}\cdot {\sqrt {x}}=(2-x)\cdot (2-x)\Leftrightarrow x=4-4x+x^{2}\Leftrightarrow }
⇔
x
2
−
4
x
−
x
+
4
−
4
=
x
−
x
−
4
⇔
x
2
−
5
x
=
−
4
⇔
x
2
−
5
x
+
25
4
=
−
4
+
25
4
⇔
{\displaystyle \Leftrightarrow x^{2}-4x-x+4-4=x-x-4\Leftrightarrow x^{2}-5x=-4\Leftrightarrow x^{2}-5x+{25 \over 4}=-4+{25 \over 4}\Leftrightarrow }
⇔
(
x
−
5
2
)
2
=
−
16
+
25
4
⇔
(
x
−
5
2
)
2
=
9
4
⇔
x
−
5
2
=
3
2
o
u
x
−
5
2
=
−
3
2
⇔
{\displaystyle \Leftrightarrow (x-{5 \over 2})^{2}={-16+25 \over 4}\Leftrightarrow (x-{5 \over 2})^{2}={9 \over 4}\Leftrightarrow x-{5 \over 2}={3 \over 2}\;ou\;x-{5 \over 2}=-{3 \over 2}\Leftrightarrow }
⇔
x
−
5
2
+
5
2
=
3
2
+
5
2
o
u
x
−
5
2
+
5
2
=
−
3
2
+
5
2
⇔
{\displaystyle \Leftrightarrow x-{5 \over 2}+{5 \over 2}={3 \over 2}+{5 \over 2}\;ou\;x-{5 \over 2}+{5 \over 2}=-{3 \over 2}+{5 \over 2}\Leftrightarrow }
x
=
8
2
o
u
x
=
2
2
⇔
x
=
4
o
u
x
=
1
{\displaystyle x={8 \over 2}\;ou\;x={2 \over 2}\Leftrightarrow x=4\;ou\;x=1}
x
+
3
=
x
⇔
x
+
3
−
3
=
x
−
3
⇔
x
=
x
−
3
⇔
x
⋅
x
=
(
x
−
3
)
⋅
(
x
−
3
)
⇔
x
=
x
2
−
6
x
+
9
⇔
{\displaystyle {\sqrt {x}}+3=x\Leftrightarrow {\sqrt {x}}+3-3=x-3\Leftrightarrow {\sqrt {x}}=x-3\Leftrightarrow {\sqrt {x}}\cdot {\sqrt {x}}=(x-3)\cdot (x-3)\Leftrightarrow x=x^{2}-6x+9\Leftrightarrow }
⇔
x
2
−
6
x
−
x
+
9
−
9
=
x
−
x
−
9
⇔
x
2
−
7
x
=
−
9
⇔
x
2
−
7
x
+
49
4
=
−
9
+
49
4
⇔
{\displaystyle \Leftrightarrow x^{2}-6x-x+9-9=x-x-9\Leftrightarrow x^{2}-7x=-9\Leftrightarrow x^{2}-7x+{49 \over 4}=-9+{49 \over 4}\Leftrightarrow }
⇔
(
x
−
7
2
)
2
=
−
36
+
49
4
⇔
(
x
−
7
2
)
2
=
13
4
⇔
x
−
7
2
=
1
3
2
o
u
x
−
7
2
=
−
1
3
2
⇔
{\displaystyle \Leftrightarrow (x-{7 \over 2})^{2}={-36+49 \over 4}\Leftrightarrow (x-{7 \over 2})^{2}={13 \over 4}\Leftrightarrow x-{7 \over 2}={{\sqrt {1}}3 \over 2}\;ou\;x-{7 \over 2}=-{{\sqrt {1}}3 \over 2}\Leftrightarrow }
⇔
x
−
7
2
+
7
2
=
1
3
2
+
7
2
o
u
x
−
7
2
+
7
2
=
−
1
3
2
+
7
2
⇔
{\displaystyle \Leftrightarrow x-{7 \over 2}+{7 \over 2}={{\sqrt {1}}3 \over 2}+{7 \over 2}\;ou\;x-{7 \over 2}+{7 \over 2}=-{{\sqrt {1}}3 \over 2}+{7 \over 2}\Leftrightarrow }
x
=
7
+
1
3
2
o
u
x
=
7
−
1
3
2
{\displaystyle x={7+{\sqrt {1}}3 \over 2}\;ou\;x={7-{\sqrt {1}}3 \over 2}}
Sejam A e B dois conjuntos não vazios. Uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
(lê-se função f de A em B) é definida por uma regra de associação, ou relação, entre elementos de A e B que a cada
x
∈
A
{\displaystyle x\in A}
associa um único elemento
f
(
x
)
{\displaystyle f(x)}
(lê-se f de x) em B, dito imagem de x por f. O conjunto A é o domínio de f enquanto que B é o contradomínio de f.
Note que não pode haver exceção à regra: todo
x
∈
A
{\displaystyle x\in A}
possui uma imagem
f
(
x
)
∈
B
{\displaystyle f(x)\in B}
. Por outro lado, pode existir
y
∈
B
{\displaystyle y\in B}
que não seja imagem de nenhum
x
∈
A
{\displaystyle x\in A}
. Note também que, dado
x
∈
A
{\displaystyle x\in A}
, não pode haver ambiguidade com respeito a f(x). Entretanto, o mesmo elemento
y
∈
B
{\displaystyle y\in B}
pode ser imagem de mais de um elemento de A, i.e., pode ocorrer
f
(
x
1
)
=
f
(
x
2
)
{\displaystyle f(x_{1})=f(x_{2})}
com
x
1
≠
x
2
{\displaystyle x_{1}\neq x_{2}}
.
Uma mesma regra pode ser definida em vários domínios diferentes:
Sejam
f
:
A
1
↦
B
∧
g
:
A
2
↦
B
{\displaystyle f:A_{1}\mapsto B\land g:A_{2}\mapsto B}
, onde f e g tenham regras iguais.
f
{\displaystyle f}
é uma função se
f
(
A
1
)
⊂
B
e
g
{\displaystyle f(A_{1})\subset B\;e\;g}
é uma função se
g
(
A
2
)
⊂
B
.
{\displaystyle g(A_{2})\subset B.}
Exemplo:
f
:
2
Z
↦
Z
e
g
:
(
2
Z
−
1
)
↦
Z
,
c
o
m
f
(
x
)
=
x
+
2
e
g
(
x
)
=
x
+
2
{\displaystyle f:2\mathbb {Z} \mapsto \mathbb {Z} \;e\;g:(2\mathbb {Z} -1)\mapsto \mathbb {Z} ,com\;f(x)=x+2\;e\;g(x)=x+2}
.
f
(
2
)
=
2
+
2
=
4
e
g
(
3
)
=
3
+
2
=
5
{\displaystyle f(2)=2+2=4\;e\;g(3)=3+2=5}
. Mas certamente
f
(
3
)
e
g
(
2
)
{\displaystyle f(3)\;e\;g(2)}
não existem porque
2
∉
2
Z
−
1
e
3
∉
2
Z
{\displaystyle 2\not \in 2\mathbb {Z} -1\;e\;3\not \in 2\mathbb {Z} }
.
Mas podemos definir uma função
h
(
x
)
=
{
f
(
x
)
,
se
x
é par
g
(
x
)
,
se
x
é ímpar
=
{\displaystyle h(x)=\left\{{\begin{matrix}f(x),&{\mbox{se }}x{\mbox{ é par}}\\g(x),&{\mbox{se }}x{\mbox{ é ímpar}}\end{matrix}}\right.=}
{
x
+
2
,
se
x
é par
x
+
2
,
se
x
é ímpar
⇒
h
:
Z
↦
Z
,
o
n
d
e
h
(
x
)
=
x
+
2
{\displaystyle \left\{{\begin{matrix}x+2,&{\mbox{se }}x{\mbox{ é par}}\\x+2,&{\mbox{se }}x{\mbox{ é ímpar}}\end{matrix}}\right.\Rightarrow h:\mathbb {Z} \mapsto \mathbb {Z} ,onde\;h(x)=x+2}
Seja
f
:
A
↦
B
,
B
′
⊂
B
{\displaystyle f:A\mapsto B,B'\subset B}
.
Definamos
B
′
=
{
y
∈
B
;
∃
x
∈
A
:
t
a
l
q
u
e
y
=
f
(
x
)
=
y
}
=
{
f
(
x
)
;
x
∈
A
}
{\displaystyle B'=\{y\in B;\exists \;x\in A:tal\;que\;y=f(x)=y\}=\{f(x);x\in A\}}
. B' é o conjunto imagem, enquanto que B é o contra-domínio,
∀
x
∈
A
:
f
:
A
↦
B
⇒
∃
!
y
∈
B
;
t
a
l
q
u
e
;
f
(
x
)
=
y
{\displaystyle \forall x\in A:f:A\mapsto B\Rightarrow \exists !y\in B;tal\;que;f(x)=y}
. y =f(a) é dito imagem de a pela função f ou valor da função aplicada em x = a.
Dado
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
, uma função que relaciona cada
x
∈
A
{\displaystyle x\in A}
com um
f
(
x
)
∈
B
{\displaystyle f(x)\in B}
.
A imagem inversa de um
y
∈
B
{\displaystyle y\in B}
vai existir se existir um
x
∈
A
,
t
a
l
q
u
e
f
(
x
)
=
y
,
o
u
s
e
j
a
,
x
=
f
−
1
(
y
)
.
{\displaystyle x\in A,tal\;que\;f(x)=y,\;ou\;seja,x=f^{-1}(y).}
Aqui não queremos afirmar que nada sobre a função inversa de f. Apenas dizer quem é o conjunto "Imagem Inversa" de "f".
Para cada valor de y em B, x é dito imagem inversa de y, se f(x) = y.
Exemplo
Tome
f
:
3
Z
↦
Z
,
s
e
n
d
o
q
u
e
f
(
x
)
=
2
x
{\displaystyle f:3\mathbb {Z} \mapsto \mathbb {Z} ,sendo\;que\;f(x)=2x}
. O conjunto Imagem de f é o conjunto
I
m
f
=
{
y
∈
Z
,
t
a
l
q
u
e
y
=
f
(
x
)
,
p
a
r
a
a
l
g
u
m
x
∈
3
Z
}
=
{\displaystyle Im_{f}=\{y\in \mathbb {Z} ,tal\;que\;y=f(x),para\;algum\;x\in 3\mathbb {Z} \}=}
Como
x
∈
3
Z
⇒
x
=
3
k
,
p
a
r
a
a
l
g
u
m
k
∈
Z
.
C
o
m
o
f
(
x
)
=
2
x
⇒
f
(
x
)
=
2
⋅
3
k
,
p
a
r
a
a
l
g
u
m
k
∈
Z
⇒
f
(
x
)
=
6
k
,
p
a
r
a
a
l
g
u
m
k
∈
Z
{\displaystyle x\in 3\mathbb {Z} \Rightarrow x=3k,para\;algum\;k\in \mathbb {Z} .Como\;f(x)=2x\Rightarrow f(x)=2\cdot 3k,para\;algum\;k\in \mathbb {Z} \Rightarrow f(x)=6k,para\;algum\;k\in \mathbb {Z} }
Assim, o conjunto
I
m
f
=
{
y
∈
Z
,
t
a
l
q
u
e
y
=
6
k
,
p
a
r
a
a
l
g
u
m
k
∈
Z
}
=
6
Z
{\displaystyle Im_{f}=\{y\in \mathbb {Z} ,tal\;que\;y=6k,para\;algum\;k\in \mathbb {Z} \}=6\mathbb {Z} }
O conjunto imagem inversa da função f, é o conjunto
{
x
∈
A
,
t
a
l
q
u
e
f
(
x
)
=
y
,
∀
y
∈
I
m
f
}
=
{\displaystyle \{x\in A,tal\;que\;f(x)=y,\forall \;y\in Im_{f}\}=}
=
{
x
∈
A
,
t
a
l
q
u
e
x
=
f
−
1
(
f
(
x
)
)
=
f
−
1
(
y
)
,
∀
y
∈
I
m
f
}
=
A
{\displaystyle =\{x\in A,tal\;que\;x=f^{-1}(f(x))=f^{-1}(y),\forall \;y\in Im_{f}\}=A}
.
Para que y esteja na imagem da função f, ele foi tomado como f(x), de algum x no conjunto A. Como a função sempre é definida por todo o domínio, então qualquer x que esteja em A, terá uma imagem, e será a imagem inversa de sua imagem. logo
x
=
f
−
1
(
f
(
x
)
)
{\displaystyle x=f^{-1}(f(x))}
Seja
f
:
A
↦
B
;
f
(
A
)
⊂
B
{\displaystyle f:A\mapsto B;f(A)\subset B}
. O gráfico da função f é o conjunto
G
(
f
)
=
{
(
a
,
f
(
a
)
)
;
a
∈
A
}
{\displaystyle G(f)=\{(a,f(a));a\in A\}}
.
Uma função
I
:
A
↦
B
{\displaystyle I:A\mapsto B}
é chamada função identidade se
∀
x
∈
A
,
I
(
x
)
=
x
.
{\displaystyle \forall x\in A,I(x)=x.}
Implicações:
A
⊂
B
{\displaystyle A\subset B}
.
a imagem inversa de
x
∈
B
,
{\displaystyle x\in B,}
sempre será
x
∈
A
,
o
u
s
e
j
a
,
I
−
1
(
x
)
=
x
.
{\displaystyle x\in A,ou\;seja,I^{-1}(x)=x.}
.
Uma função
f
:
A
↦
B
,
f
(
x
)
=
c
{\displaystyle f:A\mapsto B,f(x)=c}
é chamada função constante se
∀
x
∈
A
,
f
(
x
)
=
c
.
{\displaystyle \forall x\in A,f(x)=c.}
Implicações:
c
∈
B
{\displaystyle c\in B}
é a única imagem da função, ou seja,
I
m
f
=
{
c
}
{\displaystyle Im_{f}=\{c\}}
.
Dado
A
⊂
C
{\displaystyle A\subset C}
, definimos a função característica ou indicadora de A por
I
A
:
C
↦
{
0
,
1
}
{\displaystyle I_{A}:C\mapsto \{0,1\}}
(também denotada por
X
A
{\displaystyle X_{A}}
) por
I
A
(
x
)
=
{
0
,
se
x
∉
A
1
,
se
x
∈
A
{\displaystyle I_{A}(x)={\begin{cases}0,{\mbox{ se }}x\not \in A\\1,{\mbox{ se }}x\in A\end{cases}}}
.
A função indicadora (ou característica) é muito utilizada em teoria da integração e em probabilidade. Podemos escrever que
I
:
P
(
C
)
↦
F
(
C
;
{
0
,
1
}
)
ou
I
∈
F
(
P
(
C
)
;
F
(
C
;
{
0
,
1
}
)
)
{\displaystyle I:P(C)\mapsto F(C;\{0,1\}){\mbox{ ou }}I\in F(P(C);F(C;\{0,1\}))}
, pois I associa a cada subconjunto
A
∈
P
(
C
)
{\displaystyle A\in P(C)}
a função
I
A
{\displaystyle I_{A}}
.
Sejam
f
:
A
↦
B
e
g
:
C
↦
D
{\displaystyle f:A\mapsto B\;e\;g:C\mapsto D}
duas funções. Dizemos que f e g são iguais se
são dadas pela mesma regra de associação, ou seja, se
f
(
x
)
=
g
(
x
)
,
∀
x
∈
A
,
C
{\displaystyle f(x)=g(x),\forall x\in A,C}
.
"A = C": A condição acima só tem sentido (podendo ser falsa) se f e g tiverem o mesmo domínio (no caso A=C).
"B = D": E também é indispensável que f e g tenham o mesmo contradomínio.
Por esta razão, podemos considerar iguais duas funções de contradomínios diferentes. Mais delicado é considerar que funções de domínios diferentes sejam iguais. Entretanto, cometemos este abuso quando, por exemplo, o domínio de uma função contém o domínio da outra. Quando a prudência mandar, devemos lidar com os conceitos de restrição e extensão.
Sejam
f
:
A
↦
B
e
g
:
C
↦
D
{\displaystyle f:A\mapsto B\;e\;g:C\mapsto D}
. Dizemos que f é uma restrição de g ou que g é uma extensão de f se
A
⊂
C
e
f
(
x
)
=
g
(
x
)
,
∀
x
∈
A
{\displaystyle A\subset C\;e\;f(x)=g(x),\forall \;x\in A}
. Neste caso escrevemos
f
=
g
|
A
{\displaystyle f=g|A}
.
Sejam
f
:
A
↦
B
e
g
:
C
↦
D
{\displaystyle f:A\mapsto B\;e\;g:C\mapsto D}
tais que
f
(
A
)
⊂
C
{\displaystyle f(A)\subset C}
.
Definimos a função composta
g
∘
f
:
A
↦
D
{\displaystyle g\circ f:A\mapsto D}
que a cada
x
∈
A
{\displaystyle x\in A}
associa
z
=
g
(
f
(
x
)
)
∈
D
{\displaystyle z=g(f(x))\in D}
.
BEM ENCAIXADOS: A definição anterior faz sentido pois dado
x
∈
A
{\displaystyle x\in A}
temos que
y
=
f
(
x
)
∈
f
(
A
)
,
c
o
m
o
f
(
A
)
⊂
C
{\displaystyle y=f(x)\in f(A),como\;f(A)\subset C}
temos
y
=
f
(
x
)
∈
C
{\displaystyle y=f(x)\in C}
. Neste caso podemos aplicar g e encontrar
z
=
g
(
y
)
=
g
(
f
(
x
)
)
∈
D
{\displaystyle z=g(y)=g(f(x))\in D}
.
Na prática é assim:
D
a
d
o
x
∈
A
,
(
g
∘
f
)
(
x
)
=
g
(
f
(
x
)
)
=
g
(
y
)
=
z
,
o
n
d
e
y
=
f
(
x
)
{\displaystyle Dado\;x\in A,(g\circ f)(x)=g(f(x))=g(y)=z,onde\;y=f(x)}
.
B
⊄
C
{\displaystyle B\not \subset C}
não atrapalha a composição. Suponha
f
:
Z
↦
Z
,
f
(
x
)
=
2
x
e
g
:
2
Z
↦
Z
,
g
(
y
)
=
3
y
.
{\displaystyle f:\mathbb {Z} \mapsto \mathbb {Z} ,f(x)=2x\;e\;g:2\mathbb {Z} \mapsto \mathbb {Z} ,g(y)=3y.}
Observamos que
Z
⊄
2
Z
,
m
a
s
f
(
Z
)
⊂
2
Z
{\displaystyle \mathbb {Z} \not \subset 2\mathbb {Z} ,mas\;f(\mathbb {Z} )\subset 2\mathbb {Z} }
. Portanto a função composição é possível.
ASSOCIATIVA: Observamos ainda que a operação de composição de funções é associativa, i.e., se
f
:
A
↦
B
,
g
:
C
↦
D
e
h
:
E
↦
F
c
o
m
f
(
A
)
⊂
C
e
g
(
C
)
⊂
E
{\displaystyle f:A\mapsto B,g:C\mapsto D\;e\;h:E\mapsto F\;com\;f(A)\subset C\;e\;g(C)\subset E}
, então temos que
(
(
h
∘
g
)
∘
f
)
(
x
)
=
(
h
∘
(
g
∘
f
)
)
(
x
)
=
h
(
g
(
f
(
x
)
)
)
,
∀
x
∈
A
{\displaystyle ((h\circ g)\circ f)(x)=(h\circ (g\circ f))(x)=h(g(f(x))),\forall x\in A}
.
Para
f
:
A
↦
A
{\displaystyle f:A\mapsto A}
definimos
f
n
:
A
↦
A
{\displaystyle f^{n}:A\mapsto A}
por
f
n
=
f
∘
.
.
.
∘
f
⏟
n
v
e
z
e
s
{\displaystyle f^{n}=\underbrace {f\circ ...\circ f} _{nvezes}}
.
Seja
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
.
Definimos
g
:
f
(
A
)
↦
A
,
g
=
f
−
1
,
y
∈
f
(
A
)
,
∃
x
∈
A
;
g
(
f
(
x
)
)
=
x
,
∀
x
∈
A
{\displaystyle g:f(A)\mapsto A,g=f^{-1},y\in f(A),\exists x\in A;g(f(x))=x,\forall x\in A}
.
f
:
Z
↦
N
,
c
o
m
f
(
x
)
=
x
2
e
g
:
f
(
Z
)
↦
Z
,
c
o
m
g
(
y
)
=
y
,
y
=
f
(
x
)
{\displaystyle f:\mathbb {Z} \mapsto \mathbb {N} ,com\;f(x)=x^{2}\;e\;g:f(\mathbb {Z} )\mapsto \mathbb {Z} ,com\;g(y)={\sqrt {y}},y=f(x)}
. Assim
g
(
y
)
=
g
(
f
(
x
)
)
=
g
(
x
2
)
=
(
x
2
)
=
x
{\displaystyle g(y)=g(f(x))=g(x^{2})={\sqrt {(}}x^{2})=x}
.
Exemplo
f
(
4
)
=
16
e
g
(
16
)
=
4
{\displaystyle f(4)=16\;e\;g(16)=4}
.
Sejam
f
:
A
↦
B
e
g
:
B
↦
A
{\displaystyle f:A\mapsto B{\mbox{ e }}g:B\mapsto A}
tais que
(
g
∘
f
)
(
x
)
=
x
,
∀
x
∈
A
e
(
f
∘
g
)
(
y
)
=
y
,
∀
y
∈
B
{\displaystyle (g\circ f)(x)=x,\forall x\in A{\mbox{ e }}(f\circ g)(y)=y,\forall y\in B}
. Dizemos que f é invertível , que g é a inversa de f e escrevemos
g
=
f
−
1
{\displaystyle g=f^{-1}}
.
Não devemos confundir
f
−
1
{\displaystyle f^{-1}}
da definição acima com
f
~
−
1
{\displaystyle {\tilde {f}}^{-1}}
. Sempre que aplicamos
f
−
1
{\displaystyle f^{-1}}
em conjuntos está subentendido que trata-se da imagem inversa. Quando se aplica
f
−
1
{\displaystyle f^{-1}}
num elemento y, pode-se entender como
f
−
1
(
y
)
{\displaystyle f^{-1}(y)}
, caso a inversa exista, ou
f
~
−
1
(
{
y
}
)
{\displaystyle {\tilde {f}}^{-1}(\{y\})}
, a imagem inversa de um conjunto unitário.
Repare que intercambiando f com g, A com B e x com y as hipóteses da definição de função inversa não mudam, porém a conclusão dirá que f é a inversa de g. Concluímos que f é a inversa de g se, e somente se, g é a inversa de f. Se
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é injetiva, então mesmo quando ela não for sobrejetiva, ainda poderemos considerar sua função inversa
f
−
1
{\displaystyle f^{-1}}
ficando subentendido que o domínio de
f
−
1
{\displaystyle f^{-1}}
é f(A) (e não B). Desta forma
(
f
−
1
∘
f
)
(
x
)
=
x
,
∀
x
∈
A
e
(
f
∘
f
−
1
)
(
y
)
=
y
∀
y
∈
f
(
A
)
{\displaystyle (f^{-1}\circ f)(x)=x,\forall x\in A{\mbox{ e }}(f\circ f^{-1})(y)=y\forall y\in f(A)}
.
Uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é dita sobrejetiva se
f
(
A
)
=
B
{\displaystyle f(A)=B}
, ou seja, se
∀
y
∈
B
,
∃
x
∈
A
;
tal que
f
(
x
)
=
y
{\displaystyle \forall y\in B,\exists x\in A;{\mbox{ tal que }}f(x)=y}
.
Ao se verificar a sobrejetividade de uma função, deve estar claro qual conjunto está sendo considerado como contradomínio. Modificando-o, uma função que não é sobrejetiva pode passar a ser.
Exemplo. Seja
A
=
{
a
,
b
}
{\displaystyle A=\{a,b\}}
. A função f, definida por
f
(
x
)
=
x
,
∀
x
∈
A
{\displaystyle f(x)=x,\forall x\in A}
, não é sobrejetiva de A em
{
a
,
b
,
c
}
{\displaystyle \{a,b,c\}}
mas é sobrejetiva de A em
{
a
,
b
}
{\displaystyle \{a,b\}}
.
Toda função é sobrejetiva na sua imagem, ou seja,
f
:
A
↦
f
(
A
)
{\displaystyle f:A\mapsto f(A)}
é sobrejetiva.
Uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é dita injetiva se ocorre uma destas:
para quaisquer
x
,
y
∈
A
{\displaystyle x,y\in A}
tais que
x
≠
y
{\displaystyle x\neq y}
temos
f
(
x
)
≠
f
(
y
)
{\displaystyle f(x)\neq f(y)}
;
x
,
y
∈
A
{\displaystyle x,y\in A}
são tais que
f
(
x
)
=
f
(
y
)
{\displaystyle f(x)=f(y)}
, então
x
=
y
{\displaystyle x=y}
;
∀
y
∈
f
(
A
)
,
∃
x
!
∈
A
tal que
f
(
x
)
=
y
{\displaystyle \forall \;y\in f(A),\exists x!\in A{\mbox{ tal que }}f(x)=y}
.
Dizemos que a função f tem a propriedade P em A se
f
|
A
{\displaystyle f|A}
tem a propriedade P. Por exemplo, dizer que f é injetiva em A significa que
f
|
A
{\displaystyle f|A}
é injetiva. Isto é muito usual, sobretudo em conversas informais entre matemáticos. Entretanto, isto deve ser usado com cuidado para não cairmos em armadilhas.
Uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é dita bijetiva ou bijeção se ela é injetiva e sobrejetiva.
Exemplo: Sejam
A
=
{
1
,
2
,
3
}
,
B
=
{
2
,
4
,
6
}
e
C
=
{
1
,
4
,
9
,
16
}
{\displaystyle A=\{1,2,3\},B=\{2,4,6\}eC=\{1,4,9,16\}}
. Consideremos as funções
f
:
A
↦
B
,
g
:
A
↦
C
e
h
:
A
↦
A
{\displaystyle f:A\mapsto B,g:A\mapsto C{\mbox{ e }}h:A\mapsto A}
definidas por
f
(
x
)
=
2
x
,
g
(
x
)
=
x
2
,
h
(
x
)
=
2
∀
x
∈
A
{\displaystyle f(x)=2x,g(x)=x^{2},h(x)=2\forall \;x\in A}
.
Temos que f é injetiva e sobrejetiva e, portanto, bijetiva. Temos ainda que g é injetiva, mas não é sobrejetiva e h não é injetiva e nem sobrejetiva.
Dado A um conjunto e P(A), o conjunto das partes de A, não existe uma função
f
:
A
↦
P
(
A
)
{\displaystyle f:A\mapsto P(A)}
que seja sobrejetiva.
Prova 1
para que f não seja sobrejetiva,
P
(
A
)
∖
f
(
A
)
≠
∅
⇒
∃
y
∈
P
(
A
)
,
t
a
l
q
u
e
∀
x
∈
A
,
f
(
x
)
≠
y
{\displaystyle P(A)\setminus f(A)\neq \varnothing \Rightarrow \exists \;y\in P(A),tal\;que\;\forall \;x\in A,f(x)\neq y}
. Ou seja, existe algum y em P(A), que não é imagem de nenhum elemento de A pela função f.
Pela f ser uma função,
∀
x
∈
A
,
∃
y
∈
P
(
A
)
,
t
a
l
q
u
e
y
=
f
(
x
)
∈
P
(
A
)
{\displaystyle \forall x\in A,\exists \;y\in P(A),tal\;que\;y=f(x)\in P(A)}
.
Tomemos
f
:
A
↦
P
(
A
)
,
c
o
m
f
(
x
)
=
{
x
}
{\displaystyle f:A\mapsto P(A),comf(x)=\{x\}}
, assim
P
(
A
)
∖
f
(
A
)
=
P
(
A
)
∖
⋃
x
∈
A
{
x
}
{\displaystyle P(A)\setminus f(A)=P(A)\setminus \bigcup _{x\in A}\{x\}}
. As outras funções que existir deverá ter que
#
P
(
A
)
∖
⋃
x
∈
A
{
x
}
=
#
I
M
f
−
#
A
,
∀
f
:
A
↦
P
(
A
)
.
{\displaystyle \#P(A)\setminus \bigcup _{x\in A}\{x\}=\#IM_{f}-\#A,\forall \;f:A\mapsto P(A).}
Em outras palavras, outras funções que existirem, basta x deixar de flexar {x} e flexar outro elemento.
Prova 2
Vamos considerar um subconjunto de P(A), U(A), como sendo os conjuntos unitários formados pelos elementos de A, mais o conjunto vazio.
Assim U(A) sempre têm um elemento a mais que A, qualquer função que tomarmos,
g
:
A
↦
U
(
A
)
{\displaystyle g:A\mapsto U(A)}
não é sobrejetiva, pois sempre vai faltar um elemento em U(A) para ser flexado.
É fácil ver que g é uma restrição da função f. Como g não é sobrejetiva, f também não é.
ϕ
(
A
∪
B
)
=
ϕ
(
A
)
∪
ϕ
(
B
)
{\displaystyle \phi (A\cup B)=\phi (A)\cup \phi (B)}
ϕ
(
A
∩
B
)
⊂
ϕ
(
A
)
∪
ϕ
(
B
)
{\displaystyle \phi (A\cap B)\subset \phi (A)\cup \phi (B)}
A
⊂
B
⇒
ϕ
(
A
)
⊂
ϕ
(
B
)
{\displaystyle A\subset B\Rightarrow \phi (A)\subset \phi (B)}
ϕ
(
∅
)
=
∅
{\displaystyle \phi (\varnothing )=\varnothing }
A projeção de um plano cartesiano é o conjunto de pontos retirando uma das coordenadas.
Ex.: Seja A x B um plano cartesiano tal que
A
×
B
=
{
(
a
,
b
)
;
a
∈
A
,
b
∈
B
}
{\displaystyle A\times B=\{(a,b);a\in A,b\in B\}}
. Aqui podemos fazer duas projeções:
π
1
:
A
×
B
↦
A
;
π
1
(
a
,
b
)
=
a
{\displaystyle \pi _{1}:A\times B\mapsto A;\pi _{1}(a,b)=a}
π
2
:
A
×
B
↦
B
;
π
2
(
a
,
b
)
=
b
{\displaystyle \pi _{2}:A\times B\mapsto B;\pi _{2}(a,b)=b}
Ex.: Seja A x B X C um plano cartesiano tal que
A
×
B
×
C
=
{
(
a
,
b
,
c
)
;
a
∈
A
,
b
∈
B
,
c
∈
C
}
{\displaystyle A\times B\times C=\{(a,b,c);a\in A,b\in B,c\in C\}}
. Aqui podemos fazer seis projeções:
π
1
:
A
×
B
×
C
↦
A
;
π
1
(
a
,
b
,
c
)
=
a
{\displaystyle \pi _{1}:A\times B\times C\mapsto A;\pi _{1}(a,b,c)=a}
.
π
2
:
A
×
B
×
C
↦
B
;
π
2
(
a
,
b
,
c
)
=
b
{\displaystyle \pi _{2}:A\times B\times C\mapsto B;\pi _{2}(a,b,c)=b}
.
π
3
:
A
×
B
×
C
↦
C
;
π
3
(
a
,
b
,
c
)
=
c
{\displaystyle \pi _{3}:A\times B\times C\mapsto C;\pi _{3}(a,b,c)=c}
.
π
4
:
A
×
B
×
C
↦
A
×
B
;
π
4
(
a
,
b
,
c
)
=
(
a
,
b
)
{\displaystyle \pi _{4}:A\times B\times C\mapsto A\times B;\pi _{4}(a,b,c)=(a,b)}
.
π
5
:
A
×
B
×
C
↦
A
×
C
;
π
5
(
a
,
b
,
c
)
=
(
a
,
c
)
{\displaystyle \pi _{5}:A\times B\times C\mapsto A\times C;\pi _{5}(a,b,c)=(a,c)}
.
π
6
:
A
×
B
×
C
↦
B
×
C
;
π
6
(
a
,
b
,
c
)
=
(
b
,
c
)
{\displaystyle \pi _{6}:A\times B\times C\mapsto B\times C;\pi _{6}(a,b,c)=(b,c)}
.
Consideremos um Retângulo de vértices
(
x
1
,
y
1
)
,
(
x
2
,
y
1
)
,
(
x
1
,
y
2
)
,
(
x
2
,
y
2
)
,
tais que
x
1
<
x
2
e
y
1
<
y
2
{\displaystyle (x_{1},y_{1}),(x_{2},y_{1}),(x_{1},y_{2}),(x_{2},y_{2}),{\mbox{ tais que }}x_{1}<x_{2}{\mbox{ e }}y_{1}<y_{2}}
. Assim sua área é dada pela função
f
:
R
2
×
R
2
↦
R
+
;
f
(
x
1
,
x
2
,
y
1
,
y
2
)
=
(
x
2
−
x
1
)
⋅
(
y
2
−
y
1
)
{\displaystyle f:\mathbb {R} ^{2}\times \mathbb {R} ^{2}\mapsto \mathbb {R} ^{+};f(x_{1},x_{2},y_{1},y_{2})=(x_{2}-x_{1})\cdot (y_{2}-y_{1})}
Essa função não é injetiva, pois dado
x
3
=
x
1
+
2
,
x
4
=
x
2
+
2
,
y
3
=
y
1
,
y
4
=
y
2
⇒
f
(
x
3
,
x
4
,
y
3
,
y
4
)
=
(
x
2
−
x
1
)
⋅
(
y
2
−
y
1
)
=
f
(
x
1
,
x
2
,
y
1
,
y
2
)
{\displaystyle x_{3}=x_{1}+2,x_{4}=x_{2}+2,y_{3}=y_{1},y_{4}=y_{2}\Rightarrow f(x_{3},x_{4},y_{3},y_{4})=(x_{2}-x_{1})\cdot (y_{2}-y_{1})=f(x_{1},x_{2},y_{1},y_{2})}
sendo que
x
3
≠
x
1
e
x
4
≠
x
2
{\displaystyle x_{3}\neq x_{1}{\mbox{ e }}x_{4}\neq x_{2}}
Essa função é sobrejetiva pois dado um
A
∈
R
+
,
temos que
f
(
0
,
A
,
0
,
A
)
=
(
A
−
0
)
⋅
(
A
−
0
)
=
A
{\displaystyle A\in \mathbb {R} ^{+},{\mbox{ temos que }}f(0,{\sqrt {A}},0,{\sqrt {A}})=({\sqrt {A}}-0)\cdot ({\sqrt {A}}-0)=A}
Consideremos um Triângulo de vértices
(
x
1
,
y
1
)
,
(
x
2
,
y
1
)
,
(
x
3
,
y
2
)
,
tais que
x
1
<
x
2
,
e
y
1
<
y
2
{\displaystyle (x_{1},y_{1}),(x_{2},y_{1}),(x_{3},y_{2}),{\mbox{ tais que }}x_{1}<x_{2},{\mbox{ e }}y_{1}<y_{2}}
. Assim sua área é dada pela função
f
:
R
3
×
R
2
↦
R
+
;
f
(
x
1
,
x
2
,
x
3
,
y
1
,
y
2
)
=
(
x
2
−
x
1
)
⋅
(
y
2
−
y
1
)
2
{\displaystyle f:\mathbb {R} ^{3}\times \mathbb {R} ^{2}\mapsto \mathbb {R} ^{+};f(x_{1},x_{2},x_{3},y_{1},y_{2})={(x_{2}-x_{1})\cdot (y_{2}-y_{1}) \over 2}}
Essa função não é injetiva, pois dado
x
4
=
x
1
+
2
,
x
5
=
x
2
+
2
,
y
3
=
y
1
,
y
4
=
y
2
⇒
f
(
x
3
,
x
4
,
x
5
,
y
3
,
y
4
)
=
(
x
2
−
x
1
)
⋅
(
y
2
−
y
1
)
2
=
f
(
x
1
,
x
2
,
x
3
,
y
1
,
y
2
)
{\displaystyle x_{4}=x_{1}+2,x_{5}=x_{2}+2,y_{3}=y_{1},y_{4}=y_{2}\Rightarrow f(x_{3},x_{4},x_{5},y_{3},y_{4})={(x_{2}-x_{1})\cdot (y_{2}-y_{1}) \over 2}=f(x_{1},x_{2},x_{3},y_{1},y_{2})}
sendo que
x
4
≠
x
1
e
x
5
≠
x
2
{\displaystyle x_{4}\neq x_{1}{\mbox{ e }}x_{5}\neq x_{2}}
Essa função é sobrejetiva pois dado um
A
∈
R
+
,
temos que
f
(
0
,
2
A
,
x
3
,
0
,
2
A
)
=
(
2
A
−
0
)
⋅
(
2
A
−
0
)
2
=
A
{\displaystyle A\in \mathbb {R} ^{+},{\mbox{ temos que }}f(0,{\sqrt {2A}},x_{3},0,{\sqrt {2A}})={({\sqrt {2A}}-0)\cdot ({\sqrt {2A}}-0) \over 2}=A}
Consideremos um Triângulo de vértices
(
0
,
x
)
,
(
2
,
0
)
,
(
0
,
0
)
,
tais que
x
>
0
{\displaystyle (0,x),(2,0),(0,0),{\mbox{ tais que }}x>0}
. Assim sua área é dada pela função
f
:
R
+
↦
R
+
;
f
(
x
)
=
x
{\displaystyle f:\mathbb {R} ^{+}\mapsto \mathbb {R} ^{+};f(x)=x}
Essa função é injetiva, pois dado
x
1
≠
x
2
⇒
f
(
x
1
)
≠
f
(
x
2
)
{\displaystyle x_{1}\neq x_{2}\Rightarrow f(x_{1})\neq f(x_{2})}
.
Essa função é sobrejetiva pois dado um
x
∈
R
+
,
temos que
x
I
m
=
f
(
x
)
=
x
D
{\displaystyle x\in \mathbb {R} ^{+},{\mbox{ temos que }}x_{Im}=f(x)=x_{D}}
.
Dados dois conjuntos A e B, denotamos por F(A;B) o conjunto de todas as funções
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
.
Sejam I e C conjuntos não vazios. Uma família
(
A
i
)
i
∈
I
{\displaystyle (A_{i})_{i\in I}}
de elementos de C é uma função
A
:
I
↦
C
{\displaystyle A:I\mapsto C}
para a qual denotamos por
A
i
{\displaystyle A_{i}}
(em vez de
A
(
i
)
{\displaystyle A(i)}
) a imagem de i por A. Dizemos que a família está indexada pelo índice
i
∈
I
{\displaystyle i\in I}
, que I é o conjunto de índices e que
A
i
{\displaystyle A_{i}}
é o i-ésimo elemento (ou membro) da família. Quando I é o conjunto dos números naturais substituímos a palavra família por sequência.
Os gramáticos que nos perdoem, mas usamos o sufixo “ésimo” em i-ésimo mesmo quando i não é um número cardinal.
Observe que na notação
(
A
i
)
i
∈
I
{\displaystyle (A_{i})_{i\in I}}
não aparece o contradomínio C da função. Por isto, ao introduzirmos uma família, é obrigatório dizer que tipo de objetos constituem o seu contradomínio. Por exemplo, uma família de pessoas é uma função cujo contradomínio é um conjunto de pessoas. Da mesma forma, uma família de macacos é uma função cujo contradomínio é um conjunto de macacos (agora são os biólogos que hão de nos perdoar).
Como dito anteriormente, o uso mais frequente do termo família é quando o contradomínio
é uma coleção de conjuntos. Trata-se, então, de uma família de conjuntos. Neste caso, existem notações especiais para a união e a interseção da coleção. Se
(
A
i
)
i
∈
I
{\displaystyle (A_{i})_{i\in I}}
é uma família de conjuntos, então a união e a interseção da família são definidas, respectivamente, por
⋃
i
∈
I
A
i
=
{
x
;
∃
i
∈
I
,
tal que
x
∈
A
i
}
{\displaystyle \bigcup _{i\in I}A_{i}=\{x;\exists i\in I,{\mbox{ tal que }}x\in A_{i}\}}
e
⋂
i
∈
I
A
i
=
{
x
;
x
∈
A
i
∀
i
∈
I
}
{\displaystyle \bigcap _{i\in I}A_{i}=\{x;x\in A_{i}\forall i\in I\}}
Exemplo. Sejam
A
i
=
(
i
,
i
+
1
)
e
A
i
=
(
−
i
2
−
1
,
i
2
)
{\displaystyle A_{i}=(i,i+1){\mbox{ e }}A_{i}=(-i^{2}-1,i^{2})}
. Então:
⋃
i
∈
Q
A
i
=
R
,
⋂
i
∈
Q
B
i
=
(
−
1
,
0
)
,
⋂
i
∈
Q
A
i
=
∅
,
⋃
i
∈
Q
B
i
=
R
,
⋃
i
∈
Z
A
i
=
R
−
Z
{\displaystyle \bigcup _{i\in \mathbb {Q} }A_{i}=\mathbb {R} ,\bigcap _{i\in \mathbb {Q} }B_{i}=(-1,0),\bigcap _{i\in \mathbb {Q} }A_{i}=\varnothing ,\bigcup _{i\in \mathbb {Q} }B_{i}=\mathbb {R} ,\bigcup _{i\in \mathbb {Z} }A_{i}=\mathbb {R} -\mathbb {Z} }
.
Se I é o conjunto dos números inteiros de m até n, então também é usual escrever
⋃
i
=
m
n
A
i
=
A
m
∪
.
.
.
∪
A
n
e
⋂
i
=
m
n
A
i
=
A
m
∩
.
.
.
∩
A
n
{\displaystyle \bigcup _{i=m}^{n}A_{i}=A_{m}\cup ...\cup A_{n}{\mbox{ e }}\bigcap _{i=m}^{n}A_{i}=A_{m}\cap ...\cap A_{n}}
.
Se I é o conjunto de todos os inteiros positivos, então as notações usuais são
⋃
i
=
m
∞
A
i
=
⋃
i
∈
N
A
i
=
A
1
∪
A
2
∪
.
.
.
e
⋂
i
=
m
∞
A
i
=
⋂
i
∈
N
A
i
=
A
1
∩
A
2
∩
.
.
.
{\displaystyle \bigcup _{i=m}^{\infty }A_{i}=\bigcup _{i\in \mathbb {N} }A_{i}=A_{1}\cup A_{2}\cup ...{\mbox{ e }}\bigcap _{i=m}^{\infty }A_{i}=\bigcap _{i\in \mathbb {N} }A_{i}=A_{1}\cap A_{2}\cap ...}
.
O símbolo
∞
{\displaystyle \infty }
(infinito) que aparece nas notações anteriores não é um número. Ele é apenas um símbolo tipográfico cujo papel é dizer que tanto a união quanto a interseção da família
(
A
i
)
i
∈
I
{\displaystyle (A_{i})_{i\in I}}
são tomadas para todo
i
∈
{
1
,
2
,
3
,
.
.
.
}
{\displaystyle i\in \{1,2,3,...\}}
. Este mesmo símbolo aparecerá em várias notações ao longo do texto sendo que em cada uma delas seu papel será diferente.
Porém, sempre devemos ter em mente que infinito não é número!
Ao querermos provar alguma sentença matemática P(n), se é verdadeira, tendo seus elementos nos naturais, usamos a indução, onde:
Provamos que a propriedade é válida para n = 1.
Supomos válida para n = k e mostramos ser válida para n = k+1, usando a equação advinda da propriedade ser válida em n = k.
Definição de um número natural:
n
=
1
+
1
+
.
.
.
+
1
⏟
n
v
e
z
e
s
{\displaystyle n={\begin{matrix}\underbrace {1+1+...+1} \\n\;vezes\end{matrix}}}
Somar dois números n e p:
n
+
p
=
1
+
1
+
.
.
.
+
1
⏟
n
v
e
z
e
s
+
1
+
1
+
.
.
.
+
1
⏟
p
v
e
z
e
s
=
1
+
1
+
.
.
.
+
1
⏟
n
+
p
v
e
z
e
s
{\displaystyle n+p={\begin{matrix}\underbrace {1+1+...+1} \\n\;vezes\end{matrix}}+{\begin{matrix}\underbrace {1+1+...+1} \\p\;vezes\end{matrix}}={\begin{matrix}\underbrace {1+1+...+1} \\n+p\;vezes\end{matrix}}}
.
Um número natural n tem o seu sucessor como sendo s(n) = n + 1.
Sejam a,b naturais, assim se a=b então s(a) = s(b)
Vamos fixar a natural e provar por indução sobre b. assim:
mostrar que é válido para b = 1: a=1, então s(a) = 1+1 e s(1) = 1+1, logo s(a) = s(1)
supor que seja válido para b = k, ou seja, a=k implica que s(a) = s(k), ou seja, a+1 = k+1.
Provar que seja válido para b = k+1:
s
(
a
+
1
)
=
1
(
a
+
1
)
+
1
=
2
(
k
+
1
)
+
1
=
3
s
(
k
+
1
)
{\displaystyle s(a+1)=^{1}(a+1)+1=^{2}(k+1)+1=^{3}s(k+1)}
onde as igualdades 1 e 3 ocorrem por definição de sucessão e a igualdade 2 ocorre por hipótese de indução.
Vamos definir
s
k
(
s
(
n
)
)
=
s
k
+
1
(
n
)
{\displaystyle s_{k}(s(n))=s_{k+1}(n)}
, para dizer que tínhamos o kº sucessor de n, logo em seguida tomamos o sucessor dele, e assim obtivemos o (K+1)º sucessor de n.
p-sucessor de n será definido como
s
p
(
n
)
=
n
+
p
{\displaystyle s_{p}(n)=n+p}
, onde
p
=
1
+
1
+
.
.
.
+
1
⏟
p
v
e
z
e
s
{\displaystyle p={\begin{matrix}\underbrace {1+1+...+1} \\p\;vezes\end{matrix}}}
.
Exemplos:
s
(
n
)
=
n
+
1
,
s
2
(
n
)
=
(
n
+
1
)
+
1
=
n
+
2
,
s
3
(
n
)
=
(
n
+
2
)
+
1
=
n
+
3
,
.
.
.
,
e
s
p
(
n
)
=
(
n
+
p
−
1
)
+
1
=
n
+
p
.
{\displaystyle s(n)=n+1,s_{2}(n)=(n+1)+1=n+2,s_{3}(n)=(n+2)+1=n+3,...,\;e\;s_{p}(n)=(n+p-1)+1=n+p.}
Provaremos por indução que essa propriedade é válida.
Quando p=1, temos que
s
1
(
n
)
=
n
+
1
=
s
(
n
)
{\displaystyle s_{1}(n)=n+1=s(n)}
.
Suponhamos ser válida para p = k, ou seja,
s
k
(
n
)
=
n
+
k
{\displaystyle s_{k}(n)=n+k}
.
provaremos que é válida para p=k+1, ou seja, que
s
k
+
1
(
n
)
=
n
+
(
k
+
1
)
{\displaystyle s_{k+1}(n)=n+(k+1)}
. Assim:
Pela hipótese temos que
s
k
(
n
)
=
n
+
k
{\displaystyle s_{k}(n)=n+k}
.
Pela identidade da sucessão é implicado que
s
(
s
k
(
n
)
)
=
s
(
n
+
k
)
{\displaystyle s(s_{k}(n))=s(n+k)}
Pela definição de sucessão ocorre que
s
k
(
n
)
+
1
=
(
n
+
k
)
+
1
{\displaystyle s_{k}(n)+1=(n+k)+1}
.
Pela definição de sucessão ocorre que
s
k
+
1
(
n
)
=
n
+
(
k
+
1
)
{\displaystyle s_{k+1}(n)=n+(k+1)}
.
Faltando apenas mostrar o porque que para todo n,k naturais, é válido que
(
n
+
k
)
+
1
=
n
+
(
k
+
1
)
{\displaystyle (n+k)+1=n+(k+1)}
.
Na última prova é bem aceitável aceitar como verdadeira a igualdade
(
n
+
k
)
+
1
=
n
+
(
k
+
1
)
{\displaystyle (n+k)+1=n+(k+1)}
. Ela é dada como válida pois é dada por definição da adição, mas é interessante prová-la por indução.
Assim vamos fazer indução sobre p em
(
n
+
p
)
+
1
=
n
+
(
p
+
1
)
{\displaystyle (n+p)+1=n+(p+1)}
.
quando p = 1, temos que
∀
n
∈
N
,
(
n
+
1
)
+
1
=
n
+
(
1
+
1
)
⇒
s
(
s
(
n
)
)
=
n
+
s
(
1
)
=
n
+
2
{\displaystyle \forall \;n\in \mathbb {N} ,(n+1)+1=n+(1+1)\Rightarrow s(s(n))=n+s(1)=n+2}
.
Supomos verdadeira para p = k, ou seja,
(
n
+
k
)
+
1
=
n
+
(
k
+
1
)
,
o
u
s
e
j
a
,
s
(
n
+
k
)
=
n
+
s
(
k
)
{\displaystyle (n+k)+1=n+(k+1),\;ou\;seja,\;s(n+k)=n+s(k)}
.
Queremos provar que é válido para p = k+1, isto é,
(
n
+
(
k
+
1
)
)
+
1
=
n
+
(
(
k
+
1
)
+
1
)
,
o
u
s
e
j
a
,
s
(
n
+
s
(
k
)
)
=
n
+
s
(
s
(
k
)
)
{\displaystyle (n+(k+1))+1=n+((k+1)+1),\;ou\;seja,\;s(n+s(k))=n+s(s(k))}
Por hipótese,
s
(
n
+
k
)
=
n
+
s
(
k
)
{\displaystyle s(n+k)=n+s(k)}
.
Pela identidade da sucessão temos que
s
(
n
+
s
(
k
)
)
=
s
(
s
(
n
+
k
)
)
{\displaystyle s(n+s(k))=s(s(n+k))}
.
Mas
s
(
s
(
n
+
k
)
)
=
(
n
+
k
)
+
2
=
(
n
+
k
)
+
1
+
1
=
n
+
(
k
+
1
)
+
1
=
n
+
s
(
k
)
+
1
=
n
+
s
(
s
(
k
)
)
{\displaystyle s(s(n+k))=(n+k)+2=(n+k)+1+1=n+(k+1)+1=n+s(k)+1=n+s(s(k))}
.
ou
(
n
+
p
)
+
1
=
1
+
1
+
.
.
.
+
1
⏟
n
+
p
v
e
z
e
s
+
1
=
1
+
1
+
.
.
.
+
1
⏟
n
+
p
+
1
v
e
z
e
s
=
1
+
1
+
.
.
.
+
1
⏟
n
v
e
z
e
s
+
1
+
1
+
.
.
.
+
1
⏟
p
+
1
v
e
z
e
s
=
n
+
(
p
+
1
)
{\displaystyle (n+p)+1={\begin{matrix}\underbrace {1+1+...+1} \\n+p\;vezes\end{matrix}}+1={\begin{matrix}\underbrace {1+1+...+1} \\n+p+1\;vezes\end{matrix}}={\begin{matrix}\underbrace {1+1+...+1} \\n\;vezes\end{matrix}}+{\begin{matrix}\underbrace {1+1+...+1} \\p+1\;vezes\end{matrix}}=n+(p+1)}
Definição do "Axioma da adição":
(
n
+
p
)
+
1
=
n
+
(
p
+
1
)
{\displaystyle (n+p)+1=n+(p+1)}
.
∀
m
,
n
,
p
∈
N
,
m
+
(
n
+
p
)
=
(
m
+
n
)
+
p
{\displaystyle \forall m,n,p\in \mathbb {N} ,m+(n+p)=(m+n)+p}
.
Fixemos m,n naturais. Provaremos que é válido para todo p natural. Fazendo indução sobre p, temos:
para p = 1, provamos no teorema acima, isto é, que m + (n+1) = (m+n)+1.
supomos válido para p = k, isto é,
m
+
(
n
+
k
)
=
(
m
+
n
)
+
k
{\displaystyle m+(n+k)=(m+n)+k}
.
Provaremos que é válido para p = k+1, ou seja,
m
+
(
n
+
(
k
+
1
)
)
=
(
m
+
n
)
+
(
k
+
1
)
{\displaystyle m+(n+(k+1))=(m+n)+(k+1)}
.
Assim,
m
+
(
n
+
(
k
+
1
)
)
=
1
m
+
(
(
n
+
k
)
+
1
)
=
2
(
m
+
(
n
+
k
)
)
+
1
=
3
(
(
m
+
n
)
+
k
)
+
1
=
4
(
m
+
n
)
+
(
k
+
1
)
{\displaystyle m+(n+(k+1))=^{1}m+((n+k)+1)=^{2}(m+(n+k))+1=^{3}((m+n)+k)+1=^{4}(m+n)+(k+1)}
.
onde as igualdades 1, 2 e 4 ocorrem pelo axioma da adição e a 3 pela hipótese.
Provar por indução que
∀
m
∈
N
,
m
+
1
=
1
+
m
{\displaystyle \forall \;m\in \mathbb {N} ,m+1=1+m}
.
Para m = 1, temos que 1+1=1+1 (verdade)
Supomos válido para m = k, isto é, k+1 = 1+k e provar ser verdadeiro para k+1, ou seja,
(
k
+
1
)
+
1
=
1
+
(
k
+
1
)
{\displaystyle (k+1)+1=1+(k+1)}
.
(
k
+
1
)
+
1
=
1
(
1
+
k
)
+
1
=
2
1
+
(
k
+
1
)
{\displaystyle (k+1)+1=^{1}(1+k)+1=^{2}1+(k+1)}
onde a igualdade 1 ocorre pela hipótese e a igualdade 2 ocorre pelo axioma da adição.
∀
m
,
n
∈
N
,
m
+
n
=
n
+
m
{\displaystyle \forall m,n\in \mathbb {N} ,m+n=n+m}
.
Fixemos m natural. Provaremos que é válido para todo n natural. Fazendo indução sobre n, temos:
para n = 1, temos que m + 1 = 1 + m. (m e 1 são comutáveis)
supomos válido para n = k, isto é,
m
+
k
=
k
+
m
{\displaystyle m+k=k+m}
.
Provaremos que é válido para n = k+1, ou seja,
m
+
(
k
+
1
)
=
(
k
+
1
)
+
m
{\displaystyle m+(k+1)=(k+1)+m}
.
Assim,
m
+
(
k
+
1
)
=
1
(
m
+
k
)
+
1
=
2
(
k
+
m
)
+
1
=
3
k
+
(
m
+
1
)
=
4
k
+
(
1
+
m
)
=
5
(
k
+
1
)
+
m
{\displaystyle m+(k+1)=^{1}(m+k)+1=^{2}(k+m)+1=^{3}k+(m+1)=^{4}k+(1+m)=^{5}(k+1)+m}
onde as igualdades 1, 3 e 5 ocorrem pela associatividade da adição, a igualdade 2 ocorre pela hipótese e a igualdade 4 ocorre pelo comuto de 1 e m.
m
⋅
n
=
m
+
m
+
.
.
.
+
m
⏟
n
v
e
z
e
s
{\displaystyle m\cdot n={\begin{matrix}\underbrace {m+m+...+m} \\n\;vezes\end{matrix}}}
m
⋅
(
n
+
1
)
=
m
+
m
+
.
.
.
+
m
⏟
n
+
1
v
e
z
e
s
=
m
+
m
+
.
.
.
+
m
⏟
n
v
e
z
e
s
+
m
=
m
n
+
m
{\displaystyle m\cdot (n+1)={\begin{matrix}\underbrace {m+m+...+m} \\n+1\;vezes\end{matrix}}={\begin{matrix}\underbrace {m+m+...+m} \\n\;vezes\end{matrix}}+m=mn+m}
Para quaisquer
m
,
n
,
p
∈
N
,
{\displaystyle m,n,p\in \mathbb {N} ,}
tem-se
m
⋅
(
n
+
p
)
=
m
⋅
n
+
m
⋅
p
{\displaystyle m\cdot (n+p)=m\cdot n+m\cdot p}
.
Fixamos m,n como sendo naturais quaisquer e provaremos por indução sobre p. Pela definição é válido para p = 1, isto é,
m
⋅
(
n
+
1
)
=
m
⋅
n
+
m
⋅
1
{\displaystyle m\cdot (n+1)=m\cdot n+m\cdot 1}
.
Supomos válido para p = k, ou seja,
m
⋅
(
n
+
k
)
=
m
⋅
n
+
m
⋅
k
{\displaystyle m\cdot (n+k)=m\cdot n+m\cdot k}
.
Provemos ser válido para n = k+1:
m
⋅
(
n
+
(
k
+
1
)
)
=
1
m
⋅
(
(
n
+
k
)
+
1
)
=
2
m
⋅
(
n
+
k
)
+
m
=
3
(
m
⋅
n
+
m
⋅
k
)
+
m
=
4
m
⋅
n
+
(
m
⋅
k
+
m
⋅
1
)
=
5
m
⋅
n
+
m
⋅
(
k
+
1
)
{\displaystyle m\cdot (n+(k+1))=^{1}m\cdot ((n+k)+1)=^{2}m\cdot (n+k)+m=^{3}(m\cdot n+m\cdot k)+m=^{4}m\cdot n+(m\cdot k+m\cdot 1)=^{5}m\cdot n+m\cdot (k+1)}
.
onde a igualdade 1 ocorre pela definição de adição, as igualdades 2 e 5 ocorrem pela definição de multiplicação, a igualdade 3 pela hipótese e a igualdade 4 pela associatividade da adição.
Para quaisquer
m
∈
N
,
{\displaystyle m\in \mathbb {N} ,}
tem-se que
m
⋅
1
=
1
⋅
m
{\displaystyle m\cdot 1=1\cdot m}
.
Mostraremos por indução sobre m que a relação acima é válida para todo m natural.
Para m = 1, temos Para quaisquer
1
⋅
1
=
1
⋅
1
{\displaystyle 1\cdot 1=1\cdot 1}
, verdadeiro.
Supomos ser válido para m = k, ou seja,
k
⋅
1
=
1
⋅
k
{\displaystyle k\cdot 1=1\cdot k}
.
Provaremos ser válido para m = k + 1:
1
⋅
(
k
+
1
)
=
1
1
⋅
k
+
1
⋅
1
=
2
k
⋅
1
+
1
⋅
1
=
3
(
k
+
1
)
⋅
1
{\displaystyle 1\cdot (k+1)=^{1}1\cdot k+1\cdot 1=^{2}k\cdot 1+1\cdot 1=^{3}(k+1)\cdot 1}
.
onde a igualdade 1 é dada pela definição de multiplicação, a igualdade 2 é devida a hipótese e a igualdade 3 é devida a distributividade dos naturais.
Para quaisquer
m
,
n
∈
N
,
{\displaystyle m,n\in \mathbb {N} ,}
tem-se
m
⋅
n
=
n
⋅
m
{\displaystyle m\cdot n=n\cdot m}
.
Fixando m natural, faremos indução sobre n, mostraremos que a relação acima é válida para todo n natural.
para n = 1, temos
m
⋅
1
=
1
⋅
m
{\displaystyle m\cdot 1=1\cdot m}
, que foi verificado ser verdadeiro no axioma anterior.
Supomos válido para n=k, ou seja,
m
⋅
k
=
k
⋅
m
{\displaystyle m\cdot k=k\cdot m}
.
vamos provar que é válido para n=k+1:
m
⋅
(
k
+
1
)
=
1
m
⋅
k
+
m
⋅
1
=
2
k
⋅
m
+
1
⋅
m
=
3
(
k
+
1
)
⋅
m
{\displaystyle m\cdot (k+1)=^{1}m\cdot k+m\cdot 1=^{2}k\cdot m+1\cdot m=^{3}(k+1)\cdot m}
.
onde as igualdades 1 e 3 ocorrem pela definição de multiplicação e a igualdade 2 ocorre pelas hipóteses de indução para quando n=1 e para quando n = k.
∀
m
,
n
,
p
∈
N
,
m
⋅
(
n
⋅
p
)
=
(
m
⋅
n
)
⋅
p
{\displaystyle \forall m,n,p\in \mathbb {N} ,m\cdot (n\cdot p)=(m\cdot n)\cdot p}
.
Fixemos m,n naturais. Provaremos que é válido para todo p natural. Fazendo indução sobre p, temos:
para p = 1, temos que
m
⋅
(
n
⋅
1
)
=
m
⋅
n
=
(
m
⋅
n
)
⋅
1
{\displaystyle m\cdot (n\cdot 1)=m\cdot n=(m\cdot n)\cdot 1}
. (por definição de multiplicação por 1)
supomos válido para p = k, isto é,
m
⋅
(
n
⋅
k
)
=
(
m
⋅
n
)
⋅
k
{\displaystyle m\cdot (n\cdot k)=(m\cdot n)\cdot k}
.
Provaremos que é válido para p = k+1, ou seja,
m
⋅
(
n
⋅
(
k
+
1
)
)
=
(
m
⋅
n
)
⋅
(
k
+
1
)
{\displaystyle m\cdot (n\cdot (k+1))=(m\cdot n)\cdot (k+1)}
.
Assim,
m
⋅
(
n
⋅
(
k
+
1
)
)
=
1
m
⋅
(
(
n
⋅
k
)
+
n
)
=
2
(
m
⋅
(
n
⋅
k
)
)
+
m
⋅
n
=
3
(
(
m
⋅
n
)
⋅
k
)
+
m
⋅
n
=
4
(
m
⋅
n
)
⋅
(
k
+
1
)
{\displaystyle m\cdot (n\cdot (k+1))=^{1}m\cdot ((n\cdot k)+n)=^{2}(m\cdot (n\cdot k))+m\cdot n=^{3}((m\cdot n)\cdot k)+m\cdot n=^{4}(m\cdot n)\cdot (k+1)}
.
onde as igualdades 1, 2 e 4 ocorre pela distributividade e a igualdade 3 ocorre pela hipótese de indução.
S
e
m
,
n
,
p
∈
N
e
m
+
p
=
n
+
p
,
l
o
g
o
m
=
n
{\displaystyle Se\;m,n,p\in \mathbb {N} \;e\;m+p=n+p,\;logo\;m=n}
.
Vamos fazer indução sobre p.
Mostrar válido para p = 1, ou seja,
m
+
1
=
n
+
1
⇒
m
=
n
{\displaystyle m+1=n+1\Rightarrow m=n}
.
Temos que s(m) = m + 1, mas pela hipótese s(m) = n + 1. Mas s(n) = n+1, assim m e n têm os mesmo sucessores. Pela identidade da sucessão, m = n.
Supor válido para p = k, ou seja,
m
+
k
=
n
+
k
⇒
m
=
n
{\displaystyle m+k=n+k\Rightarrow m=n}
.
Mostrar válido para p = k+1:
m
+
k
+
1
=
n
+
k
+
1
{\displaystyle m+k+1=n+k+1}
. Pela lei de sucessor identidade s(m+k)=s(n+k), implica que m+k=n+k e pela hipótese m = k.
S
e
m
,
n
,
p
∈
N
e
m
=
n
,
l
o
g
o
m
+
p
=
n
+
p
{\displaystyle Se\;m,n,p\in \mathbb {N} \;e\;m=n,\;logo\;m+p=n+p}
.
Vamos fazer indução sobre p.
Mostrar válido para p = 1, ou seja,
m
=
n
⇒
m
+
1
=
n
+
1
{\displaystyle m=n\Rightarrow m+1=n+1}
.
como m = n, logo s(m) = s(n), ou seja, m + 1 = n + 1.
Supor válido para p = k, ou seja,
m
=
n
⇒
m
+
k
=
n
+
k
{\displaystyle m=n\Rightarrow m+k=n+k}
.
Mostrar válido para p = k+1:
m
+
(
k
+
1
)
=
1
(
m
+
k
)
+
1
=
2
(
n
+
k
)
+
1
=
3
n
+
(
k
+
1
)
{\displaystyle m+(k+1)=^{1}(m+k)+1=^{2}(n+k)+1=^{3}n+(k+1)}
onde as igualdades 1 e 3 ocorrem por associatividade da adição e a igualdade 2 ocorre pela hipótese da indução quando p=k.
S
e
m
,
n
,
p
∈
N
e
m
⋅
p
=
n
⋅
p
,
l
o
g
o
m
=
n
{\displaystyle Se\;m,n,p\in \mathbb {N} \;e\;m\cdot p=n\cdot p,\;logo\;m=n}
.
Vamos fazer indução sobre p.
Mostrar válido para p = 1, ou seja,
m
⋅
1
=
n
⋅
1
⇒
m
=
n
{\displaystyle m\cdot 1=n\cdot 1\Rightarrow m=n}
.
Supor válido para p = k, ou seja,
m
⋅
k
=
n
⋅
k
⇒
m
=
n
{\displaystyle m\cdot k=n\cdot k\Rightarrow m=n}
.
Mostrar válido para p = k + 1:
m
⋅
(
k
+
1
)
=
1
m
⋅
k
+
m
⋅
1
=
2
n
⋅
k
+
n
⋅
1
=
3
n
⋅
(
k
+
1
)
⇒
4
m
=
n
{\displaystyle m\cdot (k+1)=^{1}m\cdot k+m\cdot 1=^{2}n\cdot k+n\cdot 1=^{3}n\cdot (k+1)\Rightarrow _{4}m=n}
onde as igualdades 1 e 3 ocorrem pela lei da distributividade, a igualdade 2 ocorre pela hipótese da indução quando p=k e a implicação 4 ocorre pela hipótese de indução de p = k.
Um número "m" é menor que o outro "n", se existe um natural "p" tal que o maior "n" é igual ao menor "m" adicionado a esse natural "p":
Definiçao da ordem entre dois números naturais:
m
<
n
,
s
e
∃
p
∈
N
;
m
+
p
=
n
{\displaystyle m<n,\;se\;\exists \;p\in \mathbb {N} ;m+p=n}
.
Ou seja, o maior "n" é o "p"-sucessor de "m", ié,
n
=
s
p
(
m
)
{\displaystyle n=s_{p}(m)}
.
Ou também
m
+
p
=
1
+
1
+
.
.
.
+
1
⏟
m
v
e
z
e
s
+
1
+
1
+
.
.
.
+
1
⏟
p
v
e
z
e
s
=
1
+
1
+
.
.
.
+
1
⏟
m
+
p
v
e
z
e
s
=
1
+
1
+
.
.
.
+
1
⏟
n
v
e
z
e
s
=
n
{\displaystyle m+p={\begin{matrix}\underbrace {1+1+...+1} \\m\;vezes\end{matrix}}+{\begin{matrix}\underbrace {1+1+...+1} \\p\;vezes\end{matrix}}={\begin{matrix}\underbrace {1+1+...+1} \\m+p\;vezes\end{matrix}}={\begin{matrix}\underbrace {1+1+...+1} \\n\;vezes\end{matrix}}=n}
Definição da Relação de Ordem(definição da desigualdade):
∀
m
,
n
,
p
∈
N
,
m
<
n
⇔
∃
p
∈
N
;
m
+
p
=
n
{\displaystyle \forall m,n,p\in \mathbb {N} ,m<n\Leftrightarrow \exists \;p\in \mathbb {N} ;m+p=n}
.
É considerada uma definição, mesmo que possamos provar. Pois o "p" indica que se somarmos 1 p-vezes ao menor número, teremos o maior. Dessa maneira "m" é dito menor que "n".
Teorema:
S
e
j
a
m
m
,
n
,
p
∈
N
,
o
n
d
e
m
<
n
e
n
<
p
,
l
o
g
o
m
<
p
{\displaystyle Sejam\;m,n,p\in \mathbb {N} ,onde\;m<n\;e\;n<p,\;logo\;m<p}
.
Prova:
Sejam
m
<
n
e
n
<
p
{\displaystyle m<n\;e\;n<p}
. Pela definição da Relação de ordem,
∃
q
,
r
∈
N
,
t
a
l
q
u
e
m
+
q
=
n
e
n
+
r
=
p
⇒
(
m
+
q
)
+
r
=
p
{\displaystyle \exists \;q,r\in \mathbb {N} ,\;tal\;que\;m+q=n\;e\;n+r=p\Rightarrow (m+q)+r=p}
.
Pela associatividade da adição dos naturais temos que
m
+
(
q
+
r
)
=
p
{\displaystyle m+(q+r)=p}
.
Pela definição da relação de ordem
m
<
p
{\displaystyle m<p}
.
Tomado qualquer natural diferente de 1, teremos que esse natural é maior que 1, isto é,
Teorema:
∀
m
∈
N
−
{
1
}
⇒
1
<
m
{\displaystyle \forall \;m\in \mathbb {N} -\{1\}\Rightarrow 1<m}
.
Prova:
Por indução sobre m, devemos mostrar que é válido para o primeiro m possível, que no caso é o sucessor de 1, que é 2, assim: 1<2.
Devemos supor que seja válido para qualquer m tomado, ou seja, para quando m = k, ou seja, 1<k.
Devemos agora, provar ser válido para m = k+1. No entanto, k+1 é o sucessor de k, logo k<k+1, como por hipótese da indução 1<k, pela transitividade da relação de ordem, 1<k+1.
Mostre que
s
(
p
)
>
p
,
∀
p
∈
N
{\displaystyle s(p)>p,\forall \;p\in \mathbb {N} }
Vamos mostrar por indução sobre n, que
s
(
p
)
>
p
,
∀
p
∈
N
{\displaystyle s(p)>p,\forall \;p\in \mathbb {N} }
Devemos mostrar que é válido para p = 1, ou seja,
s
(
1
)
>
1
{\displaystyle s(1)>1}
. Mas
s
(
1
)
=
2
e
2
>
1
{\displaystyle s(1)=2\;e\;2>1}
.
Suponhamos que é válido para p = k, ou seja,
s
(
k
)
>
k
,
∀
k
∈
N
{\displaystyle s(k)>k,\forall \;k\in \mathbb {N} }
.
Como
k
+
n
=
s
(
k
)
=
k
+
1
⇒
1
s
(
k
+
n
)
=
s
(
k
+
1
)
⇒
2
k
+
n
+
1
=
s
(
k
+
1
)
⇒
3
k
+
1
+
n
=
s
(
k
+
1
)
⇒
4
{\displaystyle k+n=s(k)=k+1\Rightarrow _{1}s(k+n)=s(k+1)\Rightarrow _{2}k+n+1=s(k+1)\Rightarrow _{3}k+1+n=s(k+1)\Rightarrow _{4}}
⇒
4
∃
n
∈
N
,
t
a
l
q
u
e
s
(
k
+
1
)
>
k
+
1.
{\displaystyle \Rightarrow _{4}\exists \;n\in \mathbb {N} ,tal\;que\;s(k+1)>k+1.}
onde a implicação 1 é pela identidade de sucessão, a implicação 2 é pela sucessão de um natural, a implicação 3 é pela comutatidade da adição e a implicação 4 é pela definição de desigualdade.
Mostre que
s
m
+
1
(
p
)
>
s
m
(
p
)
,
∀
m
,
p
∈
N
{\displaystyle s^{m+1}(p)>s^{m}(p),\forall \;m,p\in \mathbb {N} }
Vamos provar por indução sobre m:
Vamos mostrar que é válido para m = 1, ou seja
s
1
+
1
(
p
)
>
s
1
(
p
)
{\displaystyle s^{1+1}(p)>s^{1}(p)}
.
Como
s
(
p
)
>
p
⇒
∃
n
∈
N
,
{\displaystyle s(p)>p\Rightarrow \exists \;n\in \mathbb {N} ,}
tal que
s
(
p
)
=
n
+
p
⇒
s
(
s
(
p
)
)
=
s
(
n
+
p
)
⇒
s
1
+
1
(
p
)
=
n
+
p
+
1
=
n
+
s
(
p
)
⇒
s
2
(
p
)
>
s
1
(
p
)
{\displaystyle s(p)=n+p\Rightarrow s(s(p))=s(n+p)\Rightarrow s^{1+1}(p)=n+p+1=n+s(p)\Rightarrow s^{2}(p)>s^{1}(p)}
Suponha válido para m = k, ou seja,
s
k
+
1
(
p
)
>
s
k
(
p
)
,
∀
k
,
p
∈
N
{\displaystyle s^{k+1}(p)>s^{k}(p),\forall \;k,p\in \mathbb {N} }
Mostrar válido para m = k + 1, ou seja,
s
k
+
2
(
p
)
>
s
k
+
1
(
p
)
,
∀
k
,
p
∈
N
{\displaystyle s^{k+2}(p)>s^{k+1}(p),\forall \;k,p\in \mathbb {N} }
Como
s
k
+
1
(
p
)
>
s
k
(
p
)
⇒
1
∃
n
∈
N
,
t
a
l
q
u
e
s
k
+
1
(
p
)
=
n
+
s
k
(
p
)
⇒
2
s
(
s
k
+
1
(
p
)
)
=
s
(
n
+
s
k
(
p
)
)
⇒
3
{\displaystyle s^{k+1}(p)>s^{k}(p)\Rightarrow _{1}\exists \;n\in \mathbb {N} ,tal\;que\;s^{k+1}(p)=n+s^{k}(p)\Rightarrow _{2}s(s^{k+1}(p))=s(n+s^{k}(p))\Rightarrow _{3}}
⇒
3
s
k
+
1
+
1
(
p
)
=
n
+
s
k
(
p
)
+
1
=
n
+
s
(
s
k
(
p
)
)
⇒
4
s
k
+
2
(
p
)
=
n
+
s
k
+
1
(
p
)
⇒
5
s
k
+
2
(
p
)
>
s
k
+
1
(
p
)
{\displaystyle \Rightarrow _{3}s^{k+1+1}(p)=n+s^{k}(p)+1=n+s(s^{k}(p))\Rightarrow _{4}s^{k+2}(p)=n+s^{k+1}(p)\Rightarrow _{5}s^{k+2}(p)>s^{k+1}(p)}
.
onde as implicações 1 e 5 são pela definição de desigualdade, a implicação 2 pela identidade de sucessão, a implicação 3 é pela definição de sucessor e a implicação 4 é pela definição de k-sucessor.
Dados dois naturais, a relação de ordem não se perde somando ou multiplicando um natural qualquer por ambos os membros.
Teorema:
∀
m
,
n
,
p
∈
N
,
t
a
l
q
u
e
m
<
n
⇒
m
+
p
<
n
+
p
e
m
⋅
n
<
n
⋅
p
{\displaystyle \forall \;m,n,p\in \mathbb {N} ,tal\;que\;m<n\Rightarrow m+p<n+p\;e\;m\cdot n<n\cdot p}
Prova:
adição:
Por hipótese temos que m<n. Pela definição da desigualdade, existe um q natural tal que m+q = n.
Pela recíproca da lei de corte para adição, temos que
m
+
q
+
p
=
n
+
p
{\displaystyle m+q+p=n+p}
.
Pela lei comutativa da adição, temos que m+p+q = n+p, logo m+p<n+p.
multiplicação: Como m<n, pela definição de desigualdade, existe um q natural tal que m+q = n, assim
(
m
+
q
)
.
p
=
n
.
p
{\displaystyle (m+q).p=n.p}
, pela lei distributiva, temos que m.p+q.p = n.p, logo
m
⋅
p
<
n
⋅
p
.
{\displaystyle m\cdot p<n\cdot p.}
Dados
m
,
n
∈
N
{\displaystyle m,n\in \mathbb {N} }
. Das três possibilidades, somente uma é verdadeira:
Demonstração: Fixemos m natural. Queremos mostrar que para qualquer n, natural, dado, teremos que m = n ou m<n ou n<m (isto é, m e n são comparáveis).
Suponha que exista um conjunto X, subconjunto dos números naturais que são comparáveis com m. Assim
X
=
{
n
∈
N
;
n
=
m
o
u
n
<
m
o
u
m
<
n
}
{\displaystyle X=\{n\in \mathbb {N} ;n=m\;ou\;n<m\;ou\;m<n\}}
.
Vamos provar que
X
=
N
{\displaystyle X=\mathbb {N} }
por indução sobre n.
Devemos mostrar que é válido para n = 1, isto é, 1=m ou 1<m ou m<1:
caso m = 1, então 1 = 1
caso m é natural e diferente de 1, pelo axioma de que "1 é o menor natural", então 1 < m.
Portanto 1 é comparável com m e
1
∈
X
{\displaystyle 1\in X}
Vamos supor que é válido para
n
=
k
,
k
∈
N
{\displaystyle n=k,k\in \mathbb {N} }
, ou seja, das três possibilidade, uma é verdadeira, k=m ou k<m ou m<k e assim
k
∈
X
{\displaystyle k\in X}
.
provar válido para n = k+1, ou seja, que das três possibilidade, uma é verdadeira, k+1=m ou k+1<m ou m<k+1 e assim
k
+
1
∈
X
{\displaystyle k+1\in X}
.
caso k=m, logo k+1=m+1, e assim k+1 é o sucessor de m, e portanto m<k+1 e
k
+
1
∈
X
{\displaystyle k+1\in X}
.
caso k<m, pelo axioma da ordem de dois números
∃
p
∈
N
;
k
+
p
=
m
{\displaystyle \exists \;p\in \mathbb {N} ;k+p=m}
.
caso
p
=
1
⇒
k
+
1
=
m
⇒
k
+
1
∈
X
{\displaystyle p=1\Rightarrow k+1=m\Rightarrow k+1\in X}
.
caso 1<p, pela monotonicidade k+1<k+p. Como k+p = m, logo
k
+
1
<
m
⇒
k
+
1
∈
X
{\displaystyle k+1<m\Rightarrow k+1\in X}
.
Pelo axioma que 1 é o menor inteiro, não é possível que p<1, portanto
k
+
1
∈
X
{\displaystyle k+1\in X}
.
caso m<k, pelo axioma da ordem de dois números
∃
p
∈
N
;
m
+
p
=
k
{\displaystyle \exists \;p\in \mathbb {N} ;m+p=k}
.
caso
p
=
1
⇒
m
+
1
=
k
⇒
(
m
+
1
)
+
1
=
k
+
1
⇒
m
+
1
<
k
+
1.
C
o
m
o
m
<
m
+
1
{\displaystyle p=1\Rightarrow m+1=k\Rightarrow (m+1)+1=k+1\Rightarrow m+1<k+1.\;Como\;m<m+1}
logo pela transitividade da relação de ordem,
m
<
k
+
1
⇒
k
+
1
∈
X
{\displaystyle m<k+1\Rightarrow k+1\in X}
.
caso 1<p, pela monotonicidade, m+1<m+p. Pela definição de desigualdade, existe um q natural tal que m+1+q=m+p. Como m+p = k, logo m+1+q=k, e assim m+1+q+1 = k+1, portanto m+1<k+1. Como m<m+1, pela transitividade da relação de ordem m < k+1
⇒
k
+
1
∈
X
{\displaystyle \Rightarrow k+1\in X}
.
Pelo axioma que 1 é o menor inteiro, não é possível que p<1, portanto
k
+
1
∈
X
{\displaystyle k+1\in X}
.
Sejam
m
,
n
,
p
,
r
∈
N
;
m
⋅
p
+
r
=
n
⋅
p
⇒
∃
q
∈
N
;
r
=
q
⋅
p
{\displaystyle m,n,p,r\in \mathbb {N} ;m\cdot p+r=n\cdot p\Rightarrow \exists \;q\in \mathbb {N} ;r=q\cdot p}
Vamos fixar m e n naturais. Faremos a indução sobre p, assim:
para quando p = 1, temos que
m
⋅
1
+
r
=
n
⋅
1
⇒
r
=
r
⋅
1
⇒
∃
q
∈
N
;
r
=
q
⋅
1
{\displaystyle m\cdot 1+r=n\cdot 1\Rightarrow r=r\cdot 1\Rightarrow \exists q\in \mathbb {N} ;r=q\cdot 1}
Suponha que seja válido para p = k, isto é, que
m
⋅
k
+
r
′
=
n
⋅
k
⇒
∃
q
∈
N
;
r
′
=
q
⋅
k
{\displaystyle m\cdot k+r'=n\cdot k\Rightarrow \exists \;q\in \mathbb {N} ;r'=q\cdot k}
.
Mostrar válido para p = k+1, ou seja, que
m
⋅
(
k
+
1
)
+
r
″
=
n
⋅
(
k
+
1
)
⇒
∃
q
∈
N
;
r
″
=
q
⋅
(
k
+
1
)
{\displaystyle m\cdot (k+1)+r''=n\cdot (k+1)\Rightarrow \exists \;q\in \mathbb {N} ;r''=q\cdot (k+1)}
.
Pela propriedade distributiva
n
⋅
(
k
+
1
)
=
n
⋅
k
+
n
{\displaystyle n\cdot (k+1)=n\cdot k+n}
.
Por hipóteses
n
⋅
k
+
n
=
m
⋅
k
+
r
′
+
n
=
m
⋅
k
+
q
⋅
k
+
m
+
r
=
m
⋅
k
+
q
⋅
k
+
m
+
q
⋅
1
{\displaystyle n\cdot k+n=m\cdot k+r'+n=m\cdot k+q\cdot k+m+r=m\cdot k+q\cdot k+m+q\cdot 1}
.
Pela comutatividade da adição
m
⋅
k
+
m
+
q
⋅
k
+
q
{\displaystyle m\cdot k+m+q\cdot k+q}
.
Pela propriedade distributiva
m
⋅
(
k
+
1
)
+
q
⋅
(
k
+
1
)
{\displaystyle m\cdot (k+1)+q\cdot (k+1)}
Tomemos
r
″
=
q
⋅
(
k
+
1
)
{\displaystyle r''=q\cdot (k+1)}
, assim
m
⋅
(
k
+
1
)
+
r
″
=
n
⋅
(
k
+
1
)
;
r
″
=
q
⋅
(
k
+
1
)
{\displaystyle m\cdot (k+1)+r''=n\cdot (k+1);r''=q\cdot (k+1)}
.
Dados m,n,p naturais, de forma que
m
+
p
<
n
+
p
{\displaystyle m+p<n+p}
ou que
m
⋅
p
<
n
⋅
p
{\displaystyle m\cdot p<n\cdot p}
, então ocorre em ambas que m < n.
adição. Como
m
+
p
<
n
+
p
{\displaystyle m+p<n+p}
. Pela definição de ordem, existe um q natural tal que
m
+
p
+
q
=
n
+
p
{\displaystyle m+p+q=n+p}
. Pela comutatividade da adição,
m
+
q
+
p
=
n
+
p
{\displaystyle m+q+p=n+p}
. Pela lei do corte da adição, m+q=n. Pela relação de ordem entre dois números, m<n.
multiplicação.
1ª Prova: Como
m
⋅
p
<
n
⋅
p
{\displaystyle m\cdot p<n\cdot p}
. Pela definição de ordem, existe um r natural tal que
m
⋅
p
+
r
=
n
⋅
p
{\displaystyle m\cdot p+r=n\cdot p}
.
Pela relatividade entre dois múltiplos naturais, temos que
r
=
q
⋅
p
⇒
m
⋅
p
+
q
⋅
p
=
n
⋅
p
{\displaystyle r=q\cdot p\Rightarrow m\cdot p+q\cdot p=n\cdot p}
. Pela propriedade distributiva,
(
m
+
q
)
⋅
p
=
n
⋅
p
{\displaystyle (m+q)\cdot p=n\cdot p}
. Pela lei do corte da multiplicação,
m
+
q
=
n
{\displaystyle m+q=n}
. Pela relação de ordem entre dois números,
m
<
n
{\displaystyle m<n}
.
2ª prova: ou Pela tricotomia, temos que dados m,n naturais temos que m=n ou m<n ou n<m.
caso m=n, logo mp=np (não atende nossa hipótese)
caso n<m, logo pela monotonicidade temos que np<mp, para qualquer p natural (também não atende a nossa hipótese)
logo m<n, pois as outras duas possibilidades são incompatíveis com a nossa hipótese e pela tricotomia uma das três comparações é verdade.
O conjunto
N
=
{
1
,
2
,
3
,
.
.
.
}
{\displaystyle \mathbb {N} =\{1,2,3,...\}}
é usado para contagens. De tão natural,
N
{\displaystyle \mathbb {N} }
é chamado de conjunto dos números naturais, o primeiro conjunto numérico que aparece na história de qualquer civilização ou em qualquer tratado sobre os fundamentos da Matemática. Admitiremos conhecidos os conjunto
N
e
Z
=
{
.
.
.
,
−
2
,
−
1
,
0
,
1
,
2
,
.
.
.
}
{\displaystyle \mathbb {N} \;e\;\mathbb {Z} =\{...,-2,-1,0,1,2,...\}}
(dos números inteiros) bem como suas propriedades algébricas de soma e multiplicação e sua relação de ordem .
No conjunto
N
{\displaystyle \mathbb {N} }
valem dois princípios fundamentais: o “Princípio da Boa Ordem” e o “Princípio da Indução”. Vamos provar mais adiante que são equivalentes.
A função sucessão é dada por
S
(
n
)
=
n
+
1
;
∀
n
∈
N
{\displaystyle S(n)=n+1;\forall n\in \mathbb {N} }
(Identidade) A função de sucessão
s
:
N
↦
N
{\displaystyle s:\mathbb {N} \mapsto \mathbb {N} }
é injetiva
Prova: Dados
m
,
n
∈
N
,
s
(
m
)
=
s
(
n
)
⇒
m
+
1
=
n
+
1
⇒
m
=
n
{\displaystyle m,n\in \mathbb {N} ,s(m)=s(n)\Rightarrow m+1=n+1\Rightarrow m=n}
.
(Menor Elemento) Existe um elemento que não é sucessor de nenhum outro: 1
Prova: Suponha ser 1 o sucessor de um número natural t, assim
s
(
t
)
=
1
⇒
t
+
1
=
1
⇒
t
=
0
∉
N
⇒
∄
m
∈
N
{\displaystyle s(t)=1\Rightarrow t+1=1\Rightarrow t=0\not \in \mathbb {N} \Rightarrow \not \exists \;m\in \mathbb {N} }
tal que
s
(
m
)
=
1
{\displaystyle s(m)=1}
.
(unicidade)
∀
n
∈
N
⇒
s
(
n
)
∈
N
{\displaystyle \forall n\in \mathbb {N} \Rightarrow s(n)\in \mathbb {N} }
Seja
m
,
n
,
p
∈
N
;
s
(
n
)
=
p
;
s
(
m
)
=
p
{\displaystyle m,n,p\in \mathbb {N} ;s(n)=p;s(m)=p}
, para cada equação temos que n=p e m=p; por transitividade n=m. Logo o sucessor de um número natural é único.
(Princípio da Indução ) Seja
A
⊂
N
{\displaystyle A\subset \mathbb {N} }
um conjunto com as seguintes propriedades: Se
{
1
∈
A
e
n
∈
A
⇒
n
+
1
∈
A
}
{\displaystyle \{1\in A\;e\;n\in A\Rightarrow n+1\in A\}}
. Então
A
=
N
{\displaystyle A=\mathbb {N} }
O Princípio da Indução (e suas variantes) é usado para demonstrar que certas propriedades são verdadeiras para todo número natural. A estratégia é a seguinte. Definimos o conjunto A constituído pelos números naturais que possuem uma certa propriedade P. A seguir, mostra-se que A satisfaz as propriedades do princípio de indução. Daí, concluímos que
A
=
N
{\displaystyle A=\mathbb {N} }
e, portanto, que P é verificada por todo número natural. Este tipo de argumento é chamado de demonstração por indução. É conhecido por indução finita pois existe a indução transfinita.
Vamos demonstrar, por indução, a conhecida fórmula
1
+
.
.
.
+
n
=
n
⋅
(
n
+
1
)
2
{\displaystyle 1+...+n={n\cdot (n+1) \over 2}}
.
Mostraremos ser válida para n = 1 assim,
1
=
1
⋅
(
1
+
1
)
2
{\displaystyle 1={1\cdot (1+1) \over 2}}
.
Suponhamos válido para n = k, ou seja, é verdadeiro que
1
+
.
.
.
+
k
=
k
⋅
(
k
+
1
)
2
{\displaystyle 1+...+k={k\cdot (k+1) \over 2}}
.
Pela recíproca da lei do corte
1
+
.
.
.
+
k
+
k
+
1
=
k
⋅
(
k
+
1
)
2
+
k
+
1
=
k
⋅
(
k
+
1
)
2
+
2
(
k
+
1
)
2
=
(
k
+
1
)
(
k
+
2
)
2
{\displaystyle 1+...+k+k+1={k\cdot (k+1) \over 2}+k+1={k\cdot (k+1) \over 2}+{2(k+1) \over 2}={(k+1)(k+2) \over 2}}
.
Teorema:
∀
n
∈
N
,
1
+
3
+
5
+
.
.
.
+
(
2
n
−
1
)
=
n
2
{\displaystyle \forall \;n\in \mathbb {N} ,1+3+5+...+(2n-1)=n^{2}}
Prova
Vamos provar por indução sobre n:
Para quando n = 1, temos que
2
n
−
1
v
a
l
e
2
⋅
1
−
1
=
2
−
1
=
1
{\displaystyle 2n-1\;vale\;2\cdot 1-1=2-1=1}
, então nossa soma é
1
=
1
=
1
2
{\displaystyle 1=1=1^{2}}
.
Para quando n = 2, temos que
2
n
−
1
v
a
l
e
2
⋅
2
−
1
=
4
−
1
=
3
{\displaystyle 2n-1\;vale\;2\cdot 2-1=4-1=3}
, então nossa soma é
1
+
3
=
4
=
2
2
{\displaystyle 1+3=4=2^{2}}
.
Suponha ser válido para quando n=k, ou seja,
2
n
−
1
v
a
l
e
2
⋅
k
−
1
{\displaystyle 2n-1\;vale\;2\cdot k-1}
, então nossa soma é
1
+
3
+
.
.
.
+
2
k
−
1
=
k
2
{\displaystyle 1+3+...+2k-1=k^{2}}
.
Vamos provar ser válido para quando n=k+1, ou seja,
2
n
−
1
v
a
l
e
2
⋅
(
k
+
1
)
−
1
{\displaystyle 2n-1\;vale\;2\cdot (k+1)-1}
, então nossa soma é
1
+
3
+
.
.
.
+
2
(
k
+
1
)
−
1
=
(
k
+
1
)
2
{\displaystyle 1+3+...+2(k+1)-1=(k+1)^{2}}
.
1
+
3
+
.
.
.
+
2
(
k
+
1
)
−
1
=
1
1
+
3
+
.
.
.
+
2
k
+
2
−
1
=
2
1
+
3
+
.
.
.
+
2
k
−
1
+
2
k
+
1
=
3
k
2
+
2
k
+
1
=
4
k
2
+
k
+
k
+
1
=
5
{\displaystyle 1+3+...+2(k+1)-1=_{1}1+3+...+2k+2-1=_{2}1+3+...+2k-1+2k+1=_{3}k^{2}+2k+1=_{4}k^{2}+k+k+1=_{5}}
=
5
k
(
k
+
1
)
+
1
(
k
+
1
)
=
6
(
k
+
1
)
2
{\displaystyle =_{5}k(k+1)+1(k+1)=_{6}(k+1)^{2}}
onde as igualdades 1, 5 e 6 são pela propriedade distributiva, a propriedade 2 pela definição de termos ocultos numa soma, a igualdade 3 pela hipótese de indução e a igualdade 4 pela definição de multiplicação.
Portanto pelo princípio da indução é válido para todo n natural.
Teorema:
∀
n
∈
N
,
1
+
2
2
+
3
2
+
.
.
.
+
n
2
=
n
(
n
+
1
)
(
2
n
+
1
)
6
{\displaystyle \forall \;n\in \mathbb {N} ,1+2^{2}+3^{2}+...+n^{2}={n(n+1)(2n+1) \over 6}}
Prova
Vamos provar por indução sobre n:
Para quando n = 1, temos que
1
2
=
1
⋅
(
1
+
1
)
⋅
(
2
⋅
1
+
1
)
6
=
1
⋅
2
⋅
3
6
{\displaystyle 1^{2}={1\cdot (1+1)\cdot (2\cdot 1+1) \over 6}={1\cdot 2\cdot 3 \over 6}}
(verdade).
Para quando n = 2, temos que
1
2
+
2
2
=
2
⋅
(
2
+
1
)
⋅
(
2
⋅
2
+
1
)
6
⇒
1
+
4
=
2
⋅
3
⋅
5
6
{\displaystyle 1^{2}+2^{2}={2\cdot (2+1)\cdot (2\cdot 2+1) \over 6}\Rightarrow 1+4={2\cdot 3\cdot 5 \over 6}}
(verdade).
Suponha ser válido para quando n=k, ou seja,
1
+
2
2
+
3
2
+
.
.
.
+
k
2
=
k
(
k
+
1
)
(
2
k
+
1
)
6
{\displaystyle 1+2^{2}+3^{2}+...+k^{2}={k(k+1)(2k+1) \over 6}}
.
Vamos provar ser válido para quando n=k+1, ou seja,
1
+
2
2
+
3
2
+
.
.
.
+
(
k
+
1
)
2
=
(
k
+
1
)
[
(
k
+
1
)
+
1
]
[
2
(
k
+
1
)
+
1
]
6
{\displaystyle 1+2^{2}+3^{2}+...+(k+1)^{2}={(k+1)[(k+1)+1][2(k+1)+1] \over 6}}
.
1
+
2
2
+
3
2
+
.
.
.
+
(
k
+
1
)
2
=
1
1
+
2
2
+
3
2
+
.
.
.
+
k
2
+
(
k
+
1
)
2
=
2
k
(
k
+
1
)
(
2
k
+
1
)
6
+
(
k
+
1
)
2
=
3
k
(
k
+
1
)
(
2
k
+
1
)
+
6
(
k
+
1
)
2
6
=
4
{\displaystyle 1+2^{2}+3^{2}+...+(k+1)^{2}=_{1}1+2^{2}+3^{2}+...+k^{2}+(k+1)^{2}=_{2}{k(k+1)(2k+1) \over 6}+(k+1)^{2}=_{3}{k(k+1)(2k+1)+6(k+1)^{2} \over 6}=_{4}}
=
4
(
k
+
1
)
[
k
(
2
k
+
1
)
+
6
(
k
+
1
)
]
6
=
5
(
k
+
1
)
[
2
k
2
+
k
+
6
k
+
6
)
]
6
=
6
(
k
+
1
)
(
2
k
2
+
4
k
+
3
k
+
6
)
6
=
7
{\displaystyle =_{4}{(k+1)[k(2k+1)+6(k+1)] \over 6}=_{5}{(k+1)[2k^{2}+k+6k+6)] \over 6}=_{6}{(k+1)(2k^{2}+4k+3k+6) \over 6}=_{7}}
=
7
(
k
+
1
)
[
2
k
(
k
+
2
)
+
3
(
k
+
2
)
6
=
8
(
k
+
1
)
(
k
+
2
)
(
2
k
+
3
)
6
=
9
(
k
+
1
)
[
(
k
+
1
)
+
1
]
[
2
(
k
+
1
)
+
1
]
6
{\displaystyle =_{7}{(k+1)[2k(k+2)+3(k+2) \over 6}=_{8}{(k+1)(k+2)(2k+3) \over 6}=_{9}{(k+1)[(k+1)+1][2(k+1)+1] \over 6}}
onde a igualdade 1 por definição de termo ocultos numa soma finita, a igualdade 2 é devido a hipótese de indução, a igualdade 3 por soma de frações, a igualdade 4 por evidência de um termo, as igualdades 5, 7 e 8 por distributiva, as igualdades 6 e 9 por associatividade da adição.
Portanto pelo princípio da indução é válido para todo n natural.
Mostrar que, para todo
n
∈
N
,
1
3
+
2
3
+
3
3
+
.
.
.
+
n
3
=
n
2
⋅
(
n
+
1
)
2
4
{\displaystyle n\in \mathbb {N} ,1^{3}+2^{3}+3^{3}+...+n^{3}={n^{2}\cdot (n+1)^{2} \over 4}}
por indução sobre n.
Prova:
Mostrar que é válido para n = 1,
1
3
=
1
2
⋅
(
1
+
1
)
2
4
⇒
1
=
4
4
{\displaystyle 1^{3}={1^{2}\cdot (1+1)^{2} \over 4}\Rightarrow 1={4 \over 4}}
(verdade).
Supor válido para n = k, ou seja,
1
3
+
2
3
+
3
3
+
.
.
.
+
k
3
=
k
2
⋅
(
k
+
1
)
2
4
{\displaystyle 1^{3}+2^{3}+3^{3}+...+k^{3}={k^{2}\cdot (k+1)^{2} \over 4}}
.
Mostrar válido para n = k+1, ou seja,
1
3
+
2
3
+
3
3
+
.
.
.
+
(
k
+
1
)
3
=
(
k
+
1
)
2
⋅
(
k
+
2
)
2
4
{\displaystyle 1^{3}+2^{3}+3^{3}+...+(k+1)^{3}={(k+1)^{2}\cdot (k+2)^{2} \over 4}}
.
1
3
+
2
3
+
3
3
+
.
.
.
+
k
3
+
(
k
+
1
)
3
=
1
k
2
⋅
(
k
+
1
)
2
4
+
(
k
+
1
)
3
=
2
k
2
⋅
(
k
+
1
)
2
+
4
⋅
(
k
+
1
)
⋅
(
k
+
1
)
2
4
=
3
[
k
2
+
4
(
k
+
1
)
]
(
k
+
1
)
2
4
=
4
{\displaystyle 1^{3}+2^{3}+3^{3}+...+k^{3}+(k+1)^{3}=_{1}{k^{2}\cdot (k+1)^{2} \over 4}+(k+1)^{3}=_{2}{k^{2}\cdot (k+1)^{2}+4\cdot (k+1)\cdot (k+1)^{2} \over 4}=_{3}{[k^{2}+4(k+1)](k+1)^{2} \over 4}=_{4}}
=
4
(
k
2
+
2
k
+
2
k
+
4
)
(
k
+
1
)
2
4
=
5
[
k
(
k
+
2
)
+
2
(
k
+
2
)
]
(
k
+
1
)
2
4
=
6
(
k
+
2
)
(
k
+
2
)
(
k
+
1
)
2
4
=
7
(
k
+
1
)
2
⋅
(
k
+
2
)
2
4
{\displaystyle =_{4}{(k^{2}+2k+2k+4)(k+1)^{2} \over 4}=_{5}{[k(k+2)+2(k+2)](k+1)^{2} \over 4}=_{6}{(k+2)(k+2)(k+1)^{2} \over 4}=_{7}{(k+1)^{2}\cdot (k+2)^{2} \over 4}}
onde a igualdade 1 é pela hipótese de indução, a igualdade 2 é pela propriedade de potência e soma de frações, as igualdades 3, 4, 5 e 6 são pela propriedade distributiva, a igualdade 7 é pela comutativa e potência.
Mostre que
1
⋅
2
+
2
⋅
3
+
.
.
.
+
n
⋅
(
n
+
1
)
=
n
⋅
(
n
+
1
)
⋅
(
n
+
2
)
3
{\displaystyle 1\cdot 2+2\cdot 3+...+n\cdot (n+1)={n\cdot (n+1)\cdot (n+2) \over 3}}
Prova por indução sobre n:
Mostrar que é válido para n = 1:
1
⋅
2
=
1
⋅
(
1
+
1
)
⋅
(
1
+
2
)
3
⇒
2
=
1
⋅
2
⋅
3
3
⇒
2
=
2
{\displaystyle 1\cdot 2={1\cdot (1+1)\cdot (1+2) \over 3}\Rightarrow 2={1\cdot 2\cdot 3 \over 3}\Rightarrow 2=2}
.
Supor válido para n = k:
1
⋅
2
+
2
⋅
3
+
.
.
.
+
k
⋅
(
k
+
1
)
=
k
⋅
(
k
+
1
)
⋅
(
k
+
2
)
3
{\displaystyle 1\cdot 2+2\cdot 3+...+k\cdot (k+1)={k\cdot (k+1)\cdot (k+2) \over 3}}
Mostrar válido para n = k+1, ou seja, Mostrar que
1
⋅
2
+
2
⋅
3
+
.
.
.
+
(
k
+
1
)
⋅
(
k
+
2
)
=
(
k
+
1
)
⋅
(
k
+
2
)
⋅
(
k
+
3
)
3
{\displaystyle 1\cdot 2+2\cdot 3+...+(k+1)\cdot (k+2)={(k+1)\cdot (k+2)\cdot (k+3) \over 3}}
.
Temos que
1
⋅
2
+
2
⋅
3
+
.
.
.
+
k
⋅
(
k
+
1
)
+
(
k
+
1
)
⋅
(
k
+
2
)
=
1
k
⋅
(
k
+
1
)
⋅
(
k
+
2
)
3
+
(
k
+
1
)
⋅
(
k
+
2
)
1
=
2
k
⋅
(
k
+
1
)
⋅
(
k
+
2
)
+
3
⋅
(
k
+
1
)
⋅
(
k
+
2
)
3
=
3
{\displaystyle 1\cdot 2+2\cdot 3+...+k\cdot (k+1)+(k+1)\cdot (k+2)=_{1}{k\cdot (k+1)\cdot (k+2) \over 3}+{(k+1)\cdot (k+2) \over 1}=_{2}{k\cdot (k+1)\cdot (k+2)+3\cdot (k+1)\cdot (k+2) \over 3}=_{3}}
.
=
3
(
k
+
1
)
⋅
(
k
+
2
)
⋅
(
k
+
3
)
3
{\displaystyle =_{3}{(k+1)\cdot (k+2)\cdot (k+3) \over 3}}
.
a igualdade 1 é devida à hipótese de indução, a igualdade 2 pela soma de frações e a igualdade 3 é pela propriedade distributiva.
Mostre que
1
1
⋅
2
+
1
2
⋅
3
+
.
.
.
+
1
n
⋅
(
n
+
1
)
=
n
n
+
1
{\displaystyle {1 \over 1\cdot 2}+{1 \over 2\cdot 3}+...+{1 \over n\cdot (n+1)}={n \over n+1}}
Prova por indução sobre n:
Mostrar que é válido para n = 1:
1
1
⋅
2
=
1
1
+
1
⇒
1
2
=
1
2
{\displaystyle {1 \over 1\cdot 2}={1 \over 1+1}\Rightarrow {1 \over 2}={1 \over 2}}
.
Supor válido para n = k:
1
1
⋅
2
+
1
2
⋅
3
+
.
.
.
+
1
k
⋅
(
k
+
1
)
=
k
k
+
1
{\displaystyle {1 \over 1\cdot 2}+{1 \over 2\cdot 3}+...+{1 \over k\cdot (k+1)}={k \over k+1}}
Mostrar válido para n = k+1, ou seja, Mostrar que
1
1
⋅
2
+
1
2
⋅
3
+
.
.
.
+
1
(
k
+
1
)
⋅
(
k
+
2
)
=
k
+
1
k
+
2
{\displaystyle {1 \over 1\cdot 2}+{1 \over 2\cdot 3}+...+{1 \over (k+1)\cdot (k+2)}={k+1 \over k+2}}
.
Temos que
1
1
⋅
2
+
1
2
⋅
3
+
.
.
.
+
1
k
⋅
(
k
+
1
)
+
1
(
k
+
1
)
⋅
(
k
+
2
)
=
1
k
k
+
1
+
1
(
k
+
1
)
⋅
(
k
+
2
)
=
2
k
⋅
(
k
+
2
)
+
1
(
k
+
1
)
⋅
(
k
+
2
)
=
3
{\displaystyle {1 \over 1\cdot 2}+{1 \over 2\cdot 3}+...+{1 \over k\cdot (k+1)}+{1 \over (k+1)\cdot (k+2)}=_{1}{k \over k+1}+{1 \over (k+1)\cdot (k+2)}=_{2}{k\cdot (k+2)+1 \over (k+1)\cdot (k+2)}=_{3}}
.
=
3
k
⋅
(
k
+
1
)
+
k
+
1
(
k
+
1
)
⋅
(
k
+
2
)
=
4
(
k
+
1
)
⋅
(
k
+
1
)
(
k
+
1
)
⋅
(
k
+
2
)
=
5
k
+
1
k
+
2
{\displaystyle =_{3}{k\cdot (k+1)+k+1 \over (k+1)\cdot (k+2)}=_{4}{(k+1)\cdot (k+1) \over (k+1)\cdot (k+2)}=_{5}{k+1 \over k+2}}
a igualdade 1 é devida à hipótese de indução, a igualdade 2 pela soma de frações, a igualdade 3 é pela propriedade redistributiva, a igualdade 4 é pela propriedade distributiva e a igualdade 5 pela lei do cancelamento.
Teorema: Torre de Hanói (Para mover n discos para outra posição são necessário no mínimo
q
(
d
)
=
2
d
−
1
{\displaystyle q(d)=2^{d}-1}
movimentos.
Prova (por indução):
Mostrar válido para n = 1:
q
(
1
)
=
2
1
−
1
=
2
−
1
=
1
{\displaystyle q(1)=2^{1}-1=2-1=1}
Supor válido para n = k:
q
(
k
)
=
2
k
−
1
{\displaystyle q(k)=2^{k}-1}
Mostrar válido para n = k+1 ou seja, mostrar que
q
(
k
+
1
)
=
2
k
+
1
−
1
{\displaystyle q(k+1)=2^{k+1}-1}
.
Para isso devemos ter uma equação que relaciona a quantidade de movimentos com um disco a menos:
Para passarmos os discos de uma haste para outra, ocorre uma sequência bem simples:
Se temos n discos, devemos passar n-1 discos para outro haste;
depois passamos o disco maior para uma terceira haste;
depois passamos os n-1 discos para a terceira haste.
Por recorrência,
q
(
d
)
=
q
(
d
−
1
)
+
1
+
q
(
d
−
1
)
⇒
q
(
d
)
=
2
q
(
d
−
1
)
+
1
⇒
q
(
d
+
1
)
=
2
q
(
d
)
+
1
{\displaystyle q(d)=q(d-1)+1+q(d-1)\Rightarrow q(d)=2q(d-1)+1\Rightarrow q(d+1)=2q(d)+1}
Assim,
q
(
k
+
1
)
=
1
2
q
(
k
)
+
1
=
2
2
⋅
(
2
k
−
1
)
+
1
=
3
2
1
+
k
−
2
+
1
⇒
q
(
k
+
1
)
=
2
k
+
1
−
1
{\displaystyle q(k+1)=_{1}2q(k)+1=_{2}2\cdot (2^{k}-1)+1=_{3}2^{1+k}-2+1\Rightarrow q(k+1)=2^{k+1}-1}
onde a igualdade 1 é por recorrência, a igualdade 2 é pela hipótese de indução, a igualdade 3 é pela propriedade
Em todo corpo ordenado K, se
n
∈
N
{\displaystyle n\in \mathbb {N} }
e
x
≥
−
1
{\displaystyle x\geq -1}
, vale
(
1
+
x
)
n
≥
1
+
n
x
{\displaystyle (1+x)^{n}\geq 1+nx}
Mostrar válido para n=1
(
1
+
x
)
1
=
1
+
x
e
1
+
1
⋅
x
=
1
+
x
⇒
(
1
+
x
)
1
≥
1
+
1
⋅
x
{\displaystyle (1+x)^{1}=1+x\;e\;1+1\cdot x=1+x\Rightarrow (1+x)^{1}\geq 1+1\cdot x}
Supor válido para n=k
(
1
+
x
)
k
≥
1
+
k
x
{\displaystyle (1+x)^{k}\geq 1+kx}
Mostrar válido para n= k+1
De
(
1
+
x
)
k
≥
1
+
k
x
{\displaystyle (1+x)^{k}\geq 1+kx}
multiplicamos
(
1
+
x
)
{\displaystyle (1+x)}
por ambos os membros pois
x
≥
−
1
⇒
1
+
x
≥
0
{\displaystyle x\geq -1\Rightarrow 1+x\geq 0}
.
Logo
(
1
+
x
)
k
(
1
+
x
)
≥
(
1
+
k
x
)
(
1
+
x
)
⇒
(
1
+
x
)
k
+
1
≥
1
+
x
+
k
x
+
k
x
2
≥
1
+
x
+
k
x
=
1
+
(
k
+
1
)
x
{\displaystyle (1+x)^{k}(1+x)\geq (1+kx)(1+x)\Rightarrow (1+x)^{k+1}\geq 1+x+kx+kx^{2}\geq 1+x+kx=1+(k+1)x}
(porque k x2 é não-negativo).
E finalmente
(
1
+
x
)
k
+
1
≥
1
+
(
k
+
1
)
x
{\displaystyle (1+x)^{k+1}\geq 1+(k+1)x}
(
1
+
x
)
n
=
∑
i
=
0
n
(
n
i
)
(
1
)
n
−
i
x
i
=
1
+
n
(
n
−
1
)
2
x
+
.
.
.
≥
1
+
n
x
{\displaystyle (1+x)^{n}=\sum _{i=0}^{n}{n \choose i}(1)^{n-i}x^{i}=1+{\frac {n(n-1)}{2}}x+...\geq 1+nx}
.
Devemos mostrar que
n
(
n
−
1
)
2
≥
n
{\displaystyle {\frac {n(n-1)}{2}}\geq n}
Como
n
∈
N
,
l
o
g
o
n
2
−
n
≥
2
n
⇒
n
2
−
3
n
≥
0
⇒
n
(
n
−
3
)
≥
0
⇒
n
≥
3
{\displaystyle n\in \mathbb {N} ,logo\;n^{2}-n\geq 2n\Rightarrow n^{2}-3n\geq 0\Rightarrow n(n-3)\geq 0\Rightarrow n\geq 3}
é verdade.
Assim
(
1
+
x
)
n
≥
1
+
n
x
{\displaystyle (1+x)^{n}\geq 1+nx}
é verdade para
n
≥
3
{\displaystyle n\geq 3}
como é válido para n = 1, basta mostrar que é válido para n = 2 que será válido para todo n natural
(
1
+
x
)
2
≥
1
+
2
x
⇒
1
+
2
x
+
x
2
≥
1
+
2
x
{\displaystyle (1+x)^{2}\geq 1+2x\Rightarrow 1+2x+x^{2}\geq 1+2x}
verdade
portanto é válido para todo n natural
Mostrar que
1
2
⋅
3
4
⋅
5
6
⋅
.
.
.
⋅
2
n
−
1
2
n
≤
1
2
n
+
1
,
∀
n
∈
N
.
{\displaystyle {1 \over 2}\cdot {3 \over 4}\cdot {5 \over 6}\cdot ...\cdot {2n-1 \over 2n}\leq {1 \over {\sqrt {2n+1}}},\;\forall \;n\;\in \mathbb {N} .}
.
Prova:
Mostrar que a desigualdade é válida para quando n = 1:
1
2
≤
1
2
+
1
⇒
3
<
4
=
2
{\displaystyle {1 \over 2}\leq {1 \over {\sqrt {2+1}}}\Rightarrow {\sqrt {3}}<{\sqrt {4}}=2}
Suponha ser válido para quando n = k:
1
2
⋅
3
4
⋅
5
6
⋅
.
.
.
⋅
2
k
−
1
2
k
≤
1
2
k
+
1
{\displaystyle {1 \over 2}\cdot {3 \over 4}\cdot {5 \over 6}\cdot ...\cdot {2k-1 \over 2k}\leq {1 \over {\sqrt {2k+1}}}}
Mostrar ser válido para quando n=k+1, isto é,
1
2
⋅
3
4
⋅
5
6
⋅
.
.
.
⋅
2
(
k
+
1
)
−
1
2
(
k
+
1
)
≤
1
2
(
k
+
1
)
+
1
{\displaystyle {1 \over 2}\cdot {3 \over 4}\cdot {5 \over 6}\cdot ...\cdot {2(k+1)-1 \over 2(k+1)}\leq {1 \over {\sqrt {2(k+1)+1}}}}
Pela hipótese temos que
1
2
⋅
3
4
⋅
5
6
⋅
.
.
.
⋅
2
k
−
1
2
k
≤
1
2
k
+
1
{\displaystyle {1 \over 2}\cdot {3 \over 4}\cdot {5 \over 6}\cdot ...\cdot {2k-1 \over 2k}\leq {1 \over {\sqrt {2k+1}}}}
, onde
2
k
+
1
2
k
+
2
≥
0
{\displaystyle {2k+1 \over 2k+2}\geq 0}
, pois k é um número natural.
1
2
⋅
3
4
⋅
5
6
⋅
.
.
.
⋅
2
k
−
1
2
k
⋅
2
k
+
1
2
k
+
2
≤
1
2
k
+
1
⋅
2
k
+
1
2
k
+
2
{\displaystyle {1 \over 2}\cdot {3 \over 4}\cdot {5 \over 6}\cdot ...\cdot {2k-1 \over 2k}\cdot {2k+1 \over 2k+2}\leq {1 \over {\sqrt {2k+1}}}\cdot {2k+1 \over 2k+2}}
.
Vamos verificar que
1
2
k
+
1
⋅
2
k
+
1
2
k
+
2
≤
1
2
(
k
+
1
)
+
1
⇒
2
k
+
3
⋅
2
k
+
1
≤
2
k
+
2
⇒
(
2
k
+
3
)
⋅
(
2
k
+
1
)
≤
(
2
k
+
2
)
2
{\displaystyle {1 \over {\sqrt {2k+1}}}\cdot {2k+1 \over 2k+2}\leq {1 \over {\sqrt {2(k+1)+1}}}\Rightarrow {\sqrt {2k+3}}\cdot {\sqrt {2k+1}}\leq 2k+2\Rightarrow (2k+3)\cdot (2k+1)\leq (2k+2)^{2}}
⇒
4
k
2
+
8
k
+
3
≤
4
k
2
+
8
k
+
4
⇒
3
≤
4
{\displaystyle \Rightarrow 4k^{2}+8k+3\leq 4k^{2}+8k+4\Rightarrow 3\leq 4}
Use o teorema da indução com 1 deslocado para provar que
n
2
<
2
n
,
∀
n
≥
5
{\displaystyle n^{2}<2^{n},\forall \;n\geq 5}
Prova: Tome
A
=
{
n
∈
N
,
t
a
l
q
u
e
n
2
<
2
n
}
.
{\displaystyle A=\{n\in \mathbb {N} ,tal\;que\;n^{2}<2^{n}\}.}
Vamos fazer por indução sobre n, que será válido para
n
≤
5
{\displaystyle n\leq 5}
Temos que mostrar que vale para quando
n
=
5
:
5
2
=
25
<
32
=
2
5
{\displaystyle n=5:5^{2}=25<32=2^{5}}
.
Suponha que seja válido para quando
n
=
k
:
n
2
<
2
k
{\displaystyle n=k:n^{2}<2^{k}}
Vamos mostrar que é válido para quando
n
=
k
+
1
:
(
k
+
1
)
2
<
2
k
+
1
{\displaystyle n=k+1:(k+1)^{2}<2^{k+1}}
(
k
+
1
)
2
=
1
k
2
+
2
k
+
1
<
2
2
k
+
2
k
+
1
<
3
2
k
+
2
k
=
4
2
k
⋅
2
1
=
5
2
k
+
1
{\displaystyle (k+1)^{2}=_{1}k^{2}+2k+1<_{2}2^{k}+2k+1<_{3}2^{k}+2^{k}=_{4}2^{k}\cdot 2^{1}=_{5}2^{k+1}}
a igualdade 1 é pelo quadrado da soma, a desigualdade 2 é pela hipótese de indução, a desigualdade 3 é pelo teorema anterior, a igualdade 4 é pela distributiva e a igualdade 5 é pela propriedade de potencia.
Prove que
(
n
+
1
n
)
n
<
n
,
∀
n
≥
3
e
m
o
s
t
r
e
q
u
e
{
1
,
2
,
3
3
,
4
4
,
.
.
.
}
{\displaystyle \left({\frac {n+1}{n}}\right)^{n}<n,\forall \;n\geq 3\;e\;mostre\;que\;{\bigg \{}1,{\sqrt {2}},{\sqrt[{3}]{3}},{\sqrt[{4}]{4}},...{\bigg \}}}
é decrescente a partir do terceiro termo.
Vamos provar a desigualdade por indução sobre n, que é válido para
n
≥
3
{\displaystyle n\geq 3}
. Tome
A
=
{
n
∈
N
,
t
a
l
q
u
e
(
n
+
1
n
)
n
<
n
}
{\displaystyle A={\bigg \{}n\in \mathbb {N} ,tal\;que\;\left({\frac {n+1}{n}}\right)^{n}<n{\bigg \}}}
vamos mostrar que é válido para
n
=
3
:
(
3
+
1
3
)
3
=
64
27
≤
?
3
⇔
64
<
81
{\displaystyle n=3:\left({3+1 \over 3}\right)^{3}={64 \over 27}\leq _{?}3\Leftrightarrow 64<81}
.
suponhamos que é válido para
n
=
k
:
(
k
+
1
k
)
k
<
k
⇒
(
k
+
1
k
)
k
+
1
<
k
⋅
(
k
+
1
k
)
⇒
(
k
+
1
k
)
k
+
1
<
k
+
1
{\displaystyle n=k:\left({k+1 \over k}\right)^{k}<k\Rightarrow \left({k+1 \over k}\right)^{k+1}<k\cdot \left({k+1 \over k}\right)\Rightarrow \left({k+1 \over k}\right)^{k+1}<k+1}
.
Observação:
0
<
1
,
k
≥
3
⇒
k
2
+
2
k
<
k
2
+
2
k
+
1
⇒
(
k
+
2
)
⋅
k
<
(
k
+
1
)
(
k
+
1
)
⇒
k
k
+
1
<
k
+
1
k
+
2
⇒
(
k
k
+
1
)
k
+
1
<
(
k
+
1
k
+
2
)
k
+
1
{\displaystyle 0<1,k\geq 3\Rightarrow k^{2}+2k<k^{2}+2k+1\Rightarrow (k+2)\cdot k<(k+1)(k+1)\Rightarrow {k \over k+1}<{k+1 \over k+2}\Rightarrow {\bigg (}{k \over k+1}{\bigg )}^{k+1}<{\bigg (}{k+1 \over k+2}{\bigg )}^{k+1}}
.
Vamos mostrar que é válido para
n
=
k
+
1
:
(
k
+
1
+
1
k
+
1
)
k
+
1
<
k
+
1
{\displaystyle n=k+1:\left({k+1+1 \over k+1}\right)^{k+1}<k+1}
.
(
k
+
2
k
+
1
)
k
+
1
=
1
(
k
+
2
k
+
1
)
k
+
1
⋅
(
k
k
+
1
)
k
+
1
⋅
(
k
+
1
k
)
k
+
1
<
2
(
k
+
2
k
+
1
)
k
+
1
⋅
(
k
+
1
k
+
2
)
k
+
1
⋅
(
k
+
1
)
=
3
k
+
1.
{\displaystyle \left({k+2 \over k+1}\right)^{k+1}=_{1}\left({k+2 \over k+1}\right)^{k+1}\cdot \left({k \over k+1}\right)^{k+1}\cdot \left({k+1 \over k}\right)^{k+1}<_{2}\left({k+2 \over k+1}\right)^{k+1}\cdot \left({k+1 \over k+2}\right)^{k+1}\cdot (k+1)=_{3}k+1.}
a igualdade 1 é pelo inverso multiplicativo, a desigualdade 2 é pela observação acima e pela hipótese de indução e a igualdade 3 é pelo inverso multiplicativo.
m
o
s
t
r
e
q
u
e
{
1
,
2
,
3
3
,
4
4
,
.
.
.
}
{\displaystyle mostre\;que\;{\bigg \{}1,{\sqrt {2}},{\sqrt[{3}]{3}},{\sqrt[{4}]{4}},...{\bigg \}}}
é decrescente a partir do terceiro termo, ou seja,
n
+
1
n
+
1
<
n
n
,
n
≥
3
{\displaystyle {\sqrt[{n+1}]{n+1}}<{\sqrt[{n}]{n}},n\geq 3}
.
Prova:
Vamos provar por indução sobre n:
n
+
1
n
+
1
<
n
n
,
n
≥
3
{\displaystyle {\sqrt[{n+1}]{n+1}}<{\sqrt[{n}]{n}},n\geq 3}
.
Mostrar que é válido para n=3:
4
4
<
3
3
{\displaystyle {\sqrt[{4}]{4}}<{\sqrt[{3}]{3}}}
.
Supor válido para n=k:
k
+
1
k
+
1
<
k
k
,
n
≥
3
⇔
(
k
+
1
k
+
1
)
k
(
k
+
1
)
<
(
k
k
)
k
(
k
+
1
)
⇔
(
k
+
1
)
k
<
(
k
)
k
+
1
⇔
(
k
+
1
)
k
k
k
<
k
⇔
(
k
+
1
k
)
k
<
k
{\displaystyle {\sqrt[{k+1}]{k+1}}<{\sqrt[{k}]{k}},n\geq 3\Leftrightarrow {\bigg (}{\sqrt[{k+1}]{k+1}}{\bigg )}^{k(k+1)}<{\bigg (}{\sqrt[{k}]{k}}{\bigg )}^{k(k+1)}\Leftrightarrow (k+1)^{k}<(k)^{k+1}\Leftrightarrow {(k+1)^{k} \over k^{k}}<k\Leftrightarrow {\bigg (}{k+1 \over k}{\bigg )}^{k}<k}
.
Provar válido para n=k+1:
k
+
1
+
1
k
+
1
+
1
<
k
+
1
k
+
1
,
n
≥
3
{\displaystyle {\sqrt[{k+1+1}]{k+1+1}}<{\sqrt[{k+1}]{k+1}},n\geq 3}
.
Pelo axioma anterior é verdade que
(
k
+
2
k
+
1
)
k
+
1
<
k
+
1
⇔
(
k
+
2
)
k
+
1
<
(
k
+
1
)
k
+
2
⇔
(
k
+
2
)
k
+
1
(
k
+
2
)
(
k
+
1
)
<
(
k
+
1
)
k
+
2
(
k
+
1
)
(
k
+
2
)
⇔
{\displaystyle {\bigg (}{k+2 \over k+1}{\bigg )}^{k+1}<k+1\Leftrightarrow (k+2)^{k+1}<(k+1)^{k+2}\Leftrightarrow {\sqrt[{(k+2)(k+1)}]{(k+2)^{k+1}}}<{\sqrt[{(k+1)(k+2)}]{(k+1)^{k+2}}}\Leftrightarrow }
⇔
k
+
2
k
+
2
<
k
+
1
k
+
1
{\displaystyle \Leftrightarrow {\sqrt[{k+2}]{k+2}}<{\sqrt[{k+1}]{k+1}}}
Mostrar que, para todo
n
∈
N
,
4
n
+
6
n
−
1
{\displaystyle n\in \mathbb {N} ,4^{n}+6n-1}
é divisível por 9.
Prova:
Mostrar que é válido para n = 1,
4
1
+
6
⋅
1
−
1
=
4
+
6
−
1
=
9
{\displaystyle 4^{1}+6\cdot 1-1=4+6-1=9}
e 9 é divisível por 9.
Supor válido para n = k, ou seja,
4
k
+
6
⋅
k
−
1
=
9
t
{\displaystyle 4^{k}+6\cdot k-1=9t}
, para algum t natural. Também
4
k
=
9
t
−
6
⋅
k
+
1
{\displaystyle 4^{k}=9t-6\cdot k+1}
Mostrar válido para n = k+1, ou seja,
4
k
+
1
+
6
⋅
(
k
+
1
)
−
1
=
9
t
′
{\displaystyle 4^{k+1}+6\cdot (k+1)-1=9t'}
, para algum
t
′
{\displaystyle t'}
natural.
4
k
+
1
+
6
⋅
(
k
+
1
)
−
1
=
1
4
⋅
4
k
+
6
k
+
6
−
1
=
2
4
⋅
(
9
t
+
1
−
6
k
)
+
6
k
+
5
=
3
36
t
+
4
−
24
k
+
6
k
+
5
=
4
36
t
−
18
k
+
9
=
5
9
⋅
(
4
t
−
2
k
+
1
)
{\displaystyle 4^{k+1}+6\cdot (k+1)-1=_{1}4\cdot 4^{k}+6k+6-1=_{2}4\cdot (9t+1-6k)+6k+5=_{3}36t+4-24k+6k+5=_{4}36t-18k+9=_{5}9\cdot (4t-2k+1)}
onde a igualdade 1 é pela propriedade de potência, a igualdade 2 é pela hipótese de indução, as igualdades 3 e 5 pela propriedade distributiva e a igualdade 4 pela soma dos termos.
Todo subconjunto não-vazio
A
⊂
N
{\displaystyle A\subset \mathbb {N} }
possui um elemento mínimo, ou seja, se
A
⊂
N
,
A
≠
∅
,
l
o
g
o
∃
n
∈
A
,
t
a
l
q
u
e
n
<
m
,
∀
m
∈
A
−
{
n
}
{\displaystyle A\subset \mathbb {N} ,A\neq \varnothing ,\;logo\;\exists \;n\in A,\;tal\;que\;n<m,\forall \;m\in A-\{n\}}
.
Prova
Devemos mostrar o complementar de
A
{\displaystyle A}
em relação ao
N
{\displaystyle \mathbb {N} }
assim
B
⊂
N
−
A
{\displaystyle B\subset \mathbb {N} -A}
Tomemos um subconjunto
N
{\displaystyle \mathbb {N} }
:
B
{\displaystyle B}
formado pelos elementos que não estão em
A
{\displaystyle A\;}
, ou seja,
B
=
{
x
∈
N
/
x
∉
A
}
{\displaystyle B=\{x\in \mathbb {N} /x\not \in A\}}
.
a quem pertence o elemento
1
{\displaystyle 1}
Se
1
∈
A
{\displaystyle 1\in A}
o teorema está demonstrado, pois
1
{\displaystyle 1}
é o menor elemento do
N
{\displaystyle \mathbb {N} }
.
Se
1
∉
A
,
{\displaystyle 1\not \in A,}
logo
1
∈
B
{\displaystyle 1\in B}
O conjunto
I
n
{\displaystyle I_{n}\;}
Agora tomemos um subconjunto de
B
{\displaystyle B\;}
, chamado
I
n
=
{
1
,
2
,
.
.
.
n
}
{\displaystyle I_{n}=\{1,2,...n\}\;}
onde n é o maior natural tal que aconteça isso, assim
1
∉
A
,
2
∉
A
,
.
.
.
,
n
∉
A
{\displaystyle 1\not \in A,2\not \in A,...,n\not \in A}
mostrar que
n
+
1
∈
A
{\displaystyle n+1\in A}
Pela construção do conjunto
I
n
{\displaystyle I_{n}\;}
, temos que
n
∈
I
n
{\displaystyle n\in I_{n}}
. Se
n
+
1
∈
B
{\displaystyle n+1\in B}
, teríamos
n
+
1
∈
I
n
{\displaystyle n+1\in I_{n}}
e logo
I
n
+
1
{\displaystyle I_{n+1}}
. Como não faz sentido, logo
n
+
1
∉
B
{\displaystyle n+1\not \in B}
, portanto
n
+
1
∈
A
{\displaystyle n+1\in A}
Devemos mostrar que
n
+
1
{\displaystyle n+1\;}
é o menor elemento de
A
{\displaystyle A\;}
Como todos os antecessores de
n
+
1
{\displaystyle n+1\;}
são os elementos de
I
n
{\displaystyle I_{n}\;}
, temos que
n
+
1
{\displaystyle n+1\;}
é o menor elemento de
A
{\displaystyle A\;}
, pois os elementos menores que
n
+
1
{\displaystyle n+1\;}
estão em
B
{\displaystyle B\;}
Vale o Princípio da Boa Ordem se, e somente se, vale o Princípio da Indução.
Demonstração
Suponha válido o Princípio da Boa Ordem. Seja
A
⊂
N
{\displaystyle A\subset \mathbb {N} }
satisfazendo as propriedades do princípio da indução.
Suponhamos, por absurdo, que
A
≠
N
{\displaystyle A\neq \mathbb {N} }
. Isto significa que existe algum elemento de
N
{\displaystyle \mathbb {N} }
que não pertence a A e, portanto, o conjunto
B
=
∁
N
A
⊂
N
{\displaystyle B=\complement _{\mathbb {N} }A\subset \mathbb {N} }
é não vazio.
Pelo Princípio da Boa Ordem, B possui um elemento mínimo
m
∈
B
{\displaystyle m\in B}
. Com certeza m > 1, pois como
1
∈
A
⇒
1
∉
A
C
=
B
{\displaystyle 1\in A\Rightarrow 1\not \in A^{C}=B}
. Assim,
m
−
1
{\displaystyle m-1}
é um natural menor que m.
Pela minimalidade de m, temos que
m
−
1
∉
B
{\displaystyle m-1\not \in B}
e portanto
m
−
1
∈
A
{\displaystyle m-1\in A}
. Pelo 2ª propriedade do princípio da indução, concluímos que
m
=
(
m
−
1
)
+
1
∈
A
{\displaystyle m=(m-1)+1\in A}
, o que é um absurdo.
Suponha válido o Princípio da Indução. Seja
B
⊂
N
{\displaystyle B\subset \mathbb {N} }
não vazio.
Suponhamos por absurdo que B não possua elemento mínimo. Em particular,
1
∉
B
{\displaystyle 1\not \in B}
(senão 1 seria elemento mínimo de B). Seja
A
=
{
n
∈
N
/
n
<
m
,
∀
m
∈
B
}
{\displaystyle A=\{n\in N/n<m,\forall \;m\in B\}}
.
Observamos inicialmente que
A
∩
B
=
∅
{\displaystyle A\cap B=\varnothing }
. De fato, se
A
∩
B
≠
∅
{\displaystyle A\cap B\neq \varnothing }
, então existiria
n
∈
A
∩
B
{\displaystyle n\in A\cap B}
, ou seja, n < n.
Tendo
n
∈
A
{\displaystyle n\in A}
temos também n < m qualquer que seja
m
∈
B
{\displaystyle m\in B}
, em particular, tomando
m
=
n
∈
B
{\displaystyle m=n\in B}
obtemos n < n o que é absurdo. Concluímos que
A
∩
B
=
∅
{\displaystyle A\cap B=\varnothing }
.
Mostraremos a seguir que
A
=
N
{\displaystyle A=\mathbb {N} }
. Vejamos agora que isto é suficiente para concluir a demonstração. Neste caso temos
∅
=
A
∩
B
=
N
∩
B
=
B
{\displaystyle \varnothing =A\cap B=\mathbb {N} \cap B=B}
contradizendo a hipótese
B
≠
∅
{\displaystyle B\neq \varnothing }
.
Mostremos, por indução, que
A
=
N
{\displaystyle A=\mathbb {N} }
. Já sabemos que
1
∉
B
{\displaystyle 1\not \in B}
e portanto
1
<
m
{\displaystyle 1<m}
qualquer que seja
m
∈
B
{\displaystyle m\in B}
, ou seja,
1
∈
A
{\displaystyle 1\in A}
. Tomemos
n
∈
A
{\displaystyle n\in A}
. Por definição de A temos
n
<
m
{\displaystyle n<m}
qualquer que seja
m
∈
B
{\displaystyle m\in B}
, logo
n
+
1
≤
m
{\displaystyle n+1\leq m}
para todo
m
∈
B
{\displaystyle m\in B}
. Se
n
+
1
∈
B
{\displaystyle n+1\in B}
então
n
+
1
{\displaystyle n+1}
é um elemento mínimo de B. Como, por hipótese, B não possui elemento mínimo, segue que
n
+
1
∉
B
{\displaystyle n+1\not \in B}
e portanto
n
+
1
<
m
{\displaystyle n+1<m}
para qualquer
m
∈
B
{\displaystyle m\in B}
. Concluímos que
n
+
1
∈
A
{\displaystyle n+1\in A}
. Pelo Princípio da Indução
A
=
N
{\displaystyle A=\mathbb {N} }
.
Nota: Na Teoria axiomática dos Conjuntos de Zermelo-Fraenkel [sistema denotado como "ZF sem adição de axiomas extras"], a generalização deste princípio acima é equivalente para o Axioma da Escolha, criado em 1904 pelo matemático alemão Ernst Zermelo. Este é considerado um dos axiomas mais importantes da história da Matemática, apesar de suas consequências não-construtivas e controversas (vide o Paradoxo de Banach-Tarski, entre outros).
Mostre que, dados
a
,
b
∈
N
,
∃
c
∈
(
N
∪
{
0
}
)
,
t
a
l
q
u
e
b
⋅
c
≤
a
<
b
⋅
(
c
+
1
)
{\displaystyle a,b\in \mathbb {N} ,\exists \;c\in (\mathbb {N} \cup \{0\}),tal\;que\;b\cdot c\leq a<b\cdot (c+1)}
.
Dados
a
,
b
∈
N
{\displaystyle a,b\in \mathbb {N} }
, pela lei da tricotomia, temos três possibilidades
a
<
b
,
a
=
b
o
u
b
<
a
{\displaystyle a<b,a=b\;ou\;b<a}
.
Caso
a
<
b
{\displaystyle a<b}
, tome
c
=
0
{\displaystyle c=0}
, assim
b
⋅
0
≤
a
<
b
⋅
(
0
+
1
)
⇒
0
≤
a
<
b
{\displaystyle b\cdot 0\leq a<b\cdot (0+1)\Rightarrow 0\leq a<b}
Caso
a
=
b
{\displaystyle a=b}
, tome
c
=
1
{\displaystyle c=1}
, assim
b
⋅
1
≤
a
<
b
⋅
(
1
+
1
)
⇒
b
≤
a
<
2
b
{\displaystyle b\cdot 1\leq a<b\cdot (1+1)\Rightarrow b\leq a<2b}
Caso
b
<
a
{\displaystyle b<a}
. Tome
A
=
{
n
∈
N
;
b
⋅
n
>
a
}
⊂
N
{\displaystyle A=\{n\in \mathbb {N} ;b\cdot n>a\}\subset \mathbb {N} }
. A não é vazio, pois
b
⋅
(
a
+
1
)
>
a
{\displaystyle b\cdot (a+1)>a}
.
Pelo Princípio da Boa Ordem (P.B.O.),
N
⊃
A
≠
∅
⇒
∃
m
∈
A
;
m
=
m
i
n
(
A
)
⇒
b
⋅
(
m
−
1
)
<
a
<
b
⋅
m
{\displaystyle \mathbb {N} \supset A\neq \varnothing \Rightarrow \exists \;m\in A;m=min(A)\Rightarrow b\cdot (m-1)<a<b\cdot m}
.
Se
n
∈
N
,
∄
p
∈
N
,
t
a
l
q
u
e
n
<
p
<
n
+
1.
{\displaystyle n\in \mathbb {N} ,\not \exists \;p\in \mathbb {N} ,tal\;que\;n<p<n+1.}
Considere
A
=
{
n
∈
N
:
p
<
n
}
≠
∅
,
A
⊂
N
{\displaystyle A=\{n\in \mathbb {N} :p<n\}\neq \varnothing ,A\subset \mathbb {N} }
. Pelo PBO,
∃
m
∈
N
,
t
a
l
q
u
e
m
=
m
i
n
(
A
)
⇒
m
=
s
(
p
)
⇒
p
+
1
=
m
⇒
p
=
m
−
1
{\displaystyle \exists m\in \mathbb {N} ,tal\;que\;m=min(A)\Rightarrow m=s(p)\Rightarrow p+1=m\Rightarrow p=m-1}
Um subconjunto importante dos naturais é o
I
n
=
{
p
∈
N
,
1
≤
p
≤
n
}
{\displaystyle I_{n}=\{p\in \mathbb {N} ,1\leq p\leq n\}}
para algum
n
∈
N
{\displaystyle n\in \mathbb {N} }
.
Exemplo: Caso exista uma bijeção entre A e
I
5
=
{
1
,
2
,
3
,
4
,
5
}
{\displaystyle I_{5}=\{1,2,3,4,5\}}
, então A possui 5 elementos.
Um conjunto A é finito quando assume uma das opções abaixo:
quando ele é vazio. (Neste caso o conjunto não têm elementos)
quando existe uma bijeção entre
I
n
{\displaystyle I_{n}}
e
A
{\displaystyle A}
. (Neste caso o conjunto têm n elementos)
escreve-se
f
b
i
j
:
I
n
↦
A
{\displaystyle f_{bij}:I_{n}\mapsto A}
.
Concluímos que:
todo conjunto
I
n
{\displaystyle I_{n}}
é finito.
Que uma função bijeção entre dois conjuntos finitos ocorre somente quando eles possuem a mesma quantidade de elementos, aí dizemos que eles possuem a mesma cardinalidade. (De forma geral, se existe uma bijeção entre dois conjuntos, eles possuem a mesma cardinalidade, podendo eles serem infinitos).
Numa bijeção, se um conjunto é finito, o outro também o é ou se um não for finito o outro também não é.
Seja A um conjunto não vazio. Se existe
n
∈
N
{\displaystyle n\in \mathbb {N} }
e uma função injetiva
g
:
A
↦
I
n
{\displaystyle g:A\mapsto I_{n}}
diremos que A é finito, caso contrário, A é infinito.
O menor número n que verifica esta propriedade é dito número de elementos de A. Escrevemos
♯
A
=
n
{\displaystyle \sharp A=n}
. Diremos também que o conjunto vazio é finito e que seu número de elementos é 0.
♯
(
A
)
{\displaystyle \sharp (A)}
: significa Cardinalidade de A . Caso A seja finito,
♯
(
A
)
{\displaystyle \sharp (A)}
é a quantidade de elementos de um conjunto finito A.
Definição: Sejam A e B dois conjuntos não vazios. Dizemos que A e B têm a mesma cardinalidade ou que a cardinalidade de A é igual à de B e escrevemos
♯
(
A
)
=
♯
(
B
)
{\displaystyle \sharp (A)=\sharp (B)}
, se existe uma bijeção
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
.
Caso contrário dizemos que eles não têm a mesma cardinalidade ou que suas cardinalidades são diferentes e escrevemos
♯
(
A
)
≠
♯
(
B
)
{\displaystyle \sharp (A)\neq \sharp (B)}
.
Exemplo:
f
b
i
j
:
A
↦
I
n
⇒
♯
(
A
)
=
n
{\displaystyle f_{bij}:A\mapsto I_{n}\Rightarrow \sharp (A)=n}
Prove que o conjunto dos Naturais e dos Pares Naturais têm a mesma cardinalidade.
Prova:
Basta exibirmos uma função bijetiva entre os dois. Assim tome
f
:
N
↦
2
N
;
f
(
n
)
=
2
⋅
n
{\displaystyle f:\mathbb {N} \mapsto 2\mathbb {N} ;f(n)=2\cdot n}
Injetividade:
f
(
m
)
=
f
(
n
)
⇒
2
m
=
2
n
⇒
m
=
n
{\displaystyle f(m)=f(n)\Rightarrow 2m=2n\Rightarrow m=n}
Sobrejetividade: Dado
n
∈
2
N
{\displaystyle n\in 2\mathbb {N} }
, devemos mostrar que existe
m
∈
N
;
f
(
m
)
=
2
m
=
n
{\displaystyle m\in \mathbb {N} ;f(m)=2m=n}
. Assim Tomemos
n
=
2
m
;
n
∈
2
N
⇒
m
∈
N
{\displaystyle n=2m;n\in 2\mathbb {N} \Rightarrow m\in \mathbb {N} }
.
Prove que um conjunto X com n elementos pode ser ordenado de n! modos.
Prova(Por indução):
Devemos mostrar que é válido para quando
n
=
1
:
X
=
{
a
1
}
{\displaystyle n=1:X=\{a_{1}\}}
(A ordenação é única).
Como fica quando
n
=
2
:
X
=
{
a
1
,
a
2
}
{\displaystyle n=2:X=\{a_{1},a_{2}\}}
; Pode ser ordenado como:
{
a
2
,
a
1
}
o
u
{
a
1
,
a
2
}
{\displaystyle \{a_{2},a_{1}\}\;ou\;\{a_{1},a_{2}\}}
, isto é
2
!
=
2
{\displaystyle 2!=2}
vezes.
Acontece que o termo
a
2
{\displaystyle a_{2}}
foi colocado antes do termo
a
1
{\displaystyle a_{1}}
e depois do termo
a
1
{\displaystyle a_{1}}
. Então para cada opção que tinhamos antes ficou duplicada.
Como fica quando
n
=
3
:
X
=
{
a
1
,
a
2
,
a
3
}
{\displaystyle n=3:X=\{a_{1},a_{2},a_{3}\}}
; Pode ser ordenado como:
{
a
3
,
a
2
,
a
1
}
,
{
a
2
,
a
3
,
a
1
}
,
{
a
2
,
a
1
,
a
3
}
,
{
a
3
,
a
1
,
a
2
}
,
{
a
1
,
a
3
,
a
2
}
o
u
{
a
1
,
a
2
,
a
3
}
{\displaystyle \{a_{3},a_{2},a_{1}\},\{a_{2},a_{3},a_{1}\},\{a_{2},a_{1},a_{3}\},\{a_{3},a_{1},a_{2}\},\{a_{1},a_{3},a_{2}\}\;ou\;\{a_{1},a_{2},a_{3}\}}
, isto é 3! = 6 vezes.
Aconteceu para cada opção que tinhamos antes com 2 elementos foi triplicada com a inserção de um terceiro elemento.
Sendo que no primeiro o termo
a
3
{\displaystyle a_{3}}
foi inserido, antes, entre e depois dos termos em
{
a
2
,
a
1
}
{\displaystyle \{a_{2},a_{1}\}}
e depois antes, entre e depois dos termos em
{
a
1
,
a
2
}
{\displaystyle \{a_{1},a_{2}\}}
.
Suponha ser válida para quando
n
=
k
;
X
=
{
a
1
,
a
2
,
.
.
.
,
a
k
}
{\displaystyle n=k;X=\{a_{1},a_{2},...,a_{k}\}}
, existem
k
!
{\displaystyle k!}
modos de ordenar.
Devemos mostrar que para quando
n
=
k
+
1
{\displaystyle n=k+1}
, existem
k
+
1
!
{\displaystyle k+1!}
modos de ordenar esses
k
+
1
{\displaystyle k+1}
elementos.
Como para k elementos existem k! modos de ordenar, então para cada uma delas existem k+1 maneiras de ordenar com o k+1-ésimo elemento.
Assim dado uma sequência com k elementos:
{
a
1
,
a
2
,
.
.
.
,
a
k
}
{\displaystyle \{a_{1},a_{2},...,a_{k}\}}
, teremos
{
a
k
+
1
,
a
1
,
a
2
,
.
.
.
,
a
k
}
,
{
a
1
,
a
k
+
1
,
a
2
,
.
.
.
,
a
k
}
,
.
.
.
,
{
a
1
,
a
2
,
.
.
.
,
a
k
,
a
k
+
1
}
{\displaystyle \{a_{k+1},a_{1},a_{2},...,a_{k}\},\{a_{1},a_{k+1},a_{2},...,a_{k}\},...,\{a_{1},a_{2},...,a_{k},a_{k+1}\}}
, onde o elemento
a
k
+
1
{\displaystyle a_{k+1}}
vai sendo colocado entre as posições dos elementos, antes e depois, resultando em k+1 lugares para ser colocados em k! elementos, resultando em
k
+
1
⋅
k
!
{\displaystyle k+1\cdot k!}
possibilidades
Logo um conjunto com X com k+1 elementos, pode ser ordenado em k+1! modos.
Proposição: Se um conjunto X tem n elementos e possui t subconjuntos, o conjunto
Y
=
X
∪
h
{\displaystyle Y=X\cup {h}}
tem n+1 elementos e possui 2t subconjuntos.
Teorema: Um conjunto com n elementos possui
2
n
{\displaystyle 2^{n}}
subconjuntos
Prova(indução sobre n):
Um conjunto com 1 elemento possui
2
1
=
2
{\displaystyle 2^{1}=2}
subconjuntos, no caso de
X
=
{
a
1
}
{\displaystyle X=\{a_{1}\}}
, teremos os subconjuntos
X
2
=
{
a
1
}
o
u
X
1
=
{
}
{\displaystyle X_{2}=\{a_{1}\}\;ou\;X_{1}=\{\}}
Um conjunto com 2 elementos possui
2
2
=
4
{\displaystyle 2^{2}=4}
subconjuntos, no caso de
X
=
{
a
1
,
a
2
}
{\displaystyle X=\{a_{1},a_{2}\}}
, teremos os subconjuntos
X
4
=
{
a
1
,
a
2
}
,
X
2
=
{
a
1
}
,
X
3
=
{
a
2
}
o
u
X
1
=
{
}
{\displaystyle X_{4}=\{a_{1},a_{2}\},\;X_{2}=\{a_{1}\},X_{3}=\{a_{2}\}\;ou\;X_{1}=\{\}}
Ou seja, foram inseridos os subconjuntos
X
3
e
X
4
{\displaystyle X_{3}\;e\;X_{4}}
ao inserir o elemento
a
2
{\displaystyle a_{2}}
.
Um conjunto com 3 elementos possui
2
3
=
8
{\displaystyle 2^{3}=8}
subconjuntos, no caso de
X
=
{
a
1
,
a
2
,
a
3
}
{\displaystyle X=\{a_{1},a_{2},a_{3}\}}
, teremos os subconjuntos
X
8
=
{
a
1
,
a
2
,
a
3
}
,
X
4
=
{
a
1
,
a
2
}
,
X
6
=
{
a
1
,
a
3
}
,
X
7
=
{
a
2
,
a
3
}
,
X
2
=
{
a
1
}
,
X
3
=
{
a
2
}
,
X
5
=
{
a
3
}
o
u
X
1
=
{
}
{\displaystyle X_{8}=\{a_{1},a_{2},a_{3}\},X_{4}=\{a_{1},a_{2}\},X_{6}=\{a_{1},a_{3}\},X_{7}=\{a_{2},a_{3}\},X_{2}=\{a_{1}\},X_{3}=\{a_{2}\},X_{5}=\{a_{3}\}\;ou\;X_{1}=\{\}}
Ou seja, foram inseridos os subconjuntos
X
5
,
X
6
,
X
7
e
X
8
{\displaystyle X_{5},X_{6},X_{7}\;e\;X_{8}}
ao inserir o elemento
a
3
{\displaystyle a_{3}}
.
Vamos supor válido para quando n = k, ou seja, um conjunto com k elementos têm
2
k
{\displaystyle 2^{k}}
subconjuntos.
Devemos mostrar válido para quando n = k+1, isto é, um conjunto com k elementos têm
2
k
+
1
{\displaystyle 2^{k+1}}
subconjuntos:
Um conjunto com k elementos tem
2
k
{\displaystyle 2^{k}}
subconjuntos. Ao inserir o elemento
a
k
+
1
{\displaystyle a_{k+1}}
a quantidade de subconjuntos vai dobrar(segundo a proposição), assim um conjunto com k+1 elementos têm
2
⋅
2
k
=
2
1
+
k
=
2
k
+
1
{\displaystyle 2\cdot 2^{k}=2^{1+k}=2^{k+1}}
subconjuntos.
Prova (Triângulo de Pascal)
um conjunto com n elementos tem
C
n
,
0
+
C
n
,
1
+
C
n
,
2
+
.
.
.
+
C
n
,
n
−
1
+
C
n
,
n
=
2
k
{\displaystyle C_{n,0}+C_{n,1}+C_{n,2}+...+C_{n,n-1}+C_{n,n}=2^{k}}
subconjuntos
um conjunto com 0 elementos tem
1
=
2
0
{\displaystyle 1=2^{0}}
subconjunto
um conjunto com 1 elementos tem
1
+
1
=
2
1
{\displaystyle 1+1=2^{1}}
subconjuntos
um conjunto com 2 elementos tem
1
+
2
+
1
=
2
2
{\displaystyle 1+2+1=2^{2}}
subconjuntos
um conjunto com 3 elementos tem
1
+
3
+
3
+
1
=
2
3
{\displaystyle 1+3+3+1=2^{3}}
subconjuntos
...
um conjunto com k elementos tem
1
+
C
k
,
1
+
C
k
,
2
+
.
.
.
+
C
k
,
k
−
1
+
1
=
2
k
{\displaystyle 1+C_{k,1}+C_{k,2}+...+C_{k,k-1}+1=2^{k}}
subconjuntos
onde o
C
n
,
0
{\displaystyle C_{n,0}}
é a quantidade de conjuntos nulo, que no caso é sempre 1
onde o
C
n
,
1
{\displaystyle C_{n,1}}
é quantidade de conjuntos unitários
onde o
C
n
,
2
{\displaystyle C_{n,2}}
é a quantidade de conjuntos formados de 2 elementos
onde o
C
n
,
n
−
1
{\displaystyle C_{n,n-1}}
é a quantidade de conjuntos formados com n-1 elementos
onde o
C
n
,
n
{\displaystyle C_{n,n}}
é a quantidade de conjuntos com n elementos, que no caso é sempre 1
Sejam A e B conjuntos não vazios.
Se existe função injetiva
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
, então dizemos que a cardinalidade de A é menor ou igual à de B e escrevemos
♯
A
≤
♯
B
{\displaystyle \sharp A\leq \sharp B}
.
Se existe uma função sobrejetiva
g
:
A
↦
B
{\displaystyle g:A\mapsto B}
, então dizemos que a cardinalidade de A é maior ou igual a de B e escrevemos
♯
A
≥
♯
B
{\displaystyle \sharp A\geq \sharp B}
.
Se
♯
A
≤
♯
B
e
♯
A
≠
♯
B
{\displaystyle \sharp A\leq \sharp B\;e\;\sharp A\neq \sharp B}
, então escrevemos
♯
A
<
♯
B
{\displaystyle \sharp A<\sharp B}
(lê-se a cardinalidade de A é menor que a de B).
Analogamente, se
♯
A
≥
♯
B
e
♯
A
≠
♯
B
{\displaystyle \sharp A\geq \sharp B\;e\;\sharp A\neq \sharp B}
, então escrevemos
♯
A
>
♯
B
{\displaystyle \sharp A>\sharp B}
(lê-se a cardinalidade de A é maior que a de B).
Feita esta definição, temos que
A
≠
∅
{\displaystyle A\neq \varnothing }
é enumerável se, e somente se,
♯
A
≤
♯
N
{\displaystyle \sharp A\leq \sharp \mathbb {N} }
.
Exemplo: Seja A um conjunto não vazio. É evidente que
♯
A
=
♯
A
{\displaystyle \sharp A=\sharp A}
pois a função identidade
I
d
:
A
↦
A
{\displaystyle Id:A\mapsto A}
dada por
I
d
(
x
)
=
x
,
∀
x
∈
A
{\displaystyle Id(x)=x,\forall x\in A}
é uma bijeção.
Exemplo: Sejam A e B dois conjuntos não vazios com
A
⊂
B
{\displaystyle A\subset B}
. Obviamente
♯
A
≤
♯
B
{\displaystyle \sharp A\leq \sharp B}
pois a função
I
d
:
A
↦
B
{\displaystyle Id:A\mapsto B}
dada por
I
d
(
x
)
=
x
,
∀
x
∈
A
{\displaystyle Id(x)=x,\forall x\in A}
é injetiva.
Uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é injetiva se, e somente se, existe uma função
g
:
B
↦
A
{\displaystyle g:B\mapsto A}
que seja sobrejetiva.”
Para provar essa proposição, fazemos em separado:
Tomemos por hipótese que
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é injetiva. Vamos provar que
∃
g
:
B
↦
A
{\displaystyle \exists \;g:B\mapsto A}
que é sobrejetiva.
A
o
t
o
m
a
r
y
∈
B
{\displaystyle Ao\;tomar\;y\in B}
, não sabemos se
∃
x
∈
A
,
t
a
l
q
u
e
y
=
f
(
x
)
.
{\displaystyle \exists \;x\in A,tal\;que\;y=f(x).}
Assim vamos considerar que
f
(
A
)
≠
B
⇒
B
−
f
(
A
)
≠
∅
.
{\displaystyle f(A)\neq B\Rightarrow B-f(A)\neq \varnothing .}
Se ocorresse que
f
(
A
)
=
B
{\displaystyle f(A)=B}
, teríamos que
g
:
B
↦
A
,
g
(
y
)
=
x
,
c
o
m
f
(
x
)
=
y
⇒
∀
x
∈
A
,
f
(
x
)
∈
B
⇒
g
(
f
(
x
)
)
=
x
{\displaystyle g:B\mapsto A,g(y)=x,comf(x)=y\Rightarrow \forall \;x\in A,f(x)\in B\Rightarrow g(f(x))=x}
e assim essa g é sobrejetiva.
Vamos tomar
B
=
[
B
∖
f
(
A
)
]
∪
f
(
A
)
{\displaystyle B=[B\setminus f(A)]\cup f(A)}
. Assim, construamos
g
:
B
↦
A
{\displaystyle g:B\mapsto A}
. Ao tomarmos
y
∈
B
⇒
y
∈
B
∖
f
(
A
)
o
u
y
∈
f
(
A
)
{\displaystyle y\in B\Rightarrow y\in B\setminus f(A)\;ou\;y\in f(A)}
.
Assim, se
y
∈
f
(
A
)
{\displaystyle y\in f(A)}
, logo
∃
x
∈
A
,
t
a
l
q
u
e
y
=
f
(
x
)
e
s
e
y
∈
B
−
f
(
A
)
{\displaystyle \exists \;x\in A,tal\;que\;y=f(x)\;e\;se\;y\in B-f(A)}
, fixemos
x
1
∈
A
{\displaystyle x_{1}\in A}
, um elemento arbitrário, tal que
g
(
y
)
=
x
1
{\displaystyle g(y)=x_{1}}
.
Da forma que construímos g,
g
(
B
)
=
A
{\displaystyle g(B)=A}
, ou seja, g é sobrejetiva.
Com efeito, se
g
(
B
)
⊄
A
,
{\displaystyle g(B)\not \subset A,}
teríamos
y
∈
B
,
t
a
l
q
u
e
g
(
y
)
∉
A
.
M
a
s
s
e
y
∈
f
(
A
)
,
∃
x
∈
A
,
t
a
l
q
u
e
y
=
f
(
x
)
,
{\displaystyle y\in B,tal\;que\;g(y)\not \in A.Mas\;se\;y\in f(A),\exists \;x\in A,tal\;que\;y=f(x),}
ou seja,
g
(
y
)
=
g
(
f
(
x
)
)
=
x
∈
A
{\displaystyle g(y)=g(f(x))=x\in A}
, que é uma contradição. Mas se
y
∈
[
B
∖
f
(
A
)
]
,
g
(
y
)
=
x
1
,
p
a
r
a
a
l
g
u
m
x
1
∈
A
{\displaystyle y\in [B\setminus f(A)],g(y)=x_{1},para\;algum\;x_{1}\in A}
, que é uma contradição, logo
g
(
B
)
⊂
A
{\displaystyle g(B)\subset A}
.
Também, se
A
⊄
g
(
B
)
,
{\displaystyle A\not \subset g(B),}
teríamos
x
∈
A
,
t
a
l
q
u
e
x
∉
g
(
B
)
.
M
a
s
x
∈
A
⇒
f
(
x
)
∈
B
∩
f
(
A
)
⇒
g
(
f
(
x
)
)
=
x
∈
A
{\displaystyle x\in A,tal\;que\;x\not \in g(B).Mas\;x\in A\Rightarrow f(x)\in B\cap f(A)\Rightarrow g(f(x))=x\in A}
, que é uma contradição, logo
A
⊂
g
(
B
)
{\displaystyle A\subset g(B)}
.
Tomemos por hipótese
g
:
B
↦
A
{\displaystyle g:B\mapsto A}
é uma função sobrejetiva. Vamos provar que qualquer
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é injetiva.
Suponha que exista uma
f
:
A
↦
B
,
f
(
x
)
=
y
,
t
a
l
q
u
e
x
=
g
(
y
)
{\displaystyle f:A\mapsto B,f(x)=y,tal\;que\;x=g(y)}
, de forma que f não seja injetiva.
Pela não-injetividade da f, existem
a
≠
b
∈
A
,
y
∈
B
,
t
a
l
q
u
e
f
(
a
)
=
y
=
f
(
b
)
.
{\displaystyle a\neq b\in A,y\in B,tal\;que\;f(a)=y=f(b).}
Mas, se acontecesse que, dado
y
∈
B
,
g
(
y
)
=
a
e
g
(
y
)
=
b
{\displaystyle y\in B,g(y)=a\;e\;g(y)=b}
, g não seria uma função.
Portanto f é injetiva.
Prove que uma função
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é invertível se, e somente se, f é bijetiva.”
Prova
Vamos tomar por hipótese que
f
:
A
↦
B
{\displaystyle f:A\mapsto B}
é invertível.
Uma função f é invertível se existe outra função g tal que
f
(
x
)
=
y
⇔
g
(
y
)
=
x
{\displaystyle f(x)=y\Leftrightarrow g(y)=x}
para todo x em A e y em B.
Por g ser uma função,
∀
y
∈
B
,
∃
!
x
∈
A
,
t
a
l
q
u
e
g
(
y
)
=
x
,
⇔
∀
y
∈
B
,
∃
!
x
∈
A
,
t
a
l
q
u
e
f
(
x
)
=
y
{\displaystyle \forall y\in B,\exists !x\in A,tal\;que\;g(y)=x,\Leftrightarrow \forall y\in B,\exists !x\in A,tal\;que\;f(x)=y}
Observando que dado qualquer y em B, existe um único x, tal que f(x) = y, nos diz que f é sobrejetiva e g é injetiva.
Observando que dado qualquer x em A, existe um único y, tal que g(y) = x, nos diz que g é sobrejetiva e f é injetiva.
Logo f e g são bijetivas.
TEOREMA De Cantor1-Bernstein2-Schroder3)
Se
♯
A
≤
♯
B
{\displaystyle \sharp A\leq \sharp B}
e
♯
B
≤
♯
A
{\displaystyle \sharp B\leq \sharp A}
, então
♯
A
=
♯
B
{\displaystyle \sharp A=\sharp B}
.
Prova:
Considere
h
1
:
A
↦
B
e
h
2
:
B
↦
A
.
{\displaystyle h_{1}:A\mapsto B\;e\;h_{2}:B\mapsto A.}
Como
#
A
≤
#
B
,
{\displaystyle \#A\leq \#B,}
temos que
h
2
{\displaystyle h_{2}}
só pode ser definida se
#
A
=
#
B
,
{\displaystyle \#A=\#B,}
Como
#
B
≤
#
A
,
{\displaystyle \#B\leq \#A,}
temos que
h
1
{\displaystyle h_{1}}
só pode ser definida se
#
A
=
#
B
,
{\displaystyle \#A=\#B,}
Portanto
#
A
=
#
B
{\displaystyle \#A=\#B}
Seja
X
⊂
I
n
{\displaystyle X\subset I_{n}}
. Se existir uma bijeção
f
:
I
n
↦
X
,
{\displaystyle f:I_{n}\mapsto X,}
então
X
=
I
n
{\displaystyle X=I_{n}}
.
Como
X
⊂
I
n
⇒
♯
(
X
)
≤
♯
(
I
n
)
.
{\displaystyle {\mbox{ Como }}X\subset I_{n}\Rightarrow \sharp (X)\leq \sharp (I_{n}).}
Como f é bijetiva
♯
(
I
n
)
=
♯
(
X
)
e
f
(
I
n
)
⊂
X
⇒
♯
(
I
n
)
≤
♯
(
X
)
⇒
♯
(
I
n
)
=
♯
(
X
)
.
{\displaystyle \sharp (I_{n})=\sharp (X)\;e\;f(I_{n})\subset X\Rightarrow \sharp (I_{n})\leq \sharp (X)\Rightarrow \sharp (I_{n})=\sharp (X).}
Como
X
⊂
I
n
{\displaystyle {\mbox{ Como }}X\subset I_{n}}
Logo
X
=
I
n
.
{\displaystyle X=I_{n}.}
Se existir uma bijeção
f
:
I
m
↦
I
n
{\displaystyle f:I_{m}\mapsto I_{n}}
então
m
=
n
{\displaystyle m=n}
. Consequentemente, se existem duas bijeções
f
:
I
m
↦
X
{\displaystyle f:I_{m}\mapsto X}
e
f
:
I
n
↦
X
{\displaystyle f:I_{n}\mapsto X}
, logo
m
=
n
{\displaystyle m=n}
.
Pela bijeção de f,
♯
(
f
(
I
m
)
)
=
♯
(
I
m
)
e
f
(
I
m
)
=
I
n
⇒
♯
(
I
m
)
=
♯
(
I
n
)
⇒
m
=
n
.
{\displaystyle \sharp (f(I_{m}))=\sharp (I_{m}){\mbox{ e }}f(I_{m})=I_{n}\Rightarrow \sharp (I_{m})=\sharp (I_{n})\Rightarrow m=n.}
Pela bijeção de f,
♯
(
f
(
I
m
)
)
=
♯
(
X
)
=
♯
(
f
(
I
n
)
)
e
f
(
I
m
)
=
X
=
f
(
I
n
)
⇒
♯
(
I
m
)
=
♯
(
X
)
=
♯
(
I
n
)
⇒
m
=
n
.
{\displaystyle \sharp (f(I_{m}))=\sharp (X)=\sharp (f(I_{n})){\mbox{ e }}f(I_{m})=X=f(I_{n})\Rightarrow \sharp (I_{m})=\sharp (X)=\sharp (I_{n})\Rightarrow m=n.}
Não pode existir uma
f
b
i
j
:
X
↦
Y
{\displaystyle f_{bij}:X\mapsto Y}
de um conjunto finito sobre uma parte própria
Y
⊂
X
{\displaystyle Y\subset X}
Se
X
{\displaystyle X}
é um conjunto finito então todo subconjunto
Y
⊂
X
{\displaystyle Y\subset X}
é finito. O número de elementos de Y não excede o de X e só é igual quando Y = X.
Seja
f
:
X
↦
Y
{\displaystyle f:X\mapsto Y}
uma função injetora. Se Y for finito então X também será. Além disso, o número de elementos de X não excede o de Y.
Seja X e Y conjuntos finitos, então
X
∪
Y
{\displaystyle X\cup Y}
é finito e tem-se que
#
(
X
∪
Y
)
=
#
X
+
#
Y
−
#
(
X
∩
Y
)
{\displaystyle \#(X\cup Y)=\#X+\#Y-\#(X\cap Y)}
Prova
Primeiro vamos mostrar que
X
∪
Y
=
(
X
∖
Y
)
∪
(
Y
∖
X
)
∪
(
X
∩
Y
)
{\displaystyle X\cup Y=(X\setminus Y)\cup (Y\setminus X)\cup (X\cap Y)}
X
∪
Y
=
[
X
∩
(
Y
∪
Y
C
)
]
∪
[
Y
∩
(
X
∪
X
C
)
]
=
[
(
X
∩
Y
)
∪
(
X
∩
Y
C
)
]
∪
[
(
Y
∩
X
)
∪
(
Y
∩
X
C
)
]
.
{\displaystyle X\cup Y=[X\cap (Y\cup Y^{C})]\cup [Y\cap (X\cup X^{C})]=[(X\cap Y)\cup (X\cap Y^{C})]\cup [(Y\cap X)\cup (Y\cap X^{C})].}
X
∪
Y
=
(
X
∖
Y
)
∪
(
Y
∩
X
)
∪
(
Y
∖
X
)
⇒
♯
(
X
∪
Y
)
=
♯
(
X
∖
Y
)
+
♯
(
Y
∩
X
)
+
♯
(
Y
∖
X
)
{\displaystyle X\cup Y=(X\setminus Y)\cup (Y\cap X)\cup (Y\setminus X)\Rightarrow \sharp (X\cup Y)=\sharp (X\setminus Y)+\sharp (Y\cap X)+\sharp (Y\setminus X)}
. Podemos somar porque a união é disjunta.
Assim
X
=
X
∩
(
Y
∪
Y
C
)
]
=
(
X
∩
Y
)
∪
(
X
∩
Y
C
)
]
=
(
X
∩
Y
)
∪
(
X
∩
Y
C
)
⇒
♯
(
X
)
=
♯
(
X
∩
Y
)
+
♯
(
X
∖
Y
)
{\displaystyle X=X\cap (Y\cup Y^{C})]=(X\cap Y)\cup (X\cap Y^{C})]=(X\cap Y)\cup (X\cap Y^{C})\Rightarrow \sharp (X)=\sharp (X\cap Y)+\sharp (X\setminus Y)}
Assim
Y
=
Y
∩
(
X
∪
X
C
)
]
=
(
Y
∩
X
)
∪
(
Y
∩
X
C
)
]
=
(
Y
∩
X
)
∪
(
Y
∩
X
C
)
⇒
♯
(
Y
)
=
♯
(
Y
∩
X
)
+
♯
(
Y
∖
X
)
{\displaystyle Y=Y\cap (X\cup X^{C})]=(Y\cap X)\cup (Y\cap X^{C})]=(Y\cap X)\cup (Y\cap X^{C})\Rightarrow \sharp (Y)=\sharp (Y\cap X)+\sharp (Y\setminus X)}
Logo
♯
(
X
)
+
♯
(
Y
)
=
♯
(
X
∩
Y
)
+
♯
(
X
∖
Y
)
+
♯
(
Y
∩
X
)
+
♯
(
Y
∖
X
)
=
♯
(
X
∩
Y
)
+
♯
(
X
∪
Y
)
⇒
♯
(
X
∩
Y
)
+
♯
(
X
∪
Y
)
=
♯
(
X
)
+
♯
(
Y
)
⇒
{\displaystyle \sharp (X)+\sharp (Y)=\sharp (X\cap Y)+\sharp (X\setminus Y)+\sharp (Y\cap X)+\sharp (Y\setminus X)=\sharp (X\cap Y)+\sharp (X\cup Y)\Rightarrow \sharp (X\cap Y)+\sharp (X\cup Y)=\sharp (X)+\sharp (Y)\Rightarrow }
⇒
♯
(
X
∪
Y
)
=
♯
(
X
)
+
♯
(
Y
)
−
♯
(
X
∩
Y
)
{\displaystyle \Rightarrow \sharp (X\cup Y)=\sharp (X)+\sharp (Y)-\sharp (X\cap Y)}
Intuitivamente, um conjunto A é enumerável quando é possível construir uma lista com todos os elementos de A .
Mais formalmente falando, A é enumerável se existir uma bijeção (relação um para um) entre A e o conjunto dos números naturais N (chamam-se de conjuntos de mesma cardinalidade quando existe uma bijeção entre os conjuntos; também diz-se que estes conjuntos são equipotentes ).
Um Conjunto A é enumerável se uma função f bijetiva aos naturais ou ao conjunto
I
n
{\displaystyle I_{n}}
, isto é,
∃
f
b
i
j
:
T
↦
S
{\displaystyle \exists \;f_{bij}:T\mapsto S}
onde
T
=
N
ou
T
=
I
n
=
{
1
,
2
,
.
.
.
,
n
}
,
de forma que
T
⊂
N
{\displaystyle T=\mathbb {N} {\mbox{ ou }}T=I_{n}=\{1,2,...,n\},{\mbox{ de forma que }}T\subset \mathbb {N} }
.
Dizemos que um conjunto A é enumerável se ele é vazio ou se existe uma função injetiva
f
:
A
↦
N
{\displaystyle f:A\mapsto \mathbb {N} }
. Caso contrário dizemos que A é não-enumerável.
Seja
X
=
{
x
1
,
x
2
,
.
.
.
,
x
n
}
{\displaystyle X=\{x_{1},x_{2},...,x_{n}\}}
um conjunto finito. Seja
f
:
I
n
→
X
{\displaystyle f:I_{n}\rightarrow X}
uma bijeção, onde
f
(
i
)
=
x
i
,
i
=
1
,
.
.
.
,
n
{\displaystyle f(i)=x_{i},i=1,...,n\;}
. Logo f é bijetiva. Portanto X é enumerável.
Seja
N
=
{
1
,
2
,
.
.
.
}
{\displaystyle \mathbb {N} =\{1,2,...\}}
o conjunto dos números naturais. Seja
f
:
N
→
N
{\displaystyle f:\mathbb {N} \rightarrow \mathbb {N} }
uma bijeção, onde
f
(
i
)
=
i
,
i
=
1
,
2
,
.
.
.
{\displaystyle f(i)=i,i=1,2,...\;}
. Logo f é bijetiva(é fácil mostrar a bijetividade). Portanto
N
{\displaystyle \mathbb {N} }
é enumerável.
Seja
2
N
=
{
2
,
4
,
.
.
.
}
{\displaystyle 2\mathbb {N} =\{2,4,...\}}
o conjunto dos números pares naturais. Seja
f
:
N
→
2
N
{\displaystyle f:\mathbb {N} \rightarrow 2\mathbb {N} }
uma bijeção, onde
f
(
i
)
=
2
i
,
i
=
1
,
2
,
.
.
.
{\displaystyle f(i)=2i,i=1,2,...\;}
. Logo f é bijetiva(é fácil mostrar a bijetividade). Portanto
2
N
{\displaystyle 2\mathbb {N} }
é enumerável.
Seja
2
N
−
1
=
{
1
,
3
,
.
.
.
}
{\displaystyle 2\mathbb {N} -1=\{1,3,...\}}
o conjunto dos números impares naturais. Seja
f
:
N
→
2
N
−
1
{\displaystyle f:\mathbb {N} \rightarrow 2\mathbb {N} -1}
uma bijeção, onde
f
(
i
)
=
2
i
−
1
,
i
=
1
,
2
,
.
.
.
{\displaystyle f(i)=2i-1,i=1,2,...\;}
. Logo f é bijetiva(é fácil mostrar a bijetividade). Portanto
2
N
−
1
{\displaystyle 2\mathbb {N} -1}
é enumerável.
Seja
f
:
Z
→
N
{\displaystyle f:\mathbb {Z} \rightarrow \mathbb {N} }
uma bijeção, onde
f
(
n
)
=
{
2
n
,
s
e
n
≥
0
−
1
−
2
n
,
s
e
n
<
0
{\displaystyle f(n)={\begin{cases}2n,se\;n\geq 0\;\\-1-2n,se\;n<0\;\end{cases}}\;}
. Logo f é bijetiva(é fácil mostrar a bijetividade). Portanto
Z
{\displaystyle \mathbb {Z} }
é enumerável.
É possível provar que os seguintes conjuntos são enumeráveis:
o conjunto dos números racionais
o conjunto dos números algébricos
Ou se dado Y enumerável e
f
:
X
→
Y
{\displaystyle f:X\rightarrow Y\;}
injetiva, então X é enumerável
Prova: Dado Y enumerável.
Se Y é finito, qualquer subconjunto X de Y é finito também, logo X é enumerável.
Mas se Y é infinito, logo Y possui um subconjunto X enumerável.
Prova2: Dado X um subconjunto de Y enumerável. Tome
f
:
X
→
Y
{\displaystyle f:X\rightarrow Y}
de forma que f seja injetiva.
Assim, se Y é finito, logo X é finito, então dado
g
:
X
→
I
n
{\displaystyle g:X\rightarrow I_{n}}
(onde n é a cardinalidade de X). Implica que X é enumerável. se Y é finito, dado
x
1
,
x
2
∈
X
{\displaystyle x_{1},x_{2}\in X}
pela injetividade,
f
(
x
1
)
≠
f
(
x
2
)
⇒
f
(
X
)
{\displaystyle f(x_{1})\not =f(x_{2})\Rightarrow f(X)}
{\displaystyle }
Além disso, é possível provar que
R
{\displaystyle \mathbb {R} \,}
e
R
2
{\displaystyle \mathbb {R} ^{2}\,}
tem a mesma cardinalidade; uma conjectura interessante neste ponto seria mostrar que todo conjunto infinito é enumerável. Esta conjectura, porém, é falsa.
{\displaystyle \;}
⇒
⇔
→
∃
∀
{
a
b
{
}
a
3
X
¯
{\displaystyle \Rightarrow \;\Leftrightarrow \;\rightarrow \;\exists \;\forall \;{\begin{cases}\;\\\;\end{cases}}\;{a \over b}\;{\bigg \{}{\bigg \}}\;{\sqrt[{3}]{a}}\;{\overline {X}}}
Cantor mostrou que o conjunto dos números reais tem mais elementos que o conjunto dos números naturais, no sentido preciso seguinte: existe uma função injetiva
f
:
N
→
R
{\displaystyle f:\mathbb {N} \to \mathbb {R} \,}
, mas não existe uma função bijetiva
f
:
N
→
R
{\displaystyle f:\mathbb {N} \to \mathbb {R} \,}
Assim, o conjunto dos números reais não é enumerável, assim como qualquer conjunto equipotente a ele (o conjunto dos números complexos, o conjunto das funções contínuas
f
:
R
→
R
{\displaystyle f:\mathbb {R} \to \mathbb {R} \,}
, o conjunto das sequências de números reais, o conjunto das partes de
N
{\displaystyle \mathbb {N} \,}
, etc), ou conjuntos de maior cardinalidade (o conjunto das partes de
R
{\displaystyle \mathbb {R} \,}
, o conjunto das funções
f
:
R
→
R
{\displaystyle f:\mathbb {R} \to \mathbb {R} \,}
, etc).
Existem várias provas de que
R
{\displaystyle \mathbb {R} \,}
não é enumerável; as provas consistem em supor uma sequência de números reais
a
0
,
a
1
,
a
2
,
.
.
.
{\displaystyle a_{0},a_{1},a_{2},...\,}
e exibir um número real x que não está nesta sequência.
Uma das provas utiliza o princípio dos intervalos encaixados , que será visto no capítulo Completude ; a demonstração está no capítulo Sequências .
Podemos dividir um conjunto em suas partições disjuntas de forma que se unirmos tudo teremos novamente o conjunto:
O conjunto dos inteiros pode ser dividido em dois grupos de mesma cardinalidade, o conjunto dos pares e dos impares, assim
Pares = {...,-4,-2,0,2,4,...}
Impares = {...,-5,-3,-1,1,3,5,...)}
Z
=
P
a
r
e
s
∪
I
m
p
a
r
e
s
{\displaystyle \mathbb {Z} =Pares\cup Impares}
Um subconjunto R de
A
2
{\displaystyle A^{2}}
é uma relação de equivalência em A se, e somente se,
(
a
,
a
)
∈
R
,
∀
a
∈
A
{\displaystyle (a,a)\in R,\forall \;a\in A}
(
a
,
b
)
∈
R
,
→
(
b
,
a
)
∈
R
{\displaystyle (a,b)\in R,\rightarrow (b,a)\in R}
(
a
,
b
)
∈
R
e
(
b
,
c
)
∈
R
→
(
a
,
c
)
∈
R
{\displaystyle (a,b)\in R\;e\;(b,c)\in R\rightarrow (a,c)\in R}
A relação binária ~ sobre A é uma relação de equivalência sobre A se:
a
∼
a
,
∀
a
∈
A
{\displaystyle a\sim a,\forall a\in A}
(reflexiva)
a
∼
b
→
b
∼
a
{\displaystyle a\sim b\rightarrow b\sim a}
(simétrica)
a
∼
b
e
b
∼
c
→
c
∼
a
{\displaystyle a\sim b\;e\;b\sim c\rightarrow c\sim a}
(transitiva)
Seja A um conjunto e ~ uma relação de equivalência em A, então a classe de equivalência de a em A é o conjunto de todos os elementos que têm relação com a:
[
a
]
=
{
x
∈
A
:
x
∼
a
}
{\displaystyle [a]=\{x\in A:x\sim a\}}
.
Pares:
[
0
]
=
{
x
∈
Z
:
x
∼
0
,
s
e
x
−
0
=
p
a
r
}
{\displaystyle [0]=\{x\in \mathbb {Z} :x\sim 0,se\;x-0=par\}}
[
0
]
=
{
.
.
.
,
−
4
,
−
2
,
0
,
2
,
4
,
.
.
.
}
{\displaystyle [0]=\{...,-4,-2,0,2,4,...\}}
Impares
[
1
]
=
{
x
∈
Z
:
x
∼
1
,
s
e
x
−
1
=
i
m
p
a
r
}
{\displaystyle [1]=\{x\in \mathbb {Z} :x\sim 1,se\;x-1=impar\}}
[
1
]
=
{
.
.
.
,
−
5
,
−
3
,
−
1
,
1
,
3
,
5
,
.
.
.
}
{\displaystyle [1]=\{...,-5,-3,-1,1,3,5,...\}}
O conjunto das classes de equivalência de uma relação de equivalência ~ em A é chamado de conjunto quociente de A sobre ~, que será escrito como A/~.
Como vimos acima, foi definido no conjunto dos inteiros uma relação de equivalência separando o conjunto dos inteiros em duas partições tal que a união disjusta:
Z
/
∼=
{
[
0
]
,
[
1
]
}
{\displaystyle Z/\sim =\{[0],[1]\}}
N
×
N
=
{
(
a
,
b
)
∈
N
2
:
a
,
b
∈
N
}
{\displaystyle \mathbb {N} \times \mathbb {N} =\{(a,b)\in \mathbb {N} ^{2}:a,b\in \mathbb {N} \}}
Seja s a função das somas naturais onde s(a,b) é a soma entre a e b.
s
:
N
×
N
∖
{
1
}
↦
N
,
o
n
d
e
s
(
m
,
n
)
=
m
+
n
{\displaystyle s:\mathbb {N} \times \mathbb {N} \setminus \{1\}\mapsto \mathbb {N} ,ondes(m,n)=m+n}
Ex:
s
(
1
,
1
)
=
1
+
1
=
2
{\displaystyle s(1,1)=1+1=2}
Seja d a função que multiplica dois naturais onde d(a,b) é a multiplicação entre a e b
d
:
N
×
N
↦
N
,
o
n
d
e
d
(
m
,
n
)
=
m
⋅
n
{\displaystyle d:\mathbb {N} \times \mathbb {N} \mapsto \mathbb {N} ,onde\;d(m,n)=m\cdot n}
E
x
:
d
(
1
,
1
)
=
1
⋅
1
=
2
{\displaystyle Ex:d(1,1)=1\cdot 1=2}
Consideremos uma aplicação
Ψ
:
N
2
↦
Z
{\displaystyle \Psi :\mathbb {N} ^{2}\mapsto \mathbb {Z} }
.
O conjunto dos inteiros
Z
{\displaystyle \mathbb {Z} }
e a operação de adição
+
{\displaystyle +\ }
formam um grupo e a multiplicação carece de inversas. Se permitirmos que a multiplicação e a adição operem nos
Z
,
{\displaystyle \mathbb {Z} ,}
nós poderemos definir um conjunto onde todo elemento, exceto o zero, tem um inverso multiplicativo. Este é o conjunto de números racionais.
A próxima extensão padrão adiciona a possibilidade de quocientes ou divisão , e dá-nos os números racionais (ou apenas racionais )
Q
,
{\displaystyle \mathbb {Q} ,}
Que inclui o inverso multiplicativo de
Z
∖
{
0
}
{\displaystyle \mathbb {Z} \setminus \{0\}}
da forma
1
z
{\displaystyle {\frac {1}{z}}}
frações como a
1
2
,
{\displaystyle {\frac {1}{2}},}
bem como produtos dos dois conjuntos a partir de
z
1
z
2
,
{\displaystyle {\frac {z_{1}}{z_{2}}},}
como
64
7
,
17
16
×
10
5
.
{\displaystyle {\frac {64}{7}},{\frac {17}{16\times 10^{5}}}.}
Os racionais nos permitem usar precisão arbitrária, e eles são suficientes para medição .
Os números racionais podem ser construídos a partir dos inteiros como classe de equivalência de pares ordenados (a, b) de inteiros, com b ≠ 0, tal que (a, b) e (c, d) são equivalentes quando ad = bc usando a definição de multiplicação de inteiros. Estes pares ordenados são, é claro, comumente escritos
a
b
.
{\displaystyle {\tfrac {a}{b}}.}
Pode-se definir adição como (a, b) + (c, d) = (ad + bc, bd) e multiplicação como (a, b) . (c, d) = (ac, bd); todos usando a definição de adição e multiplicação de inteiros.
Esta construção dos racionais a partir dos inteiros é denominada construção do corpo de frações de um anel; nem todos anéis podem ter um corpo de frações, mas uma classe especial de anéis, os domínios de integridade, podem. Entre os domínios de integridade estão os inteiros e o anel dos polinômios com coeficientes em um corpo ou domínio de integridade.
Este é um bom momento para justificar o tema da análise real, o que reduz essencialmente para justificar a necessidade de estudar
R
{\displaystyle \mathbb {R} }
.
Portanto, o que está faltando? Porque é preciso algo além dos racionais?
O primeiro sinal de problema é a raíz quadrada. Famoso dilema,
(
2
)
{\displaystyle {\sqrt {(}}2)}
não é um racional - em outras palavras, não existe um número racional que ao quadrado dá
2
{\displaystyle 2}
(veja os exercícios). Este fato tem uma curiosa consequência - considere as seguintes funções:
f
:
Q
→
Q
;
x
↦
{
0
se
x
2
<
2
1
se
x
2
>
2
{\displaystyle f:\mathbb {Q} \to \mathbb {Q} ;x\mapsto \left\{{\begin{matrix}0&{\mbox{se }}x^{2}<2\\1&{\mbox{se }}x^{2}>2\\\end{matrix}}\right.}
É evidente que esta função tem um salto dramático em torno do racional
1
,
4
{\displaystyle 1,4}
, onde ele muda de repente, inicialmente sendo igual a zero e muda para ser igual a um.
No entanto, é impossível estabelecer exatamente onde esse salto acontece. Qualquer número racional específico é seguro de um lado ou para o outro, esta função é contínua, de acordo com a definição usual de continuidade. Conceito que ficará claro num capítulo posterior.
É esta falha que os números reais são projetados para consertar. Vamos definir os números reais
R
{\displaystyle \mathbb {R} }
para que não importe o quão hábil tentaremos ser, se uma função tem um "salto" da forma que
f
{\displaystyle f}
faz, em seguida sempre seremos capaz de encontrar um número específico em que ela salta.
As seções seguintes descrevem as propriedades dos
R
{\displaystyle \mathbb {R} }
, que tornam isso possível.
A fim de provar alguma coisa sobre o números reais, precisamos saber quais são as suas propriedades. Existem duas abordagens diferentes para descrever essas propriedades - axiomática e construtiva.
Quando tomarmos uma abordagem axiomática, simplesmente faremos uma série de afirmações sobre
R
{\displaystyle \mathbb {R} }
, e assumir que são titulares.
As afirmações que fazemos são chamados axiomas - num contexto matemático este termo significa aproximadamente "pressuposto básico".
A vantagem desta abordagem é que é exatamente claro o que temos de assumir para obter os resultados que desejamos, e, além disso, podemos proceder imediatamente a dedução desses resultados.
A desvantagem desta abordagem é que ela pode não ser imediatamente evidente que qualquer objeto que satisfaça as propriedades que desejamos ainda existe!
Com uma abordagem construtiva, não estamos felizes simplesmente para assumir exatamente aquilo que queremos, mas sim tentarmos construir
R
{\displaystyle \mathbb {R} }
de algo mais simples e, em seguida, provar que ela tem as propriedades que queremos. Desta forma, o que poderia ter sido axiomas tornam-se teoremas. Existem várias maneiras de fazer isso, a partir de
Q
{\displaystyle \mathbb {Q} }
e usando algum método para 'encher as lacunas entre as racionais'.
Todos esses métodos são bastante complexos e serão adiadas até a próxima secção.
Então, quais são esses axiomas que vamos precisar? A versão curta é dizer que
R
{\displaystyle \mathbb {R} }
é um Corpo ordenado completo . Isto é, de fato, dizendo muitas coisas:
Que
R
{\displaystyle \mathbb {R} }
é um corpo ordenado arquimediano .
Que
R
{\displaystyle \mathbb {R} }
é completo e ordenado (Note que o significado da integralidade aqui não é exatamente o mesmo que o sentido comum no estudo dos conjuntos parcialmente ordenados).
Que as operações algébricas (adição e multiplicação) descritas pelo axiomas de corpo interagem com a ordenação na forma esperada.
Mais detalhadamente, afirmarmos o seguinte:
R
{\displaystyle \mathbb {R} }
é um corpo. Por isso, exigimos que as operações binárias adição (denotado
+
{\displaystyle +}
) e multiplicação (denotado
×
{\displaystyle \times }
) definida sobre
R
{\displaystyle \mathbb {R} }
, e os elementos distintos
0
{\displaystyle 0}
e
1
{\displaystyle 1}
satisfazendo:
(
R
,
+
,
0
)
{\displaystyle (\mathbb {R} ,+,0)}
é um grupo comutativo, satisfazendo:
∀
x
,
y
,
z
∈
R
:
(
x
+
y
)
+
z
=
x
+
(
y
+
z
)
{\displaystyle \forall x,y,z\in \mathbb {R} :(x+y)+z=x+(y+z)}
(associatividade)
∀
x
,
y
∈
R
:
x
+
y
=
y
+
x
{\displaystyle \forall x,y\in \mathbb {R} :x+y=y+x}
(comutatividade)
∀
x
∈
R
:
x
+
0
=
x
{\displaystyle \forall x\in \mathbb {R} :x+0=x}
(identidade)
∀
x
∈
R
:
∃
y
∈
R
:
x
+
y
=
0
{\displaystyle \forall x\in \mathbb {R} :\exists y\in \mathbb {R} :x+y=0}
(inverso)
(
R
∖
{
0
}
,
×
,
1
)
{\displaystyle (\mathbb {R} \setminus \{0\},\times ,1)}
é um grupo comutativo, satisfazendo:
∀
x
,
y
,
z
∈
R
∖
{
0
}
:
(
x
×
y
)
×
z
=
x
×
(
y
×
z
)
{\displaystyle \forall x,y,z\in \mathbb {R} \setminus \{0\}:(x\times y)\times z=x\times (y\times z)}
(associatividade)
∀
x
,
y
∈
R
∖
{
0
}
:
x
×
y
=
y
×
x
{\displaystyle \forall x,y\in \mathbb {R} \setminus \{0\}:x\times y=y\times x}
(comutatividade)
∀
x
∈
R
∖
{
0
}
:
x
×
1
=
x
{\displaystyle \forall x\in \mathbb {R} \setminus \{0\}:x\times 1=x}
(identidade)
∀
x
∈
R
∖
{
0
}
:
∃
y
∈
R
∖
{
0
}
:
x
×
y
=
1
{\displaystyle \forall x\in \mathbb {R} \setminus \{0\}:\exists y\in \mathbb {R} \setminus \{0\}:x\times y=1}
(inverso)
∀
x
,
y
,
z
∈
R
:
x
×
(
y
+
z
)
=
(
x
×
y
)
+
(
x
×
z
)
{\displaystyle \forall x,y,z\in \mathbb {R} :x\times (y+z)=(x\times y)+(x\times z)}
(distributividade)
R
{\displaystyle \mathbb {R} }
é um conjunto totalmente ordenado. Por isto, exigimos uma relação (denotado por
≤
{\displaystyle \leq }
) satisfazendo:
∀
x
∈
R
:
x
≤
x
{\displaystyle \forall x\in \mathbb {R} :x\leq x}
(reflexividade)
∀
x
,
y
,
z
∈
R
:
(
x
≤
y
e
y
≤
z
)
⟹
x
≤
z
{\displaystyle \forall x,y,z\in \mathbb {R} :(x\leq y{\mbox{ e }}y\leq z)\implies x\leq z}
(transitividade)
∀
x
,
y
∈
R
:
(
x
≤
y
e
y
≤
x
)
⟹
x
=
y
{\displaystyle \forall x,y\in \mathbb {R} :(x\leq y{\mbox{ e }}y\leq x)\implies x=y}
(anti-simetria)
∀
x
,
y
∈
R
:
temos
(
x
≤
y
)
ou
(
y
≤
x
)
{\displaystyle \forall x,y\in \mathbb {R} :{\mbox{temos}}(x\leq y){\mbox{ ou }}(y\leq x)}
(totalidade)
R
{\displaystyle \mathbb {R} }
é um corpo ordenado se o conjunto
R
+
{\displaystyle \mathbb {R} ^{+}}
satisfaz as condições abaixo:
R
+
{\displaystyle \mathbb {R} ^{+}}
é fechado para a soma e para o produto
∀
x
,
y
∈
R
+
⇒
x
+
y
∈
R
+
{\displaystyle \forall x,y\in \mathbb {R} ^{+}\Rightarrow x+y\in \mathbb {R} ^{+}}
e
x
×
y
∈
R
+
{\displaystyle x\times y\in \mathbb {R} ^{+}}
;
Dado
x
∈
R
{\displaystyle x\in \mathbb {R} }
aplicamos a tricotomia:
x
=
0
{\displaystyle x=0}
ou
x
∈
R
+
{\displaystyle x\in \mathbb {R} ^{+}}
ou
−
x
∈
R
+
{\displaystyle -x\in \mathbb {R} ^{+}}
O Corpo com operações e ordem interagem de maneira esperada, satisfazendo:
∀
x
,
y
,
z
∈
R
:
x
≤
y
⟹
(
x
+
z
)
≤
(
y
+
z
)
{\displaystyle \forall x,y,z\in \mathbb {R} :x\leq y\implies (x+z)\leq (y+z)}
∀
x
,
y
,
z
∈
R
:
(
x
≤
y
e
0
≤
z
)
⟹
(
x
×
z
)
≤
(
y
×
z
)
{\displaystyle \forall x,y,z\in \mathbb {R} :(x\leq y{\mbox{ e }}0\leq z)\implies (x\times z)\leq (y\times z)}
Esta é uma grande lista, e se não for utilizado para os axiomas matemáticos (ou mesmo se você estiver!) pode parecer um pouco assustador, especialmente desde que ainda tenha dado detalhes do que significa perfeição. Esta é uma das mais longas lista de axiomas, em qualquer região da matemática, mas se você analisar uma de cada vez, você vai descobrir que todos eles estabelecem
coisas que você provavelmente já tomou conhecimento como "a forma como os números se comportam' sem um segundo pensamento.
Estes axiomas são tão exigentes que existe um sentido em que se especifiquem o número real precisamente. Em outras palavras
R
{\displaystyle \mathbb {R} }
é somente o corpo ordenado completo.
Tendo definido essas operações e relações nos
R
{\displaystyle \mathbb {R} }
, precisamos introduzir mais notações para melhor falar sobre elas. Esperamos que todas estas convenções devem ser familiares para você, mas é importante apresentar formalmente todas elas para evitar confusões na sequência de equívoco de notação:
Ao invés de escrever
×
{\displaystyle \times }
de multiplicação, podemos simplesmente denotá-la por justaposição. Em outras palavras, é escrever
x
y
{\displaystyle xy}
para denotar
x
×
y
{\displaystyle x\times y}
.
Uma vez que tanto multiplicação e a adição são associativas, omitiremos os desnecessários parênteses quando vários números são adicionados ou multiplicados. Em outras palavras, em vez de escrever
(
x
+
y
)
+
z
{\displaystyle (x+y)+z}
ou
x
+
(
y
+
z
)
{\displaystyle x+(y+z)}
, que são iguais, nós simplesmente escreveremos
x
+
y
+
z
{\displaystyle x+y+z}
para indicar seu valor comum.
Para colocar parênteses em uma expressão, por convenção, a multiplicação tem maior precedência que a adição. Assim, por exemplo, a expressão
x
+
y
z
{\displaystyle x+yz}
deve ser interpretada como
x
+
(
y
z
)
{\displaystyle x+(yz)}
, ao invés de
(
x
+
y
)
z
{\displaystyle (x+y)z}
.
O número
x
+
y
{\displaystyle x+y}
é chamado a soma de
x
{\displaystyle x}
e
y
{\displaystyle y}
.
O número
x
y
{\displaystyle xy}
é chamado o produto de
x
{\displaystyle x}
e
y
{\displaystyle y}
.
O inverso aditivo de
x
{\displaystyle x}
é escrito como
−
x
{\displaystyle -x}
, e chamado o negativo ou negativo de
x
{\displaystyle x}
. Então,
x
+
(
−
x
)
=
0
{\displaystyle x+(-x)=0}
.
O inverso multiplicativo de
x
{\displaystyle x}
é escrito como
x
−
1
{\displaystyle x^{-1}}
, e chamado o recíproco , ou simplesmente o inverso de
x
{\displaystyle x}
. Então,
x
(
x
−
1
)
=
1
{\displaystyle x(x^{-1})=1}
.
Definimos a operação binária de subtração como se segue:
∀
x
,
y
∈
R
{\displaystyle \forall x,y\in \mathbb {R} }
, definimos
x
−
y
=
x
+
(
−
y
)
{\displaystyle x-y=x+(-y)}
. O número
x
−
y
{\displaystyle x-y}
é chamado a diferença de
x
{\displaystyle x}
e
y
{\displaystyle y}
.
Subtração tem a mesma precedência que a adição (menos superior que a multiplicação), e quando as duas operações estão mixadas sem os parênteses, Esquerda-associatividade está implícita. Por exemplo,
a
+
b
−
c
−
d
+
e
{\displaystyle a+b-c-d+e}
deverá ser interpretada como
(
(
(
a
+
b
)
−
c
)
−
d
)
+
e
{\displaystyle (((a+b)-c)-d)+e}
.
Definimos a operação binária de divisão como se segue:
∀
x
,
y
∈
R
{\displaystyle \forall x,y\in \mathbb {R} }
, com
y
≠
0
{\displaystyle y\not =0}
, definimos
x
/
y
=
x
(
y
−
1
)
{\displaystyle x/y=x(y^{-1})}
. O número
x
/
y
{\displaystyle x/y}
é chamado o quociente de
x
{\displaystyle x}
e
y
{\displaystyle y}
, e também é denotado
x
y
{\displaystyle {\frac {x}{y}}}
.
A divisão tem uma precedência bastante superior que da adição ou subtração, mas não existe uma simples convenção sobre como deve ser mixado a multiplicação e a divisão. Usando a notação
x
y
{\displaystyle {\frac {x}{y}}}
, em vez da notação
x
/
y
{\displaystyle x/y}
contribui para evitar confusões.
Definimos a operação binária de exponenciação como se segue:
∀
x
∈
R
{\displaystyle \forall x\in \mathbb {R} }
e
n
∈
N
0
{\displaystyle n\in \mathbb {N} _{0}}
, definimos
x
n
{\displaystyle x^{n}}
Recursivamente por
x
0
=
1
{\displaystyle x^{0}=1}
e
x
n
+
1
=
(
x
n
)
x
{\displaystyle x^{n+1}=(x^{n})x}
. Então para
n
∈
Z
{\displaystyle n\in \mathbb {Z} }
, com
n
<
0
{\displaystyle n<0}
, definimos
x
n
=
(
x
−
1
)
−
n
{\displaystyle x^{n}=(x^{-1})^{-n}}
.
A exponenciação têm uma precedência bastante superior que qualquer de divisão, multiplicação, adição e subtração. Por exemplo,
a
b
2
+
d
3
{\displaystyle ab^{2}+d^{3}}
deverá ser interpretado como
(
a
(
b
2
)
)
+
(
d
3
)
{\displaystyle (a(b^{2}))+(d^{3})}
.
Escrevemos
x
≥
y
{\displaystyle x\geq y}
para significar que
y
≤
x
{\displaystyle y\leq x}
.
Escrevemos
x
<
y
{\displaystyle x<y}
para significar que
x
≤
y
{\displaystyle x\leq y}
e
x
≠
y
{\displaystyle x\not =y}
.
Escrevemos
x
>
y
{\displaystyle x>y}
para significar que
y
<
x
{\displaystyle y<x}
.
Para abreviar uma coleção de equações ou inequações, podem ser contribuídos juntos. Por exemplo, a expressão
a
≤
b
=
c
=
d
<
e
{\displaystyle a\leq b=c=d<e}
deverá ser interpretada como
a
≤
b
{\displaystyle a\leq b}
e
b
=
c
{\displaystyle b=c}
e
c
=
d
{\displaystyle c=d}
e
d
<
e
{\displaystyle d<e}
.
Dizemos que
x
{\displaystyle x}
é positivo significando
x
>
0
{\displaystyle x>0}
.
Dizemos que
x
{\displaystyle x}
é negativo significando
x
<
0
{\displaystyle x<0}
.
Dizemos que
x
{\displaystyle x}
é não-positivo significando
x
≤
0
{\displaystyle x\leq 0}
.
Dizemos que
x
{\displaystyle x}
é não-negativo significando
x
≥
0
{\displaystyle x\geq 0}
.
Também introduzimos a notação comum para diversas variedades de subconjuntos dos
R
{\displaystyle \mathbb {R} }
. Todos estes subconjuntos são chamados intervalos :
[
a
,
b
]
=
{
x
∈
R
:
a
≤
x
≤
b
}
{\displaystyle [a,b]=\{x\in \mathbb {R} :a\leq x\leq b\}}
(chamado de intervalo fechado de
a
{\displaystyle a}
até
b
{\displaystyle b}
).
(
a
,
b
)
=
{
x
∈
R
:
a
<
x
<
b
}
{\displaystyle (a,b)=\{x\in \mathbb {R} :a<x<b\}}
(chamado de intervalo aberto de
a
{\displaystyle a}
até
b
{\displaystyle b}
)
[
a
,
b
)
=
{
x
∈
R
:
a
≤
x
<
b
}
{\displaystyle [a,b)=\{x\in \mathbb {R} :a\leq x<b\}}
(
a
,
b
]
=
{
x
∈
R
:
a
<
x
≤
b
}
{\displaystyle (a,b]=\{x\in \mathbb {R} :a<x\leq b\}}
[
a
,
a
]
=
{
x
∈
R
:
a
≤
x
≤
a
}
{\displaystyle [a,a]=\{x\in \mathbb {R} :a\leq x\leq a\}}
chamado de intervalo degenerado, pois o único elemento do conjunto é o próprio a
Em todos casos,
a
{\displaystyle a}
é chamado o limite inferior do intervalo, e
b
{\displaystyle b}
é chamado de limite superior .
Uma exclusão do limite inferior (nos casos 2 e 4) podem ser substituídos por
−
∞
{\displaystyle -\infty }
para indicar que não existe restrição inferior. Por exemplo
(
−
∞
,
b
]
=
{
x
∈
R
:
x
≤
b
}
{\displaystyle (-\infty ,b]=\{x\in \mathbb {R} :x\leq b\}}
.
Similarmente, uma exclusão do limite superior (nos casos 2 e 3) podem ser substituídos por
∞
{\displaystyle \infty }
. Por exemplo,
(
−
∞
,
∞
)
=
R
{\displaystyle (-\infty ,\infty )=\mathbb {R} }
.
Alguns intervalos específicos que aparecem frequentemente são os intervalos unitários fechados , ou seja intervalos unitários , que é
[
0
,
1
]
{\displaystyle [0,1]}
, e
R
+
=
(
0
,
∞
)
{\displaystyle {\mathbb {R} }^{+}=(0,\infty )}
, os números reais positivos .
Todo corpo ordenado é infinito e têm "característica zero", ou seja,
1
+
1
+
⋯
+
1
⏟
q
u
a
n
t
a
s
−
v
e
z
e
s
−
q
u
i
s
e
r
m
o
s
≠
0
{\displaystyle {\begin{matrix}\underbrace {1+1+\cdots +1} \\quantas-vezes-quisermos\end{matrix}}\not =0}
Sejam x,a elementos de um corpo ordenado
R
{\displaystyle \mathbb {R} }
. As seguintes afirmações são equivalentes:
−
a
≤
x
≤
a
{\displaystyle -a\leq x\leq a}
;
x
≤
a
{\displaystyle x\leq a}
e
−
x
≤
a
{\displaystyle -x\leq a}
;
|
x
|
≤
a
{\displaystyle |x|\leq a}
;
Dados
a
,
b
,
x
∈
R
{\displaystyle a,b,x\in \mathbb {R} }
tem-se
|
x
−
a
|
≤
b
⇔
a
−
b
≤
x
≤
a
+
b
{\displaystyle |x-a|\leq b\Leftrightarrow a-b\leq x\leq a+b}
x
∈
(
a
−
ϵ
,
a
+
ϵ
)
⇔
a
−
ϵ
<
x
<
a
+
ϵ
⇔
|
x
−
a
|
<
ϵ
{\displaystyle x\in (a-\epsilon ,a+\epsilon )\Leftrightarrow a-\epsilon <x<a+\epsilon \Leftrightarrow |x-a|<\epsilon }
∀
x
,
y
,
z
∈
R
{\displaystyle \forall x,y,z\in \mathbb {R} }
temos
‖
x
+
y
‖
≤
‖
x
‖
+
‖
y
‖
{\displaystyle \|x+y\|\leq \|x\|+\|y\|}
;
‖
x
y
|
=
‖
x
‖
‖
y
‖
{\displaystyle \|xy|=\|x\|\|y\|}
‖
x
‖
−
‖
y
‖
≤
|
‖
x
‖
−
‖
y
‖
|
≤
‖
x
−
y
‖
{\displaystyle \|x\|-\|y\|\leq |\|x\|-\|y\||\leq \|x-y\|}
‖
x
−
z
‖
≤
‖
x
−
y
‖
+
‖
y
−
z
‖
{\displaystyle \|x-z\|\leq \|x-y\|+\|y-z\|}
.
.
b)
‖
x
‖
=
‖
x
−
y
+
y
‖
≤
‖
x
−
y
‖
+
‖
y
‖
⇒
‖
x
‖
−
‖
y
‖
≤
‖
x
−
y
‖
{\displaystyle \|x\|=\|x-y+y\|\leq \|x-y\|+\|y\|\Rightarrow \|x\|-\|y\|\leq \|x-y\|}
e
‖
y
‖
=
‖
y
−
x
+
x
‖
≤
‖
y
−
x
‖
+
‖
x
‖
⇒
‖
x
‖
−
‖
y
‖
≥
−
‖
x
−
y
‖
{\displaystyle \|y\|=\|y-x+x\|\leq \|y-x\|+\|x\|\Rightarrow \|x\|-\|y\|\geq -\|x-y\|}
, logo
|
‖
x
‖
−
‖
y
‖
|
≤
‖
x
−
y
‖
{\displaystyle |\|x\|-\|y\||\leq \|x-y\|}
.
Neste ponto, há um grande número de resultados muito simples que podemos deduzir sobre estas operações a partir dos axiomas. Algumas destas são definidas e outras delas têm provas. As restantes provas devem ser considerados exercícios de manipular axiomas. O objetivo destes resultados é que nos permitam efetuar qualquer manipulação, que pensamos é "obviamente verdade", devido à nossa experiência de trabalhar com números. Salvo quantificados, o seguinte deveria realizar para todos.
0
{\displaystyle 0}
é a única identidade aditiva.
Prova: Suponha que
x
{\displaystyle x}
é uma identidade aditiva, então
x
=
x
+
0
=
0
{\displaystyle x=x+0=0}
.
◻
{\displaystyle \Box }
1
{\displaystyle 1}
é a única identidade multiplicativa.
Ambas inversas aditivas e multiplicativas são únicas. Mais formamente: Se ambos
x
+
y
=
0
{\displaystyle x+y=0}
e
x
+
z
=
0
{\displaystyle x+z=0}
então
y
=
z
{\displaystyle y=z}
; e se ambos
x
y
=
1
{\displaystyle xy=1}
e
x
z
=
1
{\displaystyle xz=1}
então
y
=
z
{\displaystyle y=z}
(De modo que a notação
−
x
{\displaystyle -x}
e
x
−
1
{\displaystyle x^{-1}}
fazem sentido).
Prova: Para o caso de adição: Temos
x
+
y
=
0
{\displaystyle x+y=0}
e
x
+
z
=
0
{\displaystyle x+z=0}
, de modo que acrescentando
y
{\displaystyle y}
a esta última equação, temos
(
x
+
z
)
+
y
=
0
+
y
{\displaystyle (x+z)+y=0+y}
, mas, em seguida, por comutatividade e associatividade deduzimos que
(
x
+
y
)
+
z
=
0
+
y
{\displaystyle (x+y)+z=0+y}
, E por outro lado pressupomos que
0
+
z
=
y
+
0
{\displaystyle 0+z=y+0}
e, em seguida, pela identidade do outro lado
z
=
y
{\displaystyle z=y}
.
◻
{\displaystyle \Box }
−
(
−
x
)
=
x
{\displaystyle -(-x)=x}
∀
x
∈
R
∖
{
0
}
:
(
x
−
1
)
−
1
=
x
{\displaystyle \forall x\in \mathbb {R} \setminus \{0\}:(x^{-1})^{-1}=x}
0
×
x
=
0
{\displaystyle 0\times x=0}
0
{\displaystyle 0}
não têm inverso multiplicativo (pois divisão por
0
{\displaystyle 0}
não faz sentido)
∀
n
,
m
∈
Z
:
x
n
x
m
=
x
n
+
m
{\displaystyle \forall n,m\in \mathbb {Z} :x^{n}x^{m}=x^{n+m}}
∀
n
,
m
∈
Z
:
(
x
n
)
m
=
x
n
m
{\displaystyle \forall n,m\in \mathbb {Z} :(x^{n})^{m}=x^{nm}}
x
>
y
⟺
¬
x
≤
y
{\displaystyle x>y\iff \neg x\leq y}
(Aqui
¬
{\displaystyle \neg }
é a negação da lógica, então
¬
x
≤
y
{\displaystyle \neg x\leq y}
(Significa que "não é o caso que
x
≤
y
{\displaystyle x\leq y}
".)
Prova: Primeiro consideramos as implicações
⟹
{\displaystyle \implies }
. Supomos
x
>
y
{\displaystyle x>y}
. Por definição, isto significa que
x
≠
y
{\displaystyle x\not =y}
e
y
<
x
{\displaystyle y<x}
. Se fosse verdade que
x
≤
y
{\displaystyle x\leq y}
então pela anti-simetria teríamos
x
=
y
{\displaystyle x=y}
, o que é impossivel. Logo
¬
x
≤
y
{\displaystyle \neg x\leq y}
.
Inversamente, suponha que
¬
x
≤
y
{\displaystyle \neg x\leq y}
. Primeiro, se tivéssemos
x
=
y
{\displaystyle x=y}
, em seguida, por reflexividade
x
≤
y
{\displaystyle x\leq y}
, o que é impossível, por isso, na realidade
x
≠
y
{\displaystyle x\not =y}
. Em segundo lugar, pela totalidade deduzimos que
y
≤
x
{\displaystyle y\leq x}
. Estas duas condições são exatamente aqueles exigidos para
x
>
y
{\displaystyle x>y}
.
◻
{\displaystyle \Box }
x
<
y
⟺
¬
x
≥
y
{\displaystyle x<y\iff \neg x\geq y}
x
{\displaystyle x}
é um não-positivo se e somente se
x
{\displaystyle x}
é um não positivo
x
{\displaystyle x}
é um não-negativo se e somente se
x
{\displaystyle x}
é um não negativo
Se
x
{\displaystyle x}
é ambos não-positivo e não-negativo então
x
=
0
{\displaystyle x=0}
x
{\displaystyle x}
é ambos não positivo e negativo
x
≥
0
⟺
−
x
≤
0
{\displaystyle x\geq 0\iff -x\leq 0}
Prova: Suponha
x
≥
0
{\displaystyle x\geq 0}
. Por um dos axiomas chegamos que
x
+
(
−
x
)
≥
0
+
(
−
x
)
{\displaystyle x+(-x)\geq 0+(-x)}
. Pelo inverso aditivo dá
0
≥
0
+
(
−
x
)
{\displaystyle 0\geq 0+(-x)}
e, em seguida, pela identidade aditiva
0
≥
−
x
{\displaystyle 0\geq -x}
, como exigido.
A implicação converge que sigamos similarmente.
◻
{\displaystyle \Box }
(
x
≤
y
e
z
≤
0
)
⟹
x
z
≥
y
z
{\displaystyle (x\leq y{\mbox{ e }}z\leq 0)\implies xz\geq yz}
∀
x
∈
R
:
x
2
≥
0
{\displaystyle \forall x\in \mathbb {R} :x^{2}\geq 0}
Prova: Por totalidade da ordem, temos que
x
≥
0
{\displaystyle x\geq 0}
ou
x
≤
0
{\displaystyle x\leq 0}
. No primeiro caso podemos aplicar os axiomas que ligam a ordem de multiplicação diretamente para
0
≤
x
{\displaystyle 0\leq x}
e deduzimos que
0
≤
x
2
{\displaystyle 0\leq x^{2}}
. Neste último caso, se aplicar o último resultado desta lista para
0
≤
x
{\displaystyle 0\leq x}
e obtemos
x
2
≥
0
{\displaystyle x^{2}\geq 0}
.
◻
{\displaystyle \Box }
1
>
0
{\displaystyle 1>0}
e
−
1
<
0
{\displaystyle -1<0}
Embora possa ser dito que a totalidade deste livro é dedicada aos estudos de aplicações de completude, em particular, existem algumas aplicações simples que podemos dar facilmente quais fornecem uma indicação quanto ao modo como a completude resolve os problemas com os reais descritos acima.
Seja
x
∈
R
{\displaystyle x\in \mathbb {R} }
é não-negativo. Então
x
{\displaystyle x}
têm uma única raíz quadrada não-negativa, denotado
x
{\displaystyle {\sqrt {x}}}
, que satisfaz
(
x
)
2
=
x
{\displaystyle ({\sqrt {x}})^{2}=x}
.
Tratamos apenas com o caso
x
≥
1
{\displaystyle x\geq 1}
. O caso
x
∈
[
0
,
1
)
{\displaystyle x\in [0,1)}
é deixado como exercício .
Primeiro, notamos que quando
y
,
z
∈
R
{\displaystyle y,z\in \mathbb {R} }
são não-negativos,
y
<
z
⟹
y
2
<
z
2
{\displaystyle y<z\implies y^{2}<z^{2}}
(Na terminologia iremos Introduzir mais tarde, dizendo que a função
y
↦
y
2
{\displaystyle y\mapsto y^{2}}
é estritamente crescente). Isso deixa claro que só pode haver uma raiz quadrada de
x
{\displaystyle x}
, e assim ele continua a encontrar um.
Seja
S
=
{
y
∈
R
:
y
2
≤
x
}
{\displaystyle S=\{y\in \mathbb {R} :y^{2}\leq x\}}
. Pretendemos aplicar o axioma do menor das cotas superiores para
S
{\displaystyle S}
, por isso temos de mostrar que é não-vazio e limitada superiormente.
Este
S
{\displaystyle S}
é não-vazio é claro, desde que
1
∈
S
{\displaystyle 1\in S}
.
Além disso,
x
{\displaystyle x}
por si só é uma cota superior para
S
{\displaystyle S}
, uma vez que se
y
>
x
≥
1
{\displaystyle y>x\geq 1}
, então
y
2
>
y
{\displaystyle y^{2}>y}
, de modo que
y
2
>
x
{\displaystyle y^{2}>x}
, e portanto
y
∉
S
{\displaystyle y\not \in S}
.
Colocando estes fatos juntos, pelo axioma do menor da costas superiores, deduzimos que
S
{\displaystyle S}
tem o menor das cotas superiores, ao qual chamamos
s
{\displaystyle s}
. Queremos mostrar que
s
{\displaystyle s}
é a raiz quadrada de
x
{\displaystyle x}
que queremos.
Certamente
s
{\displaystyle s}
é positivo, uma vez que
1
∈
S
{\displaystyle 1\in S}
e assim
s
≥
1
{\displaystyle s\geq 1}
. Em particular, podemos dividir por
s
{\displaystyle s}
.
Para mostrar que
s
2
=
x
{\displaystyle s^{2}=x}
, eliminamos as possibilidades que
s
2
>
x
{\displaystyle s^{2}>x}
, e que
s
2
<
x
{\displaystyle s^{2}<x}
.
Suponha que
s
2
>
x
{\displaystyle s^{2}>x}
. Seja
t
=
s
−
s
2
−
x
2
s
{\displaystyle t=s-{\frac {s^{2}-x}{2s}}}
. Então:
t
2
=
s
2
−
(
s
2
−
x
)
+
(
s
2
−
x
)
2
4
s
2
=
x
+
(
s
2
−
x
)
2
4
s
2
>
x
{\displaystyle t^{2}=s^{2}-(s^{2}-x)+{\frac {(s^{2}-x)^{2}}{4s^{2}}}=x+{\frac {(s^{2}-x)^{2}}{4s^{2}}}>x}
Então
t
{\displaystyle t}
é na verdade uma cota superior para
S
{\displaystyle S}
, mas isso é impossível, uma vez que
t
<
s
{\displaystyle t<s}
e
s
{\displaystyle s}
é a menor das cotas superiores para
S
{\displaystyle S}
.
Assim concluímos que
s
2
≤
x
{\displaystyle s^{2}\leq x}
.
Agora suponha que
s
2
<
x
{\displaystyle s^{2}<x}
. Seja
t
=
s
+
x
−
s
2
2
s
{\displaystyle t=s+{\frac {x-s^{2}}{2s}}}
. De maneira similar ao de acima, deduzimos que
t
2
<
x
{\displaystyle t^{2}<x}
, de modo
t
∈
S
{\displaystyle t\in S}
, mas isso é impossível uma vez que
t
>
s
{\displaystyle t>s}
e
s
{\displaystyle s}
é uma cota superior para
S
{\displaystyle S}
.
Assim concluímos que
s
2
≥
x
{\displaystyle s^{2}\geq x}
, e assim
s
2
=
x
{\displaystyle s^{2}=x}
, conforme exigido.
◻
{\displaystyle \Box }
Este argumento pode parecer excessivamente complexo (especialmente porque alguns detalhes são deixados como exercícios) e, na verdade, há um sentido no qual ele é, e desejamos ter a possibilidade de apresentar um argumento muito esmerador mais tarde. No entanto, não é suficiente para mostrar que nós podemos encontrar uma raiz quadrada de 2, e assim evitar o problema imediato com os racionais colocados no início desta seção. Para mostrar que não mais construção elaborada dará origem ao mesmo problema terá que esperar até que chegar o estudo de continuidade .
Se x é um real positivo e y um real qualquer, então existe um natural n tal que nx > y
Exemplo:
a)
∀
x
∈
R
:
∃
n
∈
N
:
n
>
x
{\displaystyle \forall x\in \mathbb {R} :\exists n\in \mathbb {N} :n>x}
b)
∀
x
∈
R
+
:
∃
n
∈
N
:
1
n
<
x
{\displaystyle \forall x\in \mathbb {R} ^{+}:\exists n\in \mathbb {N} :{\frac {1}{n}}<x}
a) Suponha que a afirmação não é verdadeira, então temos a negação, ao qual se afirma:
∃
x
∈
R
;
∀
n
∈
N
o
n
d
e
n
≤
x
{\displaystyle \exists \;x\in \mathbb {R} ;\forall \;n\in \mathbb {N} \;onde\;n\leq x}
Mas essa é, precisamente, a afirmação de que
N
{\displaystyle \mathbb {N} }
é limitada superiormente. Certamente, ele é não-vazio, para que possamos aplicar o axioma da completude, obtendo o menor das cotas superiores para
N
{\displaystyle \mathbb {N} }
. A este menor das cotas superiores chamamos
l
{\displaystyle l\;}
.
Uma vez que
l
{\displaystyle l\;}
é o menor das cotas superiores, sabemos que
l
−
1
{\displaystyle l-1\;}
não é uma cota superior e, assim,
∃
n
∈
N
;
n
>
l
−
1
{\displaystyle \exists \;n\in \mathbb {N} ;n>l-1}
. Mas então,
n
+
1
>
l
:
{\displaystyle n+1>l:}
, e
n
+
1
∈
N
{\displaystyle n+1\in \mathbb {N} }
logo chegamos a uma contradição: que
l
{\displaystyle l\;}
não é uma cota superior para
N
{\displaystyle \mathbb {N} }
depois de tudo.
Assim, a nossa suposição era falsa, e (a) está provado.
b)Tome
x
∈
R
+
{\displaystyle x\in \mathbb {R} ^{+}}
. Certamente
x
≠
0
{\displaystyle x\not =0}
, para que possamos inverter
x
{\displaystyle x\;}
obteremos
x
−
1
∈
R
+
{\displaystyle x^{-1}\in \mathbb {R} ^{+}}
. Aplicando parte (a)
x
−
1
{\displaystyle x^{-1}\;}
, podemos encontrar
n
∈
N
{\displaystyle n\in \mathbb {N} }
com
n
>
x
−
1
{\displaystyle n>x^{-1}\;}
e, em seguida, invertendo esta desigualdade, deduzindo
1
n
<
x
{\displaystyle {\frac {1}{n}}<x}
, conforme exigido.
◻
{\displaystyle \Box }
Num corpo ordenado T. Seja
a
,
b
∈
T
,
a
>
0
{\displaystyle a,b\in T,a>0}
, as seguintes afirmações são equivalentes:
N
⊂
T
{\displaystyle \mathbb {N} \subset T}
, então T é ilimitado superiormente
∃
n
∈
N
{\displaystyle \exists n\in \mathbb {N} }
tal que
n
⋅
a
>
b
{\displaystyle n\cdot a>b}
;
∃
n
∈
N
{\displaystyle \exists n\in \mathbb {N} }
tal que
0
<
1
n
<
a
{\displaystyle 0<{1 \over n}<a}
Definição 1 - Se num corpo ordenado K é valido as afirmações do teorema acima, ele é chamado Corpo Ordenado Arquimediano
Definição 2 - Um Corpo Ordenado K é completo quando todo subconjunto não-vazio
X
⊂
K
{\displaystyle X\subset K}
que for limitado superiormente, possui supremo em K
Um conjunto
X
{\displaystyle X\;}
é chamado denso em
R
{\displaystyle \mathbb {R} }
quando todo intervalo aberto
(
a
,
b
)
⊂
R
{\displaystyle (a,b)\subset \mathbb {R} }
, possui algum ponto de
X
{\displaystyle X\;}
. Ou seja,
∀
a
,
b
∈
R
{\displaystyle \forall a,b\in \mathbb {R} }
com
a
<
b
,
∃
x
∈
X
{\displaystyle a<b,\;\exists x\in X}
tal que
a
<
x
<
b
{\displaystyle a<x<b\;}
numa linguagem mais formal:
S
e
j
a
X
⊂
R
.
S
e
(
a
,
b
)
∩
X
≠
∅
,
∀
a
,
b
∈
R
{\displaystyle Seja\;X\subset \mathbb {R} .\;Se\;(a,b)\cap X\neq \varnothing ,\;\forall \;a,b\in \mathbb {R} }
, então
X
{\displaystyle X\;}
é
d
e
n
s
o
e
m
R
{\displaystyle denso\;em\;\mathbb {R} }
Se
x
<
y
{\displaystyle x<y\;}
então
(
x
,
y
)
{\displaystyle (x,y)\;}
contêm ambos um números racional e um número irracional.
Para encontrar um racional em
(
x
,
y
)
{\displaystyle (x,y)\;}
, que se aplica o axioma de Arquimedes (b) para
y
−
x
,
∃
n
∈
N
{\displaystyle y-x,\exists n\in \mathbb {N} }
tal que
1
n
<
y
−
x
{\displaystyle {\frac {1}{n}}<y-x}
. Assim
1
<
y
n
−
x
n
{\displaystyle 1<yn-xn\;}
, de modo que
x
n
<
y
n
−
1
{\displaystyle xn<yn-1\;}
.
Aplicando o axioma de arquimedes (a) para
y
+
1
{\displaystyle y+1\;}
teremos um
N
∈
N
{\displaystyle N\in \mathbb {N} }
satisfazendo
N
>
y
n
+
2
{\displaystyle N>yn+2\;}
.
Agora escolha o menor
m
∈
N
{\displaystyle m\in \mathbb {N} }
satisfazendo
N
−
m
<
y
n
{\displaystyle N-m<yn\;}
. Pelo de cima,
m
≥
2
{\displaystyle m\geq 2}
, e então, uma vez que
m
{\displaystyle m\;}
é minimo, sabemos que:
N
−
(
m
−
1
)
≥
y
n
{\displaystyle N-(m-1)\geq yn}
N
−
m
≥
y
n
−
1
{\displaystyle N-m\geq yn-1}
Colocando este juntamente com o fato que
x
n
<
y
n
−
1
{\displaystyle xn<yn-1\;}
deduzido do acima, temos:
N
−
m
>
x
n
{\displaystyle N-m>xn\;}
Assim, em resumo, temos
y
n
>
N
−
m
>
x
n
{\displaystyle yn>N-m>xn\;}
, de modo que
y
>
N
−
m
n
>
x
{\displaystyle y>{\frac {N-m}{n}}>x}
, e temos encontrado o número racional que queremos .
Para encontrar um número irracional, usaremos o que acabamos de deduzir do primeiro racional encontrado
q
∈
(
x
+
2
,
y
+
2
)
{\displaystyle q\in (x+{\sqrt {2}},y+{\sqrt {2}})}
, de modo que
q
−
2
∈
(
x
,
y
)
{\displaystyle q-{\sqrt {2}}\in (x,y)}
. Além disso,
q
−
2
{\displaystyle q-{\sqrt {2}}}
deve ser irracional, pois se ele for um racional, então teríamos também
q
−
(
q
−
2
)
=
2
{\displaystyle q-(q-{\sqrt {2}})={\sqrt {2}}}
racional, e sabemos que ele não é.
◻
{\displaystyle \Box }
Seja
A
⊂
Q
{\displaystyle A\subset \mathbb {Q} }
; A é um corte se, e somente se
a) contem algum racional e todos os racionais anterior a esse, ou seja, se
m
∈
A
,
n
<
m
⇒
n
∈
A
{\displaystyle m\in A,n<m\Rightarrow n\in A}
b) A não contém um racional como maior de todos, isto é, seja
A
=
{
n
∈
Q
∣
n
<
m
}
{\displaystyle A=\{n\in \mathbb {Q} \mid n<m\}}
se m for racional, como m < m é absurdo, temos que não existe um racional maior do que todos e que esteja em A
Seja
A
=
{
n
∈
Q
;
n
<
m
}
{\displaystyle A=\{n\in \mathbb {Q} ;n<m\}}
; Se
n
∈
A
{\displaystyle n\in A}
temos que
n
<
m
{\displaystyle n<m}
e
t
∉
A
⇒
m
<
t
{\displaystyle t\not \in A\Rightarrow m<t}
, então
n
<
m
<
t
{\displaystyle n<m<t\;}
A,B são cortes racionais; A=B, se e somente se, possuem os mesmos elementos. Como
A
=
{
n
1
∈
Q
∣
n
1
<
m
1
}
{\displaystyle A=\{n_{1}\in \mathbb {Q} \mid n_{1}<m_{1}\}}
,
B
=
{
n
2
∈
Q
∣
n
2
<
m
2
}
,
{\displaystyle B=\{n_{2}\in \mathbb {Q} \mid n_{2}<m_{2}\},}
tenos que
m
1
<
m
2
{\displaystyle m_{1}<m_{2}}
. Se não fosse assim, teríamos elementos de um que não está em outro.
{\displaystyle \;}
Os números racionais
Q
{\displaystyle \mathbb {Q} }
satisfazem todos os axiomas de Corpo Arquimediano, detalhadas no capítulo anterior. Por isso, se quisermos justificar a necessidade dos números reais então claramente precisamos de algo a mais. Este "algo mais" é a completude . Existem várias maneiras equivalentes de descrever essa completude, mas a maioria deles exige de nós conhecer um pouco sobre sequências , que nós não introduziremos até o próximo capítulo, portanto, de momento, só podemos dar uma definição.
Intuitivamente, é fácil ver que
Q
{\displaystyle \mathbb {Q} }
tem "buracos", por exemplo, podemos dividir
Q
{\displaystyle \mathbb {Q} }
em duas partes, a primeira formada pelos números que são negativos ou cujo quadrado é menor que 2, e a segunda formada pelos números positivos cujo quadrado é maior que 2. Como a raiz quadrada de dois não é um número racional, vemos que esta divisão de
Q
{\displaystyle \mathbb {Q} }
foi feita de forma que todos os números da primeira metade são menores que todos os números da segunda metade, mas não ficou nenhum número separando as duas.
Se lembrarmos dos axiomas da geometria, um deles diz que "um ponto divide uma reta em duas partes". Podemos pegar este axioma e virá-lo ao avesso, ou seja, "se uma reta está dividida em duas partes, então tem um ponto separando as duas". Note que
Q
{\displaystyle \mathbb {Q} }
pode ser dividido em duas partes sem que haja um "ponto" (um número racional) no meio.
Em
R
{\displaystyle \mathbb {R} }
, sempre que for feita uma divisão em duas partes, de modo que todos os números da primeira parte sejam menores que os números da segunda parte, então tem que existir um número real no meio, separando as duas partes; este número pertence ou à primeira parte, ou à segunda.
Seja
A
⊆
R
.
{\displaystyle A\subseteq \mathbb {R} .}
Dizemos
b
∈
R
{\displaystyle b\in \mathbb {R} }
é uma cota superior para
A
{\displaystyle A}
se
∀
s
∈
A
:
s
≤
b
{\displaystyle \forall s\in A:s\leq b}
Por exemplo,
3
{\displaystyle 3}
é uma cota superior para
[
0
,
1
]
,
{\displaystyle [0,1],}
assim como
1
,
{\displaystyle 1,}
mas
1
2
{\displaystyle {\frac {1}{2}}}
não é, porque
1
∈
[
0
,
1
]
{\displaystyle 1\in [0,1]}
e
1
>
1
2
.
{\displaystyle 1>{\frac {1}{2}}.}
Um conjunto com uma cota superior
b
{\displaystyle b}
é dito ser limitado superiormente por
b
{\displaystyle b}
.
Dizemos que
s
{\displaystyle s}
é o extremo superior ou supremo de
A
{\displaystyle A}
se
s
{\displaystyle s}
é a menor das cotas superiores de
A
,
{\displaystyle A,}
e
b
{\displaystyle b}
é qualquer extremo superior para
A
{\displaystyle A}
então
s
≤
b
.
{\displaystyle s\leq b.}
Mais formalmente:
(
∀
a
∈
A
:
a
≤
s
)
e
(
∀
b
∈
R
:
(
(
∀
a
∈
A
:
a
≤
b
)
⟹
(
s
≤
b
)
)
)
{\displaystyle (\forall a\in A:a\leq s){\mbox{ e }}(\forall b\in \mathbb {R} :((\forall a\in A:a\leq b)\implies (s\leq b)))}
Do mesmo modo, dizemos que
b
∈
R
{\displaystyle b\in \mathbb {R} }
é cota inferior para
A
{\displaystyle A}
se
∀
a
∈
A
:
a
≥
b
{\displaystyle \forall a\in A:a\geq b}
E dizemos que
i
{\displaystyle i}
é a maior das cotas inferiores ou ínfimo de
A
{\displaystyle A}
se:
(
∀
a
∈
A
:
a
≥
i
)
e
(
∀
b
∈
R
:
(
(
∀
a
∈
A
:
a
≥
b
)
⟹
(
i
≥
b
)
)
)
{\displaystyle (\forall a\in A:a\geq i){\mbox{ e }}(\forall b\in \mathbb {R} :((\forall a\in A:a\geq b)\implies (i\geq b)))}
É fácil ver que o supremo (ou ínfimo ), se existem, devem ser únicos. Se existem, o supremo e ínfimo de um conjunto
A
{\displaystyle A}
são indicadas
sup
A
{\displaystyle \sup A}
e
inf
A
{\displaystyle \inf A}
respectivamente.
Agora estamos finalmente prontos para indicar o último axioma, que é de completude:
Se
S
⊆
R
{\displaystyle S\subseteq \mathbb {R} }
é não-vazio e tem uma cota superior, então
S
{\displaystyle S}
tem o menor das cotas superiores.
Se
S
⊆
R
{\displaystyle S\subseteq \mathbb {R} }
é não-vazio e tem uma cota inferior, então
S
{\displaystyle S}
tem a maior das cotas inferiores.
É de salientar, neste ponto, a fim de evitar possíveis confusões que, geralmente, nos estudo dos conjuntos ordenados, a definição de completude, é que cada subconjunto tem a menor cota superior, e não há qualquer condição de que seja não-vazio ou limitado superiormente.
No entanto, nós, realmente, desejamos impor estas duas condições neste caso.
Podemos também trocar têm uma cota superior por é limitado superiormente e têm uma cota inferior por é limitado inferiormente .
Existem outros maneiras equivalentes de definir o axioma completude, mas envolvem sequências , então devemos falar sobre elas depois de discutido esse tema. Por causa da existência dessas outras formas, esse axioma é algumas vezes chamado de axioma do menor das cotas superiores .
O significade de completeness: é um axioma relacionado com supremo e ínfimo. Que busca uma 'completude' nesses conceitos.
Nós estaremos fazendo muito trabalho com a Menor das cotas superiores , por isso será importante saber como usá-los de forma eficiente nas provas. Aqui estão algumas definições e propriedades que são úteis a este respeito:
Todo conjunto não vazio que é limitado superiormente têm um único menor das cotas superiores , ou supremo (dito
sup
S
{\displaystyle \sup S}
).
Sejam
a
{\displaystyle a}
e
b
{\displaystyle b}
duas menores cotas superiores de um conjunto
S
.
{\displaystyle S.}
Se
a
>
b
,
{\displaystyle a>b,}
então
b
{\displaystyle b}
é uma cota superior para
S
,
{\displaystyle S,}
a
{\displaystyle a}
não pode ser a menor das cotas superiores. Assim
a
≤
b
.
{\displaystyle a\leq b.}
Similarmente,
a
≥
b
.
{\displaystyle a\geq b.}
Assim
a
=
b
,
{\displaystyle a=b,}
então
S
{\displaystyle S}
pode ter somente uma menor das cotas superiores.
Todo conjunto não vazio S que é limitado inferiormente têm um único maior das cotas inferiores , ou ínfimo (dito
inf
S
{\displaystyle \inf S}
).
Seja S não-vazio e limitado inferiormente. Seja
T
:=
{
−
x
:
x
∈
S
}
.
{\displaystyle T:=\{-x:x\in S\}.}
Como S é não-vazio,
∃
x
∈
S
.
{\displaystyle \exists x\in S.}
Assim
−
x
∈
T
,
{\displaystyle -x\in T,}
então T é não-vazio.
Como S é limitado inferiormente,
∃
M
:
∀
x
∈
S
:
x
>
M
.
{\displaystyle \exists M:\forall x\in S:x>M.}
Então
x
∈
T
⟹
−
x
∈
S
⟹
−
x
>
M
⟹
x
<
−
M
.
{\displaystyle x\in T\implies -x\in S\implies -x>M\implies x<-M.}
Logo T é limitado superiormente por -M, e portanto T têm a menor das cotas superiores,
β
.
{\displaystyle \beta .}
Como
x
∈
S
⟹
−
x
∈
T
⟹
−
x
<
β
⟹
x
>
−
β
,
{\displaystyle x\in S\implies -x\in T\implies -x<\beta \implies x>-\beta ,}
−
β
{\displaystyle -\beta }
é uma cota inferior para S.
Seja
α
{\displaystyle \alpha }
uma cota inferior para S.
Logo
x
∈
T
⟹
−
x
∈
S
⟹
−
x
>
α
⟹
x
<
−
α
,
{\displaystyle x\in T\implies -x\in S\implies -x>\alpha \implies x<-\alpha ,}
então
−
α
{\displaystyle -\alpha }
é uma cota superior para T.
Como
β
{\displaystyle \beta }
é a menor cota superior para T,
−
α
≥
β
,
{\displaystyle -\alpha \geq \beta ,}
e assim
α
≤
−
β
.
{\displaystyle \alpha \leq -\beta .}
Assim toda cota inferior para S é menor ou igual a
−
β
{\displaystyle -\beta }
Ou seja,
−
β
{\displaystyle -\beta }
é a maior cota inferior para S.
A unicidade segue similarmente ao da maior das cotas superiores.
Se
S
⊆
T
,
{\displaystyle S\subseteq T,}
onde S é não-vazio e T é limitado, então
inf
T
≤
inf
S
≤
sup
S
≤
sup
T
{\displaystyle \inf T\leq \inf S\leq \sup S\leq \sup T}
Como S é não-vazio, ele contêm um elemento x. Por definição,
inf
S
≤
x
{\displaystyle \inf S\leq x}
e
x
≤
sup
S
,
{\displaystyle x\leq \sup S,}
então
inf
S
≤
sup
S
.
{\displaystyle \inf S\leq \sup S.}
Como T é limitado superiormente, ele têm a maior das cotas superiores,
sup
T
.
{\displaystyle \sup T.}
Como t é em particular uma cota superior para T,
∀
x
∈
T
:
x
≤
sup
T
.
{\displaystyle \forall x\in T:x\leq \sup T.}
Como
S
⊆
T
,
{\displaystyle S\subseteq T,}
x
∈
S
⟹
x
∈
T
⟹
x
≤
sup
T
.
{\displaystyle x\in S\implies x\in T\implies x\leq \sup T.}
Logo
sup
T
{\displaystyle \sup T}
é uma cota superior para S, Então
sup
S
{\displaystyle \sup S}
existe e por definição
sup
S
≤
sup
T
.
{\displaystyle \sup S\leq \sup T.}
Similarmente,
inf
S
≥
inf
T
.
{\displaystyle \inf S\geq \inf T.}
S
e
j
a
X
⊂
R
e
c
∈
R
;
{\displaystyle Seja\;X\subset \mathbb {R} \;e\;c\in \mathbb {R} ;}
c
<
s
u
p
X
⇒
∃
x
∈
X
;
c
<
x
{\displaystyle c<sup\;X\Rightarrow \exists x\in X;c<x}
x
≤
c
,
∀
x
∈
X
⇒
s
u
p
X
≤
c
{\displaystyle x\leq c,\forall \;x\in X\Rightarrow supX\leq c}
i
n
f
X
<
c
⇒
∃
x
∈
X
;
x
<
c
{\displaystyle inf\;X<c\Rightarrow \exists x\in X;x<c}
c
≤
x
,
∀
x
∈
X
⇒
c
≤
i
n
f
X
{\displaystyle c\leq x,\forall \;x\in X\Rightarrow c\leq infX}
Seja
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
não vazio e limitado superiormente por
M
∈
R
,
M
=
s
u
p
X
{\displaystyle M\in \mathbb {R} ,M=supX}
. Para qualquer
n
∈
N
{\displaystyle n\in \mathbb {N} }
dado, deve existir pelo menos um
x
∈
X
{\displaystyle x\in X}
tal que
M
−
1
n
<
x
≤
M
{\displaystyle M-{1 \over n}<x\leq M}
.
Qualquer que seja
n
∈
N
{\displaystyle n\in \mathbb {N} }
devemos ter que
0
<
1
n
{\displaystyle 0<{1 \over n}}
. Somando
M
−
1
n
∈
R
{\displaystyle M-{1 \over n}\in \mathbb {R} }
dos dois lados da inequação, teremos que
M
−
1
n
<
M
{\displaystyle M-{1 \over n}<M}
. Como M é o supremo de X, logo
M
−
1
n
{\displaystyle M-{1 \over n}}
não pode ser o supremo de X. Assim deve existir
x
∈
X
,
{\displaystyle x\in X,}
tal que
M
−
1
n
<
x
{\displaystyle M-{1 \over n}<x}
. Como
M
=
s
u
p
X
{\displaystyle M=supX}
, temos que
x
≤
M
{\displaystyle x\leq M}
. Juntando as duas desigualdades, temos que
M
−
1
n
<
x
≤
M
{\displaystyle M-{1 \over n}<x\leq M}
.
Dois conjuntos,
X
,
Y
⊂
R
{\displaystyle X,Y\subset \mathbb {R} }
, não vazios, são de cotas quando:
qualquer elemento de X é cota inferior(ou superior) de Y e
qualquer elemento de Y é cota superior(ou inferior) de X.
Sejam
X
,
Y
⊂
R
{\displaystyle X,Y\subset \mathbb {R} }
, conjuntos não-vazios, tal que,
x
≤
y
,
∀
x
∈
X
e
y
∈
Y
{\displaystyle x\leq y,\forall \;x\in X\;e\;y\in Y}
temos que:
X é limitado superiormente
Y é limitado inferiormente
sup
X
≤
inf
Y
{\displaystyle \sup \;X\leq \inf \;Y}
.
Tome
y
∈
Y
{\displaystyle y\in Y}
de forma arbitrária. Por hipótese,
x
≤
y
,
∀
x
∈
X
{\displaystyle x\leq y,\forall \;x\in X}
. Assim y é uma cota superior de X. Logo X é limitado superiormente por y. Pelo axioma do supremo, existe o sup X e é único. Tome
M
=
sup
X
{\displaystyle M=\sup \;X}
. Como M é a menor das cotas superiores de X e y é uma cota superior de X, logo
M
≤
y
{\displaystyle M\leq y}
.
Como y foi escolhido de maneira arbitrária, temos que
∀
y
∈
Y
,
M
≤
y
{\displaystyle \forall \;y\in Y,M\leq y}
. Assim M é uma cota inferior de Y. Assim Y é limitado inferiormente por M, pelo axioma de ínfimo, existe o inf Y e é único. Tome
N
=
inf
Y
{\displaystyle N=\inf \;Y}
.
Como N é a maior das cotas inferiores e M é uma cota inferior, logo
M
≤
N
{\displaystyle M\leq N}
.
Sejam
X
,
Y
⊂
R
{\displaystyle X,Y\subset \mathbb {R} }
, conjuntos não-vazios, sendo X limitado superiormente e Y limitado inferiormente. Suponha ainda que
sup
X
≤
inf
Y
{\displaystyle \sup \;X\leq \inf \;Y}
.
Se
∀
n
∈
N
,
∃
x
n
∈
X
e
y
n
∈
Y
{\displaystyle \forall \;n\in \mathbb {N} ,\exists \;x_{n}\in X\;e\;y_{n}\in Y}
tais que
y
n
−
x
n
<
1
n
{\displaystyle y_{n}-x_{n}<{1 \over n}}
, então
sup
X
=
inf
Y
{\displaystyle \sup \;X=\inf \;Y}
Sejam
M
=
sup
X
e
N
=
inf
Y
{\displaystyle M=\sup \;X\;e\;N=\inf \;Y}
. Suponha por contradição que
M
≠
N
{\displaystyle M\neq N}
. Pela lei da tricotomia
M
<
N
o
u
N
<
M
{\displaystyle M<N\;ou\;N<M}
.
Suponha que
M
<
N
{\displaystyle M<N}
. Pela definição de supremo e ínfimo,
x
≤
M
,
∀
x
∈
X
{\displaystyle x\leq M,\forall x\in X}
e
N
≤
y
,
∀
y
∈
Y
{\displaystyle N\leq y,\forall y\in Y}
. Pela transitividade da inequação temos que
x
≤
M
<
N
≤
y
,
∀
x
∈
X
e
y
∈
Y
{\displaystyle x\leq M<N\leq y,\forall \;x\in X\;e\;y\in Y}
Assim
y
−
x
≥
N
−
M
,
∀
x
∈
X
e
y
∈
Y
{\displaystyle y-x\geq N-M,\forall \;x\in X\;e\;y\in Y}
. (1)
Como
N
−
M
∈
R
+
{\displaystyle N-M\in \mathbb {R} ^{+}}
pela propriedade arquimediana, existe
n
∈
N
,
{\displaystyle n\in \mathbb {N} ,}
tal que
N
−
M
>
1
n
{\displaystyle N-M>{1 \over n}}
.
Por hipótese temos que
∀
n
∈
N
,
∃
x
n
∈
X
e
y
n
∈
Y
{\displaystyle \forall \;n\in \mathbb {N} ,\exists \;x_{n}\in X\;e\;y_{n}\in Y}
tais que
y
n
−
x
n
<
1
n
{\displaystyle y_{n}-x_{n}<{1 \over n}}
. Pela transitividade da inequação
y
n
−
x
n
<
1
n
<
N
−
M
{\displaystyle y_{n}-x_{n}<{1 \over n}<N-M}
. (2)
Perceba que (1) e (2) se contradizem, logo foi um absurdo considerar que M<N.
Analogamente será um absurdo considerar que N<M.
Portanto M=N.
Vamos definir PA de forma diferente para ter o que precisamos:
Uma sequência estacionária é uma sequência numérica onde todos os seus termos são iguais.
Ex.
(
a
n
)
=
(
5
,
5
,
5
,
5
,
5
,
5
,
5
)
{\displaystyle (a_{n})=(5,5,5,5,5,5,5)}
.
O primeiro termo é o primeiro "5". O enésimo termo também será "5".
Essa sequência ao ser estudada no ensino médio, ela é vista como progressão aritmética de razão zero. Vamos defini-la como sequência estacionária.
Vamos definir PA de ordem 1 como uma sequência não-estacionária, tal que a diferença dos seus termos seja uma sequência estacionária.
Vamos perceber que se a diferença for positiva, os termos são crescentes e se a diferença for negativa, os termos serão decrescentes.
Como a diferença será constante, chamaremos a esse valor constante de razão.
Ex.
(
b
n
)
=
(
2
,
7
,
12
,
17
,
.
.
.
)
{\displaystyle (b_{n})=(2,7,12,17,...)}
é uma sequência não estacionária, porque seus termos têm diferença constante de "5".
Vamos definir o operador diferença
Δ
b
n
=
b
n
+
1
−
b
n
{\displaystyle \Delta b_{n}=b_{n+1}-b_{n}}
e a sequência diferença
(
a
n
)
=
(
Δ
b
n
)
=
(
Δ
b
1
,
Δ
b
2
,
.
.
.
)
{\displaystyle (a_{n})=(\Delta b_{n})=(\Delta b_{1},\Delta b_{2},...)}
.
Retomando o exemplo anterior
(
b
n
)
=
(
2
,
7
,
12
,
17
,
.
.
.
)
{\displaystyle (b_{n})=(2,7,12,17,...)}
. Vamos definir
a
n
{\displaystyle a_{n}}
:
Δ
b
1
=
b
2
−
b
1
=
7
−
2
=
5
;
Δ
b
2
=
b
3
−
b
2
=
12
−
7
=
5
{\displaystyle \Delta b_{1}=b_{2}-b_{1}=7-2=5;\Delta b_{2}=b_{3}-b_{2}=12-7=5}
.
Assim
(
a
n
)
=
(
5
,
5
,
5
,
.
.
.
)
{\displaystyle (a_{n})=(5,5,5,...)}
Vamos tomar
(
a
n
)
{\displaystyle (a_{n})}
uma sequência cujo termo
a
n
{\displaystyle a_{n}}
é determinado por um polinômio
a
n
=
n
3
−
n
{\displaystyle a_{n}=n^{3}-n}
.
A sequência
(
a
n
)
=
(
0
,
6
,
24
,
60
,
120
,
210
,
.
.
.
)
{\displaystyle (a_{n})=(0,6,24,60,120,210,...)}
não é uma sequência estacionária.
Vamos tomar a sequência diferença de
(
a
n
)
{\displaystyle (a_{n})}
. Assim
Δ
(
a
n
)
=
(
6
,
18
,
36
,
60
,
90
,
.
.
.
)
{\displaystyle \Delta (a_{n})=(6,18,36,60,90,...)}
Vemos que
Δ
a
1
=
a
2
−
a
1
=
6
−
0
=
6
{\displaystyle \Delta a_{1}=a_{2}-a_{1}=6-0=6}
é diferente de
Δ
a
2
=
a
3
−
a
2
=
24
−
6
=
18
{\displaystyle \Delta a_{2}=a_{3}-a_{2}=24-6=18}
.
Logo
(
Δ
(
a
n
)
)
{\displaystyle (\Delta (a_{n}))}
não é uma sequência estacionária.
Mas
Δ
(
a
n
)
=
a
n
+
1
−
a
n
=
(
n
+
1
)
3
−
(
n
+
1
)
−
(
n
3
−
n
)
=
n
3
+
3
n
2
+
3
n
+
1
−
n
−
1
−
n
3
+
n
⇒
Δ
a
n
=
3
n
2
+
3
n
{\displaystyle \Delta (a_{n})=a_{n+1}-a_{n}=(n+1)^{3}-(n+1)-(n^{3}-n)=n^{3}+3n^{2}+3n+1-n-1-n^{3}+n\Rightarrow \Delta a_{n}=3n^{2}+3n}
Vamos tomar a sequência diferença de
(
Δ
a
n
)
{\displaystyle (\Delta a_{n})}
. Assim
Δ
2
(
a
n
)
=
(
12
,
18
,
24
,
30
,
.
.
.
)
{\displaystyle \Delta ^{2}(a_{n})=(12,18,24,30,...)}
Vemos que
Δ
2
a
1
=
Δ
a
2
−
Δ
a
1
=
18
−
6
=
12
{\displaystyle \Delta ^{2}a_{1}=\Delta a_{2}-\Delta a_{1}=18-6=12}
é diferente de
Δ
2
a
2
=
Δ
a
3
−
Δ
a
2
=
36
−
18
=
18
{\displaystyle \Delta ^{2}a_{2}=\Delta a_{3}-\Delta a_{2}=36-18=18}
.
Logo
Δ
2
(
a
n
)
{\displaystyle \Delta ^{2}(a_{n})}
não é uma sequência estacionária.
Mas
Δ
2
(
a
n
)
=
a
n
+
1
−
a
n
=
3
(
n
+
1
)
2
+
3
(
n
+
1
)
−
(
3
n
2
+
3
n
)
=
3
n
2
+
6
n
+
3
+
3
n
+
3
−
3
n
2
−
3
n
⇒
Δ
2
a
n
=
+
6
n
+
6
{\displaystyle \Delta ^{2}(a_{n})=a_{n+1}-a_{n}=3(n+1)^{2}+3(n+1)-(3n^{2}+3n)=3n^{2}+6n+3+3n+3-3n^{2}-3n\Rightarrow \Delta ^{2}a_{n}=+6n+6}
Vamos tomar a sequência diferença de
(
Δ
2
a
n
)
{\displaystyle (\Delta ^{2}a_{n})}
. Assim
Δ
3
(
a
n
)
=
(
6
,
6
,
6
,
6
,
.
.
.
)
{\displaystyle \Delta ^{3}(a_{n})=(6,6,6,6,...)}
Vemos que
Δ
3
a
1
=
Δ
2
a
2
−
Δ
2
a
1
=
18
−
12
=
6
{\displaystyle \Delta ^{3}a_{1}=\Delta ^{2}a_{2}-\Delta ^{2}a_{1}=18-12=6}
é igual de
Δ
3
a
2
=
Δ
2
a
3
−
Δ
2
a
2
=
24
−
18
=
6
{\displaystyle \Delta ^{3}a_{2}=\Delta ^{2}a_{3}-\Delta ^{2}a_{2}=24-18=6}
.
Logo
Δ
3
(
a
n
)
{\displaystyle \Delta ^{3}(a_{n})}
é uma sequência estacionária.
Mas
Δ
3
(
a
n
)
=
a
n
+
1
−
a
n
=
6
(
n
+
1
)
+
6
−
(
6
n
+
6
)
=
6
n
+
6
+
6
−
6
n
−
6
⇒
Δ
3
a
n
=
6
{\displaystyle \Delta ^{3}(a_{n})=a_{n+1}-a_{n}=6(n+1)+6-(6n+6)=6n+6+6-6n-6\Rightarrow \Delta ^{3}a_{n}=6}
Como
(
Δ
3
a
n
)
{\displaystyle (\Delta ^{3}a_{n})}
é uma sequência estacionária, logo
(
Δ
2
a
n
)
{\displaystyle (\Delta ^{2}a_{n})}
é uma PA de ordem 1, logo
(
Δ
a
n
)
{\displaystyle (\Delta a_{n})}
é uma PA de ordem 2, logo
(
a
n
)
{\displaystyle (a_{n})}
é uma PA de ordem 3.
Percebemos que
(
Δ
3
a
n
)
{\displaystyle (\Delta ^{3}a_{n})}
sendo uma sequência estacionária, tem seu termo geral sendo um polinômio constante.
Percebemos que
(
Δ
2
a
n
)
{\displaystyle (\Delta ^{2}a_{n})}
é uma PA de ordem 1, tem seu termo geral sendo um polinômio de grau 1.
Percebemos que
(
Δ
a
n
)
{\displaystyle (\Delta a_{n})}
é uma PA de ordem 2, tem seu termo geral sendo um polinômio de grau 2.
Percebemos que
(
a
n
)
{\displaystyle (a_{n})}
é uma PA de ordem 3, tem seu termo geral sendo um polinômio de grau 3.
O somatório dos termos de uma PA
(
a
n
)
{\displaystyle (a_{n})}
de ordem 1, do primeiro ao enésimo-termo é dada por:
∑
a
n
=
n
(
a
1
+
a
n
)
2
{\displaystyle \sum a_{n}={n(a_{1}+a_{n}) \over 2}}
Percebemos que
∑
a
n
=
1
2
⋅
(
n
(
a
1
+
a
n
)
)
=
1
2
⋅
(
n
a
1
+
n
(
a
1
+
(
n
−
1
)
r
)
=
1
2
⋅
(
2
n
a
1
+
n
(
n
−
1
)
r
)
=
1
2
⋅
(
n
2
+
r
(
2
a
1
−
1
)
n
)
{\displaystyle \sum a_{n}={1 \over 2}\cdot {\bigg (}n(a_{1}+a_{n}){\bigg )}={1 \over 2}\cdot {\bigg (}na_{1}+n(a_{1}+(n-1)r{\bigg )}={1 \over 2}\cdot {\bigg (}2na_{1}+n(n-1)r{\bigg )}={1 \over 2}\cdot {\bigg (}n^{2}+r(2a_{1}-1)n{\bigg )}}
é um polinômio em n de grau 2.
a
n
=
n
3
−
n
{\displaystyle a_{n}=n^{3}-n}
é um polinômio em n de grau 3.
Vemos que
∑
a
n
=
a
1
+
a
2
+
.
.
.
+
a
n
=
1
3
−
1
+
.
.
.
+
(
n
−
1
)
3
−
(
n
−
1
)
+
n
3
−
n
=
(
1
3
+
2
3
+
.
.
.
+
n
3
)
−
(
1
+
2
+
.
.
.
+
n
)
=
{\displaystyle \sum a_{n}=a_{1}+a_{2}+...+a_{n}=1^{3}-1+...+(n-1)^{3}-(n-1)+n^{3}-n=(1^{3}+2^{3}+...+n^{3})-(1+2+...+n)=}
=
(
n
(
n
+
1
)
2
)
2
−
(
n
(
1
+
n
)
2
)
=
(
n
2
(
n
+
1
)
2
4
)
−
(
2
n
(
1
+
n
)
4
)
=
(
n
2
(
n
+
1
)
2
−
2
n
(
1
+
n
)
4
)
=
1
4
⋅
(
n
(
1
+
n
)
(
n
2
+
n
−
2
)
)
{\displaystyle ={\bigg (}{n(n+1) \over 2}{\bigg )}^{2}-{\bigg (}{n(1+n) \over 2}{\bigg )}={\bigg (}{n^{2}(n+1)^{2} \over 4}{\bigg )}-{\bigg (}{2n(1+n) \over 4}{\bigg )}={\bigg (}{n^{2}(n+1)^{2}-2n(1+n) \over 4}{\bigg )}={1 \over 4}\cdot {\bigg (}n(1+n)(n^{2}+n-2){\bigg )}}
.
∑
a
n
{\displaystyle \sum a_{n}}
é um polinômio em n de grau 4.
Δ
a
n
=
3
n
2
+
3
n
{\displaystyle \Delta a_{n}=3n^{2}+3n}
é um polinômio em n de grau 2.
Vemos que
∑
Δ
a
n
=
Δ
a
1
+
Δ
a
2
+
.
.
.
+
Δ
a
n
=
(
3
⋅
1
2
+
3
⋅
1
)
+
(
3
⋅
2
2
+
3
⋅
2
)
+
.
.
.
+
3
⋅
n
2
+
3
⋅
n
=
{\displaystyle \sum \Delta a_{n}=\Delta a_{1}+\Delta a_{2}+...+\Delta a_{n}=(3\cdot 1^{2}+3\cdot 1)+(3\cdot 2^{2}+3\cdot 2)+...+3\cdot n^{2}+3\cdot n=}
=
3
⋅
(
1
2
+
2
2
+
.
.
.
+
n
2
)
+
3
⋅
(
1
+
2
+
.
.
.
+
n
)
=
3
n
(
n
+
1
)
(
2
n
+
1
)
6
+
3
n
(
1
+
n
)
2
=
{\displaystyle =3\cdot (1^{2}+2^{2}+...+n^{2})+3\cdot (1+2+...+n)={3n(n+1)(2n+1) \over 6}+{3n(1+n) \over 2}=}
=
n
(
n
+
1
)
(
2
n
+
1
)
+
3
n
(
1
+
n
)
2
=
2
n
(
n
+
1
)
(
n
+
2
)
2
=
n
(
n
+
1
)
(
n
+
2
)
{\displaystyle ={n(n+1)(2n+1)+3n(1+n) \over 2}={2n(n+1)(n+2) \over 2}=n(n+1)(n+2)}
∑
Δ
a
n
{\displaystyle \sum \Delta a_{n}}
é um polinômio em n de grau 3.
Δ
2
a
n
=
+
6
n
+
6
{\displaystyle \Delta ^{2}a_{n}=+6n+6}
Vemos que
∑
Δ
2
a
n
=
Δ
2
a
1
+
Δ
2
a
2
+
.
.
.
+
Δ
2
a
n
=
6
⋅
1
+
6
+
6
⋅
2
+
6
+
.
.
.
+
6
n
+
6
=
6
⋅
(
1
+
2
+
.
.
.
+
n
)
+
6
n
=
{\displaystyle \sum \Delta ^{2}a_{n}=\Delta ^{2}a_{1}+\Delta ^{2}a_{2}+...+\Delta ^{2}a_{n}=6\cdot 1+6+6\cdot 2+6+...+6n+6=6\cdot (1+2+...+n)+6n=}
=
6
⋅
n
(
1
+
n
)
+
6
n
2
=
3
n
(
1
+
n
)
+
6
n
=
3
n
2
+
9
n
{\displaystyle =6\cdot {n(1+n)+6n \over 2}=3n(1+n)+6n=3n^{2}+9n}
∑
Δ
2
a
n
{\displaystyle \sum \Delta ^{2}a_{n}}
é um polinômio em n de grau 2.
Δ
3
a
n
=
6
{\displaystyle \Delta ^{3}a_{n}=6}
Vemos que
∑
Δ
3
a
n
=
Δ
3
a
1
+
Δ
3
a
2
+
.
.
.
+
Δ
3
a
n
=
6
+
6
+
.
.
.
+
6
⏟
n
=
n
(
6
+
6
)
2
=
6
n
{\displaystyle \sum \Delta ^{3}a_{n}=\Delta ^{3}a_{1}+\Delta ^{3}a_{2}+...+\Delta ^{3}a_{n}={\begin{matrix}\underbrace {6+6+...+6} \\n\end{matrix}}={n(6+6) \over 2}=6n}
que é um polinômio de 1º grau.
Uma sequência
(
a
n
)
{\displaystyle (a_{n})}
é uma PA de ordem p se, e somente se,
a
n
{\displaystyle a_{n}}
é um polinômio de grau p.
Vamos fazer indução sobre p
Vamos mostrar que é válido para p=1
Tome
(
a
n
)
{\displaystyle (a_{n})}
uma PA de ordem 1
⇒
a
n
=
a
1
+
(
n
−
1
)
r
=
r
n
+
a
1
−
r
{\displaystyle \Rightarrow a_{n}=a_{1}+(n-1)r=rn+a_{1}-r}
que é um polinômio de grau 1
Tome
a
n
=
a
n
+
b
{\displaystyle a_{n}=an+b}
um polinômio de ordem 1
⇒
(
a
n
)
=
(
a
+
b
,
2
a
+
b
,
.
.
.
)
⇒
Δ
(
a
n
)
=
(
a
,
a
,
.
.
.
)
{\displaystyle \Rightarrow (a_{n})=(a+b,2a+b,...)\Rightarrow \Delta (a_{n})=(a,a,...)}
que nos diz que
(
a
n
)
{\displaystyle (a_{n})}
é uma PA de ordem 1.
Vamos mostrar que é válido para p=2
Seja
(
a
n
)
{\displaystyle (a_{n})}
uma PA de ordem 2
⇒
(
Δ
a
n
)
{\displaystyle \Rightarrow (\Delta a_{n})}
é uma PA de ordem 1, ou seja
Δ
a
n
=
Δ
a
1
+
(
n
−
1
)
r
{\displaystyle \Delta a_{n}=\Delta a_{1}+(n-1)r}
Assim
∑
Δ
a
n
{\displaystyle \sum \Delta a_{n}}
é um polinômio de grau 2, onde
∑
Δ
a
n
=
Δ
a
1
+
Δ
a
2
+
.
.
.
+
Δ
a
n
=
(
a
2
−
a
1
)
+
(
a
3
−
a
2
)
+
.
.
.
+
(
a
n
+
1
−
a
n
)
=
a
n
+
1
−
a
1
{\displaystyle \sum \Delta a_{n}=\Delta a_{1}+\Delta a_{2}+...+\Delta a_{n}=(a_{2}-a_{1})+(a_{3}-a_{2})+...+(a_{n+1}-a_{n})=a_{n+1}-a_{1}}
Como
∑
Δ
a
n
=
n
(
Δ
a
1
+
Δ
a
n
)
2
=
n
(
2
Δ
a
1
+
(
n
−
1
)
r
)
2
{\displaystyle \sum \Delta a_{n}={n(\Delta a_{1}+\Delta a_{n}) \over 2}={n(2\Delta a_{1}+(n-1)r) \over 2}}
que é um polinômio de grau 2
Tome
a
n
=
a
n
+
b
{\displaystyle a_{n}=an+b}
um polinômio de ordem 1
⇒
(
a
n
)
=
(
a
+
b
,
2
a
+
b
,
.
.
.
)
⇒
Δ
(
a
n
)
=
(
a
,
a
,
.
.
.
)
{\displaystyle \Rightarrow (a_{n})=(a+b,2a+b,...)\Rightarrow \Delta (a_{n})=(a,a,...)}
que nos diz que
(
a
n
)
{\displaystyle (a_{n})}
é uma PA de ordem 1.
Muitas vezes precisamos usar a soma ou produto de vários números reais de cada vez. Como "..." é dado sem significado pelos nossos axiomas, não podemos apenas escrever "
a
1
+
a
2
+
⋯
+
a
n
{\displaystyle a_{1}+a_{2}+\dots +a_{n}}
". Logo usamos símbolos
∑
k
=
1
n
a
k
{\displaystyle \sum _{k=1}^{n}a_{k}}
e
∏
k
=
1
n
a
k
{\displaystyle \prod _{k=1}^{n}a_{k}}
para denotar a soma e produto, respectivamente, sobre um arbitrário número finito de números reais. Faremos isto indutivamente, como se segue:
∑
k
=
1
1
a
k
=
a
1
{\displaystyle \sum _{k=1}^{1}a_{k}=a_{1}}
e
∏
k
=
1
1
=
a
1
{\displaystyle \prod _{k=1}^{1}=a_{1}}
∑
k
=
1
n
a
k
=
a
n
+
∑
k
=
1
n
−
1
a
k
{\displaystyle \sum _{k=1}^{n}a_{k}=a_{n}+\sum _{k=1}^{n-1}a_{k}}
e
∏
k
=
1
n
a
k
=
a
n
∏
k
=
1
n
−
1
a
k
{\displaystyle \prod _{k=1}^{n}a_{k}=a_{n}\prod _{k=1}^{n-1}a_{k}}
Agora podemos provar algumas propridades de soma e produto:
A ordem da somatória pode ser mudada arbitrariamente. Ao qual, se
{
a
k
:
1
≤
k
≤
n
}
=
{
b
k
:
1
≤
k
≤
n
}
,
{\displaystyle \{a_{k}:1\leq k\leq n\}=\{b_{k}:1\leq k\leq n\},}
então
∑
k
=
1
n
a
k
=
∑
k
=
1
n
b
k
{\displaystyle \sum _{k=1}^{n}a_{k}=\sum _{k=1}^{n}b_{k}}
e
∏
k
=
1
n
a
k
=
∏
k
=
1
n
b
k
{\displaystyle \prod _{k=1}^{n}a_{k}=\prod _{k=1}^{n}b_{k}}
Prova: Isto segue por comutatividade e um pouco de indução.
∑
k
=
1
n
a
k
+
∑
k
=
1
n
b
k
=
∑
k
=
1
n
(
a
k
+
b
k
)
{\displaystyle \sum _{k=1}^{n}a_{k}+\sum _{k=1}^{n}b_{k}=\sum _{k=1}^{n}(a_{k}+b_{k})}
e
∏
k
=
1
n
a
k
∏
k
=
1
n
b
k
=
∏
k
=
1
n
(
a
k
b
k
)
{\displaystyle \prod _{k=1}^{n}a_{k}\prod _{k=1}^{n}b_{k}=\prod _{k=1}^{n}(a_{k}b_{k})}
Prova: Procederemos por indução. Primeiro, note que
∑
k
=
1
1
a
k
+
∑
k
=
1
1
b
k
=
a
k
+
b
k
=
∑
k
=
1
1
(
a
k
+
b
k
)
.
{\displaystyle \sum _{k=1}^{1}a_{k}+\sum _{k=1}^{1}b_{k}=a_{k}+b_{k}=\sum _{k=1}^{1}(a_{k}+b_{k}).}
Agora vamos supor que
∑
k
=
1
n
−
1
a
k
+
∑
k
=
1
n
−
1
b
k
=
∑
k
=
1
n
−
1
(
a
k
+
b
k
)
.
{\displaystyle \sum _{k=1}^{n-1}a_{k}+\sum _{k=1}^{n-1}b_{k}=\sum _{k=1}^{n-1}(a_{k}+b_{k}).}
Logo
∑
k
=
1
n
a
k
+
∑
k
=
1
n
b
k
{\displaystyle \sum _{k=1}^{n}a_{k}+\sum _{k=1}^{n}b_{k}}
=
∑
k
=
1
n
−
1
a
k
+
a
n
+
∑
k
=
1
n
−
1
b
k
+
b
n
{\displaystyle =\sum _{k=1}^{n-1}a_{k}+a_{n}+\sum _{k=1}^{n-1}b_{k}+b_{n}}
=
∑
k
=
1
n
−
1
a
k
+
∑
k
=
1
n
−
1
b
k
+
a
n
+
b
n
{\displaystyle =\sum _{k=1}^{n-1}a_{k}+\sum _{k=1}^{n-1}b_{k}+a_{n}+b_{n}}
=
∑
k
=
1
n
−
1
(
a
k
+
b
k
)
+
(
a
n
+
b
n
)
{\displaystyle =\sum _{k=1}^{n-1}(a_{k}+b_{k})+(a_{n}+b_{n})}
=
∑
k
=
1
n
(
a
k
+
b
k
)
.
{\displaystyle =\sum _{k=1}^{n}(a_{k}+b_{k}).}
A prova para o produto segue-se similarmente.
c
∑
k
=
1
n
a
k
=
∑
k
=
1
n
c
a
k
{\displaystyle c\sum _{k=1}^{n}a_{k}=\sum _{k=1}^{n}ca_{k}}
Prova: Outra indução. Para
n
=
1
,
{\displaystyle n=1,}
c
∑
k
=
1
1
a
k
=
c
a
1
=
∑
k
=
1
1
c
a
k
.
{\displaystyle c\sum _{k=1}^{1}a_{k}=ca_{1}=\sum _{k=1}^{1}ca_{k}.}
Vamos supor que seja verdade para n-1. logo
c
∑
k
=
1
n
a
k
=
c
(
∑
k
=
1
n
−
1
a
k
+
a
n
)
=
∑
k
=
1
n
−
1
c
a
k
+
c
a
n
=
∑
k
=
1
n
c
a
k
.
{\displaystyle c\sum _{k=1}^{n}a_{k}=c(\sum _{k=1}^{n-1}a_{k}+a_{n})=\sum _{k=1}^{n-1}ca_{k}+ca_{n}=\sum _{k=1}^{n}ca_{k}.}
∑
k
=
1
n
(
a
k
)
∑
l
=
1
m
(
b
l
)
=
∑
k
=
1
n
∑
l
=
1
m
a
k
b
l
{\displaystyle \sum _{k=1}^{n}(a_{k})\sum _{l=1}^{m}(b_{l})=\sum _{k=1}^{n}\sum _{l=1}^{m}a_{k}b_{l}}
Prova: Faremos indução sobre n. A propriedade anterior toma conta do caso em que n=1. Assuremos que seja verdade para n-1. Logo
∑
k
=
1
n
(
a
k
)
∑
l
=
1
m
(
b
k
)
{\displaystyle \sum _{k=1}^{n}(a_{k})\sum _{l=1}^{m}(b_{k})}
=
(
∑
k
=
1
n
−
1
(
a
k
)
+
a
n
)
∑
l
=
1
m
(
b
k
)
{\displaystyle =(\sum _{k=1}^{n-1}(a_{k})+a_{n})\sum _{l=1}^{m}(b_{k})}
=
∑
k
=
1
n
−
1
(
a
k
)
∑
l
=
1
m
(
b
k
)
+
a
n
∑
l
=
1
m
(
b
k
)
{\displaystyle =\sum _{k=1}^{n-1}(a_{k})\sum _{l=1}^{m}(b_{k})+a_{n}\sum _{l=1}^{m}(b_{k})}
=
∑
k
=
1
n
−
1
∑
l
=
1
m
(
a
k
b
l
)
+
∑
l
=
1
m
(
a
n
b
k
)
{\displaystyle =\sum _{k=1}^{n-1}\sum _{l=1}^{m}(a_{k}b_{l})+\sum _{l=1}^{m}(a_{n}b_{k})}
=
∑
k
=
1
n
∑
l
=
1
m
(
a
k
b
l
)
{\displaystyle =\sum _{k=1}^{n}\sum _{l=1}^{m}(a_{k}b_{l})}
Propridades mais familiares de soma e produto podem ser deduzidas por métodos similares.
Esse conceito será muito útil para nós. E será muito usado nas próximas secções e em muitos exercícios.
Seja uma
X
1
⊂
X
2
⊂
.
.
.
⊂
X
n
⊂
.
.
.
{\displaystyle X_{1}\subset X_{2}\subset ...\subset X_{n}\subset ...}
sequência decrescentes de intervalos limitados e fechados
X
n
=
[
x
n
,
y
n
]
.
{\displaystyle X_{n}=[x_{n},y_{n}]\;.}
X
=
⋂
i
=
1
∞
X
i
≠
∅
⇔
∃
a
∈
R
;
a
∈
X
n
,
∀
n
∈
N
{\displaystyle X=\bigcap _{i=1}^{\infty }X_{i}\neq \varnothing \Leftrightarrow \exists a\in \mathbb {R} ;\;a\in X_{n},\;\forall \;n\in \mathbb {N} }
De fato temos que
X
=
[
x
,
y
]
,
o
n
d
e
x
=
s
u
p
x
n
,
y
=
i
n
f
y
n
{\displaystyle X\;=[x,y],onde\;x=sup\;x_{n},y=inf\;y_{n}}
Uma sequência de números reais é uma função
s
:
N
→
R
{\displaystyle s:\mathbb {N} \rightarrow \mathbb {R} }
que associa cada número natural a um número real. A notação usual para representar uma sequência é
(
s
n
)
n
∈
N
,
{\displaystyle (s_{n})_{n\in \mathbb {N} },}
quando não houver ambiguidade também pode-se escrever apenas
(
s
n
)
.
{\displaystyle (s_{n}).}
Para se referir a um termo específico da sequência, a notação é
s
n
,
{\displaystyle s_{n},}
ao invés de s(n). Uma outra forma muito comum de dar exemplos de sequências é listando os primeiros elementos (como um conjunto), seguido de "...", de forma que a regra de formação seja óbvia.
Vamos observar que em todo livro estaremos considerando que o conjunto dos naturais
N
=
{
1
,
2
,
3
,
…
}
{\displaystyle \mathbb {N} =\{1,2,3,\ldots \}}
.
Exemplos :
A sequência dos números naturais
s
:
N
→
R
{\displaystyle s:\mathbb {N} \rightarrow R}
dada por
s
n
=
n
,
∀
n
∈
N
{\displaystyle s_{n}=n,\forall n\in \mathbb {N} }
ou mais simplesmente
(
n
)
n
∈
N
.
{\displaystyle (n)_{n\in \mathbb {N} }.}
A sequência de fibonacci
s
1
=
1
,
s
2
=
1
,
s
n
=
s
n
−
1
+
s
n
−
2
,
∀
n
∈
N
,
{\displaystyle s_{1}=1,s_{2}=1,s_{n}=s_{n-1}+s_{n-2},\forall \;n\in \mathbb {N} ,}
com
n
≥
2.
{\displaystyle n\geq 2.}
s
n
=
1
n
,
∀
n
∈
N
,
{\displaystyle s_{n}={1 \over n},\forall n\in \mathbb {N} ,}
com
n
≥
1
,
{\displaystyle n\geq 1,}
ou mais simplesmente
(
1
n
)
n
∈
N
.
{\displaystyle ({1 \over n})_{n\in \mathbb {N} }.}
A sequência
{
1
,
1
4
,
1
9
,
1
16
,
.
.
.
}
{\displaystyle \{1,{1 \over 4},{1 \over 9},{1 \over 16},...\}}
é uma forma de representar
s
1
=
1
1
2
,
s
2
=
1
2
2
,
s
3
=
1
3
2
,
s
4
=
1
4
2
,
…
{\displaystyle s_{1}={1 \over 1^{2}},s_{2}={1 \over 2^{2}},s_{3}={1 \over 3^{2}},s_{4}={1 \over 4^{2}},\ldots \,}
ou seja,
s
n
=
1
n
2
{\displaystyle s_{n}={1 \over n^{2}}}
Faremos o uso da equivalência de ponto em um intervalo.
Algumas propriedades das sequências são tão importantes que elas recebem nomes especiais. Uma sequência
(
a
n
)
n
∈
N
{\displaystyle (a_{n})_{n\in \mathbb {N} }}
é dita:
estritamente crescente se
∀
n
∈
N
:
a
n
<
a
n
+
1
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}<a_{n+1};}
não-decrescente se
∀
n
∈
N
:
a
n
≤
a
n
+
1
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}\leq a_{n+1};}
estritamente decrescente se
∀
n
∈
N
:
a
n
>
a
n
+
1
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}>a_{n+1};}
não-crescente se
∀
n
∈
N
:
a
n
≥
a
n
+
1
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}\geq a_{n+1};}
monótona se a sequência satisfaz alguma das propriedades acima (i.é. se ela é não-decrescente ou não-crescente);
estritamente monótona se ela é ou estritamente crescente ou estritamente decrescente;
limitada superiormente se existe
M
∈
R
{\displaystyle M\in \mathbb {R} }
tal que
∀
n
∈
N
:
a
n
≤
M
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}\leq M;}
limitada inferiormente se existe
m
∈
R
{\displaystyle m\in \mathbb {R} }
tal que
∀
n
∈
N
:
a
n
≥
m
;
{\displaystyle \forall n\in \mathbb {N} :a_{n}\geq m;}
limitada se ela é limitada superior e inferiormente, ou seja, se
∃
M
,
m
∈
R
{\displaystyle \exists M,m\in \mathbb {R} }
tal que
m
≤
a
n
≤
M
;
{\displaystyle m\leq a_{n}\leq M;}
ilimitada quando ela não é limitada nem superior e nem inferiormente;
Cauchy se
∀
ϵ
>
0
,
∃
n
0
|
∀
n
,
m
>
n
0
⇒
|
a
m
−
a
n
|
<
ϵ
;
{\displaystyle \forall \epsilon >0,\exists n_{0}\ |\ \forall n,m>n_{0}\ \Rightarrow |a_{m}-a_{n}|<\epsilon ;}
Dizemos que uma sequência
(
a
n
)
{\displaystyle (a_{n})\;}
converge para o número real
a
{\displaystyle a\;}
quando, qualquer que seja
ϵ
>
0
{\displaystyle \epsilon >0\;}
dado,
∃
n
0
∈
N
{\displaystyle \exists n_{0}\in \mathbb {N} }
tal que, se
n
>
n
0
,
{\displaystyle n>n_{0}\;,}
então
|
a
n
−
a
|
<
ϵ
.
{\displaystyle |a_{n}-a|<\epsilon \;.}
Para dizer que
(
a
n
)
{\displaystyle (a_{n})\;}
converge para
a
,
{\displaystyle a\;,}
normalmente escrevemos
(
a
n
)
→
a
,
{\displaystyle (a_{n})\rightarrow a,}
ou
lim
n
→
∞
x
n
=
a
{\displaystyle \textstyle \lim _{n\rightarrow \infty }x_{n}=a}
ou apenas
lim
a
n
=
a
,
{\displaystyle \lim a_{n}=a,}
quando não houver dúvida que o limite trata de
n
{\displaystyle n}
tendendo ao infinito. Em outras palavras, a sequência
(
a
n
)
{\displaystyle (a_{n})\;}
fica arbitrariamente próxima de
a
{\displaystyle a\;}
desde que se tome um
n
{\displaystyle n\;}
suficientemente grande.
Exemplos
A sequência
(
1
/
n
)
n
∈
N
{\displaystyle (1/n)_{n\in \mathbb {N} }}
converge para
0.
{\displaystyle 0.}
De fato, dado
ϵ
>
0
,
{\displaystyle \epsilon >0,}
pela propriedade arquimediana da reta real, existe
n
0
∈
N
{\displaystyle n_{0}\in \mathbb {N} }
tal que
n
0
>
1
ϵ
,
{\displaystyle n_{0}>{\frac {1}{\epsilon }}\;,}
portanto
−
ϵ
<
0
<
1
/
n
0
<
ϵ
.
{\displaystyle -\epsilon <0<1/n_{0}<\epsilon \;.}
Logo
|
1
/
n
0
−
0
|
<
ϵ
{\displaystyle |1/n_{0}-0|<\epsilon \;}
e concluimos que
(
1
/
n
)
→
0
.
{\displaystyle (1/n)\rightarrow 0\;.}
Uma sequência que não é convergente é dita divergente. A divergência geralmente ocorre por dois motivos: A sequência não é limitada ou possui duas subsequências convergindo para valores diferentes.
Uma pergunta muito natural de se fazer: a definição de convergência é precisa? Intuitivamente sabemos o que significa uma sequência convergir para um número, mas agora precisamos saber se a definição formal não permite que exista mais de um limite. Ou seja, queremos provar que, se uma sequência converge, então o limite é único .
Seja
(
x
n
)
{\displaystyle (x_{n})}
uma sequência de números reais convergente com
x
=
lim
x
n
.
{\displaystyle x=\lim x_{n}.}
Suponha que
y
∈
R
{\displaystyle y\in R}
seja tal que
y
=
lim
x
n
,
{\displaystyle y=\lim x_{n},}
queremos mostrar que
x
=
y
{\displaystyle x=y}
.
Suponha, por absurdo, que
x
≠
y
,
{\displaystyle x\not =y,}
então
|
x
−
y
|
>
0
{\displaystyle |x-y|>0}
. Tomemos então
ϵ
=
|
x
−
y
|
2
{\displaystyle \epsilon ={|x-y| \over 2}}
.(3)
Por um lado,
(
x
n
)
→
x
,
{\displaystyle (x_{n})\rightarrow x,}
assim
∀
ϵ
>
0
,
∃
n
1
∈
N
{\displaystyle \forall \;\epsilon >0,\exists \;n_{1}\in \mathbb {N} }
tal que
n
>
n
1
⇒
|
x
n
−
x
|
<
ϵ
{\displaystyle n>n_{1}\Rightarrow |x_{n}-x|<\epsilon }
.(4)
Por outro lado
(
x
n
)
→
y
,
{\displaystyle (x_{n})\rightarrow y,}
logo
∀
ϵ
>
0
,
∃
n
2
∈
N
{\displaystyle \forall \;\epsilon >0,\exists \;n_{2}\in \mathbb {N} }
tal que
n
>
n
2
⇒
|
x
n
−
y
|
<
ϵ
{\displaystyle n>n_{2}\Rightarrow |x_{n}-y|<\epsilon }
.(5)
Tome
n
0
=
m
a
x
{
n
1
,
n
2
}
{\displaystyle n_{0}=max\{n_{1},n_{2}\}}
para garantir que os termos da sequência satisfaçam a convergência tanto para x, como para y. Assim
n
>
n
0
⇒
∀
n
∈
N
,
n
>
n
1
e
n
>
n
2
⇒
(
4
)
,
(
5
)
|
x
n
−
x
|
,
|
x
n
−
y
|
<
ϵ
{\displaystyle n>n_{0}\Rightarrow \forall \;n\in \mathbb {N} ,n>n_{1}\;e\;n>n_{2}\Rightarrow _{(4),(5)}|x_{n}-x|,|x_{n}-y|<\epsilon }
(2)
Contudo
|
x
−
y
|
=
|
x
−
x
n
+
x
n
−
y
|
≤
(
1
)
|
x
−
x
n
|
+
|
x
n
−
y
|
<
(
2
)
ϵ
+
ϵ
=
2
ϵ
=
(
3
)
|
x
−
y
|
{\displaystyle |x-y|=|x-x_{n}+x_{n}-y|\leq _{(1)}|x-x_{n}|+|x_{n}-y|<_{(2)}\epsilon +\epsilon =2\epsilon =_{(3)}|x-y|}
.
(1) pela desigualdade triangular
Mas é um absurdo concluir que
|
x
−
y
|
<
|
x
−
y
|
{\displaystyle |x-y|<|x-y|}
. Portanto foi um absurdo ter suposto que
x
≠
y
{\displaystyle x\neq y}
. Então podemos concluir que x=y.
Essa proposição nos diz que se uma sequência converge para um limite a, então dados b e c reais, tais que b<a<c então a partir de um certo termo da sequência
n
0
{\displaystyle n_{0}}
todos os termos estarão no intervalo (b,c).
Seja
a
=
lim
a
n
,
b
∈
R
{\displaystyle a=\lim a_{n},b\in \mathbb {R} }
, logo:
Se
a
<
b
{\displaystyle a<b}
( resp.
a
>
b
{\displaystyle a>b}
), então existe
n
0
∈
N
{\displaystyle n_{0}\in \mathbb {N} }
tal que
n
>
n
0
⇒
a
n
<
b
(
r
e
s
p
.
a
n
>
b
)
{\displaystyle n>n_{0}\Rightarrow a_{n}<b\;(resp.a_{n}>b)}
.
Se
a
n
≥
b
(
r
e
s
p
.
a
n
≤
b
)
,
∀
n
∈
N
{\displaystyle a_{n}\geq b\;(resp.a_{n}\leq b),\forall \;n\in \mathbb {N} }
, então
a
≥
b
(
r
e
s
p
.
a
≤
b
)
{\displaystyle a\geq b\;(resp.a\leq b)}
.
Tome
a
<
b
(
⇒
b
−
a
>
0
)
e
ϵ
=
b
−
a
{\displaystyle a<b(\Rightarrow b-a>0)\;e\;\epsilon =b-a}
(1), logo
∃
n
0
∈
N
{\displaystyle \exists \;n_{0}\in \mathbb {N} }
tal que
n
>
n
0
⇒
|
a
n
−
a
|
<
ϵ
⇒
(
1
)
−
(
b
−
a
)
<
a
n
−
a
<
b
−
a
⇒
a
n
<
b
,
∀
n
∈
N
{\displaystyle n>n_{0}\Rightarrow |a_{n}-a|<\epsilon \Rightarrow _{(1)}-(b-a)<a_{n}-a<b-a\Rightarrow a_{n}<b,\forall \;n\in \mathbb {N} }
.
O segundo resultado resulta da contraposição do primeiro.
Toda sequência convergente é limitada.
Seja
lim
a
n
=
a
{\displaystyle \lim \;a_{n}=a}
, assim para
ϵ
=
1
,
∃
n
0
∈
N
{\displaystyle \epsilon =1,\exists \;n_{0}\in \mathbb {N} }
tal que
n
>
n
0
⇒
|
a
n
−
a
|
<
1.
{\displaystyle n>n_{0}\Rightarrow |a_{n}-a|<1.}
Além disso, o conjunto
X
=
{
a
0
,
a
1
,
.
.
.
,
a
n
0
,
a
−
1
,
a
+
1
}
{\displaystyle X=\{a_{0},a_{1},...,a_{n_{0}},a-1,a+1\}}
é finito, não-vazio e limitado, então existe
A
=
min
X
{\displaystyle A=\min X\;}
e
B
=
max
X
,
{\displaystyle B=\max X\;,}
. Tome
L
=
max
{
|
A
|
,
|
B
|
,
}
⇒
−
L
<
A
<
B
<
L
{\displaystyle L=\max\{|A|,|B|,\}\Rightarrow -L<A<B<L}
. Como temos que
A
≤
x
n
≤
B
⇒
−
L
≤
x
n
≤
L
⇒
|
x
n
|
≤
L
{\displaystyle A\leq x_{n}\leq B\Rightarrow -L\leq x_{n}\leq L\Rightarrow |x_{n}|\leq L}
para todo
n
∈
N
.
{\displaystyle n\in \mathbb {N} .}
Dadas duas sequências
(
a
n
)
{\displaystyle (a_{n})\;}
e
(
b
n
)
{\displaystyle (b_{n})\;}
convergentes, com
a
=
lim
a
n
{\displaystyle a=\lim a_{n}}
e
b
=
lim
b
n
{\displaystyle b=\lim b_{n}}
e um número real
λ
,
{\displaystyle \lambda \;,}
então valem as seguintes propriedades:
(
a
n
+
b
n
)
→
a
+
b
;
{\displaystyle (a_{n}+b_{n})\rightarrow a+b;}
(
a
n
b
n
)
→
a
b
;
{\displaystyle (a_{n}b_{n})\rightarrow ab;}
(
λ
a
n
)
→
λ
a
;
{\displaystyle (\lambda a_{n})\rightarrow \lambda a;}
Se
b
n
≠
0
,
∀
n
∈
N
,
{\displaystyle b_{n}\not =0,\forall n\in \mathbb {N} ,}
e
b
≠
0
,
{\displaystyle b\not =0,}
então:
(
a
n
b
n
)
→
a
b
.
{\displaystyle \left({\frac {a_{n}}{b_{n}}}\right)\rightarrow {\frac {a}{b}}.}
Vamos demonstrar a primeira das propriedades. Dado
ϵ
>
0
,
{\displaystyle \epsilon >0\;,}
existem
n
a
,
n
b
{\displaystyle n_{a},n_{b}\;}
naturais tais que, se
n
>
n
a
,
n
b
{\displaystyle n>n_{a},n_{b}\;}
então
|
a
n
−
a
|
<
ϵ
2
{\displaystyle |a_{n}-a|<{\frac {\epsilon }{2}}}
e
|
b
n
−
b
|
<
ϵ
2
.
{\displaystyle |b_{n}-b|<{\frac {\epsilon }{2}}.}
Portanto, se
n
0
=
m
a
x
{
n
a
,
n
b
}
{\displaystyle n_{0}=max\{n_{a},n_{b}\}\;}
e
n
>
n
0
,
{\displaystyle n>n_{0}\;,}
então
|
(
a
n
+
b
n
)
−
(
a
+
b
)
|
=
|
(
a
n
−
a
)
+
(
b
n
−
b
)
|
≤
|
a
n
−
a
|
+
|
b
n
−
b
|
<
ϵ
2
+
ϵ
2
=
ϵ
.
{\displaystyle |(a_{n}+b_{n})-(a+b)|=|(a_{n}-a)+(b_{n}-b)|\leq |a_{n}-a|+|b_{n}-b|<{\frac {\epsilon }{2}}+{\frac {\epsilon }{2}}=\epsilon .}
Logo
(
a
n
+
b
n
)
→
a
+
b
.
{\displaystyle (a_{n}+b_{n})\rightarrow a+b.}
As outras propriedades ficam de exercício para o leitor.
Se
a
n
→
0
,
b
n
é limitada
,
{\displaystyle a_{n}\rightarrow 0,b_{n}\;{\text{é limitada}},}
então
a
n
⋅
b
n
→
0
;
{\displaystyle a_{n}\cdot b_{n}\rightarrow 0;}
Como bn é uma sequência limitada, temos que existe B > 0 tal que |bn | < B para todo n .
Então, dado ε > 0 , temos que
ϵ
B
>
0
.
{\displaystyle {\frac {\epsilon }{B}}>0\,.}
Como an é uma sequência que converge para 0 , existe n 0 tal que, para todo n > n0 , | an - 0| < ε / B .
Finalmente, fazendo as contas, temos que |an bn - 0| < |an | |bn | < (ε / B ) . B = ε .
Ou seja, para todo ε > 0 , encontramos n0 tal que para todo n > n0 , |an bn - 0| < ε - precisamente a definição de limite.
Toda sequência de números reais monótona limitada converge.
Vamos demonstrar que toda sequência não-decrescente, limitada superiormente, é convergente. Fica como exercício para o leitor adaptar a demonstração para outros tipos de sequências monótonas.
Seja
(
a
n
)
n
∈
N
{\displaystyle (a_{n})_{n\in \mathbb {N} }}
uma sequência não-decrescente limitada superiormente. Isto é,
a
n
≤
a
m
{\displaystyle a_{n}\leq a_{m}}
se
n
<
m
{\displaystyle n<m\;}
e existe
M
∈
R
{\displaystyle M\in \mathbb {R} }
tal que
a
n
<
M
,
{\displaystyle a_{n}<M\;,}
para todo
n
∈
N
.
{\displaystyle n\in \mathbb {N} .}
Desta forma, o conjunto
A
=
{
a
n
:
n
∈
N
}
{\displaystyle A=\{a_{n}:n\in \mathbb {N} \}}
é um conjunto de número reais, não vazio e limitado superiormente, então
A
{\displaystyle A\;}
tem supremo.
Seja
a
=
s
u
p
A
,
{\displaystyle a=supA\;,}
vou mostrar que
(
a
n
)
→
a
.
{\displaystyle (a_{n})\rightarrow a.}
Como
a
=
s
u
p
A
,
{\displaystyle a=supA\;,}
qualquer que seja
ϵ
>
0
,
a
−
ϵ
{\displaystyle \epsilon >0,a-\epsilon \;}
não é o supremo de
A
,
{\displaystyle A\;,}
então existe
a
n
0
∈
A
{\displaystyle a_{n_{0}}\in A}
com
a
−
ϵ
≤
a
n
0
≤
a
.
{\displaystyle a-\epsilon \leq a_{n_{0}}\leq a.}
Como a sequência
(
a
n
)
{\displaystyle (a_{n})\;}
é não-decrescente, se
n
≥
n
0
,
{\displaystyle n\geq n_{0},}
temos
a
−
ϵ
≤
a
n
0
≤
a
n
≤
a
,
{\displaystyle a-\epsilon \leq a_{n_{0}}\leq a_{n}\leq a,}
sendo a o supremo de
A
,
{\displaystyle A\;,}
podemos ainda acrescentar uma relação à desigualdade, temos então
a
−
ϵ
≤
a
n
0
≤
a
n
≤
a
≤
a
+
ϵ
,
{\displaystyle a-\epsilon \leq a_{n_{0}}\leq a_{n}\leq a\leq a+\epsilon ,}
que significa que, se
n
≥
n
0
{\displaystyle n\geq n_{0}}
então
|
a
−
a
n
|
<
ϵ
.
{\displaystyle |a-a_{n}|<\epsilon \;.}
Que é exatamente a definição de convergência de sequências, então
(
a
n
)
→
a
.
{\displaystyle (a_{n})\rightarrow a.}
Toda sequência monótona converge se possui uma subsequência convergente
Sejam
(
a
n
)
{\displaystyle (a_{n})\;}
uma sequência em
R
{\displaystyle \mathbb {R} }
convergente para
a
.
{\displaystyle a\;.}
Se
a
>
0
,
{\displaystyle a>0\;,}
então
∃
n
0
∈
N
;
n
>
n
0
⇒
a
n
>
0
{\displaystyle \exists \;n_{0}\in \mathbb {N} ;n>n_{0}\Rightarrow a_{n}>0}
Se
a
n
>
0
,
∀
n
∈
N
,
{\displaystyle a_{n}>0,\forall \;n\in \mathbb {N} ,}
então
a
≥
0.
{\displaystyle a\geq 0.}
(1)Seja
ϵ
=
a
{\displaystyle \epsilon =a}
, então existe
n
0
∈
N
{\displaystyle n_{0}\in \mathbb {N} }
tal que
∀
n
≥
n
0
⟹
|
a
n
−
a
|
<
a
⟹
−
a
<
a
n
−
a
<
a
{\displaystyle \forall n\geq n_{0}\implies |a_{n}-a|<a\implies -a<a_{n}-a<a}
. Somando
a
{\displaystyle a}
a todos os lados da desigualdade temos que
0
<
a
n
<
2
a
⟹
a
n
>
0
∀
n
≥
n
0
{\displaystyle 0<a_{n}<2a\implies a_{n}>0\quad \forall n\geq n_{0}}
(2)Dado
ϵ
>
0
,
∃
n
0
{\displaystyle \epsilon >0,\exists n_{0}}
tal que
n
>
n
0
⇒
a
−
ϵ
<
a
n
<
a
+
ϵ
.
{\displaystyle n>n_{0}\Rightarrow a-\epsilon <a_{n}<a+\epsilon .}
Como
a
n
>
0
,
{\displaystyle a_{n}>0\;,}
temos
0
<
a
n
<
a
+
ϵ
{\displaystyle 0<a_{n}<a+\epsilon \;}
e portanto
0
<
a
+
ϵ
{\displaystyle 0<a+\epsilon \;}
e consequentemente
0
≤
a
.
{\displaystyle 0\leq a.}
Sejam
(
a
n
)
{\displaystyle (a_{n})\;}
e
(
b
n
)
{\displaystyle (b_{n})\;}
duas sequências em
R
{\displaystyle \mathbb {R} }
convergentes, com
a
=
lim
a
n
{\displaystyle a=\lim a_{n}}
e
b
=
lim
b
n
.
{\displaystyle b=\lim b_{n}.}
Se
a
n
<
b
n
,
{\displaystyle a_{n}<b_{n}\;,}
para todo
n
{\displaystyle n}
natural, então
a
≤
b
.
{\displaystyle a\leq b.}
Se
a
≤
b
n
,
∀
n
,
{\displaystyle a\leq b_{n},\forall \;n,}
então
a
≤
b
{\displaystyle a\leq b}
(1)Se
a
n
<
b
n
,
{\displaystyle a_{n}<b_{n}\;,}
para todo
n
{\displaystyle n\;}
natural, então
0
<
b
n
−
a
n
,
{\displaystyle 0<b_{n}-a_{n}\;,}
para todo
n
{\displaystyle n\;}
e, pelo lema anterior,
0
≤
lim
(
b
n
−
a
n
)
=
lim
b
n
−
lim
a
n
{\displaystyle 0\leq \lim(b_{n}-a_{n})=\lim b_{n}-\lim a_{n}}
e portanto
lim
a
n
≤
lim
b
n
.
{\displaystyle \lim a_{n}\leq \lim b_{n}.}
(
1
)
⇒
(
2
)
{\displaystyle (1)\Rightarrow (2)}
Seja
a
n
=
a
(
c
o
n
s
t
a
n
t
e
)
,
∀
n
.
{\displaystyle a_{n}=a(constante),\forall \;n.}
Sejam
(
a
n
)
,
(
b
n
)
e
(
c
n
)
{\displaystyle (a_{n}),(b_{n}){\mbox{ e }}(c_{n})\;}
sequências em
R
.
{\displaystyle \mathbb {R} .}
Se
lim
a
n
=
lim
b
n
{\displaystyle \lim a_{n}=\lim b_{n}}
e
a
n
≤
c
n
≤
b
n
,
{\displaystyle a_{n}\leq c_{n}\leq b_{n},}
para todo
n
{\displaystyle n\;}
então
∃
lim
c
n
{\displaystyle \exists \lim c_{n}}
e
lim
c
n
=
lim
a
n
=
lim
b
n
.
{\displaystyle \lim c_{n}=\lim a_{n}=\lim b_{n}.}
Seja
c
=
lim
a
n
{\displaystyle c=\lim a_{n}}
e
ϵ
>
0
{\displaystyle \epsilon >0\;}
dado.
Por um lado, como
c
=
lim
a
n
,
{\displaystyle c=\lim a_{n},}
existe
n
a
∈
N
{\displaystyle n_{a}\in \mathbb {N} }
tal que, se
n
>
n
a
{\displaystyle n>n_{a}\;}
então
c
−
ϵ
<
a
n
<
c
+
ϵ
.
{\displaystyle c-\epsilon <a_{n}<c+\epsilon \;.}
Por outro lado, como também temos que, como
c
=
lim
b
n
{\displaystyle c=\lim b_{n}}
existe
n
b
∈
N
{\displaystyle n_{b}\in \mathbb {N} }
tal que, se
n
>
n
b
{\displaystyle n>n_{b}\;}
então
c
−
ϵ
<
b
n
<
c
+
ϵ
.
{\displaystyle c-\epsilon <b_{n}<c+\epsilon \;.}
Pela desigualdade
a
n
≤
c
n
≤
b
n
,
{\displaystyle a_{n}\leq c_{n}\leq b_{n},}
se
n
>
max
{
n
a
,
n
b
}
{\displaystyle n>\max\{n_{a},n_{b}\}\;}
então
c
−
ϵ
<
a
n
≤
c
n
≤
b
n
<
c
+
ϵ
.
{\displaystyle c-\epsilon <a_{n}\leq c_{n}\leq b_{n}<c+\epsilon .}
Logo
c
=
lim
c
n
.
{\displaystyle c=\lim c_{n}.}
Uma subsequência de uma sequência
(
a
n
)
n
∈
N
{\displaystyle (a_{n})_{n\in \mathbb {N} }}
é uma função
s
:
N
′
→
R
,
{\displaystyle s:\mathbb {N} '\rightarrow \mathbb {R} ,}
onde
N
′
⊂
N
{\displaystyle \mathbb {N} '\subset \mathbb {N} }
e
N
′
{\displaystyle \mathbb {N} '}
é infinito. A notação usual para representar uma subsequência é
(
a
n
)
n
∈
N
′
.
{\displaystyle (a_{n})_{n\in \mathbb {N} '}.}
Como
N
′
{\displaystyle \mathbb {N} '}
é enumerável, seus elementos podem ser escritos como
{
n
1
,
n
2
,
.
.
.
,
n
k
,
.
.
}
,
{\displaystyle \{n_{1},n_{2},...,n_{k},..\}\;,}
e ainda podemos escolher a enumeração de forma com que
n
i
<
n
j
,
{\displaystyle n_{i}<n_{j}\;,}
se
i
<
j
.
{\displaystyle i<j\;.}
Então podemos identificar uma subsequência com uma sequência escrevendo
(
a
n
k
)
k
∈
N
.
{\displaystyle (a_{n_{k}})_{k\in \mathbb {N} }.}
Portanto, todos os teoremas que valem para sequências valem para subsequências.
Toda subsequência de uma sequência convergente é convergente.
Seja
(
a
n
)
{\displaystyle (a_{n})\;}
uma sequência convergente para
a
{\displaystyle a\;}
e
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
uma subsequência de
(
a
n
)
.
{\displaystyle (a_{n})\;.}
Como
(
a
n
)
→
a
,
{\displaystyle (a_{n})\rightarrow a,}
dado
ϵ
>
0
,
{\displaystyle \epsilon >0\;,}
existe
n
0
{\displaystyle n_{0}\;}
tal que, se
n
>
n
0
,
{\displaystyle n>n_{0}\;,}
então
|
a
n
−
a
|
<
ϵ
.
{\displaystyle |a_{n}-a|<\epsilon \;.}
Em especial, se
n
k
>
n
0
,
{\displaystyle n_{k}>n_{0}\;,}
temos
|
a
n
k
−
a
|
<
ϵ
.
{\displaystyle |a_{n_{k}}-a|<\epsilon .}
Logo
(
a
n
k
)
→
a
.
{\displaystyle (a_{n_{k}})\rightarrow a.}
Se uma sequência possui duas subsequências convergindo para valores distintos então a sequência é divergente.
Toda sequência limitada, possui uma subsequência convergente
{\displaystyle \;}
Definição(Valor de aderência):
a
{\displaystyle a\;}
é "valor de aderência" de uma sequência
(
a
n
)
{\displaystyle (a_{n})\;}
se, e somente se,
a
{\displaystyle a\;}
é limite de alguma das subsequências de
(
a
n
)
{\displaystyle (a_{n})\;}
se, e somente se,
∀
ϵ
>
0
,
∃
n
0
∈
N
;
n
>
n
0
⇒
a
n
∈
(
a
−
ϵ
,
a
+
ϵ
)
.
{\displaystyle \forall \epsilon >0,\exists \;n_{0}\in \mathbb {N} ;\;n>n_{0}\Rightarrow a_{n}\in (a-\epsilon ,a+\epsilon ).}
Seja
a
n
{\displaystyle a_{n}\;}
uma sequência limitada.
Se a sequência
a
n
{\displaystyle a_{n}\;}
é convergente, então o valor de aderência é único
Se a sequência
a
n
{\displaystyle a_{n}\;}
possui duas subsequências convergente, convergindo para a e b, com a<b então para índices suficientemente grandes
a
n
∈
(
a
−
ϵ
,
b
+
ϵ
)
{\displaystyle a_{n}\in (a-\epsilon ,b+\epsilon )}
Se a sequência
a
n
{\displaystyle a_{n}\;}
possui n+2 subsequências convergindo para
a
,
c
1
,
.
.
.
,
c
n
,
b
c
o
m
a
<
c
i
<
b
,
i
=
1
,
2
,
.
.
.
,
n
.
{\displaystyle a,c_{1},...,c_{n},b\;com\;a<c_{i}<b,i=1,2,...,n.}
Então a e b são o menor e maior valor de aderência e
c
i
∈
(
a
+
ϵ
,
b
−
ϵ
)
,
i
=
1
,
2
,
.
.
.
,
n
{\displaystyle c_{i}\in (a+\epsilon ,b-\epsilon ),i=1,2,...,n}
Se
b
n
→
a
,
c
n
→
b
{\displaystyle b_{n}\rightarrow a,c_{n}\rightarrow b}
subsequências de
a
n
{\displaystyle a_{n}\;}
que possuem menor e o maior valor de aderência respectivamente, então
b
n
,
c
n
{\displaystyle b_{n},c_{n}\;}
são monótonas e
b
n
{\displaystyle b_{n}\;}
é crescente ou não-decrescente e
c
n
{\displaystyle c_{n}\;}
é decrescente ou não-crescente
(1)
a
n
→
a
⇒
a
n
{\displaystyle a_{n}\rightarrow a\Rightarrow a_{n}}
possui uma subsequência convergindo para a. Por definição a é valor de aderência. Como
a
n
{\displaystyle a_{n}\;}
é convergente, não existe outra subsequência convergindo para outro valor diferente de a. Logo a é o único valor de aderência.
(2) Temos
n
>
n
1
⇒
a
n
∈
(
a
−
ϵ
,
a
+
ϵ
)
e
n
>
n
2
⇒
a
n
∈
(
b
−
ϵ
,
b
+
ϵ
)
.
{\displaystyle n>n_{1}\Rightarrow a_{n}\in (a-\epsilon ,a+\epsilon )\;e\;n>n_{2}\Rightarrow a_{n}\in (b-\epsilon ,b+\epsilon ).}
Também
a
−
ϵ
<
a
<
b
<
b
+
ϵ
⇒
n
>
n
0
=
m
a
x
{
n
1
,
n
2
}
,
c
o
m
a
n
∈
(
a
−
ϵ
,
b
+
ϵ
)
{\displaystyle a-\epsilon <a<b<b+\epsilon \Rightarrow n>n_{0}=max\{n_{1},n_{2}\},com\;a_{n}\in (a-\epsilon ,b+\epsilon )}
(3)Seja
c
j
≤
c
i
≤
c
k
,
i
=
1
,
2
,
.
.
.
,
n
.
{\displaystyle c_{j}\leq c_{i}\leq c_{k},i=1,2,...,n.}
Temos
n
>
n
j
⇒
a
n
∈
(
c
j
−
ϵ
,
c
j
+
ϵ
)
{\displaystyle n>n_{j}\Rightarrow a_{n}\in (c_{j}-\epsilon ,c_{j}+\epsilon )}
. Tome
n
>
n
k
⇒
a
n
∈
(
c
k
−
ϵ
,
c
k
+
ϵ
)
⇒
n
>
n
0
∗
=
max
{
n
j
,
n
k
}
,
c
o
m
a
n
∈
(
c
j
−
ϵ
,
c
k
+
ϵ
)
.
{\displaystyle n>n_{k}\Rightarrow a_{n}\in (c_{k}-\epsilon ,c_{k}+\epsilon )\Rightarrow n>n_{0}^{*}=\max\{n_{j},n_{k}\},\;com\;a_{n}\in (c_{j}-\epsilon ,c_{k}+\epsilon ).}
a
+
ϵ
<
c
j
<
c
k
<
b
−
ϵ
⇒
a
<
c
j
−
ϵ
<
c
k
+
ϵ
<
b
{\displaystyle a+\epsilon <c_{j}<c_{k}<b-\epsilon \Rightarrow a<c_{j}-\epsilon <c_{k}+\epsilon <b\;}
c
i
∈
[
c
j
,
c
k
]
⊂
(
c
j
−
ϵ
<
c
k
+
ϵ
)
⊂
(
a
,
b
)
{\displaystyle c_{i}\in [c_{j},c_{k}]\subset (c_{j}-\epsilon <c_{k}+\epsilon )\subset (a,b)}
e
c
i
∈
[
c
j
,
c
k
]
⊂
(
a
+
ϵ
,
b
−
ϵ
)
⊂
(
a
,
b
)
{\displaystyle c_{i}\in [c_{j},c_{k}]\subset (a+\epsilon ,b-\epsilon )\subset (a,b)}
(4) por (2) é verdade que
n
>
n
0
=
m
a
x
{
n
1
,
n
2
}
⇒
a
n
∈
(
a
−
ϵ
,
b
+
ϵ
)
.
{\displaystyle n>n_{0}=max\{n_{1},n_{2}\}\Rightarrow a_{n}\in (a-\epsilon ,b+\epsilon ).}
Mas não pode existir
b
n
,
c
n
∈
(
a
+
ϵ
,
b
−
ϵ
)
c
o
m
n
>
n
0
(
S
e
n
d
o
ϵ
<
a
+
b
2
)
{\displaystyle b_{n},c_{n}\in (a+\epsilon ,b-\epsilon )\;com\;n>n_{0}(Sendo\;\epsilon <{a+b \over 2})}
∄
b
j
≥
c
i
,
∀
i
,
j
∈
N
⇒
b
i
<
c
j
,
∀
i
,
j
∈
N
{\displaystyle \not \exists b_{j}\geq c_{i},\forall \;i,j\in \mathbb {N} \Rightarrow b_{i}<c_{j},\forall \;i,j\in \mathbb {N} }
Se
b
n
{\displaystyle b_{n}\;}
fosse decrescente ou não-crescente, teríamos
b
n
∈
[
a
,
a
+
ϵ
)
.
{\displaystyle b_{n}\in [a,a+\epsilon ).}
Como
n
>
n
0
⇒
b
n
∈
(
a
,
b
+
ϵ
)
,
a
s
s
i
m
b
<
b
i
{\displaystyle n>n_{0}\Rightarrow b_{n}\in (a,b+\epsilon ),\;assim\;b<b_{i}}
para algum
b
i
.
{\displaystyle b_{i}\;.}
(contradição). Da mesma forma fazemos com
c
n
{\displaystyle c_{n}\;}
Uma classe muito importante de sequências são as sequências de Cauchy, que são muito importantes não só para a Análise Real, mas também para a Análise Matemática e Topologia.
Seja
(
a
n
)
{\displaystyle (a_{n})\;}
uma sequência convergente para um ponto
a
.
{\displaystyle a\;.}
Como
(
a
n
)
{\displaystyle (a_{n})\;}
converge para
a
,
{\displaystyle a\;,}
qualquer que seja
ϵ
>
0
,
{\displaystyle \epsilon >0\;,}
existe
n
0
{\displaystyle n_{0}\;}
tal que, se
n
>
n
0
,
{\displaystyle n>n_{0}\;,}
então
|
a
n
−
a
|
<
ϵ
/
2
.
{\displaystyle |a_{n}-a|<\epsilon /2\;.}
Portanto, se
n
,
m
>
n
0
,
{\displaystyle n,m>n_{0}\;,}
então
|
a
n
−
a
m
|
≤
|
a
n
−
a
|
+
|
a
m
−
a
|
<
ϵ
/
2
+
ϵ
/
2
=
ϵ
.
{\displaystyle |a_{n}-a_{m}|\leq |a_{n}-a|+|a_{m}-a|<\epsilon /2+\epsilon /2=\epsilon .}
Portanto
(
a
n
)
{\displaystyle (a_{n})\;}
é de Cauchy.
Se
(
x
n
)
{\displaystyle (x_{n})\;}
é uma sequência de números reais de Cauchy, então existem
m
,
M
{\displaystyle m,M\;}
reais tais que
m
≤
x
n
≤
M
,
{\displaystyle m\leq x_{n}\leq M,}
para todo n natural.
Como
(
x
n
)
{\displaystyle (x_{n})\;}
é uma sequência de Cauchy, dado
ϵ
>
0
,
{\displaystyle \epsilon >0\;,}
existe
n
0
{\displaystyle n_{0}\;}
natural tal que, se
n
,
m
>
n
0
,
{\displaystyle n,m>n_{0}\;,}
então
|
x
n
−
x
m
|
<
ϵ
,
{\displaystyle |x_{n}-x_{m}|<\epsilon \;,}
portanto
|
x
n
−
x
n
0
+
1
)
|
<
ϵ
,
{\displaystyle |x_{n}-x_{{n_{0}}+1})|<\epsilon ,}
de onde concluimos que
x
n
∈
(
x
n
0
+
1
−
ϵ
,
x
n
0
+
1
+
ϵ
)
.
{\displaystyle x_{n}\in (x_{{n_{0}}+1}-\epsilon ,x_{{n_{0}}+1}+\epsilon ).}
Como
{
x
0
,
x
1
,
.
.
.
,
x
n
0
}
{\displaystyle \{x_{0},x_{1},...,x_{n_{0}}\}}
é um conjunto finito, sabemos que ele tem maior e menor elemento, então podemos definir
s
=
m
i
n
{
x
0
,
x
1
,
.
.
.
,
x
n
0
}
,
S
=
m
a
x
{
x
0
,
x
1
,
.
.
.
,
x
n
0
}
,
{\displaystyle s=min\{x_{0},x_{1},...,x_{n_{0}}\},S=max\{x_{0},x_{1},...,x_{n_{0}}\},}
Desta forma definindo
m
=
m
i
n
{
s
,
x
n
0
+
1
−
ϵ
}
{\displaystyle m=min\{s,x_{{n_{0}}+1}-\epsilon \}}
e
M
=
m
a
x
{
S
,
x
n
0
+
1
+
ϵ
}
,
{\displaystyle M=max\{S,x_{{n_{0}}+1}+\epsilon \},}
temos que
m
≤
x
n
≤
M
,
{\displaystyle m\leq x_{n}\leq M,}
para todo
n
{\displaystyle n\;}
natural. Como queríamos.
Se
(
a
n
)
{\displaystyle (a_{n})\;}
em
R
{\displaystyle \mathbb {R} }
é uma sequência de Cauchy com subsequência
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
convergente para
a
,
{\displaystyle a\;,}
então
(
a
n
)
{\displaystyle (a_{n})\;}
converge para
a
.
{\displaystyle a\;.}
Dado
ϵ
>
0
,
{\displaystyle \epsilon >0\;,}
como
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
converge para
a
,
{\displaystyle a\;,}
existe
n
k
0
{\displaystyle n_{k_{0}}}
tal que se
n
k
≥
n
k
0
,
{\displaystyle n_{k}\geq n_{k_{0}},}
então
|
a
−
a
n
k
|
<
ϵ
/
2.
{\displaystyle |a-a_{n_{k}}|<\epsilon /2.}
Como
(
a
n
)
{\displaystyle (a_{n})\;}
é Cauchy, existe
n
0
>
0
t
a
l
q
u
e
n
,
m
≥
n
0
,
{\displaystyle n_{0}>0\;tal\;que\;n,m\geq n_{0},}
então
|
a
m
−
a
n
|
<
ϵ
/
2
.
{\displaystyle |a_{m}-a_{n}|<\epsilon /2\;.}
Tome agora
n
k
1
=
max
(
n
k
0
,
n
0
)
{\displaystyle n_{k_{1}}=\max(n_{k_{0}},n_{0})}
. Assim, pela desigualdade triangular, se
n
>
n
k
1
,
{\displaystyle n>n_{k_{1}}\;,}
então
|
a
−
a
n
|
≤
|
a
−
a
n
k
1
|
+
|
a
n
k
1
+
a
n
|
≤
ϵ
/
2
+
ϵ
/
2
=
ϵ
.
{\displaystyle |a-a_{n}|\leq |a-a_{n_{k_{1}}}|+|a_{n_{k_{1}}}+a_{n}|\leq \epsilon /2+\epsilon /2=\epsilon .}
Seja
(
a
n
)
{\displaystyle (a_{n})\;}
uma sequência qualquer e considere o conjunto
B
=
{
a
n
:
a
n
≤
a
k
,
∀
k
∈
N
,
k
>
n
}
.
{\displaystyle B=\{a_{n}:a_{n}\leq a_{k},\forall k\in \mathbb {N} ,k>n\}.}
Se
B
{\displaystyle B\;}
for infinito, então
(
a
n
)
{\displaystyle (a_{n})\;}
tem subsequência não decrescente, caso contrário
(
a
n
)
{\displaystyle (a_{n})\;}
tem subsequência decrescente.
Se
(
a
n
)
{\displaystyle (a_{n})\;}
é uma sequência de Cauchy, pelo lema anterior, existe uma subsequência
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
monótona. Como
(
a
n
)
{\displaystyle (a_{n})\;}
é Cauchy,
(
a
n
)
{\displaystyle (a_{n})\;}
é limitada e portanto a subsequência
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
também é limitada. Como toda sequência real monótona limitada converge, temos que
(
a
n
k
)
{\displaystyle (a_{n_{k}})}
converge, logo
(
a
n
)
{\displaystyle (a_{n})\;}
converge também, pois tem subsequência convergente. Concluímos que toda sequência real de Cauchy converge.
Vimos, em um capítulo anterior (Enumerabilidade ) que existem conjuntos enumeráveis e conjuntos que não são enumeráveis. A prova será feita agora; mais especificamente, mostraremos que o intervalo fechado [0, 1] não é enumerável (o resultado para
R
{\displaystyle \mathbb {R} \,}
é imediato, pois
[
0
,
1
]
⊆
R
{\displaystyle [0,1]\subseteq \mathbb {R} \,}
).
Seja portanto
s
:
N
→
[
0
,
1
]
{\displaystyle s:\mathbb {N} \to [0,1]\,}
uma sequência qualquer de números reais entre zero e um.
Vamos construir uma sequência de intervalos, por indução finita, definindo:
I
0
=
[
0
,
1
]
{\displaystyle I_{0}=[0,1]\,}
Seja
I
n
=
[
a
,
b
]
{\displaystyle I_{n}=[a,b]\,}
e sejam
m
=
a
+
b
2
{\displaystyle m={\frac {a+b}{2}}}
,
a
1
=
2
a
+
b
3
{\displaystyle a_{1}={\frac {2a+b}{3}}\,}
e
b
1
=
a
+
2
b
3
{\displaystyle b_{1}={\frac {a+2b}{3}}}
. Então definimos
I
n
+
1
=
[
a
,
a
1
]
{\displaystyle I_{n+1}=[a,a_{1}]\,}
se
x
n
>
m
{\displaystyle x_{n}>m\,}
, e
I
n
+
1
=
[
b
1
,
b
]
{\displaystyle I_{n+1}=[b_{1},b]\,}
caso contrário.
Por construção, é fácil ver que
…
I
2
⊂
I
1
⊂
I
0
{\displaystyle \ldots I_{2}\subset I_{1}\subset I_{0}\,}
. Além disso, temos que
∀
n
,
x
n
∉
I
n
+
1
{\displaystyle \forall n,x_{n}\not \in I_{n+1}\,}
.
Consideremos, então, a interseção de todos os intervalos
A
=
I
0
∩
I
1
∩
I
2
…
{\displaystyle A=I_{0}\cap I_{1}\cap I_{2}\ldots \,}
. Pela propriedade dos intervalos encaixados , este conjunto não é vazio (este conjunto é unitário, mas este detalhe não é importante neste prova).
Assim, temos que existe a ,
a
∈
A
{\displaystyle a\in A\,}
. Mas, pela propriedade de que
∀
n
,
x
n
∉
I
n
+
1
{\displaystyle \forall n,x_{n}\not \in I_{n+1}\,}
, temos que
x
n
∉
A
{\displaystyle x_{n}\not \in A\,}
, ou seja, a é diferente de cada um dos xn .
Em outras palavras, dada uma sequência de números entre 0 e 1, é possível construir um número real que não está nesta sequência.
Ou seja, o intervalo [0, 1] (portanto, os números reais) não é um conjunto enumerável.
Série de uma sequência é a soma de todos os elementos de uma sequência infinita. Como uma sequência
(
x
n
)
n
∈
N
{\displaystyle (x_{n})_{n\in \mathbb {N} }}
, têm infinitos termos, assim podemos dizer mais formalmente que:
Série de uma sequência é a soma infinita de uma sequência
Dada uma sequência
(
x
n
)
n
∈
N
{\displaystyle (x_{n})_{n\in \mathbb {N} }}
, como somaremos todos os seus termos?
vamos tomar
(
s
n
)
n
∈
N
{\displaystyle (s_{n})_{n\in \mathbb {N} }}
como uma sequência de soma dos termos de
(
x
n
)
n
∈
N
{\displaystyle (x_{n})_{n\in \mathbb {N} }}
. Assim:
s
1
=
a
1
{\displaystyle s_{1}=a_{1}\;}
,
s
2
=
∑
n
=
1
2
a
n
{\displaystyle s_{2}=\sum _{n=1}^{2}a_{n}\;}
,
s
m
=
∑
n
=
1
m
a
n
{\displaystyle s_{m}=\sum _{n=1}^{m}a_{n}\;}
s
=
lim
s
n
=
∑
n
=
1
∞
a
n
{\displaystyle s=\lim s_{n}=\sum _{n=1}^{\infty }a_{n}\;}
Proposição: é condição necessária para convergência de uma série que seu termo geral tenda para 0.
Se
s
=
lim
s
n
=
∑
n
=
1
∞
a
n
{\displaystyle s=\lim s_{n}=\sum _{n=1}^{\infty }a_{n}\;}
é uma série convergente então
lim
a
n
=
0
{\displaystyle \lim \;a_{n}=0}
Demonstração
a
n
=
∑
k
=
1
n
a
k
−
∑
k
=
1
n
−
1
a
k
{\displaystyle a_{n}=\sum _{k=1}^{n}a_{k}-\sum _{k=1}^{n-1}a_{k}\,}
tomando limites, temos:
lim
a
n
=
s
−
s
=
0
{\displaystyle \lim a_{n}=s-s=0\,}
Observação
A recíproca é, no entanto, falsa. Um contraexemplo simples é dado pela série harmônica
∑
1
∞
1
/
n
{\displaystyle \sum _{1}^{\infty }1/n\,}
que não é convergente[ 1] , apesar de seu termo geral convergir para zero [ 2] .
Seja
∑
a
n
=
a
,
∑
b
n
=
b
{\displaystyle \sum a_{n}=\;a,\sum b_{n}=b}
convergentes. Pelas propriedades de soma e produto
∑
a
n
+
∑
b
n
=
∑
(
a
n
+
b
n
)
{\displaystyle \sum a_{n}+\sum b_{n}=\sum (a_{n}+b_{n})\;}
converge para a + b
t
∑
a
n
=
∑
t
a
n
{\displaystyle t\sum a_{n}=\sum ta_{n}\;}
converge para ta
(
∑
a
n
)
(
∑
b
n
)
=
{\displaystyle (\sum a_{n})(\sum b_{n})=\;}
converge para ab
∑
n
=
1
∞
a
n
⇒
∑
n
=
n
0
∞
a
n
{\displaystyle \sum _{n=1}^{\infty }a_{n}\Rightarrow \sum _{n=n_{0}}^{\infty }a_{n}}
converge para p .
p
=
a
−
∑
n
=
1
n
0
−
1
a
n
{\displaystyle p=a-\sum _{n=1}^{n_{0}-1}a_{n}\,}
Se
a
n
≥
0
,
∀
n
∈
N
⇒
p
<
a
{\displaystyle a_{n}\geq 0,\forall n\in \mathbb {N} \Rightarrow p<a}
A série geométrica é a é formada por termos em progressão geométrica:
∑
n
=
0
∞
r
n
=
1
+
r
+
r
2
+
r
3
+
…
{\displaystyle \sum _{n=0}^{\infty }r^{n}=1+r+r^{2}+r^{3}+\ldots }
Da teoria das progressões geométricas, temos que:
∑
n
=
0
N
r
n
=
1
−
r
N
+
1
1
−
r
=
1
1
−
r
−
r
N
+
1
1
−
r
{\displaystyle \sum _{n=0}^{N}r^{n}={\frac {1-r^{N+1}}{1-r}}={\frac {1}{1-r}}-{\frac {r^{N+1}}{1-r}}}
É facil ver que se
|
r
|
<
1
{\displaystyle |r|<1}
então esta série é convergente e sua soma é dada por:
∑
n
=
0
∞
r
n
=
1
1
−
r
{\displaystyle \sum _{n=0}^{\infty }r^{n}={\frac {1}{1-r}}}
Por outro lado, se
|
r
|
≥
1
{\displaystyle |r|\geq 1}
, esta série não pode ser convergente pelo teste do termo geral, demonstrado logo acima.
De maneira geral, para qualquer série geométrica, cujo valor da razão r seja menor que 1, sua soma é dada por:
∑
n
=
0
∞
a
r
n
=
a
1
−
r
{\displaystyle \sum _{n=0}^{\infty }ar^{n}={\frac {a}{1-r}}}
Onde "a" é o termo inicial da série.
↑ Veja, por exemplo, esta página
↑ Conforme se vê nesta página
Conceitos da topologia da reta que serão usados na Análise Real. Nota: para usar uma analogia com a geometria, um número real x também será chamado de um ponto x .
Seja X um conjunto real, a vizinhança de um elemento x de X são todos os elementos y que estão próximo de x a um "raio"
ϵ
{\displaystyle \epsilon \;}
, isto é,
|
x
−
y
|
{\displaystyle |x-y|}
deve ser menor estrito a
ϵ
{\displaystyle \epsilon \;}
. Portanto
V
ϵ
(
x
)
=
{
y
∈
R
;
|
x
−
y
|
<
ϵ
}
=
B
(
x
,
ϵ
)
=
(
x
−
ϵ
,
x
+
ϵ
)
=
{
y
∈
R
;
x
−
ϵ
<
y
<
x
+
ϵ
}
{\displaystyle V_{\epsilon }(x)=\{y\in \mathbb {R} ;|x-y|<\epsilon \}=B(x,\epsilon )=(x-\epsilon ,x+\epsilon )=\{y\in \mathbb {R} ;x-\epsilon <y<x+\epsilon \}}
⋂
∀
ϵ
>
0
V
ϵ
(
x
)
=
{
x
}
{\displaystyle \bigcap _{\forall \epsilon >0}V_{\epsilon }(x)=\{x\}}
Tome
x
,
y
∈
X
,
x
≠
y
⇒
∃
ϵ
>
0
;
V
ϵ
(
x
)
∩
V
ϵ
(
y
)
=
∅
{\displaystyle x,y\in X,x\neq y\Rightarrow \exists \;\epsilon >0;V_{\epsilon }(x)\cap V_{\epsilon }(y)=\emptyset }
Tome
x
∈
X
,
δ
<
ϵ
⇒
V
δ
(
x
)
⊂
V
ϵ
(
x
)
{\displaystyle x\in X,\delta <\epsilon \Rightarrow V_{\delta }(x)\subset V_{\epsilon }(x)}
Tome
y
∈
V
δ
(
x
)
⇒
|
y
−
x
|
<
δ
{\displaystyle y\in V_{\delta }(x)\Rightarrow |y-x|<\delta }
, como
δ
<
ϵ
⇒
|
y
−
x
|
<
δ
<
ϵ
⇒
y
∈
V
ϵ
(
x
)
{\displaystyle \delta <\epsilon \Rightarrow |y-x|<\delta <\epsilon \Rightarrow y\in V_{\epsilon }(x)}
Um ponto x é dito ponto interior de um conjunto
X
⊂
R
,
{\displaystyle X\subset \mathbb {R} ,}
se, e somente, se
∃
V
ϵ
(
x
)
⊆
X
{\displaystyle \exists \;V_{\epsilon }(x)\subseteq X}
Usamos a notação
i
n
t
(
X
)
{\displaystyle int(X)\,}
para denotar o conjunto de todos os pontos interiores do conjunto
X
{\displaystyle X\,}
X
f
i
n
i
t
o
⇒
i
n
t
(
X
)
=
∅
{\displaystyle Xfinito\Rightarrow int(X)=\emptyset }
( A recíproca é falsa, por exemplo
i
n
t
(
Q
)
=
∅
{\displaystyle int(\mathbb {Q} )=\emptyset }
)
i
n
t
(
X
)
=
{
x
∈
X
;
V
ϵ
(
x
)
⊂
X
,
para algum
ϵ
>
0
}
{\displaystyle int(X)=\{x\in X;V_{\epsilon }(x)\subset X,{\mbox{ para algum }}\epsilon >0\}}
.
∃
V
ϵ
(
x
)
⊂
X
⇒
x
∈
i
n
t
(
X
)
{\displaystyle \exists V_{\epsilon }(x)\subset X\Rightarrow x\in int(X)}
.
Todo ponto x é um ponto interior de
R
{\displaystyle \mathbb {R} \,}
Todo número real x com a < x < b é um ponto interior do intervalo aberto (a , b ). É fácil ver que nenhum outro ponto é ponto interior de (a , b ); por exemplo, a não é ponto interior de (a , b ) porque qualquer intervalo aberto em volta de a incluirá pontos menores que a .
Analogamente, os pontos interiores do intervalo fechado [a , b ] formam o intervalo aberto (a , b ).
Nenhum ponto é ponto interior de
N
,
{\displaystyle \mathbb {N} \,,}
Z
{\displaystyle \mathbb {Z} \,}
ou
Q
.
{\displaystyle \mathbb {Q} \,.}
Dado
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
. Um ponto
x
∈
R
{\displaystyle x\in \mathbb {R} }
é dito ponto da fronteira de
X
{\displaystyle X\;}
, se toda vizinhança de x intersecta
X
e
R
−
X
{\displaystyle X{\mbox{ e }}\mathbb {R} -X\;}
.
∀
ϵ
>
0
,
V
ϵ
(
x
)
∩
X
≠
∅
e
V
ϵ
(
x
)
∩
R
−
X
≠
∅
⇒
x
∈
∂
X
{\displaystyle \forall \;\epsilon >0,V_{\epsilon }(x)\cap X\neq \varnothing {\mbox{ e }}V_{\epsilon }(x)\cap \mathbb {R} -X\neq \varnothing \Rightarrow x\in \partial X}
Denotamos o conjunto dos pontos da fronteira do conjunto
A
{\displaystyle A}
por
∂
A
{\displaystyle \partial A}
.
Dizemos que um conjunto
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
é conjunto aberto se todos seus pontos forem pontos interiores, ou seja:
∀
x
∈
X
,
∃
ϵ
>
0
;
V
ϵ
(
x
)
⊂
X
.
{\displaystyle \forall \;x\in X,\exists \;\epsilon >0;V_{\epsilon }(x)\subset X.}
∀
x
∈
X
,
∃
ϵ
;
V
ϵ
(
x
)
⊂
X
⇒
X
{\displaystyle \forall x\in X,\exists \epsilon \;;V_{\epsilon }(x)\subset X\Rightarrow X}
é aberto.
Dizemos que um conjunto
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
não é conjunto aberto se
∃
x
∈
X
;
∀
ϵ
>
0
;
V
ϵ
(
x
)
⊄
X
.
{\displaystyle \exists \;x\in X;\forall \;\epsilon >0;V_{\epsilon }(x)\not \subset X.}
Um conjunto é aberto se
A
∩
∂
A
=
∅
{\displaystyle A\cap \partial A=\varnothing }
.
O intervalo aberto
(
a
,
b
)
⊂
R
,
{\displaystyle (a,b)\subset \mathbb {R} ,}
com
a
<
b
{\displaystyle a<b\;}
é aberto, de fato, dado
x
∈
(
a
,
b
)
,
{\displaystyle x\in (a,b),}
tomando
ϵ
=
m
i
n
{
x
−
a
,
b
−
x
}
,
{\displaystyle \epsilon =min\{x-a,b-x\}\;,}
temos que
(
x
−
ϵ
,
x
+
ϵ
)
⊂
(
a
,
b
)
.
{\displaystyle (x-\epsilon ,x+\epsilon )\subset (a,b).}
Portanto, o intervalo aberto é, de fato, aberto.
[
a
,
b
)
⊂
R
,
{\displaystyle [a,b)\subset \mathbb {R} ,}
com
a
<
b
{\displaystyle a<b\;}
não é aberto, pois, qualquer que seja
ϵ
>
0
,
(
a
−
ϵ
,
a
+
ϵ
)
⊄
[
a
,
b
)
.
{\displaystyle \epsilon >0,(a-\epsilon ,a+\epsilon )\not \subset [a,b).}
(
a
,
∞
)
⊂
R
,
{\displaystyle (a,\infty )\subset \mathbb {R} ,}
é aberto, de fato, dado
x
∈
(
a
,
∞
)
,
{\displaystyle x\in (a,\infty ),}
tomando
ϵ
=
x
−
a
,
{\displaystyle \epsilon =x-a,\;}
temos que
(
x
−
ϵ
,
x
+
ϵ
)
⊂
(
a
,
∞
)
.
{\displaystyle (x-\epsilon ,x+\epsilon )\subset (a,\infty ).}
(
−
∞
,
b
)
⊂
R
,
{\displaystyle (-\infty ,b)\subset \mathbb {R} ,}
é aberto, de fato, dado
x
∈
(
−
∞
,
b
)
,
{\displaystyle x\in (-\infty ,b),}
tomando
ϵ
=
b
−
x
,
{\displaystyle \epsilon =b-x,\;}
temos que
(
x
−
ϵ
,
x
+
ϵ
)
⊂
(
−
∞
,
b
)
.
{\displaystyle (x-\epsilon ,x+\epsilon )\subset (-\infty ,b).}
Os conjuntos
R
{\displaystyle \mathbb {R} }
e
∅
{\displaystyle \emptyset \,}
são abertos.
A união de uma família arbitrária de conjuntos abertos é um conjunto aberto.
A intersecção de uma família finita de conjuntos abertos é um conjunto aberto.
Demonstração
1. Imediato da definição.
2.Seja
{
O
λ
}
{\displaystyle \{O_{\lambda }\}\,}
uma família de conjuntos abertos indexada pelo índice
λ
∈
Λ
{\displaystyle \lambda \in \Lambda \,}
e seja:
O
=
⋃
λ
∈
Λ
O
λ
.
{\displaystyle O=\bigcup _{\lambda \in \Lambda }O_{\lambda }\,.}
Então se
x
∈
O
,
{\displaystyle x\in O\,,}
existe um
λ
′
∈
Λ
{\displaystyle \lambda '\in \Lambda \,}
tal que
x
∈
O
λ
′
.
{\displaystyle x\in O_{\lambda '}\,.}
Como
O
λ
′
{\displaystyle O_{\lambda '}\,}
é aberto, existe um intervalo
(
a
,
b
)
{\displaystyle (a,b)\,}
com
a
<
b
{\displaystyle a<b\,}
tal que:
x
∈
(
a
,
b
)
⊆
O
λ
′
{\displaystyle x\in (a,b)\subseteq O_{\lambda '}\,}
Como
O
λ
′
⊆
⋃
λ
∈
Λ
O
λ
,
{\displaystyle O_{\lambda '}\subseteq \bigcup _{\lambda \in \Lambda }O_{\lambda }\,,}
temos que:
x
∈
(
a
,
b
)
⊆
O
{\displaystyle x\in (a,b)\subseteq O\,}
E portanto
O
{\displaystyle O\,}
é aberto.
3.Seja
{
O
k
}
k
=
1
n
{\displaystyle \{O_{k}\}_{k=1}^{n}}
uma família finita de conjuntos aberto e seja
O
=
⋂
k
=
1
n
O
k
{\displaystyle O=\bigcap _{k=1}^{n}O_{k}\,}
e
x
∈
O
.
{\displaystyle x\in O\,.}
Como
x
∈
O
k
,
k
=
1
,
…
,
n
{\displaystyle x\in O_{k},k=1,\ldots ,n\,}
e cada
O
k
{\displaystyle O_{k}\,}
é aberto. Existem intervalos
(
a
k
,
b
k
)
{\displaystyle (a_{k},b_{k})\,}
tais que:
x
∈
(
a
k
,
b
k
)
⊆
O
k
{\displaystyle x\in (a_{k},b_{k})\subseteq O_{k}\,}
Naturalmente vale que
a
k
<
x
<
b
k
.
{\displaystyle a_{k}<x<b_{k}\,.}
Agora definimos:
a
=
max
{
a
k
}
k
=
1
n
b
=
min
{
b
k
}
k
=
1
n
{\displaystyle a=\max\{a_{k}\}_{k=1}^{n}\quad b=\min\{b_{k}\}_{k=1}^{n}\,}
É fácil ver que
a
<
x
<
b
{\displaystyle a<x<b\,}
e também que:
x
∈
(
a
,
b
)
⊆
O
k
,
k
=
1
,
…
,
n
{\displaystyle x\in (a,b)\subseteq O_{k},k=1,\ldots ,n\,}
e portanto:
x
∈
(
a
,
b
)
⊆
O
.
{\displaystyle x\in (a,b)\subseteq O\,.}
O que completa a demonstração.
Seja
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
. As afirmativas abaixo são equivalentes.
(1) X é aberto.
(2) Todo ponto de X é ponto interior.
(3) X é uma vizinhança de seus pontos.
Vamos mostrar que
(
1
)
⇒
(
2
)
⇒
(
3
)
⇒
(
1
)
.
{\displaystyle (1)\Rightarrow (2)\Rightarrow (3)\Rightarrow (1).}
Assumindo (1), Seja
x
∈
X
{\displaystyle x\in X\;}
. Como por hipótese, X é aberto, temos que
∃
ϵ
>
0
,
V
ϵ
(
x
)
⊂
X
{\displaystyle \exists \;\epsilon >0,V_{\epsilon }(x)\subset X}
. Logo x é ponto interior de X. Como x é arbitrário, obtemos (2).
Seja agora (2) verdadeiro. Se
x
∈
X
{\displaystyle x\in X\;}
, então por hipótese, x é ponto interior de X, i.e.,
∃
ϵ
>
0
,
V
ϵ
(
x
)
⊂
X
{\displaystyle \exists \;\epsilon >0,V_{\epsilon }(x)\subset X}
existe um aberto em X contendo x. Logo, por definição, X é uma vizinhança de x e (3) vale.
Finalmente, assumindo (3), tome para cada
x
∈
X
{\displaystyle x\in X\;}
um aberto
I
x
⊂
B
{\displaystyle I_{x}\subset B}
tal que
x
∈
I
x
{\displaystyle x\in I_{x}}
.
Então
X
=
⋃
x
∈
B
I
x
{\displaystyle X=\bigcup _{x\in B}I_{x}}
é aberto pois é união de abertos.
Ponto aderente de um conjunto é definido como todo ponto a que é limite de uma sequência de pontos xn ∈ X ⊂
R
.
{\displaystyle \mathbb {R} .}
Todo ponto a de um conjunto
X
{\displaystyle X\,}
é também um ponto aderente, pois ele é o limite da sequência constante
x
n
=
a
.
{\displaystyle x_{n}=a\,.}
Um ponto aderente pode não pertencer ao conjunto, por exemplo, o conjunto
X
:=
{
1
/
n
}
n
=
1
∞
{\displaystyle X:=\left\{1/n\right\}_{n=1}^{\infty }\,}
possui 0 como ponto aderente, mas 0 não pertence a X .
valor de aderência de uma sequência é um ponto aderente do conjunto
{
x
1
,
x
2
,
.
.
.
,
x
n
,
.
.
.
}
.
{\displaystyle \{x_{1},x_{2},...,x_{n},...\}.}
O único valor de aderência de
{
x
1
,
x
2
,
.
.
.
,
x
n
,
.
.
.
}
∪
{
a
=
lim
x
n
}
{\displaystyle \{x_{1},x_{2},...,x_{n},...\}\cup \{a=\lim x_{n}\}}
é a .
As seguintes afirmações são equivalentes:
a
{\displaystyle a}
é ponto aderente de
X
{\displaystyle X}
Para todo
ϵ
>
0
,
{\displaystyle \epsilon >0\,,}
existe um ponto
x
∈
X
{\displaystyle x\in X\,}
tal que
|
x
−
a
|
≤
ε
{\displaystyle \left|x-a\right|\leq \varepsilon }
B
(
a
,
ϵ
)
∩
X
≠
∅
{\displaystyle B(a,\epsilon )\cap X\not =\varnothing \,}
para todo
ϵ
>
0
;
{\displaystyle \epsilon >0\,;}
Demonstração
1 →2 : Se a é um ponto aderente de X , por definição, existe um sequência
x
n
∈
X
{\displaystyle x_{n}\in X\,}
tal que
x
n
→
a
.
{\displaystyle x_{n}\to a.}
Da definição de limite de sequências, para todo
ϵ
>
0
,
{\displaystyle \epsilon >0\,,}
existe um
x
k
{\displaystyle x_{k}\,}
tal que
|
x
k
−
a
|
≤
ε
.
{\displaystyle \left|x_{k}-a\right|\leq \varepsilon .}
Como
x
k
∈
X
,
{\displaystyle x_{k}\in X\,,}
basta definir
x
=
x
k
{\displaystyle x=x_{k}\,}
e o resultado segue.
2 →3 :Suponha que
x
∈
X
{\displaystyle x\in X\,}
e
|
x
−
a
|
≤
ε
.
{\displaystyle \left|x-a\right|\leq \varepsilon \,.}
Como
B
(
a
,
ϵ
)
=
{
x
∈
R
:
|
x
−
a
|
<
ϵ
}
,
{\displaystyle B(a,\epsilon )=\left\{x\in \mathbb {R} :|x-a|<\epsilon \right\},}
x
∈
B
(
a
,
ϵ
)
{\displaystyle x\in B(a,\epsilon )\,}
e o resultado segue.
3 →1 :Defina a sequência
x
n
,
{\displaystyle x_{n}\,,}
escolhendo-os de forma que
x
n
∈
B
(
a
,
1
/
n
)
∩
X
.
{\displaystyle x_{n}\in B(a,1/n)\cap X\,.}
Esta sequência tem a propriedade que
x
n
∈
X
{\displaystyle x_{n}\in X\,}
e
|
x
n
−
a
|
<
1
/
n
,
{\displaystyle \left|x_{n}-a\right|<1/n\,,}
logo
x
n
→
a
{\displaystyle x_{n}\to a\,}
e o resultado segue.
Define-se o fecho de um conjunto X como o conjunto dos pontos aderentes de X e denota-se por
X
¯
:
{\displaystyle {\bar {X}}:}
X
¯
:=
{
a
∈
R
:
∀
ϵ
>
0.
B
(
a
,
ϵ
)
∩
X
≠
∅
}
{\displaystyle {\bar {X}}:=\left\{a\in \mathbb {R} :\forall \epsilon >0.B(a,\epsilon )\cap X\not =\varnothing \right\}}
Os fechos de
R
{\displaystyle \mathbb {R} \,}
e
∅
{\displaystyle \varnothing \,}
são eles mesmos
O fecho do conjunto {1, 1/2, 1/3, ...} é o conjunto {0, 1, 1/2, 1/3, ...}
Como cada número irracional pode ser arredondado com a precisão que se queira por números racionais, existe, para todo
x
∈
R
{\displaystyle x\in \mathbb {R} \,}
uma sequência de números racionais
q
i
{\displaystyle q_{i}\,}
que converge para x . Ou seja, o fecho de
Q
{\displaystyle \mathbb {Q} \,}
é
R
{\displaystyle \mathbb {R} \,}
Uma sequência de números naturais (ou inteiros) só será convergente se ela for constante a partir de algum índice. Portanto, uma sequência de números naturais (ou inteiros), se converge, converge para um número natural (resp. inteiro). Ou seja, os fechos de
N
{\displaystyle \mathbb {N} \,}
e
Z
{\displaystyle \mathbb {Z} \,}
são eles mesmos.
O fecho de qualquer intervalo (a , b ), (a , b ], [a , b ) ou [a , b ], em que a < b , é o intervalo fechado [a , b ]. É fácil ver que nenhum ponto x < a e nenhum ponto x > b pode ser ponto aderente; então basta provar que a é um ponto aderente de (a , b ) (os demais casos são similares). Mas isto equivale a dizer que existe uma sequência com elementos em (a , b ) que converge para a . Tomando-se a sequência a + 1, a + 1/2, a + 1/3, ..., é fácil ver que esta sequência converge para a . Então, por definição, para ε = b - a > 0, existe N tal que se n > N , então |a - (a + 1/n )| < ε . Reescrevendo, temos que para n > N , 1/n < b - a , ou seja, a + 1/n < b . Como a + 1/n > a , temos que
a
+
1
/
n
∈
(
a
,
b
)
.
{\displaystyle a+1/n\in (a,b)\,.}
Portanto, a sequência de elementos do intervalo (a , b ) dada por a + 1/N , a + 1/(N + 1), a + 1/(N + 2), ... é uma sequência de elementos de (a , b ) que converge para a .
Um conjunto
X
{\displaystyle X\,}
é dito conjunto fechado se e somente ele é igual ao seu fecho:
X
=
X
¯
{\displaystyle X={\bar {X}}\,}
São fechados:
R
,
{\displaystyle \mathbb {R} \,,}
∅
,
{\displaystyle \varnothing \,,}
N
,
{\displaystyle \mathbb {N} \,,}
Z
,
[
a
,
b
]
,
[
a
,
∞
)
,
(
−
∞
,
b
]
{\displaystyle \mathbb {Z} \,,[a,b],[a,\infty ),(-\infty ,b]}
.
Não são fechados:
Q
,
R
−
Q
,
(
a
,
b
)
,
(
a
,
b
]
,
[
a
,
b
)
{\displaystyle \mathbb {Q} ,\mathbb {R} -\mathbb {Q} ,(a,b),(a,b],[a,b)}
.
Um conjunto é fechado se, e somente se, seu complementar for um conjunto aberto. De fato, este é talvez o principal teorema sobre conjuntos fechados. Nos estudos mais avançados da chamada "topologia geral", os fechados são usualmente definidos através desta caracterização.
a. Suponha que X seja um conjunto fechado e O seja o complementar de X nos reais:
O
=
R
∖
X
{\displaystyle O=\mathbb {R} \backslash X\,}
Suponha por absurdo que
O
{\displaystyle O\,}
não seja um conjunto aberto, ou seja, suponha a existência de um ponto
x
∈
O
{\displaystyle x\in O\,}
tal que:
∀
ϵ
>
0
;
B
(
x
,
ϵ
)
⊈
O
{\displaystyle \forall \epsilon >0;B(x,\epsilon )\nsubseteq O\,}
Como
O
∪
X
=
R
{\displaystyle O\cup X=\mathbb {R} \,}
temos que
B
(
x
,
ϵ
)
⊈
O
⟹
B
(
x
,
ϵ
)
∪
X
≠
∅
{\displaystyle B(x,\epsilon )\nsubseteq O\Longrightarrow B(x,\epsilon )\cup X\neq \emptyset \,}
Esta propriedade implica que
x
∈
X
¯
{\displaystyle x\in {\bar {X}}\,}
e como X é fechado,
x
∈
X
,
{\displaystyle x\in X\,,}
o que contraria a hipótese inicial de que
x
∈
O
{\displaystyle x\in O\,}
e
O
=
R
∖
X
.
{\displaystyle O=\mathbb {R} \backslash X\,.}
b. Suponha que X seja o complementar nos reais de um conjunto aberto O :
X
=
R
∖
O
{\displaystyle X=\mathbb {R} \backslash O\,}
Suponha a existência de uma sequência
x
n
∈
X
{\displaystyle x_{n}\in X\,}
tal que:
lim
n
→
∞
x
n
=
x
{\displaystyle \lim _{n\to \infty }x_{n}=x\,}
Queremos mostrar que
x
∈
X
.
{\displaystyle x\in X\,.}
Suponha, por absurdo, que
x
∉
X
,
{\displaystyle x\notin X\,,}
ou seja,
x
∈
O
.
{\displaystyle x\in O\,.}
Como O é aberto, exite uma bola
B
(
x
,
ϵ
)
⊆
O
.
{\displaystyle B(x,\epsilon )\subseteq O\,.}
Escolha
x
N
{\displaystyle x_{N}\,}
tal que
|
x
N
−
x
|
<
ϵ
.
{\displaystyle \left|x_{N}-x\right|<\epsilon \,.}
Isso implica
x
N
∈
B
(
x
,
ϵ
)
⊆
O
,
{\displaystyle x_{N}\in B(x,\epsilon )\subseteq O\,,}
o que é uma contradição, já que
x
N
∈
X
.
{\displaystyle x_{N}\in X\,.}
Os conjuntos
R
{\displaystyle \mathbb {R} }
e
∅
{\displaystyle \emptyset \,}
são fechados.
A intersecção de uma família arbitrária de conjuntos fechados é um conjunto fechado.
A união de uma família finita de conjuntos fechados é um conjunto fechado.
Demonstração
1.
∅
{\displaystyle \emptyset \,}
é aberto. Pelo teorema "Um conjunto é fechado
⇔
{\displaystyle \Leftrightarrow }
se, e somente se, seu complementar é aberto" o seu complementar é fechado, isto é,
R
{\displaystyle \mathbb {R} }
é fechado.
X
⊂
Y
{\displaystyle X\subset Y}
.
X
{\displaystyle X\;}
é denso em
Y
{\displaystyle Y\;}
logo:
Dado
y
∈
Y
⇒
I
y
∩
X
≠
∅
,
{\displaystyle y\in Y\Rightarrow I_{y}\cap X\not =\emptyset ,\;}
Dado
y
∈
Y
⇒
∃
x
∈
I
y
∩
X
{\displaystyle y\in Y\Rightarrow \exists \;x\in I_{y}\cap X\;}
Dado
y
∈
Y
⇒
y
∈
X
¯
{\displaystyle y\in Y\Rightarrow y\in {\overline {X}}\;}
Dado
y
∈
Y
⇒
y
=
l
i
m
x
n
,
∀
(
x
n
)
n
∈
N
∈
X
{\displaystyle y\in Y\Rightarrow y=limx_{n},\forall \;(x_{n})_{n\in \mathbb {N} }\in X\;}
Seja X um subconjunto dos números reais. Dizemos que um ponto x pertencente aos reais é um ponto de acumulação se existe uma sequência
x
n
∈
X
{\displaystyle x_{n}\in X\,}
de pontos diferentes de x convergindo para x .
É claro da definição que todo ponto de acumulação é também um ponto de aderência. Deve-se observar que nem todo ponto de aderência é um ponto de acumulação. Por exemplo o conjunto
X
=
{
0
}
{\displaystyle X=\{0\}\;}
possui um único elemento. Este elemento é um ponto de aderência, já que a sequência constante
x
n
=
0
{\displaystyle x_{n}=0\,}
converge para ele, mas não é um ponto de acumulação, pois não existe nenhuma sequência de elementos de X diferentes de 0 convergindo para 0 .
x é ponto de acumulação se,
∀
ϵ
>
0
,
X
∩
(
x
−
ϵ
,
x
+
ϵ
)
≠
{
x
}
.
{\displaystyle \forall \epsilon >0,X\cap (x-\epsilon ,x+\epsilon )\neq \{x\}.}
x é ponto de acumulação se,
∀
ϵ
>
0
;
∃
y
∈
X
;
0
<
|
y
−
x
|
<
ϵ
{\displaystyle \forall \epsilon >0;\exists y\in X;0<|y-x|<\epsilon }
X' é o conjunto chamado derivado , onde seus elementos são os pontos de acumulação de X, assim:
X
′
=
{
x
∈
R
;
∀
ϵ
>
0
,
X
∩
(
x
−
ϵ
,
x
+
ϵ
)
≠
{
x
}
}
=
{
x
∈
R
;
∀
ϵ
>
0
;
∃
y
∈
X
;
0
<
|
y
−
x
|
<
ϵ
}
{\displaystyle X'=\{x\in \mathbb {R} ;\forall \epsilon >0,X\cap (x-\epsilon ,x+\epsilon )\neq \{x\}\}=\{x\in \mathbb {R} ;\forall \epsilon >0;\exists y\in X;0<|y-x|<\epsilon \}}
Define-se como ponto isolado de um conjunto X , um elemento
x
∈
X
{\displaystyle x\in X\,}
que não é ponto de acumulação.
Diz-se que
X
{\displaystyle X\,}
é um conjunto discreto se todos os seus pontos forem isolados. O conjunto dos números naturais é um exemplo de conjunto discreto nos reais.
Seja
X
⊂
R
{\displaystyle X\subset \mathbb {R} }
um conjunto cujos pontos são todos isolados, então
|
X
|
≤
|
N
|
{\displaystyle |X|\leq |\mathbb {N} |}
.
Uma vez que os pontos de
X
{\displaystyle X}
são todos isolados, para cada
x
∈
X
{\displaystyle x\in X}
podemos fixar
δ
x
>
0
{\displaystyle \delta _{x}>0}
tal que
B
δ
x
(
x
)
∩
X
=
{
x
}
{\displaystyle B_{\delta _{x}}(x)\cap X=\{x\}}
. Agora
Q
{\displaystyle \mathbb {Q} }
é denso em
R
{\displaystyle \mathbb {R} }
, então
B
δ
x
2
(
x
)
∩
Q
≠
∅
{\displaystyle B_{\frac {\delta _{x}}{2}}(x)\cap \mathbb {Q} \neq \emptyset }
.
Fixemos para cada
x
∈
X
{\displaystyle x\in X}
algum
q
x
∈
B
δ
x
2
(
x
)
∩
Q
{\displaystyle q_{x}\in B_{\frac {\delta _{x}}{2}}(x)\cap \mathbb {Q} }
e definamos a função
ϕ
:
X
→
Q
{\displaystyle \phi :X\to \mathbb {Q} }
por
ϕ
(
x
)
=
q
x
{\displaystyle \phi (x)=q_{x}}
. Essa função é injetora, de fato, suponha que
ϕ
(
x
)
=
q
=
ϕ
(
y
)
{\displaystyle \phi (x)=q=\phi (y)}
devemos ter que
d
(
x
,
q
)
<
δ
x
2
{\displaystyle d(x,q)<{\frac {\delta _{x}}{2}}}
e
d
(
y
,
q
)
<
δ
y
2
{\displaystyle d(y,q)<{\frac {\delta _{y}}{2}}}
. Defina
δ
=
max
(
δ
x
,
δ
y
)
{\displaystyle \delta =\max(\delta _{x},\delta _{y})}
, segue que
d
(
x
,
y
)
<
d
(
x
,
q
)
+
d
(
q
,
y
)
<
δ
x
2
+
δ
y
2
<
δ
{\displaystyle d(x,y)<d(x,q)+d(q,y)<{\frac {\delta _{x}}{2}}+{\frac {\delta _{y}}{2}}<\delta }
, mas isso significa que ou
x
∈
B
δ
(
y
)
∩
X
⊂
B
δ
y
(
y
)
∩
X
=
{
y
}
{\displaystyle x\in B_{\delta }(y)\cap X\subset B_{\delta _{y}}(y)\cap X=\{y\}}
ou
y
∈
B
δ
(
x
)
∩
X
⊂
B
δ
x
(
x
)
∩
X
=
{
x
}
{\displaystyle y\in B_{\delta }(x)\cap X\subset B_{\delta _{x}}(x)\cap X=\{x\}}
e em ambos os casos concluímos que
x
=
y
{\displaystyle x=y}
.
Uma vez que
ϕ
:
X
→
Q
{\displaystyle \phi :X\to \mathbb {Q} }
é injetora devemos ter
|
X
|
≤
|
Q
|
=
|
N
|
{\displaystyle |X|\leq |\mathbb {Q} |=|\mathbb {N} |}
e portanto
X
{\displaystyle X}
é enumerável.
Note que a mesma demonstração continua válida para espaços métricos que satisfazem o 3º axioma de enumerabilidade.
Seja
X
{\displaystyle X}
um conjunto infinito e limitado, então
X
{\displaystyle X}
possui pelo menos um ponto de acumulação.
Como X é um conjunto limitado, existe um intervalo finito
[
a
,
b
]
{\displaystyle [a,b]\,}
tal que
X
⊂
[
a
,
b
]
.
{\displaystyle X\subset [a,b]\,.}
Defina
M
1
,
{\displaystyle M_{1}\,,}
o ponto médio deste intervalo:
M
1
:=
a
+
b
2
{\displaystyle M_{1}:={\frac {a+b}{2}}\,}
como
X
=
(
X
∩
[
a
,
M
1
]
)
∪
(
X
∩
[
M
1
,
b
]
)
{\displaystyle X=\left(X\cap [a,M_{1}]\right)\cup \left(X\cap [M_{1},b]\right)}
e X é um conjunto com infinitos pontos, podemos inferir que
(
X
∩
[
a
,
M
1
]
)
{\displaystyle \left(X\cap [a,M_{1}]\right)}
ou
(
X
∩
[
M
1
,
b
]
)
{\displaystyle \left(X\cap [M_{1},b]\right)}
possui infinitos pontos. Definimos então:
:
a
1
=
M
1
,
b
1
=
b
,
se
(
X
∩
[
M
1
,
b
]
)
for infinito;
a
1
=
a
,
b
1
=
M
1
,
c.c.
{\displaystyle {\begin{array}{lll}a_{1}=M_{1},&b_{1}=b,&{\hbox{se }}\left(X\cap [M_{1},b]\right){\hbox{for infinito;}}\\a_{1}=a,&b_{1}=M_{1},&{\hbox{c.c.}}\end{array}}}
E define-se
X
1
:=
X
∩
[
a
1
,
b
1
]
,
{\displaystyle X_{1}:=X\cap [a_{1},b_{1}]\,,}
X
1
{\displaystyle X_{1}\,}
é novamente um conjunto infinito. Este processo pode ser aplicado recursivamente, definindo:
M
n
+
1
:=
a
n
+
b
n
2
:
{\displaystyle M_{n+1}:={\frac {a_{n}+b_{n}}{2}}\,:}
a
n
+
1
=
M
n
+
1
,
b
n
+
1
=
b
n
,
se
(
X
∩
[
M
n
+
1
,
b
n
]
)
for infinito;
a
n
+
1
=
a
n
,
b
n
+
1
=
M
n
+
1
,
c.c.
{\displaystyle {\begin{array}{lll}a_{n+1}=M_{n+1},&b_{n+1}=b_{n},&{\hbox{se }}\left(X\cap [M_{n+1},b_{n}]\right){\hbox{for infinito;}}\\a_{n+1}=a_{n},&b_{n+1}=M_{n+1},&{\hbox{c.c.}}\end{array}}}
e, finalmente,
X
n
+
1
:=
X
n
∩
[
a
n
+
1
,
b
n
+
1
]
,
{\displaystyle X_{n+1}:=X_{n}\cap [a_{n+1},b_{n+1}]\,,}
que será um conjunto de infinitos pontos.
Observe que a sequência
a
n
{\displaystyle a_{n}\,}
é não decrescente e limitada superiormente por b e a sequência
b
n
{\displaystyle b_{n}\,}
é não crescente e limitada inferiormente por a . Daí, podemos inferir a existência dos limites:
lim
n
→
∞
a
n
{\displaystyle \lim _{n\to \infty }a_{n}\,}
e
lim
n
→
∞
b
n
.
{\displaystyle \lim _{n\to \infty }b_{n}\,.}
Como
b
n
−
a
n
=
b
−
a
2
n
,
{\displaystyle b_{n}-a_{n}={\frac {b-a}{2^{n}}}\,,}
estes limites deve ser idênticos:
lim
n
→
∞
a
n
=
lim
n
→
∞
b
n
=:
x
∗
.
{\displaystyle \lim _{n\to \infty }a_{n}=\lim _{n\to \infty }b_{n}=:x^{*}\,.}
Vamos mostrar agora que
x
∗
{\displaystyle x^{*}\,}
é um ponto de acumulação de X . Para isso, devemos mostrar que para todo
ϵ
>
0
{\displaystyle \epsilon >0\,}
o conjunto
B
(
x
∗
,
ϵ
)
∩
X
{\displaystyle B(x^{*},\epsilon )\cap X}
possui infinitos pontos. De fato, fixe
ϵ
>
0
{\displaystyle \epsilon >0\,}
e escolha n tal que:
b
n
−
a
n
<
ϵ
{\displaystyle b_{n}-a_{n}<\epsilon \,}
Como
x
∈
[
a
n
,
b
n
]
,
{\displaystyle x\in [a_{n},b_{n}]\,,}
temos que
[
a
n
,
b
n
]
⊆
B
(
x
∗
,
ε
)
.
{\displaystyle [a_{n},b_{n}]\subseteq B(x^{*},\varepsilon )\,.}
Logo
B
(
x
∗
,
ϵ
)
∩
X
⊇
[
a
b
,
b
n
]
∩
X
=
X
n
.
{\displaystyle B(x^{*},\epsilon )\cap X\supseteq [a_{b},b_{n}]\cap X=X_{n}.}
Como
X
n
{\displaystyle X_{n}\,}
é infinito por construção,
x
∗
{\displaystyle x^{*}\,}
é um ponto de acumulação de X , o que completa a demonstração.
Uma aplicação versão ligeiramente modificada e muito útil do teorema de Bolzano-Weierstrass é a seguinte:
Todo sequência limitada de números reais admite uma sub-sequência convergente.
Se
F
n
{\displaystyle F_{n}\,}
é uma sequência de conjuntos fechados, limitados e não-vazios tais que
F
n
+
1
⊆
F
n
,
{\displaystyle F_{n+1}\subseteq F_{n}\,,}
então a intersecção destes conjuntos é não vazia. Isto é:
⋂
n
=
1
∞
F
n
≠
∅
;
{\displaystyle \bigcap _{n=1}^{\infty }F_{n}\neq \emptyset \,;}
Demonstração
Como cada
F
n
{\displaystyle F_{n}\,}
é não vazio é possível construir a sequência
x
n
{\displaystyle x_{n}\,}
tal que:
x
n
∈
F
n
{\displaystyle x_{n}\in F_{n}\,}
Do fato de os conjuntos
F
n
{\displaystyle F_{n}\,}
são limitados, passando a uma subsequência se necessário, pode-se supor
{
x
n
}
{\displaystyle \{x_{n}\}\,}
é uma sequência convergente para algum real
x
∗
.
{\displaystyle x^{*}\,.}
De
F
k
⊆
F
n
{\displaystyle F_{k}\subseteq F_{n}\,}
se
k
≥
n
,
{\displaystyle k\geq n\,,}
temos que
{
x
n
}
n
=
k
∞
⊆
F
k
{\displaystyle \{x_{n}\}_{n=k}^{\infty }\subseteq F_{k}\,}
e como cada um destes conjuntos é fechados,
x
∗
∈
F
k
{\displaystyle x^{*}\in F_{k}\,}
para todo k . Daí temos que o limite
x
∗
∈
⋂
n
=
1
∞
F
n
{\displaystyle x^{*}\in \bigcap _{n=1}^{\infty }F_{n}\,}
e o resultado segue.
A distância de um conjunto até um ponto é um importante conceito na análise e permite uma nova caracterização para os pontos do fecho de um conjunto: um ponto
x
∈
R
{\displaystyle x\in \mathbb {R} \,}
pertence ao fecho
S
¯
{\displaystyle {\overline {S}}\,}
de um conjunto
S
{\displaystyle S\,}
se e somente se a distância se
S
{\displaystyle S\,}
ate
x
{\displaystyle x\,}
é nula.
Definimos a distância entre um conjunto
S
⊆
R
{\displaystyle S\subseteq \mathbb {R} \,}
e um ponto
x
∈
R
{\displaystyle x\in \mathbb {R} \,}
como o ínfimo da distância entre os pontos de S e o ponto x .
dist
(
S
,
x
)
:=
inf
y
∈
S
|
x
−
y
|
{\displaystyle {\hbox{dist}}(S,x):=\inf _{y\in S}|x-y|\,}
dist
(
S
,
x
)
>
0
⟹
x
∉
S
{\displaystyle {\hbox{dist}}(S,x)>0\Longrightarrow x\notin S\,}
dist
(
S
,
x
)
=
dist
(
S
¯
,
x
)
{\displaystyle {\hbox{dist}}(S,x)={\hbox{dist}}({\overline {S}},x)\,}
x
∈
S
¯
⟺
dist
(
S
,
x
)
=
0
;
{\displaystyle x\in {\overline {S}}\Longleftrightarrow {\hbox{dist}}(S,x)=0\,;}
Demonstração
1. Se
dist
(
S
,
x
)
>
0
,
{\displaystyle {\hbox{dist}}(S,x)>0\,,}
todo ponto
y
∈
S
{\displaystyle y\in S\,}
tem a propriedade que:
|
x
−
y
|
≥
dist
(
S
,
x
)
>
0
⟹
x
≠
y
{\displaystyle |x-y|\geq {\hbox{dist}}(S,x)>0\Longrightarrow x\neq y\,}
e o resultado segue.
2. Do fato que
S
⊆
S
¯
{\displaystyle S\subseteq {\overline {S}}\,}
e da definição de ínfimo, temos:
dist
(
S
,
x
)
≥
dist
(
S
¯
,
x
)
{\displaystyle {\hbox{dist}}(S,x)\geq {\hbox{dist}}({\overline {S}},x)\,}
Para provar a desiguldade inversa, fixe um ponto
x
∈
R
{\displaystyle x\in \mathbb {R} \,}
e defina
δ
:=
dist
(
S
¯
,
x
)
{\displaystyle \delta :={\hbox{dist}}({\overline {S}},x)\,}
Da definição de ínfimo, podemos construir a sequência
{
y
n
}
{\displaystyle \{y_{n}\}\,}
tal que
y
n
∈
S
¯
e
|
y
n
−
x
|
<
δ
+
1
/
n
,
n
=
1
,
2
,
3
,
…
{\displaystyle y_{n}\in {\overline {S}}{\hbox{ e }}|y_{n}-x|<\delta +1/n,~~n=1,2,3,\ldots \,}
Como
y
n
∈
S
¯
,
{\displaystyle y_{n}\in {\overline {S}}\,,}
da definição de fecho de um conjunto, temos a existência de pontos
z
n
{\displaystyle z_{n}\,}
tais que:
z
n
∈
S
e
|
z
n
−
y
n
|
<
1
/
n
{\displaystyle z_{n}\in S{\hbox{ e }}|z_{n}-y_{n}|<1/n\,}
Da desigualdade triangular, temos:
|
z
n
−
x
|
≤
|
z
n
−
y
n
|
+
|
y
n
−
x
|
<
δ
+
2
/
n
{\displaystyle |z_{n}-x|\leq |z_{n}-y_{n}|+|y_{n}-x|<\delta +2/n\,}
Agora, basta estimar:
dist
(
S
,
x
)
≤
inf
n
=
1
∞
|
z
n
−
x
|
=
δ
=
dist
(
S
¯
,
x
)
{\displaystyle {\hbox{dist}}(S,x)\leq \inf _{n=1}^{\infty }|z_{n}-x|=\delta ={\hbox{dist}}({\overline {S}},x)\,}
E o resultado segue.
3. Resta-nos demonstrar que se
F
{\displaystyle F\,}
é um conjunto fechado então
dist
(
F
,
x
)
=
0
⟹
x
∈
F
{\displaystyle {\hbox{dist}}(F,x)=0\Longrightarrow x\in F\,}
Da definição de ínfimo, podemos construir a sequência
{
y
n
}
{\displaystyle \{y_{n}\}\,}
tal que
y
n
∈
S
¯
e
|
y
n
−
x
|
<
1
/
n
,
n
=
1
,
2
,
3
,
…
{\displaystyle y_{n}\in {\overline {S}}{\hbox{ e }}|y_{n}-x|<1/n,~~n=1,2,3,\ldots \,}
Da definição de limite, temos que:
lim
n
→
∞
y
n
=
x
{\displaystyle \lim _{n\to \infty }y_{n}=x\,}
Como
F
{\displaystyle F\,}
é um conjunto fechado, o limite
x
{\displaystyle x\,}
da sequência
{
y
n
}
{\displaystyle \{y_{n}\}\,}
deve pertencer a
F
.
{\displaystyle F\,.}
Assim, o resultado segue.
Um conjunto é dito compacto se toda sequência contida em X possui uma sub-sequência que converge para algum ponto de X .
a. Suponha que X não seja um conjunto fechado, então, por definição, existe uma sequência
x
n
∈
X
{\displaystyle x_{n}\in X\,}
que converge para um número real
x
∉
X
{\displaystyle x\notin X\,}
. Como
{
x
n
}
{\displaystyle \{x_{n}\}\,}
é convergente, todas as suas sub-sequências convergem para o mesmo limite x , portanto, nenhuma subsequência de
{
x
n
}
{\displaystyle \{x_{n}\}}
converge para um ponto de X , logo X não pode ser compacto.
b. Suponha que X não seja um conjunto limitado. Então por definição, é possível construir uma sequência
x
n
∈
X
{\displaystyle x_{n}\in X\,}
tal que
|
x
n
|
>
n
.
{\displaystyle |x_{n}|>n\,.}
Esta sequência não possui nenhuma sub-sequência convergente, logo X não pode ser compacto.
Suponha que X é fechado e limitado e seja
{
x
n
}
{\displaystyle \{x_{n}\}\,}
uma sequência contida em X . A sequência
{
x
n
}
{\displaystyle \{x_{n}\}\,}
é limitado, portanto, possui um sub-sequência convergente para um limite
x
∗
,
{\displaystyle x^{*}\,,}
como X é fechado,
x
∗
∈
X
,
{\displaystyle x^{*}\in X\,,}
o que completa a demonstração.
Seja
X
{\displaystyle X\,}
um conjunto na reta e
{
O
λ
}
{\displaystyle \{O_{\lambda }\}\,}
um coleção de conjuntos abertos
O
λ
{\displaystyle O_{\lambda }\,}
indexados por um índice
λ
∈
Λ
.
{\displaystyle \lambda \in \Lambda \,.}
Dizemos que
{
O
λ
}
{\displaystyle \{O_{\lambda }\}\,}
é uma cobertura de
X
{\displaystyle X\,}
se:
⋃
λ
∈
Λ
O
λ
⊇
X
{\displaystyle \bigcup _{\lambda \in \Lambda }O_{\lambda }\supseteq X\,}
A família de abertos
{
O
n
}
n
=
1
∞
{\displaystyle \left\{O_{n}\right\}_{n=1}^{\infty }\,}
dada por
O
n
=
(
−
n
,
n
)
{\displaystyle O_{n}=(-n,n)\,}
é uma cobertura para o conjuntos dos número reais,
R
{\displaystyle \mathbb {R} \,}
A família de abertos
{
O
n
}
n
=
1
∞
{\displaystyle \left\{O_{n}\right\}_{n=1}^{\infty }\,}
dada por
O
n
=
(
1
−
1
/
n
,
1
+
1
/
n
)
{\displaystyle O_{n}=(1-1/n,1+1/n)\,}
é uma cobertura do intervalo
(
0
,
1
)
.
{\displaystyle (0,1)\,.}
A família de abertos
{
O
λ
}
{\displaystyle \left\{O_{\lambda }\right\}\,}
dada por
O
λ
=
(
−
λ
,
λ
)
,
{\displaystyle O_{\lambda }=(-\lambda ,\lambda )\,,}
onde o índice
λ
{\displaystyle \lambda \,}
pertence a
(
0
,
1
)
{\displaystyle (0,1)\,}
é uma cobertura do intervalo
(
−
1
,
1
)
.
{\displaystyle (-1,1)\,.}
Seja
{
O
λ
}
,
λ
∈
Λ
{\displaystyle \{O_{\lambda }\},~~\lambda \in \Lambda \,}
uma cobertura de
X
{\displaystyle X\,}
e
Γ
⊆
Λ
.
{\displaystyle \Gamma \subseteq \Lambda \,.}
Dizemos que
{
O
γ
}
,
γ
∈
Γ
{\displaystyle \{O_{\gamma }\},~~\gamma \in \Gamma \,}
é uma subcobertura de
{
O
λ
}
,
λ
∈
Λ
{\displaystyle \{O_{\lambda }\},~~\lambda \in \Lambda \,}
se
{
O
γ
}
,
γ
∈
Γ
{\displaystyle \{O_{\gamma }\},~~\gamma \in \Gamma \,}
é também uma cobertura de X .
Um conjunto é compacto se e somente se possui a propriedade de Heine-Borel:
Toda cobertura de abertos admite uma subcobertura finita.
Demonstração
Começamos demonstrando o seguinte lema:
Lema
Se um conjunto K possui a propriedade de Heine-Borel e
x
∉
K
,
{\displaystyle x\notin K\,,}
então
dist
(
K
,
x
)
>
0
;
{\displaystyle {\hbox{dist}}(K,x)>0\,;}
Demonstração
Define-se:
r
(
y
)
=
|
x
∗
−
y
|
2
,
∀
y
∈
R
n
{\displaystyle r(y)={\frac {|x^{*}-y|}{2}},\forall y\in \mathbb {R} ^{n}}
É claro que
r
(
y
)
>
0
{\displaystyle r(y)>0\,}
para todo ponto
y
{\displaystyle y\,}
em
K
.
{\displaystyle K\,.}
Agora constróem-se os abertos:
O
y
=
B
(
y
,
r
(
y
)
)
,
∀
y
∈
K
,
{\displaystyle O_{y}=B(y,r(y)),\forall y\in K,}
ou seja, a bola de centro y e raio
r
(
y
)
{\displaystyle r(y)\,}
Eles formam uma cobertura para
K
:
{\displaystyle K:}
K
=
⋃
y
∈
K
{
y
}
⊇
⋃
y
∈
K
O
y
{\displaystyle K=\bigcup _{y\in K}\{y\}\supseteq \bigcup _{y\in K}O_{y}}
Usando a propriedade de Heine-Borel, estabelecemos a existência de um conjunto finito de pontos
y
1
,
y
2
,
…
,
y
n
∈
K
{\displaystyle y_{1},y_{2},\ldots ,y_{n}\in K\,}
tais que:
K
⊆
⋃
k
=
1
n
O
y
k
{\displaystyle K\subseteq \bigcup _{k=1}^{n}O_{y_{k}}}
Da simples definição de
O
y
,
{\displaystyle O_{y}\,,}
sabemos que eles são disjuntos das bolas centradas em
y
∗
{\displaystyle y^{*}\,}
de raio
r
(
y
)
:
{\displaystyle r(y)\,:}
O
y
⋂
B
(
x
∗
,
r
(
y
)
)
=
B
(
y
,
r
(
y
)
)
⋂
B
(
x
∗
,
r
(
y
)
)
=
∅
{\displaystyle O_{y}\bigcap B(x^{*},r(y))=B(y,r(y))\bigcap B(x^{*},r(y))=\emptyset }
Define-se:
δ
=
min
k
=
1
n
r
(
y
k
)
{\displaystyle \delta =\min _{k=1}^{n}r(y_{k})\,}
temos:
O
y
k
⋂
B
(
x
∗
,
δ
)
=
B
(
y
k
,
r
(
y
k
)
)
⋂
B
(
x
∗
,
δ
)
⊆
B
(
y
k
,
r
(
y
k
)
)
⋂
B
(
x
∗
,
r
(
y
k
)
)
=
∅
,
∀
k
=
1
,
…
,
n
{\displaystyle O_{y_{k}}\bigcap B(x^{*},\delta )=B(y_{k},r(y_{k}))\bigcap B(x^{*},\delta )\subseteq B(y_{k},r(y_{k}))\bigcap B(x^{*},r(y_{k}))=\emptyset ,\forall k=1,\ldots ,n}
Tomando a união, temos:
K
⋂
(
B
(
x
∗
,
δ
)
)
⊆
(
⋃
k
=
1
n
O
y
k
)
⋂
B
(
x
∗
,
δ
)
=
∅
{\displaystyle K\bigcap \left(B(x^{*},\delta )\right)\subseteq \left(\bigcup _{k=1}^{n}O_{y_{k}}\right)\bigcap B(x^{*},\delta )=\emptyset }
O que completa a demonstração.
Todo conjunto de Heine-Borel é fechado
Seja K um conjunto com a propriedade de Heine-Borel e seja
x
∉
K
,
{\displaystyle x\notin K\,,}
pelo lema anterior
dist
K
,
x
>
0
{\displaystyle {\hbox{dist}}{K,x}>0\,}
e, portanto,
x
∉
K
¯
,
{\displaystyle x\notin {\overline {K}}\,,}
isso significa que:
K
c
⊆
K
¯
c
⟹
K
¯
⊆
K
{\displaystyle K^{c}\subseteq {\overline {K}}^{c}\Longrightarrow {\overline {K}}\subseteq K\,}
e portanto K é fechado.
Todo conjunto de Heine-Borel é limitado
Seja K um conjunto com a propriedade de Heine-Borel. Considere a seguinte cobertura de K :
K
⊆
R
=
⋃
n
=
1
∞
(
−
n
,
n
)
{\displaystyle K\subseteq \mathbb {R} =\bigcup _{n=1}^{\infty }(-n,n)\,}
Da propriedade de Heine-Borel, podemos extrair uma subcobertura finita tal que:
K
⊆
⋃
n
=
1
N
(
−
n
,
n
)
=
(
−
N
,
N
)
{\displaystyle K\subseteq \bigcup _{n=1}^{N}(-n,n)=(-N,N)\,}
Logo K é limitado.
O objetivo deste livro não é estudar a teoria dos conjuntos. Para isto, sugere-se:
Um espaço métrico (X,d) é um conjunto X dotado de uma função
d
:
X
2
→
R
{\displaystyle d:X^{2}\to \mathbf {R} \,}
chamada métrica ou distância que associa a cada par de elementos de X uma distância entre eles. Esta distância deve satisfazer os seguintes axiomas:
d
(
x
,
y
)
{\displaystyle d(x,y)\,}
é um número real, não negativo e finito
d
(
x
,
y
)
=
0
⇔
x
=
y
{\displaystyle d(x,y)=0\Leftrightarrow x=y}
d
(
x
,
y
)
=
d
(
y
,
x
)
{\displaystyle d(x,y)=d(y,x)\,}
(simetria)
d
(
x
,
z
)
≤
d
(
x
,
y
)
+
d
(
y
,
z
)
{\displaystyle d(x,z)\leq d(x,y)+d(y,z)}
(desigualdade triangular)
O espaço vetorial euclidiano
(
R
n
,
d
)
{\displaystyle (\mathbb {R} ^{n},d)}
, onde
d
(
(
x
1
,
…
,
x
n
)
,
(
y
1
,
…
,
y
n
)
)
=
(
y
1
−
x
1
)
2
+
⋯
+
(
y
n
−
x
n
)
2
{\displaystyle d((x_{1},\ldots ,x_{n}),(y_{1},\ldots ,y_{n}))={\sqrt {(y_{1}-x_{1})^{2}+\cdots +(y_{n}-x_{n})^{2}}}}
, é um espaço vetorial de dimensão
n
{\displaystyle n\,}
É importante notar que a distância acima definida não é a única que satisfaz os axiomas de espaço métrico; porém, pela sua importância, ela é considerada a métrica canônica no
R
n
{\displaystyle \mathbb {R} ^{n}\,}
. Outras métricas são:
d
(
(
x
1
,
…
,
x
n
)
,
(
y
1
,
…
,
y
n
)
)
=
max
(
|
y
1
−
x
1
|
,
⋯
,
|
y
n
−
x
n
|
)
{\displaystyle d((x_{1},\ldots ,x_{n}),(y_{1},\ldots ,y_{n}))=\max(|y_{1}-x_{1}|,\cdots ,|y_{n}-x_{n}|)}
d
(
(
x
1
,
…
,
x
n
)
,
(
y
1
,
…
,
y
n
)
)
=
|
y
1
−
x
1
|
+
⋯
+
|
y
n
−
x
n
|
{\displaystyle d((x_{1},\ldots ,x_{n}),(y_{1},\ldots ,y_{n}))=|y_{1}-x_{1}|+\cdots +|y_{n}-x_{n}|}
(
X
,
d
)
{\displaystyle (X,d)\,}
, onde
d
(
x
,
y
)
=
{
0
,
se
x
=
y
1
,
se
x
≠
y
{\displaystyle d(x,y)=\left\{{\begin{matrix}0,&{\mbox{se }}x=y\\1,&{\mbox{se }}x\neq y\end{matrix}}\right.}
é denominado de espaço métrico discreto.
Qualquer subconjunto de um espaço métrico é um espaço métrico (para a mesma distância)
Diz-se que uma sequência de pontos
x
n
∈
X
{\displaystyle x_{n}\in X\,}
converge para um ponto
x
∈
X
{\displaystyle x\in X\,}
se e somente se:
lim
n
→
∞
d
(
x
,
x
n
)
=
0
{\displaystyle \lim _{n\to \infty }d(x,x_{n})=0\,}
Diz-se que uma sequência de pontos
x
n
∈
X
{\displaystyle x_{n}\in X\,}
é de Cauchy se para todo
ε
>
0
{\displaystyle \varepsilon >0\,}
, existe um N tal que
d
(
x
n
,
x
m
)
<
ε
,
∀
n
,
m
>
N
{\displaystyle d(x_{n},x_{m})<\varepsilon ,\forall n,m>N\,}
Proposição: toda sequência convergente é de Cauchy.
Um espaço métrico é dito completo se todo sequência de Cauchy é convergente.
Teorema: Um subconjunto fechado de um espaço métrico completo é um espaço métrico completo.
Espaço métrico (topologia)
Lembrar que uma função de um conjunto X para um conjunto Y é uma aplicação
f
:
X
↦
Y
{\displaystyle f:X\mapsto Y}
tais que f(x) é o único elemento de Y para cada
x
∈
X
{\displaystyle x\in X}
. Na análise, temos tendência para falar de funções a partir de subconjuntos
A
⊆
R
{\displaystyle A\subseteq \mathbb {R} }
para
R
{\displaystyle \mathbb {R} }
.
A definição para o limite de uma função é quase a mesma que a definição de uma seqüência. De fato, como veremos mais adiante, é possível definir limites funcionais, em termos de limites seqüenciais. Para o momento, porém, vamos apenas dar a definição:
Dado um subconjunto
A
⊂
R
{\displaystyle A\subset \mathbb {R} }
e uma função
f
:
A
↦
R
{\displaystyle f:A\mapsto \mathbb {R} }
, nós dizemos que o
lim
x
→
c
f
(
x
)
=
L
,
s
e
∀
ϵ
>
0
,
∃
δ
>
0
;
∀
x
∈
D
f
,
0
<
|
x
−
c
|
<
δ
⟹
|
f
(
x
)
−
L
|
<
ϵ
{\displaystyle \lim _{x\rightarrow c}f(x)=L,\;se\;\forall \;\epsilon >0,\exists \delta >0;\forall x\in D_{f},0<|x-c|<\delta \implies |f(x)-L|<\epsilon }
A exigência
0
<
|
x
−
c
|
{\displaystyle 0<|x-c|\;}
é um pouco técnico. É uma expressão que da a idéia de que o comportamento de uma função perto de um ponto não deve ser prejudicado pelo seu comportamento no ponto. Desta forma f(x) não precisa ser definida em c para ter um limite aí.
Esta definição dá um monte de problemas para um monte de gente, por isso é melhor passar algum tempo intrigante com isso, exemplos de trabalho, etc. Uma forma de conceituar a definição é esta:
lim
x
→
c
f
(
x
)
=
L
{\displaystyle \lim _{x\rightarrow c}f(x)=L}
significa que nós podemos fazer f(x) tão próximo quanto gostarmos de L, fazendo x perto de c.
Sejam
f
:
A
→
R
{\displaystyle f:A\to \mathbb {R} \;}
uma função definida em um conjunto
A
⊆
R
{\displaystyle A\subseteq \mathbb {R} \;}
e
x
0
∈
A
′
{\displaystyle x_{0}\in A'\;}
. Diz-se que existe o limite de
f
(
x
)
{\displaystyle f(x)\,}
quando
x
{\displaystyle x\,}
tende a
x
0
{\displaystyle x_{0}\,}
e denota-se por:
lim
x
→
x
0
f
(
x
)
{\displaystyle \lim _{x\to x_{0}}f(x)\,}
quando existe um
L
∈
R
{\displaystyle L\in \mathbb {R} \,}
com a propriedade de que, para todo
ε
>
0
{\displaystyle \varepsilon >0\,}
, existe um
δ
>
0
{\displaystyle \delta >0\,}
tal que:
0
<
|
x
−
x
0
|
≤
δ
⟹
|
f
(
x
)
−
L
|
<
ε
{\displaystyle 0<\left|x-x_{0}\right|\leq \delta \Longrightarrow \left|f(x)-L\right|<\varepsilon \,}
Observe cuidadosamente que
f
(
x
0
)
{\displaystyle f(x_{0})\,}
não precisa estar definido e, quando está, não necessariamente vale
f
(
x
0
)
=
lim
x
→
x
0
f
(
x
)
{\displaystyle f(x_{0})=\lim _{x\to x_{0}}f(x)\,}
.
Seja
A
⊆
Q
,
f
:
A
↦
R
,
x
0
∈
A
′
{\displaystyle A\subseteq \mathbb {Q} ,f:A\mapsto \mathbb {R} ,x_{0}\in A'}
.
Se
lim
x
→
x
0
f
(
x
)
=
L
1
e
lim
x
→
x
0
f
(
x
)
=
L
2
{\displaystyle \lim _{x\to x_{0}}f(x)=L_{1}\;e\;\lim _{x\to x_{0}}f(x)=L_{2}}
, então
L
1
=
L
2
{\displaystyle L_{1}=L_{2}\;}
Pela definição de limite temos
(1)
∀
ϵ
>
0
,
∃
δ
>
0
;
x
∈
A
;
|
x
−
x
0
|
<
δ
1
⟹
|
f
(
x
)
−
L
1
|
<
ϵ
2
{\displaystyle \forall \;\epsilon >0,\exists \;\delta >0;\;x\in A;|x-x_{0}|<\delta _{1}\implies |f(x)-L_{1}|<{\epsilon \over 2}}
(2)
∀
ϵ
>
0
,
∃
δ
>
0
;
x
∈
A
;
|
x
−
x
0
|
<
δ
2
⟹
|
f
(
x
)
−
L
2
|
<
ϵ
2
{\displaystyle \forall \;\epsilon >0,\exists \;\delta >0;\;x\in A;|x-x_{0}|<\delta _{2}\implies |f(x)-L_{2}|<{\epsilon \over 2}}
Seja
δ
=
min
{
δ
1
,
δ
2
}
{\displaystyle \delta =\min\{\delta _{1},\delta _{2}\}\;}
. Como
x
0
∈
A
′
{\displaystyle x_{0}\in A'}
logo
∃
x
δ
∈
(
x
−
δ
,
x
+
δ
)
{\displaystyle \exists \;x_{\delta }\in (x-\delta ,x+\delta )}
De fato
x
0
∈
(
x
−
δ
,
x
+
δ
)
{\displaystyle x_{0}\in (x-\delta ,x+\delta )}
.
|
L
1
−
L
2
|
=
|
L
1
−
f
(
x
)
+
f
(
x
)
−
L
2
|
<
|
L
1
−
f
(
x
)
|
+
|
f
(
x
)
−
L
2
|
<
ϵ
{\displaystyle |L_{1}-L_{2}|=|L_{1}-f(x)+f(x)-L_{2}|<|L_{1}-f(x)|+|f(x)-L_{2}|<\epsilon \;}
{\displaystyle \;}
Sejam
D
⊆
Q
,
f
,
g
,
h
:
D
↦
R
,
x
0
∈
D
′
{\displaystyle D\subseteq \mathbb {Q} ,f,g,h:D\mapsto \mathbb {R} ,x_{0}\in D'}
.
S
e
f
(
x
)
<
g
(
x
)
<
h
(
x
)
,
∀
x
∈
D
−
{
a
}
e
lim
x
→
x
0
f
(
x
)
=
lim
x
→
x
0
h
(
x
)
=
L
{\displaystyle Se\;f(x)<g(x)<h(x),\forall x\in D-\{a\}\;e\;\lim _{x\to x_{0}}f(x)=\lim _{x\to x_{0}}h(x)=L}
, então
lim
x
→
x
0
g
(
x
)
=
L
{\displaystyle \lim _{x\to x_{0}}g(x)=L}
lim
x
→
x
0
f
(
x
)
=
L
⟹
∀
ϵ
>
0
,
∃
δ
1
>
0
;
x
∈
D
;
|
x
−
x
0
|
<
δ
1
⟹
L
−
ϵ
<
f
(
x
)
<
L
+
ϵ
{\textstyle \lim _{x\to x_{0}}f(x)=L\implies \forall \epsilon >0,\exists \delta _{1}>0;x\in D;|x-x_{0}|<\delta _{1}\implies L-\epsilon <f(x)<L+\epsilon \;}
[ editar | editar código-fonte ]
lim
x
→
x
0
h
(
x
)
=
L
⟹
∀
ϵ
>
0
,
∃
δ
2
>
0
;
x
∈
D
;
|
x
−
x
0
|
<
δ
2
⟹
L
−
ϵ
<
h
(
x
)
<
L
+
ϵ
{\displaystyle \lim _{x\to x_{0}}h(x)=L\implies \forall \epsilon >0,\exists \delta _{2}>0;x\in D;|x-x_{0}|<\delta _{2}\implies L-\epsilon <h(x)<L+\epsilon \;}
x
∈
D
,
δ
=
min
{
δ
1
,
δ
2
}
⟹
|
x
−
x
0
|
<
δ
⟹
L
−
ϵ
<
f
(
x
)
<
g
(
x
)
<
h
(
x
)
<
L
+
ϵ
⟹
lim
x
→
x
0
g
(
x
)
=
L
{\displaystyle x\in D,\delta =\min\{\delta _{1},\delta _{2}\}\implies |x-x_{0}|<\delta \implies L-\epsilon <f(x)<g(x)<h(x)<L+\epsilon \implies \lim _{x\to x_{0}}g(x)=L\;}
Limite Sequencial
Poderíamos muito bem ter dado a seguinte definição do limite:
Dado um subconjunto
A
⊂
R
{\displaystyle A\subset \mathbb {R} }
e uma função
f
:
A
→
R
{\displaystyle f:A\rightarrow \mathbb {R} }
, dizemos que o
lim
x
→
c
f
(
x
)
=
L
{\displaystyle \lim _{x\rightarrow c}f(x)=L}
se
∀
(
x
n
)
n
=
1
∞
{\displaystyle \forall (x_{n})_{n=1}^{\infty }}
tal que
x
n
≠
c
,
lim
n
→
∞
(
x
n
)
=
c
{\displaystyle x_{n}\not =c,\lim _{n\rightarrow \infty }(x_{n})=c}
, e
lim
n
→
∞
(
f
(
x
n
)
)
=
L
{\displaystyle \lim _{n\rightarrow \infty }(f(x_{n}))=L}
Note-se que o requisito
x
n
≠
c
{\displaystyle x_{n}\not =c}
corresponde com a exigência
|
x
−
c
|
>
0
{\displaystyle |x-c|>0}
.
Como um exercício para testar sua compreensão, prove que estas duas definições são equivalentes. Note-se que tendo o contrapositive dá um bom critério para determinar se ou não uma função diverge:
Se
∃
(
x
n
)
,
(
y
n
)
:
(
x
n
)
→
c
,
(
y
n
)
→
c
{\displaystyle \exists (x_{n}),(y_{n}):(x_{n})\rightarrow c,(y_{n})\rightarrow c}
, e
lim
n
→
∞
(
f
(
x
n
)
)
≠
lim
n
→
∞
(
f
(
y
n
)
)
{\displaystyle \lim _{n\rightarrow \infty }(f(x_{n}))\not =\lim _{n\rightarrow \infty }(f(y_{n}))}
, então
lim
x
→
c
f
(
x
)
{\displaystyle \lim _{x\rightarrow c}f(x)}
não existe.
Seja
D
,
E
⊂
R
{\displaystyle D,E\subset \mathbb {R} }
{\displaystyle \;}
Podemos definir o que significa para uma função divergir para o infinito, e o que significa para uma função ter um limite no infinito:
Dizemos que
lim
x
→
c
f
(
x
)
=
∞
{\displaystyle \lim _{x\rightarrow c}f(x)=\infty }
se
∀
M
>
0
:
∃
δ
:
0
<
|
x
−
c
|
<
δ
⟹
f
(
x
)
>
M
{\displaystyle \forall M>0:\exists \delta :0<|x-c|<\delta \implies f(x)>M}
.
Dizemos que
lim
x
→
c
f
(
x
)
=
−
∞
{\displaystyle \lim _{x\rightarrow c}f(x)=-\infty }
se
∀
M
>
0
:
∃
δ
:
0
<
|
x
−
c
|
<
δ
⟹
f
(
x
)
<
−
M
{\displaystyle \forall M>0:\exists \delta :0<|x-c|<\delta \implies f(x)<-M}
Dizemos quet
lim
x
→
∞
f
(
x
)
=
L
{\displaystyle \lim _{x\rightarrow \infty }f(x)=L}
se
∀
ϵ
>
0
:
∃
M
:
x
>
M
⟹
|
f
(
x
)
−
L
|
<
ϵ
{\displaystyle \forall \epsilon >0:\exists M:x>M\implies |f(x)-L|<\epsilon }
.
Dizemos quet
lim
x
→
−
∞
f
(
x
)
=
L
{\displaystyle \lim _{x\rightarrow -\infty }f(x)=L}
se
∀
ϵ
>
0
:
∃
M
:
x
<
−
M
⟹
|
f
(
x
)
−
L
|
<
ϵ
{\displaystyle \forall \epsilon >0:\exists M:x<-M\implies |f(x)-L|<\epsilon }
.
Como exercício, veja se você pode definir o que significa para uma função ter limite
∞
{\displaystyle \infty }
como
x
→
∞
{\displaystyle x\rightarrow \infty }
.
Agora que definimos o limite de uma função, estamos prontos para definir o que significa para uma função ser contínua. A noção de Continuidade captura a intuitiva imagem de uma função "sem oscilações bruscas ou saltos". Veremos alguns exemplos de funções descontínuas que ilustram o significado da definição. A idéia de funções contínuas é encontrada em várias áreas da matemática, além de análise real.
Seja
A
⊆
R
{\displaystyle A\subseteq \mathbb {R} }
;
f
:
A
→
R
{\displaystyle f:A\to \mathbb {R} }
;
c
∈
A
{\displaystyle c\in A}
;
Dizemos que
f
(
x
)
{\displaystyle f(x)\;}
é contínua em
c
{\displaystyle c\;}
se, e somente se, para todo
ϵ
>
0
{\displaystyle \epsilon >0\,}
, existe um
δ
>
0
{\displaystyle \delta >0\,}
tal que:
x
∈
A
,
|
x
−
x
0
|
<
δ
⇒
|
f
(
x
)
−
f
(
x
0
)
|
<
ϵ
{\displaystyle x\in A,|x-x_{0}|<\delta \Rightarrow |f(x)-f(x_{0})|<\epsilon }
Seja
A
⊂
D
⊆
R
{\displaystyle A\subset D\subseteq \mathbb {R} }
;
f
:
A
→
R
{\displaystyle f:A\to \mathbb {R} }
;
c
∈
A
{\displaystyle c\in A}
;. Dizemos que
f
{\displaystyle f}
é contínua em
A
{\displaystyle A\;}
se
f
{\displaystyle f}
é contínua em
c
{\displaystyle c\;}
, para todo
c
∈
A
{\displaystyle c\in A}
.
Dizemos que
f
{\displaystyle f\;}
em si é contínua, se esta condição vale para todos os pontos em
A
{\displaystyle A}
.
Se
A
{\displaystyle A\;}
é uma união de intervalos, a declaração é equivalente a dizer que
lim
x
→
c
f
(
x
)
=
f
(
c
)
{\displaystyle \lim _{x\to c}f(x)=f(c)}
.
A função identidade
f
(
x
)
=
x
{\displaystyle f(x)=x}
é contínua em toda a reta. De fato, dado
ϵ
>
0
{\displaystyle \epsilon >0}
e
x
0
{\displaystyle x_{0}}
real, tomando
δ
=
ϵ
{\displaystyle \delta =\epsilon }
, temos que, se
|
x
−
x
0
|
<
δ
=
ϵ
{\displaystyle |x-x_{0}|<\delta =\epsilon }
.
A função quadrado
f
(
x
)
=
x
2
{\displaystyle f(x)=x^{2}}
também é contínua em toda a reta.
Demonstração
Dado
ϵ
>
0
{\displaystyle \epsilon >0}
, e
x
0
{\displaystyle x_{0}}
real, temos
|
x
2
−
(
x
0
)
2
|
=
|
x
+
x
0
|
|
x
−
x
0
|
{\displaystyle |x^{2}-(x_{0})^{2}|=|x+x_{0}||x-x_{0}|}
.
Como estamos trabalhando com
x
{\displaystyle x}
próximo de
x
0
{\displaystyle x_{0}}
, temos
|
x
+
x
0
|
<
C
{\displaystyle |x+x_{0}|<C}
, para algum
C
{\displaystyle C}
real.
Definindo
δ
=
ϵ
/
C
{\displaystyle \delta =\epsilon /C}
, se
|
x
−
x
0
|
<
δ
⇒
|
x
−
x
0
|
<
ϵ
/
C
⇒
|
x
+
x
0
|
|
x
−
x
0
|
<
C
|
x
−
x
0
|
<
ϵ
{\displaystyle |x-x_{0}|<\delta \Rightarrow |x-x_{0}|<\epsilon /C\Rightarrow |x+x_{0}||x-x_{0}|<C|x-x_{0}|<\epsilon }
.
Portanto
f
{\displaystyle f}
é contínua em
x
0
{\displaystyle x_{0}}
, para todo
x
0
{\displaystyle x_{0}}
real.
A função
f
(
x
)
=
x
n
{\displaystyle f(x)=x^{n}\,}
é contínua em toda a reta para qualquer natural n .
Demonstração
Fixemos um ponto
x
0
∈
R
{\displaystyle x_{0}\in \mathbb {R} \,}
e
ε
>
0
{\displaystyle \varepsilon >0\,}
, e procedemos com a fatoração da potência:
f
(
x
)
−
f
(
x
0
)
=
x
n
−
x
0
n
=
(
x
−
x
0
)
∑
k
=
0
n
−
1
x
k
x
0
n
−
k
−
1
{\displaystyle f(x)-f(x_{0})=x^{n}-x_{0}^{n}=(x-x_{0})\sum _{k=0}^{n-1}x^{k}x_{0}^{n-k-1}}
Definamos, agora,
δ
=
min
[
ε
n
(
|
x
0
|
+
1
)
n
−
1
,
1
]
{\displaystyle \delta =\min \left[{\frac {\varepsilon }{n(|x_{0}|+1)^{n-1}}},1\right]}
Por definição,
δ
≤
1
{\displaystyle \delta \leq 1\,}
, portanto, se
|
x
−
x
0
|
<
δ
{\displaystyle \left|x-x_{0}\right|<\delta \,}
, temos:
|
x
|
=
|
x
0
+
(
x
−
x
0
)
|
≤
|
x
0
|
+
|
x
−
x
0
|
≤
|
x
0
|
+
δ
≤
|
x
0
|
+
1
{\displaystyle |x|=|x_{0}+(x-x_{0})|\leq |x_{0}|+|x-x_{0}|\leq |x_{0}|+\delta \leq |x_{0}|+1\,}
Assim:
|
f
(
x
)
−
f
(
x
0
)
|
=
|
(
x
−
x
0
)
∑
k
=
0
n
−
1
x
k
x
0
n
−
k
−
1
|
≤
δ
∑
k
=
0
n
−
1
|
x
k
|
⋅
|
x
0
|
n
−
k
−
1
≤
ε
{\displaystyle \left|f(x)-f(x_{0})\right|=\left|(x-x_{0})\sum _{k=0}^{n-1}x^{k}x_{0}^{n-k-1}\right|\leq \delta \sum _{k=0}^{n-1}|x^{k}|\cdot |x_{0}|^{n-k-1}\leq \varepsilon }
Sejam
f
,
g
:
D
⊂
R
→
R
{\displaystyle f,g:D\subset \mathbb {R} \to \mathbb {R} }
funções contínuas e
λ
{\displaystyle \lambda }
um número real, então valem as seguintes propriedades:
f
+
g
{\displaystyle f+g\;}
é contínua;
f
g
{\displaystyle fg\;}
é contínua;
λ
f
{\displaystyle \lambda f\;}
é contínua;
f
/
g
{\displaystyle f/g\;}
é contínua em todos os pontos onde
g
{\displaystyle g\;}
não se anula.
Podemos usar limites seqüenciais para provar que funções são descontínuas da seguinte forma:
f
(
x
)
{\displaystyle f(x)}
é descontínua em
c
{\displaystyle c\;}
se, e somente se, houver duas seqüências
(
x
n
)
→
c
{\displaystyle (x_{n})\rightarrow c}
e
(
y
n
)
→
c
{\displaystyle (y_{n})\rightarrow c}
tal que
lim
n
→
∞
(
f
(
x
n
)
)
≠
lim
n
→
∞
(
f
(
y
n
)
)
{\displaystyle \lim _{n\rightarrow \infty }(f(x_{n}))\not =\lim _{n\rightarrow \infty }(f(y_{n}))}
.
Outro resultado que nos permitirá construir muitos exemplos de funções contínuas é que qualquer composição de funções contínuas em si é contínuo:
Se
f
:
B
→
R
{\displaystyle f:B\rightarrow \mathbb {R} }
e
g
:
A
↦
B
{\displaystyle g:A\mapsto B}
são contínuas, então a composição
(
f
∘
g
)
(
x
)
=
f
(
g
(
x
)
)
{\displaystyle (f\circ g)(x)=f(g(x))}
é contínua sobre A.
Seja
ϵ
>
0
{\displaystyle \epsilon >0}
;
c
∈
A
{\displaystyle c\in A}
.
Uma vez que f é contínua,
∃
δ
1
>
0
:
|
x
−
c
|
<
δ
1
⟹
|
f
(
x
)
−
f
(
c
)
|
<
ϵ
{\displaystyle \exists \delta _{1}>0:|x-c|<\delta _{1}\implies |f(x)-f(c)|<\epsilon }
.
Desde que g é contínua,
∃
δ
2
>
0
:
|
x
−
c
|
<
δ
2
⟹
|
g
(
x
)
−
g
(
c
)
|
<
δ
1
{\displaystyle \exists \delta _{2}>0:|x-c|<\delta _{2}\implies |g(x)-g(c)|<\delta _{1}}
.
Assim
|
x
−
c
|
<
δ
2
⟹
|
g
(
x
)
−
g
(
c
)
|
<
δ
1
⟹
|
f
(
g
(
x
)
)
−
f
(
g
(
c
)
)
|
<
ϵ
{\displaystyle |x-c|<\delta _{2}\implies |g(x)-g(c)|<\delta _{1}\implies |f(g(x))-f(g(c))|<\epsilon }
, por isso
(
f
∘
g
)
(
x
)
{\displaystyle (f\circ g)(x)}
é contínua sobre A.
Este é o grande teorema sobre continuidade. Basicamente ele diz que funções contínuas não tem interrupções bruscas ou saltos.
Seja f(x) uma função contínua. Se
a
<
b
{\displaystyle a<b\;}
e
f
(
a
)
<
m
<
f
(
b
)
{\displaystyle f(a)<m<f(b)\;}
, então
∃
c
∈
(
a
,
b
)
:
f
(
c
)
=
M
{\displaystyle \exists c\in (a,b):f(c)=M}
.
Seja
S
=
{
x
∈
(
a
,
b
)
:
f
(
x
)
<
m
}
{\displaystyle S=\{x\in (a,b):f(x)<m\}}
, e seja
c
=
sup
S
{\displaystyle c=\sup S}
.
Seja
ϵ
=
|
f
(
c
)
−
m
|
{\displaystyle \epsilon =|f(c)-m|}
. Pela continuidade,
∃
δ
:
|
x
−
c
|
<
δ
⟹
|
f
(
x
)
−
f
(
c
)
|
<
ϵ
{\displaystyle \exists \delta :|x-c|<\delta \implies |f(x)-f(c)|<\epsilon }
.
Se f(c) < m, então
|
f
(
c
+
δ
2
)
−
f
(
c
)
|
<
ϵ
{\displaystyle |f(c+{\frac {\delta }{2}})-f(c)|<\epsilon }
, por isso
f
(
c
+
δ
2
)
<
f
(
c
)
+
ϵ
=
m
{\displaystyle f(c+{\frac {\delta }{2}})<f(c)+\epsilon =m}
. Mas então
c
+
δ
2
∈
S
{\displaystyle c+{\frac {\delta }{2}}\in S}
, o que implica que c não é um limite superior para S, uma contradição.
Se f(c) > m, desde então
c
=
sup
S
{\displaystyle c=\sup S}
,
∃
x
:
x
∈
S
,
c
>
x
>
c
−
δ
{\displaystyle \exists x:x\in S,c>x>c-\delta }
. Mas desde que
|
x
−
c
|
<
δ
,
|
f
(
x
)
−
f
(
c
)
|
<
ϵ
{\displaystyle |x-c|<\delta ,\;|f(x)-f(c)|<\epsilon }
, por isso
f
(
x
)
>
f
(
c
)
−
ϵ
{\displaystyle f(x)>f(c)-\epsilon }
= m, o que implica que
x
∉
S
{\displaystyle x\notin S}
, uma contradição.
◻
{\displaystyle \Box }
Iremos provar agora o Teorema Mínimo-Máximo, que é um outro resultado importante que está relacionada com a continuidade. Essencialmente, ela diz que qualquer imagem contínua de um intervalo fechado é limitada, e também que ele atinge esses limites.
Seja
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\to \mathbb {R} }
contínuo
Então
(i)
f
(
[
a
,
b
]
)
{\displaystyle f([a,b])}
é limitado
(ii)Se
M
,
m
{\displaystyle M,m}
são respectivamente o limite superior e inferior do
f
(
[
a
,
b
]
)
{\displaystyle f([a,b])}
, então existem
c
,
d
∈
[
a
,
b
]
{\displaystyle c,d\in [a,b]}
tais que
f
(
c
)
=
M
,
f
(
d
)
=
m
{\displaystyle f(c)=M,f(d)=m}
(i)Suponhamos que, se possível
f
{\displaystyle f}
é ilimitado.
Seja
x
1
=
a
+
b
2
{\displaystyle x_{1}={\tfrac {a+b}{2}}}
. Em seguida,
f
{\displaystyle f\;}
é ilimitado em pelo menos um dos intervalos fechados
[
a
,
x
1
]
{\displaystyle [a,x_{1}]}
e
[
x
1
,
b
]
{\displaystyle [x_{1},b]\;}
(para outra,
f
{\displaystyle f\;}
seria ilimitada sobre
[
a
,
b
]
{\displaystyle [a,b]}
contradizendo a hipótese). Chamar este intervalo
I
1
{\displaystyle I_{1}}
.
Similarmente, partindo
I
1
{\displaystyle I_{1}}
em dois intervalos fechados e deixar
I
2
{\displaystyle I_{2}}
ser um dos quais
f
{\displaystyle f}
é ilimitado.
Assim sendo, temos uma seqüência de intervalos fechados adjacentes
[
a
,
b
]
⊇
I
1
⊇
I
2
⊇
…
{\displaystyle [a,b]\supseteq I_{1}\supseteq I_{2}\supseteq \ldots }
tais que
f
{\displaystyle f\;}
é ilimitada sobre cada um deles.
Sabemos que a intersecção de uma seqüência de intervalos fechados adjacentes é não vazio. Daí, seja
x
0
∈
I
1
∩
I
2
∩
…
{\displaystyle x_{0}\in I_{1}\cap I_{2}\cap \ldots }
Como
f
(
x
)
{\displaystyle f(x)\;}
é contínua em
x
=
x
0
{\displaystyle x=x_{0}}
, existe
δ
>
0
{\displaystyle \delta >0}
tal que
x
∈
V
δ
(
x
0
)
⟹
f
(
x
)
∈
(
f
(
x
0
)
−
1
,
f
(
x
0
)
+
1
)
{\displaystyle x\in V_{\delta }(x_{0})\implies f(x)\in (f(x_{0})-1,f(x_{0})+1)}
Mas, por definição, existe sempre
k
∈
N
{\displaystyle k\in \mathbb {N} }
tal que
I
k
⊆
V
δ
(
x
0
)
{\displaystyle I_{k}\subseteq V_{\delta }(x_{0})}
, contradizendo a hipótese de que
f
{\displaystyle f\;}
é ilimitado sobre
I
k
{\displaystyle I_{k}}
. Assim,
f
{\displaystyle f\;}
é limitada sobre
[
a
,
b
]
{\displaystyle [a,b]}
(ii) Considere-se, se possível,
M
=
sup
(
f
(
[
a
,
b
]
)
)
{\displaystyle M=\sup(f([a,b]))}
mas
M
∉
f
(
[
a
,
b
]
)
{\displaystyle M\notin f([a,b])}
.
Considere a função
g
(
x
)
=
1
M
−
f
(
x
)
{\displaystyle g(x)={\frac {1}{M-f(x)}}}
. Pela propriedade algébricas de continuidade,
g
:
[
a
,
b
]
→
R
{\displaystyle g:[a,b]\to \mathbb {R} }
é contínuo. No entanto,
M
{\displaystyle M\;}
sendo um ponto relativo de
f
(
[
a
,
b
]
)
{\displaystyle f([a,b])}
,
g
(
x
)
{\displaystyle g(x)\;}
é ilimitado sobre
[
a
,
b
]
{\displaystyle [a,b]}
, contradizendo (i). Daí,
M
∈
f
(
[
a
,
b
]
)
{\displaystyle M\in f([a,b])}
. Da mesma forma, podemos mostrar que
m
∈
f
(
[
a
,
b
]
)
{\displaystyle m\in f([a,b])}
.
Como se referiu, a ideia de funções contínuas é utilizado em várias áreas da matemática, mais notavelmente na Topologia . A caracterização diferente de continuidade é útil em tais situações.
Seja
A
⊆
R
{\displaystyle A\subseteq \mathbb {R} }
Seja
f
:
A
→
R
{\displaystyle f:A\to \mathbb {R} }
f
(
x
)
{\displaystyle f(x)}
é contínua em
x
=
c
{\displaystyle x=c\;}
se, e somente se, para cada vizinhança aberta
V
{\displaystyle V}
de
f
(
x
)
{\displaystyle f(x)\;}
, existe uma vizinhança aberta
U
{\displaystyle U}
de
x
{\displaystyle x}
tal que
U
⊆
f
−
1
(
V
)
{\displaystyle U\subseteq f^{-1}(V)}
Deve ser mencionado aqui que o termo "Conjunto aberto" pode ser definido em geral muito mais do que o conjunto de definições reais ou mesmo espaços métricos, e daí a utilidade desta caracterização.
Seja
A
⊆
R
{\displaystyle A\subseteq \mathbb {R} }
Seja
f
:
A
→
R
{\displaystyle f:A\to \mathbb {R} }
Dizemos que
f
{\displaystyle f\;}
é uniformemente contínua sobre
A
{\displaystyle A\;}
se, e somente se, para cada
ε
>
0
{\displaystyle \varepsilon >0}
existe
δ
>
0
{\displaystyle \delta >0}
tal que, se
x
,
y
∈
A
{\displaystyle x,y\in A}
e
|
x
−
y
|
<
δ
{\displaystyle |x-y|<\delta }
então
|
f
(
x
)
−
f
(
y
)
|
<
ε
{\displaystyle |f(x)-f(y)|<\varepsilon }
Continudade no wiki em inglês
Seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função real. Definimos a oscilação de
f
{\displaystyle f\,}
em um intervalo
[
a
,
b
]
{\displaystyle [a,b]\,}
contido em
D
{\displaystyle D\,}
como:
osc
[
a
,
b
]
(
f
)
:=
sup
[
a
,
b
]
f
(
x
)
−
inf
[
a
,
b
]
f
(
x
)
{\displaystyle {\hbox{osc}}_{[a,b]}(f):=\sup _{[a,b]}f(x)-\inf _{[a,b]}f(x)\,}
Se
f
{\displaystyle f\,}
é um função não decrescente, então:
osc
[
a
,
b
]
(
f
)
=
f
(
b
)
−
f
(
a
)
{\displaystyle {\hbox{osc}}_{[a,b]}(f)=f(b)-f(a)\,}
Se
f
{\displaystyle f\,}
é um função não crescente, então:
osc
[
a
,
b
]
(
f
)
=
f
(
a
)
−
f
(
b
)
{\displaystyle {\hbox{osc}}_{[a,b]}(f)=f(a)-f(b)\,}
Seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função real. Definimos a variação de
f
{\displaystyle f\,}
em um partição
P
:=
{
x
0
:=
a
,
x
1
,
x
2
,
…
,
x
n
−
1
,
x
n
:=
b
}
{\displaystyle P:=\left\{x_{0}:=a,x_{1},x_{2},\ldots ,x_{n-1},x_{n}:=b\right\}\,}
de um intervalo
[
a
,
b
]
{\displaystyle [a,b]\,}
contido em
D
{\displaystyle D\,}
como:
var
P
(
f
)
:=
∑
i
=
1
n
|
f
(
x
i
)
−
f
(
x
i
−
1
)
|
{\displaystyle {\hbox{var}}_{P}(f):=\sum _{i=1}^{n}\left|f(x_{i})-f(x_{i-1})\right|\,}
1. Seja P uma partição cujos extremos são
x
0
=
a
{\displaystyle x_{0}=a\,}
and
x
n
=
b
{\displaystyle x_{n}=b\,}
e seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função real definida em um domínio
D
⊃
[
a
,
b
]
{\displaystyle D\supset [a,b]\,}
então:
var
P
(
α
f
)
=
|
α
|
var
P
(
f
)
,
∀
α
∈
R
{\displaystyle {\hbox{var}}_{P}(\alpha f)=|\alpha |{\hbox{var}}_{P}(f),~~\forall \alpha \in \mathbb {R} \,}
Demonstração
Imediato da definição.
2. Seja P uma partição cujos extremos são
x
0
=
a
{\displaystyle x_{0}=a\,}
and
x
n
=
b
{\displaystyle x_{n}=b\,}
e seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função monótona definida em um domínio
D
⊃
[
a
,
b
]
{\displaystyle D\supset [a,b]\,}
então:
var
P
(
f
)
=
|
f
(
a
)
−
f
(
b
)
|
{\displaystyle {\hbox{var}}_{P}(f)=\left|f(a)-f(b)\right|\,}
Demonstração
Considere, sem perda de generalidade, que
f
{\displaystyle f\,}
é uma função crescente, da definição de variação temos:
var
P
(
f
)
:=
∑
i
=
1
n
|
f
(
x
i
)
−
f
(
x
i
−
1
)
|
{\displaystyle {\hbox{var}}_{P}(f):=\sum _{i=1}^{n}\left|f(x_{i})-f(x_{i-1})\right|\,}
Como
x
i
≥
x
i
−
1
{\displaystyle x_{i}\geq x_{i-1}\,}
, temos que
|
f
(
x
i
)
−
f
(
x
i
−
1
)
|
=
f
(
x
i
)
−
f
(
x
i
−
1
)
≥
0
{\displaystyle \left|f(x_{i})-f(x_{i-1})\right|=f(x_{i})-f(x_{i-1})\geq 0\,}
, logo:
var
P
(
f
)
:=
∑
i
=
1
n
f
(
x
i
)
−
f
(
x
i
−
1
)
=
f
(
x
n
)
−
f
(
x
0
)
=
f
(
b
)
−
f
(
a
)
=
|
f
(
a
)
−
f
(
b
)
|
{\displaystyle {\hbox{var}}_{P}(f):=\sum _{i=1}^{n}f(x_{i})-f(x_{i-1})=f(x_{n})-f(x_{0})=f(b)-f(a)=\left|f(a)-f(b)\right|\,}
3. Seja P uma partição cujos extremos são
x
0
=
a
{\displaystyle x_{0}=a\,}
and
x
n
=
b
{\displaystyle x_{n}=b\,}
e sejam
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
e
g
:
D
→
R
{\displaystyle g:D\to \mathbb {R} \,}
funções reais definidas em um domínio
D
⊃
[
a
,
b
]
{\displaystyle D\supset [a,b]\,}
então:
var
P
(
f
+
g
)
≤
var
P
(
f
)
+
var
P
(
g
)
{\displaystyle {\hbox{var}}_{P}(f+g)\leq {\hbox{var}}_{P}(f)+{\hbox{var}}_{P}(g)\,}
Demonstração
var
P
(
f
+
g
)
:=
∑
i
=
1
n
|
f
(
x
i
)
+
g
(
x
1
)
−
f
(
x
i
−
1
)
−
g
(
x
i
−
1
)
|
≤
∑
i
=
1
n
(
|
f
(
x
i
)
−
f
(
x
i
−
1
)
|
+
|
g
(
x
i
)
−
g
(
x
i
−
1
)
|
)
=
var
P
(
f
)
+
var
P
(
g
)
{\displaystyle {\begin{array}{rcl}{\hbox{var}}_{P}(f+g)&:=&\sum _{i=1}^{n}\left|f(x_{i})+g(x_{1})-f(x_{i-1})-g(x_{i-1)}\right|\\&\leq &\sum _{i=1}^{n}\left(\left|f(x_{i})-f(x_{i-1})\right|+\left|g(x_{i})-g(x_{i-1})\right|\right)\\&=&{\hbox{var}}_{P}(f)+{\hbox{var}}_{P}(g)\end{array}}\,}
4. Seja P uma partição cujos extremos são
x
0
=
a
{\displaystyle x_{0}=a\,}
and
x
n
=
b
{\displaystyle x_{n}=b\,}
e
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função real definida em um domínio
D
⊃
[
a
,
b
]
{\displaystyle D\supset [a,b]\,}
então, se P' é um refinamento de P
var
P
f
≤
var
P
′
(
f
)
{\displaystyle {\hbox{var}}_{P}f\leq {\hbox{var}}_{P'}(f)\,}
Demonstração
Sem perda de generalidade, considere que P' é um refinamento de P pela inclusão de um único ponto
x
k
−
1
≤
x
′
≤
x
k
{\displaystyle x_{k-1}\leq x'\leq x_{k}\,}
. Como a seguinte desigualdade é válida:
|
f
(
x
k
−
1
)
−
f
(
x
k
)
|
≤
|
f
(
x
k
−
1
)
−
f
(
x
′
)
|
+
|
f
(
x
′
)
−
f
(
x
k
)
|
{\displaystyle \left|f(x_{k-1})-f(x_{k})\right|\leq \left|f(x_{k-1})-f(x')\right|+\left|f(x')-f(x_{k})\right|\,}
o resultado segue.
Seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função real. Definimos a variação de
f
{\displaystyle f\,}
em um intervalo
[
a
,
b
]
{\displaystyle [a,b]\,}
contido em
D
{\displaystyle D\,}
como:
var
[
a
,
b
]
(
f
)
:=
sup
P
∈
P
var
P
(
f
)
{\displaystyle {\hbox{var}}_{[a,b]}(f):=\sup _{P\in \mathbb {P} }{\hbox{var}}_{P}(f)\,}
O supremo é tomado em
P
{\displaystyle \mathbb {P} \,}
, o conjunto de todas as possíveis partições de
[
a
,
b
]
{\displaystyle [a,b]\,}
.
As seguintes propriedades são de demonstração imediata, aparir da definição de supremo e das propriedades já demonstradas para a variação em uma partição.
1. Se
f
{\displaystyle f\,}
é um função monótona, então:
var
[
a
,
b
]
(
f
)
=
|
f
(
a
)
−
f
(
b
)
|
{\displaystyle {\hbox{var}}_{[a,b]}(f)=\left|f(a)-f(b)\right|\,}
2. Se
f
{\displaystyle f\,}
uma função real, então:
var
[
a
,
b
]
(
f
)
≥
var
[
c
,
d
]
(
f
)
{\displaystyle {\hbox{var}}_{[a,b]}(f)\geq {\hbox{var}}_{[c,d]}(f)\,}
, sempre que
a
≤
c
≤
d
≤
b
{\displaystyle a\leq c\leq d\leq b\,}
.
3. Se
f
{\displaystyle f\,}
e
g
{\displaystyle g\,}
são funções reais, vale
var
[
a
,
b
]
(
f
+
g
)
≤
var
[
a
,
b
]
(
f
)
+
var
[
a
,
b
]
(
g
)
{\displaystyle {\hbox{var}}_{[a,b]}(f+g)\leq {\hbox{var}}_{[a,b]}(f)+{\hbox{var}}_{[a,b]}(g)\,}
,
4. Se
f
{\displaystyle f\,}
uma função real, então:
var
[
a
,
b
]
(
α
f
)
=
|
α
|
var
[
a
,
b
]
(
f
)
,
∀
α
∈
R
{\displaystyle {\hbox{var}}_{[a,b]}(\alpha f)=|\alpha |{\hbox{var}}_{[a,b]}(f),~~\forall ~\alpha \in \mathbb {R} \,}
,
5. Se
f
{\displaystyle f\,}
uma função real, então:
var
[
a
,
c
]
(
f
)
=
var
[
c
,
b
]
(
f
)
+
var
[
b
,
c
]
(
f
)
,
∀
c
∈
[
a
,
b
]
{\displaystyle {\hbox{var}}_{[a,c]}(f)={\hbox{var}}_{[c,b]}(f)+{\hbox{var}}_{[b,c]}(f),~~\forall ~c\in [a,b]\,}
,
Diz-se que uma função real
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
é de variação limitada em um intervalo
[
a
,
b
]
{\displaystyle [a,b]\,}
se e somente se:
var
[
a
,
b
]
(
α
f
)
≤
∞
{\displaystyle {\hbox{var}}_{[a,b]}(\alpha f)\leq \infty \,}
Seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função de classe
C
1
[
a
,
b
]
{\displaystyle C^{1}[a,b]\,}
, então:
var
[
a
,
b
]
(
f
)
=
∫
a
b
|
f
′
(
x
)
|
d
x
{\displaystyle {\hbox{var}}_{[a,b]}(f)=\int _{a}^{b}|f'(x)|dx\,}
Demontração
Primeiro observamos que se
P
{\displaystyle P\,}
é uma partição do intervalo
[
a
,
b
]
{\displaystyle [a,b]\,}
, podemos escrever, usando o teorema do valor médio:
var
P
f
=
∑
i
=
1
n
|
f
(
x
i
)
−
f
(
x
i
−
1
)
|
=
∑
i
=
1
n
|
f
′
(
x
i
∗
)
|
(
x
i
−
x
i
−
1
)
,
x
i
∗
∈
(
x
i
−
1
,
x
i
)
{\displaystyle {\hbox{var}}_{P}{f}=\sum _{i=1}^{n}\left|f(x_{i})-f(x_{i-1})\right|=\sum _{i=1}^{n}\left|f'(x_{i}^{*})\right|(x_{i}-x_{i-1}),~~~x_{i}^{*}\in (x_{i-1},x_{i})\,}
Da definição de variação total, podemos inferir a existência de uma seqüência de partições
P
k
=
(
x
0
k
,
x
1
k
,
…
,
x
n
k
k
)
,
{\displaystyle P_{k}=\left(x_{0}^{k},x_{1}^{k},\ldots ,x_{n_{k}}^{k}\right),\,}
tal que:
0
≤
var
[
a
,
b
]
(
f
)
−
var
P
k
(
f
)
≤
1
/
k
{\displaystyle 0\leq {\hbox{var}}_{[a,b]}(f)-{\hbox{var}}_{P_{k}}(f)\leq 1/k\,}
Como a variação não decresce com o refino da partição, pode supor que comprimento das partições
P
k
{\displaystyle P_{k}\,}
está convergindo para zero. Assim:
var
[
a
,
b
]
(
f
)
=
lim
k
→
∞
var
P
k
(
f
)
=
lim
k
→
∞
∑
i
=
1
n
k
|
f
′
(
x
i
k
∗
)
|
(
x
i
k
−
x
i
−
1
k
)
=
∫
a
b
|
f
′
(
x
)
|
d
x
{\displaystyle {\hbox{var}}_{[a,b]}(f)=\lim _{k\to \infty }{\hbox{var}}_{P_{k}}(f)=\lim _{k\to \infty }\sum _{i=1}^{n_{k}}\left|f'(x_{i}^{k}*)\right|(x_{i}^{k}-x_{i-1}^{k})=\int _{a}^{b}|f'(x)|dx\,}
Uma função é de variação limitada se e somente se pode ser escrita como a diferença de duas funções não decrescentes.
Demontração
a. Seja
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
uma função de variação limitada em
D
{\displaystyle D\,}
. Define-se a função
F
:
D
2
→
R
{\displaystyle F:D^{2}\to \mathbb {R} \,}
da seguinte forma:
F
(
x
0
,
x
)
=
{
var
[
x
0
,
x
]
(
f
)
,
x
0
≤
x
−
var
[
x
0
,
x
]
(
f
)
,
x
0
>
x
{\displaystyle F(x_{0},x)=\left\{{\begin{array}{ll}{\hbox{var}}_{[x_{0},x]}(f),&x_{0}\leq x\\-{\hbox{var}}_{[x_{0},x]}(f),&x_{0}>x\\\end{array}}\right.\,}
Fixando um
x
0
∈
D
{\displaystyle x_{0}\in D\,}
é uma função não decrescente em
x
{\displaystyle x\,}
.
Agora define-se:
p
(
x
)
=
1
2
[
F
(
x
0
,
x
)
+
f
(
x
)
]
q
(
x
)
=
1
2
[
F
(
x
0
,
x
)
−
f
(
x
)
]
{\displaystyle {\begin{array}{l}p(x)={\frac {1}{2}}\left[F(x_{0},x)+f(x)\right]\\~\\q(x)={\frac {1}{2}}\left[F(x_{0},x)-f(x)\right]\end{array}}}
.
É fácil ver que
f
(
x
)
=
p
(
x
)
−
q
(
x
)
{\displaystyle f(x)=p(x)-q(x)\,}
. Resta-nos provar que tanto
p
(
x
)
{\displaystyle p(x)\,}
como
q
(
x
)
{\displaystyle q(x)\,}
são funções não decrescentes. Para tal, seja
y
>
x
{\displaystyle y>x\,}
e fazemos a seguinte estimativa:
p
(
y
)
−
p
(
x
)
=
1
2
[
F
(
x
0
,
y
)
+
f
(
y
)
]
−
1
2
[
F
(
x
0
,
x
)
+
f
(
x
)
]
=
1
2
[
F
(
x
0
,
y
)
−
F
(
x
0
,
x
)
]
+
1
2
[
f
(
y
)
−
f
(
x
)
]
=
1
2
[
var
[
y
,
x
]
(
f
)
]
+
1
2
[
f
(
y
)
−
f
(
x
)
]
≥
0
{\displaystyle {\begin{array}{rcl}p(y)-p(x)&=&{\frac {1}{2}}\left[F(x_{0},y)+f(y)\right]-{\frac {1}{2}}\left[F(x_{0},x)+f(x)\right]\\&=&{\frac {1}{2}}\left[F(x_{0},y)-F(x_{0},x)\right]+{\frac {1}{2}}\left[f(y)-f(x)\right]\\&=&{\frac {1}{2}}\left[{\hbox{var}}_{[y,x](f)}\right]+{\frac {1}{2}}\left[f(y)-f(x)\right]\geq 0\end{array}}}
Da penúltipla para a última linha usamos
F
(
x
0
,
y
)
−
F
(
x
0
,
x
)
=
var
[
x
0
,
y
]
(
f
)
−
var
[
x
0
,
x
]
(
f
)
=
var
[
x
,
y
]
(
f
)
{\displaystyle F(x_{0},y)-F(x_{0},x)={\hbox{var}}_{[x_{0},y](f)}-{\hbox{var}}_{[x_{0},x](f)}={\hbox{var}}_{[x,y](f)}}
e depois observamos que
var
[
x
,
y
]
(
f
)
≥
|
f
(
x
)
−
f
(
y
)
|
{\displaystyle {\hbox{var}}_{[x,y](f)}\geq \left|f(x)-f(y)\right|}
.
A demontração sendo perfeitamente análoga para a função
q
(
x
)
{\displaystyle q(x)\,}
, o resultado segue.
Considere a função:
f
(
x
)
=
{
x
cos
(
π
x
)
,
x
≠
0
0
,
x
=
0
{\displaystyle f(x)=\left\{{\begin{array}{ll}x\cos \left({\frac {\pi }{x}}\right),&x\neq 0\\0,&x=0\end{array}}\right.}
Esta função não é de variação limitada no intervalo
[
0
,
1
]
{\displaystyle [0,1]\,}
. Para provar isso considere o seguintes pontos:
x
n
=
1
n
+
1
,
f
(
x
n
)
=
1
n
+
1
(
−
1
)
n
,
n
=
0
,
1
,
2
,
…
{\displaystyle x_{n}={\frac {1}{n+1}},\quad f(x_{n})={\frac {1}{n+1}}(-1)^{n},n=0,1,2,\ldots \,}
Assim
|
f
(
x
n
)
−
f
(
x
n
−
1
)
|
=
1
n
+
1
+
1
n
>
1
/
n
,
n
=
1
,
2
,
3
,
…
{\displaystyle \left|f(x_{n})-f(x_{n-1})\right|={\frac {1}{n+1}}+{\frac {1}{n}}>1/n,n=1,2,3,\ldots \,}
Portanto,
var
[
0
,
1
]
(
f
)
≥
∑
n
=
1
∞
1
n
=
+
∞
{\displaystyle {\hbox{var}}_{[0,1]}(f)\geq \sum _{n=1}^{\infty }{\frac {1}{n}}=+\infty \,}
Estamos agora prontos para definir a derivada de uma função.
Seja
f
:
R
→
R
{\displaystyle f:\mathbb {R} \to \mathbb {R} }
, e seja
a
∈
R
{\displaystyle a\in \mathbb {R} }
. Dizemos que
f
(
x
)
{\displaystyle f(x)}
é diferenciável em
x
=
a
{\displaystyle x=a}
se, e somente se, existir
L
∈
R
{\displaystyle L\in \mathbb {R} }
tal que
lim
x
→
a
f
(
x
)
−
f
(
a
)
x
−
a
=
L
{\displaystyle \lim _{x\rightarrow a}{f(x)-f(a) \over x-a}=L}
.
L
{\displaystyle L}
é dita a derivada de
f
{\displaystyle f}
em
a
{\displaystyle a}
e é denotada por
f
′
(
a
)
{\displaystyle f'(a)}
.
A função é dita diferenciável no conjunto
A
{\displaystyle A}
se a derivada existir para cada
a
∈
A
{\displaystyle a\in A}
. A função é diferenciável se ela é diferenciável em todo o seu domínio.
Conceitualmente, encontrar a derivada em um ponto significa encontrar a inclinação da reta tangente ao gráfico da função naquele ponto. Assim, a derivada pode ser considerada como uma aproximação linear ou de primeira ordem.
Algumas propriedades das derivadas seguem imediatamente a partir da definição:
Se f e g são diferenciáveis, então:
(
f
+
g
)
′
(
x
)
=
f
′
(
x
)
+
g
′
(
x
)
{\displaystyle (f+g)'(x)=f'(x)+g'(x)}
(
λ
f
)
′
(
x
)
=
λ
f
′
(
x
)
{\displaystyle (\lambda f)'(x)=\lambda f'(x)}
(
f
+
g
)
′
(
x
)
=
lim
y
→
x
(
f
(
y
)
+
g
(
y
)
)
−
(
f
(
x
)
+
g
(
x
)
)
y
−
x
{\displaystyle (f+g)'(x)=\lim _{y\rightarrow x}{(f(y)+g(y))-(f(x)+g(x)) \over y-x}}
=
lim
y
→
x
(
f
(
y
)
−
f
(
x
)
y
−
x
+
g
(
y
)
−
g
(
x
)
y
−
x
)
{\displaystyle =\lim _{y\rightarrow x}\left({f(y)-f(x) \over y-x}+{g(y)-g(x) \over y-x}\right)}
=
lim
y
→
x
f
(
y
)
−
f
(
x
)
y
−
x
+
lim
y
→
x
g
(
y
)
−
g
(
x
)
y
−
x
=
f
′
(
x
)
+
g
′
(
x
)
{\displaystyle =\lim _{y\rightarrow x}{f(y)-f(x) \over y-x}+\lim _{y\rightarrow x}{g(y)-g(x) \over y-x}=f'(x)+g'(x)}
(
λ
f
)
′
(
x
)
=
lim
y
→
x
λ
f
(
y
)
−
λ
f
(
x
)
y
−
x
=
λ
lim
y
→
x
f
(
y
)
−
f
(
x
)
y
−
x
=
λ
f
′
(
x
)
{\displaystyle (\lambda f)'(x)=\lim _{y\rightarrow x}{\lambda f(y)-\lambda f(x) \over y-x}=\lambda \lim _{y\rightarrow x}{f(y)-f(x) \over y-x}=\lambda f'(x)}
Se
f
{\displaystyle f}
é diferenciável em
x
{\displaystyle x}
, então ela é contínua em
x
{\displaystyle x}
.
Uma vez que
f
{\displaystyle f}
é diferenciável em
x
{\displaystyle x}
,
lim
y
→
x
f
(
y
)
−
f
(
x
)
y
−
x
=
f
′
(
x
)
{\displaystyle \lim _{y\rightarrow x}{f(y)-f(x) \over y-x}=f'(x)}
.
Então
lim
y
→
x
[
f
(
y
)
−
f
(
x
)
]
=
lim
y
→
x
f
(
y
)
−
f
(
x
)
y
−
x
lim
y
→
x
(
y
−
x
)
=
f
′
(
x
)
0
=
0
{\displaystyle \lim _{y\rightarrow x}\left[f(y)-f(x)\right]=\lim _{y\rightarrow x}{f(y)-f(x) \over y-x}\lim _{y\rightarrow x}\left(y-x\right)=f'(x)\;0=0}
Assim,
lim
y
→
x
f
(
y
)
=
f
(
x
)
{\displaystyle \lim _{y\rightarrow x}f(y)=f(x)}
, então f é contínua em x.
Se
f
{\displaystyle f}
e
g
{\displaystyle g}
são diferenciáveis, então
(
f
g
)
′
(
x
)
=
f
′
(
x
)
g
(
x
)
+
f
(
x
)
g
′
(
x
)
{\displaystyle (fg)'(x)=f'(x)g(x)+f(x)g'(x)}
.
(
f
g
)
′
(
x
)
=
lim
y
→
x
f
(
y
)
g
(
y
)
−
f
(
x
)
g
(
x
)
y
−
x
{\displaystyle (fg)'(x)=\lim _{y\rightarrow x}{f(y)g(y)-f(x)g(x) \over y-x}}
=
lim
y
→
x
f
(
y
)
g
(
y
)
−
f
(
x
)
g
(
y
)
+
f
(
x
)
g
(
y
)
−
f
(
x
)
g
(
x
)
y
−
x
{\displaystyle =\lim _{y\rightarrow x}{f(y)g(y)-f(x)g(y)+f(x)g(y)-f(x)g(x) \over y-x}}
=
lim
y
→
x
(
f
(
y
)
−
f
(
x
)
)
g
(
y
)
+
f
(
x
)
(
g
(
y
)
−
g
(
x
)
)
y
−
x
{\displaystyle =\lim _{y\rightarrow x}({f(y)-f(x))g(y)+f(x)(g(y)-g(x)) \over y-x}}
=
lim
y
→
x
f
(
y
)
−
f
(
x
)
y
−
x
lim
y
→
x
g
(
y
)
+
f
(
x
)
lim
y
→
x
g
(
y
)
−
g
(
x
)
y
−
x
{\displaystyle =\lim _{y\rightarrow x}{f(y)-f(x) \over y-x}\lim _{y\rightarrow x}g(y)+f(x)\lim _{y\rightarrow x}{g(y)-g(x) \over y-x}}
=
f
′
(
x
)
g
(
x
)
+
f
(
x
)
g
′
(
x
)
{\displaystyle =f'(x)g(x)+f(x)g'(x)}
, uma vez que g é contínua em x.
◼
{\displaystyle \blacksquare }
O próximo teorema é um pouco mais complicado para provar do que parece. Nós gostaríamos de usar o seguinte argumento:
(
f
∘
g
)
′
(
x
)
=
lim
y
→
x
f
(
g
(
y
)
)
−
f
(
g
(
x
)
)
y
−
x
{\displaystyle (f\circ g)'(x)=\lim _{y\rightarrow x}{f(g(y))-f(g(x)) \over y-x}}
=
lim
y
→
x
f
(
g
(
y
)
)
−
f
(
g
(
x
)
)
g
(
y
)
−
g
(
x
)
g
(
y
)
−
g
(
x
)
y
−
x
{\displaystyle =\lim _{y\rightarrow x}{f(g(y))-f(g(x)) \over g(y)-g(x)}{g(y)-g(x) \over y-x}}
=
lim
y
→
x
f
(
g
(
y
)
)
−
f
(
g
(
x
)
)
g
(
y
)
−
g
(
x
)
lim
y
→
x
g
(
y
)
−
g
(
x
)
y
−
x
{\displaystyle =\lim _{y\rightarrow x}{f(g(y))-f(g(x)) \over g(y)-g(x)}\lim _{y\rightarrow x}{g(y)-g(x) \over y-x}}
=
f
′
(
g
(
x
)
)
g
′
(
x
)
{\displaystyle =f'(g(x))g'(x)}
O problema é que
g
(
y
)
−
g
(
x
)
{\displaystyle g(y)-g(x)}
pode ser zero em pontos arbitrariamente próximos de x, e, por conseguinte,
f
(
g
(
y
)
)
−
f
(
g
(
x
)
)
g
(
y
)
−
g
(
x
)
{\displaystyle {f(g(y))-f(g(x)) \over g(y)-g(x)}}
não seria contínua nesses pontos. Assim aplicamos um lema inteligente como se segue:
Seja
f
:
R
→
R
{\displaystyle f:\mathbb {R} \to \mathbb {R} }
. Dizemos que
f
(
x
)
{\displaystyle f(x)}
é diferenciável em
x
=
c
{\displaystyle x=c}
se, e somente se, existe uma função contínua
ϕ
:
R
→
R
{\displaystyle \phi :\mathbb {R} \to \mathbb {R} }
que satisfaz
(
x
−
c
)
ϕ
(
x
)
=
f
(
x
)
−
f
(
c
)
∀
x
∈
R
{\displaystyle (x-c)\phi (x)=f(x)-f(c)\quad \forall x\in \mathbb {R} }
Seja
f
(
x
)
{\displaystyle f(x)}
diferenciável em
x
=
c
{\displaystyle x=c}
e defina a função
ϕ
:
R
→
R
{\displaystyle \phi :\mathbb {R} \to \mathbb {R} }
tal que
ϕ
(
x
)
=
f
(
x
)
−
f
(
c
)
x
−
c
para
x
≠
c
{\displaystyle \phi (x)={\frac {f(x)-f(c)}{x-c}}{\mbox{ para }}x\neq c}
e
ϕ
(
c
)
=
f
′
(
c
)
{\displaystyle \phi (c)=f'(c)}
É fácil ver que
ϕ
(
x
)
{\displaystyle \phi (x)}
é contínua e preenche a condição exigida.
Seja
ϕ
(
x
)
{\displaystyle \phi (x)}
uma função contínua que satisfaz
(
x
−
c
)
ϕ
(
x
)
=
f
(
x
)
−
f
(
c
)
∀
x
∈
R
{\displaystyle (x-c)\phi (x)=f(x)-f(c)\quad \forall x\in \mathbb {R} }
. Temos,
∀
x
≠
c
{\displaystyle \forall x\neq c}
, que
ϕ
(
x
)
=
f
(
x
)
−
f
(
c
)
x
−
c
{\displaystyle \phi (x)={\frac {f(x)-f(c)}{x-c}}}
Como
ϕ
{\displaystyle \phi }
é contínua,
ϕ
(
c
)
=
lim
x
→
c
ϕ
(
x
)
{\displaystyle \phi (c)=\lim _{x\to c}\phi (x)}
, ou seja,
ϕ
(
c
)
=
lim
x
→
c
f
(
x
)
−
f
(
c
)
x
−
c
{\displaystyle \phi (c)=\lim _{x\to c}{\frac {f(x)-f(c)}{x-c}}}
, o que implica que
f
(
x
)
{\displaystyle f(x)}
é diferenciável em
x
=
c
{\displaystyle x=c}
.
Seja
g
:
R
→
R
{\displaystyle g:\mathbb {R} \to \mathbb {R} }
diferenciável em
c
∈
R
{\displaystyle c\in \mathbb {R} }
e seja
f
:
R
→
R
{\displaystyle f:\mathbb {R} \to \mathbb {R} }
diferenciável em
d
=
g
(
c
)
{\displaystyle d=g(c)}
. Então
(i)
(
f
∘
g
)
(
x
)
{\displaystyle (f\circ g)(x)}
é diferenciável em
x
=
c
{\displaystyle x=c}
;
(ii)
(
f
∘
g
)
′
(
c
)
=
f
′
(
g
(
c
)
)
g
′
(
c
)
{\displaystyle (f\circ g)'(c)=f'(g(c))\,g'(c)}
.
O lema de Caratheodory implica que existem funções contínuas
ϕ
,
γ
:
R
→
R
{\displaystyle \phi ,\gamma :\mathbb {R} \to \mathbb {R} }
tais que
(
x
−
c
)
γ
(
x
)
=
g
(
x
)
−
g
(
c
)
{\displaystyle (x-c)\gamma (x)=g(x)-g(c)}
e
(
g
(
x
)
−
g
(
c
)
)
ϕ
(
x
)
=
f
(
g
(
x
)
)
−
f
(
g
(
c
)
)
{\displaystyle (g(x)-g(c))\phi (x)=f(g(x))-f(g(c))}
.
Agora, considere a função
η
(
x
)
=
ϕ
(
x
)
γ
(
x
)
{\displaystyle \eta (x)=\phi (x)\gamma (x)}
. Obviamente,
η
(
x
)
{\displaystyle \eta (x)}
é contínua. Além disso, ela satisfaz
(
x
−
c
)
η
(
x
)
=
(
f
∘
g
)
(
x
)
−
(
f
∘
g
)
(
c
)
{\displaystyle (x-c)\eta (x)=(f\circ g)(x)-(f\circ g)(c)}
.
Assim, pelo Lema de Caratheodory,
(
f
∘
g
)
(
x
)
{\displaystyle (f\circ g)(x)}
é diferenciável em
x
=
c
{\displaystyle x=c}
e vale
(
f
∘
g
)
′
(
c
)
=
η
(
c
)
=
f
′
(
g
(
c
)
)
g
′
(
c
)
{\displaystyle (f\circ g)'(c)=\eta (c)=f'(g(c))\,g'(c)}
.
Considere
f
:
R
→
R
{\displaystyle f:\mathbb {R} \rightarrow \mathbb {R} }
definida por
f
(
x
)
=
x
{\displaystyle f(x)=x}
. Qual é a derivada de
f
{\displaystyle f}
em
a
{\displaystyle a}
?
f
′
(
a
)
=
lim
h
→
0
f
(
a
+
h
)
−
f
(
a
)
h
{\displaystyle f'(a)=\lim _{h\rightarrow 0}{\frac {f(a+h)-f(a)}{h}}}
=
lim
h
→
0
a
+
h
−
a
h
=
lim
h
→
0
h
h
=
lim
h
→
0
1
=
1
{\displaystyle =\lim _{h\rightarrow 0}{\frac {a+h-a}{h}}=\lim _{h\rightarrow 0}{\frac {h}{h}}=\lim _{h\rightarrow 0}1=1}
Assim, aqui vemos que
f
′
(
a
)
=
1
{\displaystyle f'(a)=1}
. Uma vez que
a
{\displaystyle a}
foi um ponto arbitrariamente escolhido, concluímos que
f
′
(
a
)
=
1
∀
a
∈
R
{\displaystyle f'(a)=1\quad \forall a\in \mathbb {R} }
.
Similarmente a fórmula da derivada também pode ser encontrada.
Uma vez que os teoremas anteriores garantem que soma, bem como o produto, de funções diferenciáveis é resulta em uma função diferenciável, segue que as funções polinomiais são diferenciáveis.
Encontrar as derivadas das funções polinomiais, trigonométricas, exponencial e logarítmica.
Alguns dos contra-exemplos mais populares para ilustrar propriedades de continuidade e de diferenciabilidade são funções que envolvem
f
(
x
)
=
sen
(
1
x
)
{\displaystyle f(x)=\operatorname {sen} \left({\frac {1}{x}}\right)}
.
Prove que
f
(
x
)
=
{
sen
(
1
x
)
para todo
x
≠
0
0
para
x
=
0
{\displaystyle f(x)={\begin{cases}\operatorname {sen} \left({\frac {1}{x}}\right)&{\text{ para todo }}x\neq 0\\0&{\text{ para }}x=0\end{cases}}\ }
não é contínua em
x
=
0
{\displaystyle x=0}
.
Prove que a função
f
(
x
)
=
{
x
sen
(
1
x
)
para todo
x
≠
0
0
para
x
=
0
{\displaystyle f(x)={\begin{cases}x\,\operatorname {sen} \left({\frac {1}{x}}\right)&{\text{ para todo }}x\neq 0\\0&{\text{ para }}x=0\end{cases}}\ }
é contínua, mas não diferenciável em
x
=
0
{\displaystyle x=0}
.
Prove que
f
(
x
)
=
{
x
2
sen
(
1
x
)
para todo
x
≠
0
0
para
x
=
0
{\displaystyle f(x)={\begin{cases}x^{2}\,\operatorname {sen} \left({\frac {1}{x}}\right)&{\text{ para todo }}x\neq 0\\0&{\text{ para }}x=0\end{cases}}\ }
é diferenciável em
x
=
0
{\displaystyle x=0}
.
The Rule of L'Hopital says that a derivate of a function F(x) divided by the derivate of another function G(x) gives the same value of limit of both primitive functions;
Com origem histórica na antiguidade, o cálculo integral foi particularmente enriquecido a partir do momento em que Isaac Newton (1642-1727) e Gottfried Willelm Leibniz (1646-1716) lhe descobriram propriedades inversas da derivação. Até então foi sempre um assunto intimamente ligado ao cálculo de áreas e de volumes, que a partir de meados do século XVI sofre um desenvolvimento metodológico notável promovido principalmente, por Johann Kepler (1571-1630), Galileu Galilei (1584-1642), Buonaventura Cavalieri (1598-1647) e Evangelista Torricelli (1608-1647). Da sua importância bastará recordar o papel das áreas na descrição das leis físicas dos movimentos dos planetas, propostas por Kepler na sua Investigationes Astronomicae , e a segunda obra do mesmo autor, Nova Stereometria Doliorum Vinariorum, exclusivamente dedicada ao cálculo de volumes de sólidos.
Inspirando-se essencialmente no princípio da exaustão , largamente utilizado pelos matemáticos da Grécia antiga, desde Eudoxo (408-355 a.C.) até Arquimedes (287-213 a.C.), a base desse desenvolvimento encontra-se na introdução dos chamados indivisíveis ou infinitésimos , particularmente especificados de forma mais rigorosa por matemáticos do século XIX, entre os quais, Georg Bernhard Riemann (1826-1866). (Para uma descrição histórica detalhada sobre este tema veja-se[ 1] [ 2] [ 3] )-
A integral de Riemann pode ter várias formulações. A versão que iremos apresentar é a devida a Jean-Gaston Darboux (1842-1917), publicada em 1875 nos Annales de l'École Normale Supérieur de Paris. Esta escolha apresenta algumas vantagens, pois sendo então a integral de Riemann uma consequência das integrais superior e inferior , as propriedades destes refletem-se necessariamente nas daquele. Esta ideia é explorada sempre que possível, com proveito em muitos casos.
A integral de Riemann têm como objetivo calcular a região limitada por funções limitadas em intervalos limitados. E calcularemos esta região através da divisão da mesma em retângulos.
Já sabemos que a área de um retângulo de lados "a" e "b" é dado por A(Área) = ab. Agora basta saber como faremos a divisão de uma figura por retângulos.
Se a área for limitada por [a,b]x[0,f(x)]. Então temos x=a; x=b; y=0; y=f(x) limitando nossa figura.
Por ser 0<y<f(x), temos que
f
(
x
)
>
0
;
∀
x
∈
R
{\displaystyle f(x)>0;\forall x\in \mathbb {R} }
.
Quando particionamos a figura em retângulos, conseguimos calcular a área dela com um pequeno erro. É claro que enquanto maior for a partição, menor será o erro.
(f,P) significa que a área relacionada a função f estará sendo particionada na partição P.
Se tomarmos inicialmente o intervalo [a,b] e particionarmos uma vez, teremos
P
1
=
{
t
0
;
t
1
;
t
2
}
com
t
0
=
a
e
t
2
=
b
{\displaystyle P_{1}=\{t_{0};t_{1};t_{2}\}{\mbox{ com }}t_{0}=a{\mbox{ e }}t_{2}=b}
. Aqui estamos dividindo o intervalo [a,b] em
[
t
0
,
t
1
]
e
[
t
1
,
t
2
]
{\displaystyle [t_{0},t_{1}]{\mbox{ e }}[t_{1},t_{2}]}
Generalizando, podemos particionar o intervalo [a,b] quantas vezes quisermos.
Estaremos trocando A(Área) por S(soma de áreas)
(A1) Sejam m e M; menor e maior "altura" do retângulo de base b-a
Sejam
m
=
inf
{
f
(
x
)
;
x
∈
[
a
,
b
]
}
e
M
=
sup
{
f
(
x
)
;
x
∈
[
a
,
b
]
}
{\displaystyle m={\mbox{inf}}\{f(x);x\in [a,b]\}{\mbox{ e }}M={\mbox{sup}}\{f(x);x\in [a,b]\}}
m
(
b
−
a
)
≤
M
(
b
−
a
)
{\displaystyle m(b-a)\leq M(b-a)}
. Tomando
P
0
=
{
a
,
b
}
temos
S
_
(
f
;
P
0
)
≤
S
¯
(
f
;
P
0
)
{\displaystyle P_{0}=\{a,b\}{\mbox{ temos }}{\underline {S}}(f;P_{0})\leq {\overline {S}}(f;P_{0})}
(A2) Sejam
m
i
e
M
i
{\displaystyle m_{i}\;e\;M_{i}}
; menor e maior "altura" do retângulo de base
t
i
−
t
i
−
1
{\displaystyle t_{i}-t_{i-1}}
Podemos calcular a área da partição
P
1
{\displaystyle P_{1}}
da seguinte forma:
Por falta
A
(
f
a
l
t
a
)
=
m
1
(
t
1
−
t
0
)
+
m
2
(
t
2
−
t
1
)
=
S
_
(
f
;
P
1
)
{\displaystyle A(falta)=m_{1}(t_{1}-t_{0})+m_{2}(t_{2}-t_{1})={\underline {S}}(f;P_{1})}
conhecido como soma inferior
Onde
m
1
=
i
n
f
{
f
(
x
)
;
x
∈
[
t
0
,
t
1
]
}
e
m
2
=
i
n
f
{
f
(
x
)
;
x
∈
[
t
1
,
t
2
]
}
{\displaystyle m_{1}=inf\{f(x);x\in [t_{0},t_{1}]\}{\mbox{ e }}m_{2}=inf\{f(x);x\in [t_{1},t_{2}]\}}
Por sobra
A
(
s
o
b
r
a
)
=
M
1
(
t
1
−
t
0
)
+
M
2
(
t
2
−
t
1
)
=
S
¯
(
f
;
P
1
)
{\displaystyle A(sobra)=M_{1}(t_{1}-t_{0})+M_{2}(t_{2}-t_{1})={\overline {S}}(f;P_{1})}
conhecido como soma superior
Onde
M
1
=
s
u
p
{
f
(
x
)
;
x
∈
[
t
0
,
t
1
]
}
e
M
2
=
s
u
p
{
f
(
x
)
;
x
∈
[
t
1
,
t
2
]
}
{\displaystyle M_{1}=sup\{f(x);x\in [t_{0},t_{1}]\}{\mbox{ e }}M_{2}=sup\{f(x);x\in [t_{1},t_{2}]\}}
Como
m
1
≤
M
1
e
m
2
≤
M
2
{\displaystyle m_{1}\leq M_{1}{\mbox{ e }}m_{2}\leq M_{2}}
. Logo
S
_
(
f
;
P
1
)
≤
S
¯
(
f
;
P
1
)
{\displaystyle {\underline {S}}(f;P_{1})\leq {\overline {S}}(f;P_{1})}
(A3) Seja
m
(
b
−
a
)
=
m
(
t
2
−
t
0
)
. Tomando
t
1
∈
[
t
0
,
t
2
]
, temos
m
(
t
2
−
t
1
+
t
1
−
t
0
)
=
{\displaystyle m(b-a)=m(t_{2}-t_{0}){\mbox{. Tomando }}t_{1}\in [t_{0},t_{2}]{\mbox{, temos }}m(t_{2}-t_{1}+t_{1}-t_{0})=}
=
m
(
t
2
−
t
1
)
+
m
(
t
1
−
t
0
)
≤
m
2
(
t
2
−
t
1
)
+
m
1
(
t
1
−
t
0
)
⇒
S
_
(
f
;
P
0
)
≤
S
_
(
f
;
P
1
)
, pois
m
≤
m
1
e
m
≤
m
2
{\displaystyle =m(t_{2}-t_{1})+m(t_{1}-t_{0})\leq m_{2}(t_{2}-t_{1})+m_{1}(t_{1}-t_{0})\Rightarrow {\underline {S}}(f;P_{0})\leq {\underline {S}}(f;P_{1}){\mbox{, pois }}m\leq m_{1}{\mbox{ e }}m\leq m_{2}}
(A4) o fato que
S
¯
(
f
;
P
1
)
≤
S
¯
(
f
;
P
0
)
{\displaystyle {\overline {S}}(f;P_{1})\leq {\overline {S}}(f;P_{0})}
é análogo a (A3)
(A2),(A3)e(A4)
S
_
(
f
;
P
0
)
≤
S
_
(
f
;
P
1
)
≤
S
¯
(
f
;
P
1
)
≤
S
¯
(
f
;
P
0
)
{\displaystyle {\underline {S}}(f;P_{0})\leq {\underline {S}}(f;P_{1})\leq {\overline {S}}(f;P_{1})\leq {\overline {S}}(f;P_{0})}
.
Pelo que vimos acima, quando acrescentamos um único ponto a partição inicial [a,b], a nossa soma inferior ficou maior, e nossa soma superior ficou menor. A nossa idéia então é fazer com que elas se aproximem o suficiente até
|
S
¯
(
f
;
P
∞
)
−
S
_
(
f
;
P
∞
)
|
<
ϵ
,
o
n
d
e
P
∞
{\displaystyle |{\overline {S}}(f;P_{\infty })-{\underline {S}}(f;P_{\infty })|<\epsilon ,onde\;P_{\infty }}
será para nós quando
lim
P
i
→
P
∞
|
t
i
−
t
i
−
1
|
=
0
{\displaystyle \lim _{P_{i}\to P_{\infty }}|t_{i}-t_{i-1}|=0}
. Então encontraremos a área da figura.
Sejam
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
limitada e as partições
P
k
−
1
, Q cujo
Q
=
P
k
−
1
∪
{
c
}
{\displaystyle P_{k-1}{\mbox{, Q cujo }}Q=P_{k-1}\cup \{c\}}
S
_
(
f
;
P
k
−
1
)
≤
S
_
(
f
;
Q
)
≤
S
¯
(
f
;
Q
)
≤
S
¯
(
f
;
P
k
−
1
)
{\displaystyle {\underline {S}}(f;P_{k-1})\leq {\underline {S}}(f;Q)\leq {\overline {S}}(f;Q)\leq {\overline {S}}(f;P_{k-1})}
.
Sejam
P
k
−
1
=
{
t
0
,
t
1
,
.
.
.
,
t
l
−
1
,
t
l
,
t
l
+
1
,
.
.
.
t
k
−
1
,
t
k
}
e
Q
=
P
k
−
1
∪
{
c
}
onde
c
∈
[
t
l
−
1
,
t
l
]
{\displaystyle P_{k-1}=\{t_{0},t_{1},...,t_{l-1},t_{l},t_{l+1},...t_{k-1},t_{k}\}{\mbox{ e }}Q=P_{k-1}\cup \{c\}{\mbox{ onde }}c\in [t_{l-1},t_{l}]}
S
_
(
f
;
P
k
−
1
)
=
∑
i
=
1
k
m
i
(
t
i
−
t
i
−
1
)
=
∑
i
=
1
l
−
1
m
i
(
t
i
−
t
i
−
1
)
+
m
l
(
t
l
−
t
l
−
1
)
+
∑
i
=
l
k
m
i
(
t
i
−
t
i
−
1
)
{\displaystyle {\underline {S}}(f;P_{k-1})=\sum _{i=1}^{k}m_{i}(t_{i}-t_{i-1})=\sum _{i=1}^{l-1}m_{i}(t_{i}-t_{i-1})+m_{l}(t_{l}-t_{l-1})+\sum _{i=l}^{k}m_{i}(t_{i}-t_{i-1})}
S
_
(
f
;
Q
)
=
∑
i
=
1
l
−
1
m
i
(
t
i
−
t
i
−
1
)
+
m
′
(
c
−
t
l
−
1
)
+
m
″
(
t
l
−
c
)
+
∑
i
=
l
k
m
i
(
t
i
−
t
i
−
1
)
{\displaystyle {\underline {S}}(f;Q)=\sum _{i=1}^{l-1}m_{i}(t_{i}-t_{i-1})+m'(c-t_{l-1})+m''(t_{l}-c)+\sum _{i=l}^{k}m_{i}(t_{i}-t_{i-1})}
Onde
m
′
=
i
n
f
{
f
(
x
)
;
x
∈
[
t
l
−
1
,
c
]
}
e
m
″
=
i
n
f
{
f
(
x
)
;
x
∈
[
c
,
t
i
]
}
{\displaystyle m'=inf\{f(x);x\in [t_{l-1},c]\}{\mbox{ e }}m''=inf\{f(x);x\in [c,t_{i}]\}}
É verdade que
m
l
(
t
l
−
t
l
−
1
)
=
m
l
(
t
l
−
c
+
c
−
t
l
−
1
)
=
m
l
(
t
l
−
c
)
+
m
l
(
c
−
t
l
−
1
)
como
m
l
≤
m
′
e
m
l
≤
m
″
{\displaystyle m_{l}(t_{l}-t_{l-1})=m_{l}(t_{l}-c+c-t_{l-1})=m_{l}(t_{l}-c)+m_{l}(c-t_{l-1}){\mbox{ como }}m_{l}\leq m'{\mbox{ e }}m_{l}\leq m''}
. Então
S
_
(
f
;
P
k
−
1
)
≤
S
_
(
f
;
Q
)
{\displaystyle {\underline {S}}(f;P_{k-1})\leq {\underline {S}}(f;Q)}
De forma análoga se demonstra que
S
¯
(
f
;
Q
)
≤
S
¯
(
f
;
P
k
−
1
)
{\displaystyle {\overline {S}}(f;Q)\leq {\overline {S}}(f;P_{k-1})}
Sejam
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
limitada, quando se refina uma partição a soma inferior não diminui e a soma superior não aumenta
Pelo Lema 1, Q é uma refinação da partição P.
Sejam
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
limitada, e as partições P e Q, onde
S
_
(
f
;
P
)
≤
S
¯
(
f
;
Q
)
{\displaystyle {\underline {S}}(f;P)\leq {\overline {S}}(f;Q)}
.
Refinando P nos pontos de Q, e refinando Q nos pontos de P teremos
S
_
(
f
;
P
)
≤
S
_
(
f
;
P
∪
Q
)
e
S
¯
(
f
;
P
∪
Q
)
≤
S
¯
(
f
;
P
)
{\displaystyle {\underline {S}}(f;P)\leq {\underline {S}}(f;P\cup Q){\mbox{ e }}{\overline {S}}(f;P\cup Q)\leq {\overline {S}}(f;P)}
. Como
S
_
(
f
;
P
∪
Q
)
≤
S
¯
(
f
;
P
∪
Q
)
⇒
S
_
(
f
;
P
)
≤
S
_
(
f
;
P
∪
Q
)
≤
S
¯
(
f
;
P
∪
Q
)
≤
S
¯
(
f
;
P
)
{\displaystyle {\underline {S}}(f;P\cup Q)\leq {\overline {S}}(f;P\cup Q)\Rightarrow {\underline {S}}(f;P)\leq {\underline {S}}(f;P\cup Q)\leq {\overline {S}}(f;P\cup Q)\leq {\overline {S}}(f;P)}
.
Seja
f
:
[
a
,
b
]
→
R
limitada e
P
∗
{\displaystyle f:[a,b]\rightarrow \mathbb {R} {\mbox{ limitada e }}P^{*}}
todas as partições de [a,b]
∫
_
a
b
f
(
x
)
d
x
=
sup
S
_
(
f
;
P
∗
)
{\displaystyle {\underline {\int }}_{a}^{b}f(x)\,dx={\mbox{ sup }}{\underline {S}}(f;P^{*})}
é a integral inferior de f
∫
¯
a
b
f
(
x
)
d
x
=
inf
S
¯
(
f
;
P
∗
)
{\displaystyle {\overline {\int }}_{a}^{b}f(x)\,dx={\mbox{ inf }}{\overline {S}}(f;P^{*})}
é a integral superior de f
Pelo Lema 1
S
_
(
f
;
P
∗
)
≤
sup
S
_
(
f
;
P
∗
)
≤
inf
S
¯
(
f
;
P
∗
)
≤
S
¯
(
f
;
P
∗
)
{\displaystyle {\underline {S}}(f;P^{*})\leq {\mbox{ sup }}{\underline {S}}(f;P^{*})\leq {\mbox{ inf }}{\overline {S}}(f;P^{*})\leq {\overline {S}}(f;P^{*})}
.
Logo
S
_
(
f
;
P
∗
)
≤
∫
_
a
b
f
(
x
)
d
x
≤
∫
¯
a
b
f
(
x
)
d
x
≤
S
¯
(
f
;
P
∗
)
{\displaystyle {\underline {S}}(f;P^{*})\leq {\underline {\int }}_{a}^{b}f(x)dx\leq {\overline {\int }}_{a}^{b}f(x)dx\leq {\overline {S}}(f;P^{*})}
.
Seja
c
∈
]
a
,
b
[
{\displaystyle c\in ]a,b[}
e
Q
∗
{\displaystyle Q^{*}}
são todas as partição de [a,b] que contém c. Assim
Q
∗
=
P
∗
∪
{
c
}
{\displaystyle Q^{*}=P^{*}\cup \{c\}}
, então
∫
_
a
b
f
(
x
)
d
x
,
∫
¯
a
b
f
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}f(x)dx,{\overline {\int }}_{a}^{b}f(x)dx}
são únicos.
Em particular
Q
⊂
Q
∗
{\displaystyle Q\subset Q^{*}}
, ou seja, tomemos uma partição que contém {c}
Seja
P
=
Q
∖
c
{\displaystyle P=Q\setminus {c}}
; onde
P
⊂
P
∗
{\displaystyle P\subset P^{*}}
.
Pelo Lema 1
S
_
(
f
;
P
)
≤
S
_
(
f
;
Q
)
≤
S
¯
(
f
;
Q
)
≤
S
¯
(
f
;
P
)
{\displaystyle {\underline {S}}(f;P)\leq {\underline {S}}(f;Q)\leq {\overline {S}}(f;Q)\leq {\overline {S}}(f;P)}
.
olhemos para o fato que A' = {cota inferior de Q} e B' = {cota superior de Q}; A = {cota inferior de P} e B = {cota superior de P}
A
⊂
A
′
⇒
s
e
a
∈
A
e
a
′
∈
A
′
,
l
o
g
o
a
≤
a
′
{\displaystyle A\subset A'\Rightarrow se\;a\in A\;e\;a'\in A',logo\;a\leq a'}
sup A = sup A', pois
c
∈
]
a
,
b
[
{\displaystyle c\in ]a,b[}
B
⊂
B
′
⇒
s
e
b
∈
B
e
b
′
∈
B
′
,
l
o
g
o
b
≤
b
′
{\displaystyle B\subset B'\Rightarrow se\;b\in B\;e\;b'\in B',logo\;b\leq b'}
inf B = inf B', pois
c
∈
]
a
,
b
[
{\displaystyle c\in ]a,b[}
sup
S
_
(
f
;
P
)
=
sup
S
_
(
f
;
Q
)
≤
inf
S
¯
(
f
;
Q
)
=
inf
S
¯
(
f
;
P
)
{\displaystyle {\mbox{ sup }}{\underline {S}}(f;P)={\mbox{ sup }}{\underline {S}}(f;Q)\leq {\mbox{ inf }}{\overline {S}}(f;Q)={\mbox{ inf }}{\overline {S}}(f;P)}
.
Sejam A, B subconjuntos não vazios e limitados dos reais. (a) => (b)
(a) Se
A
=
{
a
∈
A
}
,
B
=
{
b
∈
B
}
{\displaystyle A=\{a\in A\},B=\{b\in B\}}
, então
A
+
B
=
{
a
+
b
;
a
∈
A
,
b
∈
B
}
{\displaystyle A+B=\{a+b;a\in A,b\in B\}}
(b) inf(A+B) = inf A + inf B ; sup(A+B) = sup A + Sup B
Dado
a
∈
A
,
b
∈
B
,
t
e
m
o
s
a
≥
i
n
f
A
,
b
≥
i
n
f
B
⇒
a
+
b
≥
i
n
f
A
+
i
n
f
B
{\displaystyle a\in A,b\in B,temos\;a\geq infA,b\geq infB\Rightarrow a+b\geq infA+infB}
.
Assim inf A + inf B é uma cota inferior de A+B,
Dado
ϵ
>
0
,
∃
a
′
∈
A
,
b
′
∈
B
;
a
′
<
i
n
f
A
+
ϵ
2
,
b
′
<
i
n
f
B
+
ϵ
2
⇒
a
′
+
b
′
<
i
n
f
A
+
i
n
f
B
+
ϵ
{\displaystyle \epsilon >0,\exists a'\in A,b'\in B;a'<infA+{\epsilon \over 2},b'<infB+{\epsilon \over 2}\Rightarrow a'+b'<infA+infB+\epsilon }
portanto inf A + inf B é o ínfimo do conjunto A + B
o sup se mostra analogamente
Sejam
f
,
g
:
[
a
,
b
]
↦
R
{\displaystyle f,g:[a,b]\mapsto \mathbb {R} }
limitadas. Então
(a)
s
u
p
(
f
+
g
)
≤
s
u
p
(
f
)
+
s
u
p
(
g
)
{\displaystyle sup(f+g)\leq sup(f)+sup(g)}
(b)
i
n
f
(
f
+
g
)
≥
i
n
f
(
f
)
+
i
n
f
(
g
)
{\displaystyle inf(f+g)\geq inf(f)+inf(g)}
Se
A
=
f
(
[
a
,
b
]
)
,
B
=
g
(
[
a
,
b
]
)
{\displaystyle A=f([a,b]),\;B=g([a,b])}
, então
C
=
{
f
(
x
)
+
g
(
x
)
;
x
∈
[
a
,
b
]
}
⊂
A
+
B
{\displaystyle C=\{f(x)+g(x);x\in [a,b]\}\subset A+B}
pelo teorema
i
n
f
(
A
+
B
)
≤
i
n
f
(
C
)
≤
s
u
p
(
C
)
≤
s
u
p
(
A
+
B
)
{\displaystyle inf(A+B)\leq inf(C)\leq sup(C)\leq sup(A+B)}
e pelo lema 3 temos
(a)
s
u
p
(
f
+
g
)
=
s
u
p
(
C
)
≤
s
u
p
(
A
+
B
)
=
s
u
p
(
A
)
+
s
u
p
(
B
)
=
s
u
p
(
f
)
+
s
u
p
(
g
)
{\displaystyle sup(f+g)=sup(C)\leq sup(A+B)=sup(A)+sup(B)=sup(f)+sup(g)}
(b)
i
n
f
(
f
+
g
)
=
i
n
f
(
C
)
≥
i
n
f
(
A
+
B
)
=
i
n
f
(
A
)
+
i
n
f
(
B
)
=
i
n
f
(
f
)
+
i
n
f
(
g
)
{\displaystyle inf(f+g)=inf(C)\geq inf(A+B)=inf(A)+inf(B)=inf(f)+inf(g)}
Sejam
c
∈
[
a
,
b
]
,
f
:
[
a
,
b
]
↦
R
{\displaystyle c\in [a,b],f:[a,b]\mapsto \mathbb {R} }
limitada, então
(a)
∫
_
a
b
f
(
x
)
d
x
=
∫
_
a
c
f
(
x
)
d
x
+
∫
_
c
b
f
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}f(x)dx={\underline {\int }}_{a}^{c}f(x)dx+{\underline {\int }}_{c}^{b}f(x)dx}
(b)
∫
¯
a
b
f
(
x
)
d
x
=
∫
¯
a
c
f
(
x
)
d
x
+
∫
¯
c
b
f
(
x
)
d
x
{\displaystyle {\overline {\int }}_{a}^{b}f(x)dx={\overline {\int }}_{a}^{c}f(x)dx+{\overline {\int }}_{c}^{b}f(x)dx}
(a)Sejam
A
=
{
S
_
(
f
/
[
a
,
c
]
,
P
)
;
∀
P
⊂
P
∗
}
,
B
=
{
S
_
(
f
/
[
c
,
b
]
,
P
)
;
∀
P
⊂
P
∗
}
{\displaystyle A=\{{\underline {S}}(f/[a,c],P);\forall P\subset P^{*}\},B=\{{\underline {S}}(f/[c,b],P);\forall P\subset P^{*}\}}
A
+
B
=
{
S
_
(
f
/
[
a
,
c
]
,
P
)
+
S
_
(
f
/
[
c
,
b
]
,
P
)
;
∀
P
⊂
P
∗
}
=
{
S
_
(
f
/
[
a
,
b
]
,
Q
)
;
∀
Q
⊂
Q
∗
}
{\displaystyle A+B=\{{\underline {S}}(f/[a,c],P)+{\underline {S}}(f/[c,b],P);\forall P\subset P^{*}\}=\{{\underline {S}}(f/[a,b],Q);\forall Q\subset Q^{*}\}}
pelo lema 2 e pelo lema 3 temos
∫
_
a
b
f
(
x
)
d
x
=
s
u
p
(
A
+
B
)
=
s
u
p
(
A
)
+
s
u
p
(
B
)
=
∫
_
a
c
f
(
x
)
d
x
+
∫
_
c
b
f
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}f(x)dx=sup(A+B)=sup(A)+sup(B)={\underline {\int }}_{a}^{c}f(x)dx+{\underline {\int }}_{c}^{b}f(x)dx}
(b)Sejam
A
=
{
S
¯
(
f
/
[
a
,
c
]
,
P
)
;
∀
P
⊂
P
∗
}
,
B
=
{
S
¯
(
f
/
[
c
,
b
]
,
P
)
;
∀
P
⊂
P
∗
}
{\displaystyle A=\{{\overline {S}}(f/[a,c],P);\forall P\subset P^{*}\},B=\{{\overline {S}}(f/[c,b],P);\forall P\subset P^{*}\}}
A
+
B
=
{
S
¯
(
f
/
[
a
,
c
]
,
P
)
+
S
¯
(
f
/
[
c
,
b
]
,
P
)
;
∀
P
⊂
P
∗
}
=
{
S
¯
(
f
/
[
a
,
b
]
,
Q
)
;
∀
Q
⊂
Q
∗
}
{\displaystyle A+B=\{{\overline {S}}(f/[a,c],P)+{\overline {S}}(f/[c,b],P);\forall P\subset P^{*}\}=\{{\overline {S}}(f/[a,b],Q);\forall Q\subset Q^{*}\}}
pelo lema 2 e pelo lema 3 temos
∫
¯
a
b
f
(
x
)
d
x
=
i
n
f
(
A
+
B
)
=
i
n
f
(
A
)
+
i
n
f
(
B
)
=
∫
¯
a
c
f
(
x
)
d
x
+
∫
¯
c
b
f
(
x
)
d
x
{\displaystyle {\overline {\int }}_{a}^{b}f(x)dx=inf(A+B)=inf(A)+inf(B)={\overline {\int }}_{a}^{c}f(x)dx+{\overline {\int }}_{c}^{b}f(x)dx}
Seja
A
′
⊂
R
{\displaystyle A'\subset \mathbb {R} }
e
A
=
{
x
∈
A
′
;
M
≤
x
≤
N
}
;
A
∩
[
M
,
N
]
≠
∅
{\displaystyle A=\{x\in A';M\leq x\leq N\};A\cap [M,N]\neq \emptyset }
; Dado
c
∈
R
{\displaystyle c\in \mathbb {R} }
temos:
(a)Se c> 0, então
c
⋅
A
=
{
c
.
x
∈
A
′
;
c
⋅
M
≤
c
⋅
x
≤
c
⋅
N
}
{\displaystyle c\cdot A=\{c.x\in A';c\cdot M\leq c\cdot x\leq c\cdot N\}}
Assim:
s
u
p
(
c
⋅
A
)
=
c
⋅
s
u
p
(
A
)
e
i
n
f
(
c
⋅
A
)
=
c
⋅
i
n
f
(
A
)
{\displaystyle sup(c\cdot A)=c\cdot sup(A)\;e\;inf(c\cdot A)=c\cdot inf(A)}
(b)Se c< 0, então
c
⋅
A
=
{
c
.
x
∈
A
′
;
c
⋅
M
≥
c
⋅
x
≥
c
⋅
N
}
{\displaystyle c\cdot A=\{c.x\in A';c\cdot M\geq c\cdot x\geq c\cdot N\}}
Assim:
s
u
p
(
c
⋅
A
)
=
c
⋅
i
n
f
(
A
)
e
i
n
f
(
c
⋅
A
)
=
c
⋅
s
u
p
(
A
)
{\displaystyle sup(c\cdot A)=c\cdot inf(A)\;e\;inf(c\cdot A)=c\cdot sup(A)}
(a)
s
u
p
(
c
⋅
A
)
=
c
⋅
N
=
c
⋅
s
u
p
(
A
)
{\displaystyle sup(c\cdot A)=c\cdot N=c\cdot sup(A)}
i
n
f
(
c
⋅
A
)
=
c
⋅
M
=
c
⋅
i
n
f
(
A
)
{\displaystyle inf(c\cdot A)=c\cdot M=c\cdot inf(A)}
(b)
s
u
p
(
c
⋅
A
)
=
c
⋅
M
=
c
⋅
i
n
f
(
A
)
{\displaystyle sup(c\cdot A)=c\cdot M=c\cdot inf(A)}
i
n
f
(
c
⋅
A
)
=
c
⋅
N
=
c
⋅
s
u
p
(
A
)
{\displaystyle inf(c\cdot A)=c\cdot N=c\cdot sup(A)}
Sejam
f
,
g
:
[
a
,
b
]
↦
{\displaystyle f,g:[a,b]\mapsto }
(a)
∫
_
a
b
f
(
x
)
d
x
+
∫
_
a
b
g
(
x
)
d
x
≤
∫
_
a
b
[
f
(
x
)
+
g
(
x
)
]
d
x
≤
∫
¯
a
b
[
f
(
x
)
+
g
(
x
)
]
d
x
≤
∫
¯
a
b
f
(
x
)
d
x
+
∫
¯
a
b
g
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}f(x)dx+{\underline {\int }}_{a}^{b}g(x)dx\leq {\underline {\int }}_{a}^{b}[f(x)+g(x)]dx\leq {\overline {\int }}_{a}^{b}[f(x)+g(x)]dx\leq {\overline {\int }}_{a}^{b}f(x)dx+{\overline {\int }}_{a}^{b}g(x)dx}
(b)
c>0
∫
_
a
b
c
⋅
f
(
x
)
d
x
=
c
∫
_
a
b
f
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}c\cdot f(x)dx=c{\underline {\int }}_{a}^{b}f(x)dx}
∫
¯
a
b
c
⋅
f
(
x
)
d
x
=
c
∫
¯
a
b
f
(
x
)
d
x
{\displaystyle {\overline {\int }}_{a}^{b}c\cdot f(x)dx=c{\overline {\int }}_{a}^{b}f(x)dx}
c<0
∫
_
a
b
c
⋅
f
(
x
)
d
x
=
c
∫
¯
a
b
f
(
x
)
d
x
{\displaystyle {\underline {\int }}_{a}^{b}c\cdot f(x)dx=c{\overline {\int }}_{a}^{b}f(x)dx}
∫
¯
a
b
c
⋅
f
(
x
)
d
x
=
c
∫
_
a
b
f
(
x
)
d
x
{\displaystyle {\overline {\int }}_{a}^{b}c\cdot f(x)dx=c{\underline {\int }}_{a}^{b}f(x)dx}
(c)
S
e
f
(
x
)
<
g
(
x
)
∀
x
∈
[
a
,
b
]
{\displaystyle Sef(x)<g(x)\forall ~x\in [a,b]}
, então
\underline {\int}_{a}^{b} f(x)dx \le \underline {\int}_{a}^{b} g(x)dx
\overline {\int}_{a}^{b} f(x)dx \le \overline {\int}_{a}^{b} g(x)dx
Das somas de Darboux destacamos as seguintes propriedades elementares .
Para quaisquer partições
P
,
Q
∈
P
(
[
a
,
b
]
)
{\displaystyle P,Q\in {\mathcal {P}}([a,b])}
tem-se
s
f
(
P
)
≤
S
f
(
Q
)
{\displaystyle s_{f}(P)\leq S_{f}(Q)}
.
Se
P
,
Q
∈
P
(
[
a
,
b
]
)
{\displaystyle P,Q\in {\mathcal {P}}([a,b])}
são duas partições tais que
P
⊂
Q
{\displaystyle P\subset Q}
(caso em que
Q
{\displaystyle Q}
se diz uma partição mais fina que
P
{\displaystyle P}
ou um refinamento da partição
P
{\displaystyle P}
) então
s
f
(
P
)
≤
s
f
(
Q
)
{\displaystyle s_{f}(P)\leq s_{f}(Q)}
e
S
f
(
Q
)
≤
S
f
(
P
)
{\displaystyle S_{f}(Q)\leq S_{f}(P)}
.
As duas propriedades simples acima permitem-nos obter com facilidade a seguinte primeira condição de integrabilidade (ver [ 4] ), muito comum na literatura.
Uma função
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
limitada é integrável à Riemann se e só se
Para cada
ϵ
>
0
{\displaystyle \epsilon >0}
existe
P
∈
P
(
[
a
,
b
]
)
{\displaystyle P\in {\mathcal {P}}([a,b])}
tal que
S
f
(
P
)
−
s
f
(
P
)
<
ϵ
{\displaystyle S_{f}(P)-s_{f}(P)<\epsilon }
.
Para provar este teorema comecemos por observar que pelas propriedades algébricas dos ínfimos e dos supremos se tem
∫
¯
a
b
f
(
x
)
d
x
−
∫
_
a
b
f
(
x
)
d
=
inf
{
S
f
(
Q
1
)
:
Q
1
∈
P
(
[
a
,
b
]
)
}
−
sup
{
s
f
(
Q
2
)
:
Q
2
∈
P
(
[
a
,
b
]
)
}
=
inf
{
S
f
(
Q
1
)
:
Q
1
∈
P
(
[
a
,
b
]
)
}
+
inf
{
−
s
f
(
Q
2
)
:
Q
2
∈
P
(
[
a
,
b
]
)
}
=
inf
{
S
f
(
Q
1
)
−
s
f
(
Q
2
)
:
Q
1
,
Q
2
∈
P
(
[
a
,
b
]
)
}
.
{\displaystyle {\begin{aligned}{\overline {\int }}_{a}^{\ b}f(x)\,\mathrm {d} x-{\underline {\int }}_{a}^{\ b}f(x)\,\mathrm {d} &=\inf \ \{S_{f}(Q_{1}):Q_{1}\in {\mathcal {P}}([a,b])\}-\sup\{s_{f}(Q_{2}):Q_{2}\in {\mathcal {P([a,b])}}\}\\&=\inf \ \{S_{f}(Q_{1}):Q_{1}\in {\mathcal {P}}([a,b])\}+\inf\{-s_{f}(Q_{2}):Q_{2}\in {\mathcal {P([a,b])}}\}\\&\\&=\inf \ \{S_{f}(Q_{1})-s_{f}(Q_{2}):Q_{1},Q_{2}\in {\mathcal {P}}([a,b])\}.\\\end{aligned}}}
Deste modo, se
f
{\displaystyle f}
é integrável então para cada
ϵ
>
0
{\displaystyle \epsilon >0}
existem
Q
1
,
Q
2
∈
P
(
[
a
,
b
]
)
{\displaystyle Q_{1},Q_{2}\in {\mathcal {P}}([a,b])}
tais que
0
≤
S
f
(
Q
1
)
−
s
f
(
Q
2
)
<
ϵ
{\displaystyle 0\leq S_{f}(Q_{1})-s_{f}(Q_{2})<\epsilon }
. Assim, tomando
P
=
Q
1
∪
Q
2
{\displaystyle P=Q_{1}\cup Q_{2}}
, pela propriedade 2, teremos igualmente,
0
≤
S
f
(
P
)
−
s
f
(
P
)
<
ϵ
.
{\displaystyle 0\leq S_{f}(P)-s_{f}(P)<\epsilon .}
Reciprocamente, se para cada
ϵ
>
0
{\displaystyle \epsilon >0}
existir
P
∈
P
(
[
a
,
b
]
)
{\displaystyle P\in {\mathcal {P}}([a,b])}
tal que
0
≤
S
f
(
P
)
−
s
f
(
P
)
<
ϵ
.
{\displaystyle 0\leq S_{f}(P)-s_{f}(P)<\epsilon .}
então também
0
≤
S
f
(
Q
1
)
−
s
f
(
Q
2
)
<
ϵ
{\displaystyle 0\leq S_{f}(Q_{1})-s_{f}(Q_{2})<\epsilon }
, para quaisquer
Q
1
,
Q
2
∈
P
(
[
a
,
b
]
)
{\displaystyle Q_{1},Q_{2}\in {\mathcal {P}}([a,b])}
que contenham
P
.
{\displaystyle P.}
Seja
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
uma função monótona no intervalo
[
a
,
b
]
.
{\displaystyle [a,b].}
Então
f
{\displaystyle f}
é integrável em
[
a
,
b
]
.
{\displaystyle [a,b].}
Supondo,por exemplo, que
f
{\displaystyle f}
é crescente em
[
a
,
b
]
{\displaystyle [a,b]}
(no caso decrescente, basta ter em conta que
−
f
{\displaystyle -f}
é crescente), temos que
f
{\displaystyle f}
é limitada, pois
f
(
a
)
≤
f
/
x
)
≤
f
(
b
)
{\displaystyle f(a)\leq f/x)\leq f(b)}
para cada
x
∈
[
a
,
b
]
{\displaystyle x\in [a,b]}
. Do mesmo modo, relativamente a uma qualquer partição
P
=
{
x
0
,
x
1
,
.
.
.
,
x
n
}
{\displaystyle P=\{x_{0},x_{1},...,x_{n}\}}
de
[
a
,
b
]
{\displaystyle [a,b]}
. a diferença de somas de Darboux
S
f
(
P
)
−
s
f
(
P
)
=
∑
1
=
1
n
(
f
(
x
i
)
−
f
(
x
i
−
1
]
)
)
(
x
i
−
x
i
−
1
)
{\textstyle S_{f}(P)-s_{f}(P)=\sum _{1=1}^{n}(f(x_{i})-f(x_{i-1]}))(x_{i}-x_{i-1})}
. Ora, como
(
x
i
−
x
i
−
1
)
≤
|
P
|
{\displaystyle (x_{i}-x_{i-1})\leq |P|}
temos que
S
f
(
P
)
−
s
f
(
P
)
≤
(
f
(
b
)
−
f
(
a
)
)
|
P
|
{\textstyle S_{f}(P)-s_{f}(P)\leq (f(b)-f(a))|P|}
. Então para cada
ϵ
>
0
{\displaystyle \epsilon >0}
, se a partição
P
{\displaystyle P}
for tal que
|
P
|
<
ϵ
/
(
f
(
b
)
−
f
(
a
)
)
{\displaystyle |P|<\epsilon /(f(b)-f(a))}
obtemos
S
f
(
P
)
−
s
f
(
P
)
<
ϵ
{\displaystyle S_{f}(P)-s_{f}(P)<\epsilon }
. Logo a condição de Riemann é satisfeita e por conseguinte,
f
{\displaystyle f}
é integrável em
[
a
,
b
]
.
{\displaystyle [a,b].}
Igualmente como aplicação da condição de Riemann podemos obter a integrabilidade das funções contínuas. Para o efeito, vamos usar uma propriedade importante das funções contínuas em intervalos compactos (isto é, fechados e limitados): a de serem uniformemente contínua s. Significa isto, que para qualquer
α
>
0
{\displaystyle \alpha >0}
, existe
β
>
0
{\displaystyle \beta >0}
, tal que
|
f
(
x
)
−
f
(
y
)
|
<
α
{\textstyle |f(x)-f(y)|<\alpha }
sempre que se tenha
|
x
−
y
|
<
β
{\displaystyle |x-y|<\beta }
.
Seja
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\rightarrow \mathbb {R} }
uma função contínua no intervalo
[
a
,
b
]
.
{\displaystyle [a,b].}
Então
f
{\displaystyle f}
é integrável em
[
a
,
b
]
.
{\displaystyle [a,b].}
Comecemos por notar que, pelo teorema de Weierstrass ,
f
{\displaystyle f}
é uma função limitada em
[
a
,
b
]
{\displaystyle [a,b]}
. Pela mesma razão, as somas de Darboux são somas de Riemann. Mais concretamente, para
i
=
1
,
.
.
.
,
n
,
{\displaystyle i=1,...,n,}
temos
m
i
=
f
(
c
i
)
{\displaystyle m_{i}=f(c_{i})}
e
M
i
=
f
(
d
i
)
{\displaystyle M_{i}=f(d_{i})}
, com
c
i
,
d
i
∈
[
x
i
−
1
,
x
i
]
{\displaystyle c_{i},d_{i}\in [x_{i-1},x_{i}]}
, pelo que para a correspondente partição
P
=
{
x
0
,
x
1
,
.
.
.
,
x
n
}
{\displaystyle P=\{x_{0},x_{1},...,x_{n}\}}
de
[
a
,
b
]
{\displaystyle [a,b]}
, vem
S
f
(
P
)
−
s
f
(
P
)
=
∑
i
=
1
n
(
f
(
d
i
)
−
f
(
c
i
)
)
(
x
i
−
x
i
−
1
)
{\textstyle S_{f}(P)-s_{f}(P)=\sum _{i=1}^{n}(f(d_{i})-f(c_{i}))(x_{i}-x_{i-1})}
.
Então na condição de Riemann tomemos
ϵ
>
0
{\displaystyle \epsilon >0}
arbitrário, na relação acima que define a continuidade uniforme de
f
{\displaystyle f}
em
[
a
,
b
]
{\displaystyle [a,b]}
, façamos
α
=
ϵ
/
(
b
−
a
)
{\displaystyle \alpha =\epsilon /(b-a)}
e consideremos o valor
β
>
0
{\textstyle \beta >0}
cuja existência nos é garantida. Supondo que a partição
P
{\displaystyle P}
de
[
a
,
b
]
{\displaystyle [a,b]}
possui diâmetro
|
P
|
<
β
{\displaystyle |P|<\beta }
, temos por conseguinte, para cada
i
=
1
,
.
.
.
,
n
,
{\displaystyle i=1,...,n,}
que
0
≤
(
f
(
d
i
)
−
f
(
c
i
)
)
<
ϵ
/
(
b
−
a
)
{\textstyle 0\leq (f(d_{i})-f(c_{i}))<\epsilon /(b-a)}
donde resulta
S
f
(
P
)
−
s
f
(
P
)
<
ϵ
.
{\textstyle S_{f}(P)-s_{f}(P)<\epsilon .}
Logo pela condição de Riemann
f
{\displaystyle f}
é integrável em
[
a
,
b
]
.
{\displaystyle [a,b].}
A condição do teorema assume um aspeto meramente técnico. Ela não nos dá qualquer indício das qualidades que a função deva verificar para ser integrável à Riemann.Um quadro qualitativo desta propriedade, aparece pela mão de Henri Lebesgue, na sua tese doutoral ("Intégrale, Longueur, Aire" (Integral, Comprimento, Área) apresentada na Faculdade de Ciências de Paris em 1902, com base no conceito de conjunto de medida de nula.
Seja
f
:
[
a
,
b
]
↦
R
{\displaystyle f:[a,b]\mapsto \mathbb {R} }
Nesta seção, introduzimos um importante conceito da análise real, a ideia de sequência de funções . Uma sequência de funções em um domínio
D
{\displaystyle D\,}
é definida com um conjunto
{
f
i
}
{\displaystyle \{f_{i}\}\,}
de funções
f
i
:
D
→
R
{\displaystyle f_{i}:D\to \mathbb {R} \,}
indexadas com um índice
i
{\displaystyle i\,}
. São exemplos de sequência de funções definidas em toda a reta (
D
=
R
{\displaystyle D=\mathbb {R} \,}
):
f
i
(
x
)
=
i
x
2
{\displaystyle f_{i}(x)=ix^{2}\,}
f
i
(
x
)
=
i
i
+
x
2
,
i
≥
1
{\displaystyle f_{i}(x)={\frac {i}{i+x^{2}}}~~,i\geq 1\,}
f
i
(
x
)
=
x
i
,
i
≥
1
{\displaystyle f_{i}(x)={\frac {x}{i}}~~,i\geq 1\,}
O leitor deve observar que para cada ponto fixo no domínio
x
0
{\displaystyle x_{0}\,}
, uma sequência de funções define um sequência numérica:
f
i
(
x
0
)
{\displaystyle f_{i}(x_{0})\,}
define uma sequência numérica para cada
x
0
{\displaystyle x_{0}\,}
fixo.
Uma sequência de funções
{
f
i
}
i
=
1
∞
{\displaystyle \{f_{i}\}_{i=1}^{\infty }\,}
é dita equilimitada num conjunto
E
{\displaystyle E\,}
se cada uma das funções está definida em
E
{\displaystyle E\,}
e se existe uma constante
M
{\displaystyle M\,}
tal que:
|
f
i
(
x
)
|
≤
M
,
∀
x
∈
E
∀
i
≥
1
{\displaystyle |f_{i}(x)|\leq M,~~\forall x\in E~~\forall i\geq 1\,}
O conceito de convergência de funções é fundamental para a análise real. O critério de convergência pontual , também chamado de convergência ponto a ponto ou convergência simples é um dos muitos critérios diferentes de convergências para uma família de funções.
Seja
D
∈
R
{\displaystyle D\in \mathbb {R} }
um conjunto e
f
n
:
D
→
R
{\displaystyle f_{n}:D\to \mathbb {R} \,}
uma seqüência de funções reais definidas no domínio
D
{\displaystyle D\,}
.
Diz que
{
f
n
}
n
=
1
∞
{\displaystyle \{f_{n}\}_{n=1}^{\infty }\,}
converge quando existe uma função
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
tal que para cada ponto
x
∈
D
{\displaystyle x\in D\,}
a seqüência numérica
f
n
(
x
)
{\displaystyle f_{n}(x)\,}
converge para
f
(
x
)
{\displaystyle f(x)\,}
. Ou, na notação de limites:
lim
n
→
∞
f
n
(
x
)
=
f
(
x
)
,
∀
x
∈
D
{\displaystyle \lim _{n\to \infty }f_{n}(x)=f(x),~~\forall x\in D\,}
Equivalentemente, diz-se que
{
f
n
}
{\displaystyle \{f_{n}\}\,}
converge para
f
{\displaystyle f\,}
em
D
{\displaystyle D\,}
se para todo
ε
>
0
{\displaystyle \varepsilon >0\,}
e todo
x
∈
D
{\displaystyle x\in D\,}
existe um
N
{\displaystyle N\,}
tal que
|
f
n
(
x
)
−
f
(
x
)
|
<
ε
,
∀
n
≥
N
{\displaystyle \left|f_{n}(x)-f(x)\right|<\varepsilon ,~~\forall n\geq N\,}
Seja a seguinte seqüência de funções:
f
n
(
x
)
=
x
n
,
x
∈
R
,
n
=
1
,
2
,
3
,
…
{\displaystyle f_{n}(x)={\frac {x}{n}},~x\in \mathbb {R} ,~~n=1,2,3,\ldots \,}
É fácil ver que:
lim
n
→
∞
f
n
(
x
)
=
0
{\displaystyle \lim _{n\to \infty }f_{n}(x)=0}
Deve-se observar que o limite pontual de funções contínuas não é necessariamente uma função contínua. Um exemplo deste fenômeno pode ser observado na seguinte seqüência de funções:
f
n
(
x
)
=
1
1
+
|
x
|
n
,
x
∈
R
,
n
=
1
,
2
,
3
,
…
{\displaystyle f_{n}(x)={\frac {1}{1+|x|^{n}}},~x\in \mathbb {R} ,~~n=1,2,3,\ldots \,}
cujo limite é dado por:
lim
n
→
∞
f
n
(
x
)
=
{
1
,
|
x
|
<
1
1
/
2
,
|
x
|
=
1
0
,
|
x
|
>
1
{\displaystyle \lim _{n\to \infty }f_{n}(x)=\left\{{\begin{array}{rl}1,&|x|<1\\1/2,&|x|=1\\0,&|x|>1\end{array}}\right.}
Algumas seqüências de funções podem ter um comportamento bastante peculiar, como a seguinte:
f
n
(
x
)
=
cos
2
n
(
m
!
π
x
)
x
∈
R
,
n
=
1
,
2
,
3
,
…
{\displaystyle f_{n}(x)=\cos ^{2n}(m!\pi x)~x\in \mathbb {R} ,~~n=1,2,3,\ldots \,}
cujo limite é dado por:
lim
n
→
∞
f
n
(
x
)
=
{
1
,
m
!
x
∈
Z
0
,
c.c.
{\displaystyle \lim _{n\to \infty }f_{n}(x)=\left\{{\begin{array}{rl}1,&m!x\in \mathbb {Z} \\0,&{\hbox{c.c.}}\end{array}}\right.}
Veja mais um exemplo peculiar de convergência:
f
n
(
x
)
=
{
0
,
x
<
n
1
,
x
≥
n
{\displaystyle f_{n}(x)=\left\{{\begin{array}{rl}0,x<n\\1,x\geq n\end{array}}\right.}
A convergência uniforme é um conceito mais forte que o de convergêcia pontual .
Uma seqüência de funções
{
f
n
(
x
)
}
n
=
1
∞
{\displaystyle \{f_{n}(x)\}_{n=1}^{\infty }\,}
definida em um conjunto
D
{\displaystyle D\,}
é dita convergir uniformemente se existe uma função
f
:
D
→
R
{\displaystyle f:D\to \mathbb {R} \,}
tal que:
Para todo
ε
>
0
{\displaystyle \varepsilon >0\,}
, existe um
N
{\displaystyle N\,}
tal que:
|
f
n
(
x
)
−
f
(
x
)
|
<
ε
,
∀
x
∈
D
∀
n
≥
N
{\displaystyle \left|f_{n}(x)-f(x)\right|<\varepsilon ,\forall x\in D~~\forall n\geq N\,}
Observe que a desigualdade é válida para todo ponto do domínio.
Como comparação, uma sequência de funções
f
n
(
x
)
:
S
→
R
{\displaystyle f_{n}(x):S\rightarrow \mathbb {R} \,}
converge pontualmente para uma função
f
:
S
→
R
{\displaystyle f:S\rightarrow \mathbb {R} \,}
se, e somente se:
∀
ϵ
>
0
,
∀
x
∈
S
∃
N
∈
N
t
.
q
.
∀
n
>
N
⇒
|
f
n
(
x
)
−
f
(
x
)
|
<
ϵ
{\displaystyle \forall \epsilon >0,\ \forall x\in S\ \exists N\in \mathbb {N} \ t.q.\ \forall n>N\ \Rightarrow \ |f_{n}(x)-f(x)|<\epsilon \,}
A sequência converge uniformemente quando:
∀
ϵ
>
0
∃
N
∈
N
∀
x
∈
S
t
.
q
.
∀
n
>
N
⇒
|
f
n
(
x
)
−
f
(
x
)
|
<
ϵ
{\displaystyle \forall \epsilon >0\ \exists N\in \mathbb {N} \ \forall x\in S\ t.q.\ \forall n>N\ \Rightarrow \ |f_{n}(x)-f(x)|<\epsilon \,}
Essa diferença é importante: para provar a convergência pontual , basta escolher um N para cada
ϵ
{\displaystyle \epsilon \,}
e cada x . Para provar a convergência uniforme , é preciso escolher, para cada
ϵ
{\displaystyle \epsilon \,}
um N que se aplica a todo x .
Considere a seqüência:
f
n
(
x
)
=
1
n
{\displaystyle f_{n}(x)={\frac {1}{n}}\,}
A convergência uniforme é válida com
N
>
1
ε
{\displaystyle N>{\frac {1}{\varepsilon }}\,}
.
Considere o conjunto
D
:=
{
x
∈
R
:
x
>
0
{\displaystyle D:=\{x\in \mathbb {R} :x>0\,}
e a seguinte seqüência de funções definidas em
D
{\displaystyle D\,}
:
f
n
(
x
)
=
1
n
x
{\displaystyle f_{n}(x)={\frac {1}{nx}}\,}
Observa-se que para cada
x
{\displaystyle x\,}
fixo
f
n
(
x
)
{\displaystyle f_{n}(x)\,}
converge para 0 mas a convergência não é uniforme pois para cada n e cada
ε
{\displaystyle \varepsilon }
existe um x suficiente próximo à origem tal que:
|
f
n
(
x
)
−
0
|
≥
ε
{\displaystyle |f_{n}(x)-0|\geq \varepsilon \,}
Teorema Seja
f
n
(
x
)
{\displaystyle f_{n}(x)\,}
uma seqüência de funções contínuas definidas um conjunto
D
∈
R
{\displaystyle D\in \mathbb {R} \,}
. Suponha que
f
n
{\displaystyle f_{n}\,}
converge uniformemente para uma função
f
(
x
)
{\displaystyle f(x)\,}
então f é uma função contínua.
Demonstração Seja
ε
>
0
{\displaystyle \varepsilon >0\,}
e
x
0
∈
D
{\displaystyle x_{0}\in D\,}
, devemos mostrar que existe um
δ
>
0
{\displaystyle \delta >0\,}
tal que:
|
x
0
−
x
|
<
δ
⟹
|
f
(
x
0
)
−
f
(
x
)
|
≤
ε
{\displaystyle |x_{0}-x|<\delta \Longrightarrow \left|f(x_{0})-f(x)\right|\leq \varepsilon }
Da convergência uniforme, temos a existência de um N tal que
|
f
n
(
x
)
−
f
(
x
)
|
≤
ε
/
3
,
n
≥
N
(
1
)
{\displaystyle \left|f_{n}(x)-f(x)\right|\leq \varepsilon /3,n\geq N\quad (1)}
Da continuidade de
f
N
{\displaystyle f_{N}\,}
, temos que existe um
δ
>
0
{\displaystyle \delta >0\,}
tal que:
|
x
0
−
x
|
<
δ
⟹
|
f
N
(
x
0
)
−
f
N
(
x
)
|
≤
ε
/
3
(
2
)
{\displaystyle |x_{0}-x|<\delta \Longrightarrow \left|f_{N}(x_{0})-f_{N}(x)\right|\leq \varepsilon /3\quad (2)}
Agora, basta estimar usando a desigualdade triangular:
⟹
|
f
(
x
0
)
−
f
(
x
)
|
≤
|
f
(
x
0
)
−
f
N
(
x
0
)
|
+
|
f
N
(
x
0
)
−
f
N
(
x
)
|
+
|
f
N
(
x
)
−
f
(
x
)
|
{\displaystyle \Longrightarrow \left|f(x_{0})-f(x)\right|\leq \left|f(x_{0})-f_{N}(x_{0})\right|+\left|f_{N}(x_{0})-f_{N}(x)\right|+\left|f_{N}(x)-f(x)\right|}
E das desigualdades
(
1
)
{\displaystyle (1)\,}
e
(
2
)
{\displaystyle (2)\,}
, vale que se
|
x
0
−
x
|
<
δ
{\displaystyle |x_{0}-x|<\delta \,}
:
|
f
(
x
0
)
−
f
(
x
)
|
≤
ε
/
3
+
ε
/
3
+
ε
/
3
=
ε
{\displaystyle \left|f(x_{0})-f(x)\right|\leq \varepsilon /3+\varepsilon /3+\varepsilon /3=\varepsilon }
Teorema Seja
f
n
:
[
a
,
b
]
→
R
{\displaystyle f_{n}:[a,b]\to \mathbb {R} \,}
uma seqüência de funções integráveis a Riemann convergindo uniformemente para uma função
f
:
[
a
,
b
]
→
R
{\displaystyle f:[a,b]\to \mathbb {R} \,}
, então
f
{\displaystyle f\,}
é integrável a Riemann e vale a igualdade:
lim
n
→
∞
∫
a
b
f
n
(
x
)
d
x
=
∫
a
b
f
(
x
)
d
x
{\displaystyle \lim _{n\to \infty }\int _{a}^{b}f_{n}(x)dx=\int _{a}^{b}f(x)dx\,}
Demonstração Da definição de convergência uniforma, para todo
ε
>
0
{\displaystyle \varepsilon >0\,}
, exite um
N
{\displaystyle N\,}
tal que:
f
n
(
x
)
−
ε
≤
f
(
x
)
≤
f
n
(
x
)
+
ε
,
∀
n
≥
N
{\displaystyle f_{n}(x)-\varepsilon \leq f(x)\leq f_{n}(x)+\varepsilon ,~~\forall n\geq N\,}
Como
f
n
{\displaystyle f_{n}\,}
é integrável, vale que:
∫
a
b
¯
f
n
(
x
)
d
x
=
∫
a
b
_
f
n
(
x
)
d
x
=
∫
a
b
f
(
x
)
d
x
{\displaystyle {\overline {\int _{a}^{b}}}f_{n}(x)dx={\underline {\int _{a}^{b}}}f_{n}(x)dx=\int _{a}^{b}f(x)dx}
Assim, valem as desigualdades:
∫
a
b
¯
f
(
x
)
d
x
≤
∫
a
b
¯
(
f
n
(
x
)
+
ε
)
d
x
=
∫
a
b
f
n
(
x
)
d
x
+
(
b
−
a
)
ε
{\displaystyle {\overline {\int _{a}^{b}}}f(x)dx\leq {\overline {\int _{a}^{b}}}\left(f_{n}(x)+\varepsilon \right)dx=\int _{a}^{b}f_{n}(x)dx+(b-a)\varepsilon }
∫
a
b
_
f
(
x
)
d
x
≥
∫
a
b
_
(
f
n
(
x
)
−
ε
)
d
x
=
∫
a
b
f
n
(
x
)
d
x
−
(
b
−
a
)
ε
{\displaystyle {\underline {\int _{a}^{b}}}f(x)dx\geq {\underline {\int _{a}^{b}}}\left(f_{n}(x)-\varepsilon \right)dx=\int _{a}^{b}f_{n}(x)dx-(b-a)\varepsilon }
E, portanto:
∫
a
b
¯
f
(
x
)
d
x
−
(
b
−
a
)
ε
≤
∫
a
b
f
n
(
x
)
d
x
≤
∫
a
b
_
f
(
x
)
d
x
+
(
b
−
a
)
ε
{\displaystyle {\overline {\int _{a}^{b}}}f(x)dx-(b-a)\varepsilon \leq \int _{a}^{b}f_{n}(x)dx\leq {\underline {\int _{a}^{b}}}f(x)dx+(b-a)\varepsilon }
Tomando o limite
n
→
∞
{\displaystyle n\to \infty \,}
, temos:
∫
a
b
¯
f
(
x
)
d
x
−
(
b
−
a
)
ε
≤
lim
n
→
∞
∫
a
b
f
n
(
x
)
d
x
≤
∫
a
b
_
f
(
x
)
d
x
+
(
b
−
a
)
ε
{\displaystyle {\overline {\int _{a}^{b}}}f(x)dx-(b-a)\varepsilon \leq \lim _{n\to \infty }\int _{a}^{b}f_{n}(x)dx\leq {\underline {\int _{a}^{b}}}f(x)dx+(b-a)\varepsilon }
Como
ε
>
0
{\displaystyle \varepsilon >0\,}
é arbitrário e a integral superior é sempre maior ou igual à integral inferior vale a igualdade:
∫
a
b
¯
f
(
x
)
d
x
=
lim
n
→
∞
∫
a
b
f
n
(
x
)
d
x
=
∫
a
b
_
f
(
x
)
d
x
{\displaystyle {\overline {\int _{a}^{b}}}f(x)dx=\lim _{n\to \infty }\int _{a}^{b}f_{n}(x)dx={\underline {\int _{a}^{b}}}f(x)dx}
E o resultado segue.
Existem várias maneira de construir o conjunto
R
{\displaystyle \mathbb {R} }
dos números reais, portanto é importante é descobrir se diferentes maneiras de construir os números reais poderiam resultar em conjuntos com propriedades distintas. Como veremos a seguir, construir os reais usando cortes de Dedeking resultará em um conjunto que será, em essência, o mesmo conjuntos dos reais construídos usando sequências de Cauchy.
Se pensarmos estritamente, as várias maneira de construir os números reais de fato criam conjuntos muito estranhos e diferentes em sua estrutura , mas isto é irrelevante, pois o importante é o que podemos fazer com os números reais e não o que eles de fato são.
Como veremos a seguir, é que dois corpos ordenados completos arquimedianos, são iguais, a menos de um isomorfismo. Ou em linguagem mais coloquial, se tivermos dois existe isomorfismo entre eles, isto é, ambos possuem as mesmas propriedades.
Dizemos que
ϕ
:
F
→
K
{\displaystyle \phi :\mathbb {F} \to \mathbb {K} }
é um isomorfismo entre corpos ordenados se:
ϕ
(
a
+
b
)
=
ϕ
(
a
)
+
ϕ
(
b
)
,
∀
a
,
b
∈
F
{\displaystyle \phi (a+b)=\phi (a)+\phi (b),\forall a,b\in \mathbb {F} }
;
ϕ
(
a
b
)
=
ϕ
(
a
)
ϕ
(
b
)
,
∀
a
,
b
∈
F
{\displaystyle \phi (ab)=\phi (a)\phi (b),\forall a,b\in \mathbb {F} }
;
∀
a
,
b
∈
F
{\displaystyle \forall a,b\in \mathbb {F} }
, com
a
<
b
⇒
ϕ
(
a
)
<
ϕ
(
b
)
{\displaystyle a<b\Rightarrow \phi (a)<\phi (b)}
;
ϕ
(
a
)
=
ϕ
(
b
)
⇒
a
=
b
{\displaystyle \phi (a)=\phi (b)\Rightarrow a=b}
, isto é,
ϕ
{\displaystyle \phi }
é injetiva;
∀
y
∈
K
,
∃
x
∈
F
|
y
=
ϕ
(
x
)
{\displaystyle \forall y\in \mathbb {K} ,\exists x\in \mathbb {F} |y=\phi (x)}
, ou seja, é sobrejetiva.
Se
F
,
K
{\displaystyle \mathbb {F} ,\mathbb {K} }
são corpos ordenados completos, então existe um isomorfismo entre eles.
A demonstração NÃO ESTÁ pronta, tenham paciência.
A maneira mais simples de provar que existe um isomorfismo é construir uma função
ϕ
{\displaystyle \phi }
entre os corpos
F
{\displaystyle \mathbb {F} }
e
K
{\displaystyle \mathbb {K} }
e então provar que essa função é um isomorfismo.
Vamos começar definindo uma função auxiliar. Sabemos que
F
,
K
{\displaystyle \mathbb {F} ,\mathbb {K} }
são corpos, então existe
0
,
1
∈
F
{\displaystyle 0,1\in \mathbb {F} }
e
0
′
,
1
′
∈
K
{\displaystyle 0',1'\in \mathbb {K} }
, nada mais natural que definirmos:
Seja
f
:
Q
⊂
F
→
K
{\displaystyle f:\mathbb {Q} \subset \mathbb {F} \to \mathbb {K} }
definida da seguinte maneira:
f
(
0
)
=
0
′
{\displaystyle f(0)=0'}
f
(
1
)
=
1
′
{\displaystyle f(1)=1'}
E por indução, para cada
n
≥
1
{\displaystyle n\geq 1}
, temos:
f
(
n
)
=
f
(
n
−
1
)
+
1
′
{\displaystyle f(n)=f(n-1)+1'}
f
(
−
n
)
=
−
f
(
n
)
{\displaystyle f(-n)=-f(n)}
Se
n
≠
0
{\displaystyle n\not =0}
, então sabemos que
∃
f
(
n
)
−
1
∈
K
{\displaystyle \exists f(n)^{-1}\in \mathbb {K} }
, pois como
n
≠
0
{\displaystyle n\not =0}
, então
f
(
n
)
≠
0
′
{\displaystyle f(n)\not =0'}
.
Portanto podemos definir:
f
(
m
/
n
)
=
f
(
m
)
f
(
n
)
−
1
{\displaystyle f(m/n)=f(m)f(n)^{-1}}
.
Desta forma a função
f
{\displaystyle f}
mapeia
Q
⊂
F
{\displaystyle \mathbb {Q} \subset \mathbb {F} }
em
Q
′
:=
f
(
Q
)
⊂
K
{\displaystyle \mathbb {Q} ':=f(\mathbb {Q} )\subset \mathbb {K} }
.
Vamos mostrar que
f
{\displaystyle f}
é um isomorfismo de corpos ordenados de
Q
{\displaystyle \mathbb {Q} }
em
Q
′
.
{\displaystyle \mathbb {Q} '.}
f
{\displaystyle f}
preserva a soma:
Por definição, temos
f
(
n
+
1
)
=
f
(
n
)
+
1
′
=
f
(
n
)
+
f
(
1
)
{\displaystyle f(n+1)=f(n)+1'=f(n)+f(1)}
, para todo n natural.
Suponha que
f
(
n
+
m
)
=
f
(
n
)
+
f
(
m
)
{\displaystyle f(n+m)=f(n)+f(m)}
, para todo
m
{\displaystyle m}
tal que
1
≤
m
<
k
{\displaystyle 1\leq m<k}
.
f
(
n
+
(
k
−
1
)
)
+
f
(
1
)
=
f
(
n
)
+
f
(
k
−
1
)
+
f
(
1
)
=
f
(
n
)
+
f
(
k
)
{\displaystyle f(n+(k-1))+f(1)=f(n)+f(k-1)+f(1)=f(n)+f(k)}
, pela hipótese de indução.
f
{\displaystyle f}
preserva o produto:
f
{\displaystyle f}
preserva a ordem:
f
{\displaystyle f}
é injetora:
f
{\displaystyle f}
é sobrejetora;
Seja
ϕ
:
F
→
K
{\displaystyle \phi :\mathbb {F} \to \mathbb {K} }
definida da seguinte maneira:
Para cada
a
∈
F
{\displaystyle a\in \mathbb {F} }
, sejam,
X
a
=
{
x
≤
a
;
x
∈
Q
⊂
F
}
{\displaystyle X_{a}=\{x\leq a;x\in \mathbb {Q} \subset \mathbb {F} \}}
. Como
X
a
≠
∅
{\displaystyle X_{a}\not =\emptyset }
, podemos definir
ϕ
(
a
)
=
sup
{
f
(
x
)
;
x
∈
X
a
}
.
{\displaystyle \phi (a)=\sup\{f(x);x\in X_{a}\}.}
Agora vamos provar que
ϕ
{\displaystyle \phi }
é de fato um isomorfismo de corpos ordenados.
ϕ
{\displaystyle \phi }
preserva a soma:
ϕ
{\displaystyle \phi }
preserva o produto:
ϕ
{\displaystyle \phi }
preserva a ordem:
ϕ
{\displaystyle \phi }
é injetora:
ϕ
{\displaystyle \phi }
é sobrejetora;
Dado
y
∈
F
,
y
=
s
u
p
{
q
′
∈
Q
′
;
q
<
y
}
.
{\displaystyle y\in \mathbb {F} ,y=sup\{q'\in \mathbb {Q} ';q<y\}.}
(
A
1
,
A
2
,
.
.
.
,
A
n
)
{\displaystyle (A_{1},A_{2},...,A_{n})}
é partição de
Ω
{\displaystyle \Omega }
se,
Ω
=
⋃
i
=
1
n
A
i
{\displaystyle \Omega =\displaystyle \bigcup _{i=1}^{n}A_{i}}
e
A
i
∩
A
j
=
∅
{\displaystyle A_{i}\cap A_{j}=\emptyset }
, se
i
≠
j
{\displaystyle i\not =j}
.
Uma seqüência
(
x
n
)
n
∈
N
{\displaystyle (x_{n})_{n\in \mathbb {N} }}
em
K
{\displaystyle \mathbb {K} }
é dita de Cauchy se, dado
ϵ
>
0
,
∃
n
0
∈
N
{\displaystyle \epsilon >0,\ \exists n_{0}\in \mathbb {N} }
tal que, se
n
,
m
>
n
0
{\displaystyle n,m>n_{0}}
então
|
x
n
−
x
m
|
<
ϵ
{\displaystyle |x_{n}-x_{m}|<\epsilon }
.
Um conjunto
F
⊂
K
{\displaystyle F\subset \mathbb {K} }
é dito fechado se o limite de toda sequência de pontos de
F
{\displaystyle F}
é ponto de F.
K
{\displaystyle \mathbb {K} }
é dito conexo se
K
{\displaystyle \mathbb {K} }
e
∅
{\displaystyle \emptyset }
são os únicos subconjuntos abertos e fechados de
K
{\displaystyle \mathbb {K} }
Seja
K
{\displaystyle \mathbb {K} }
um corpo ordenado arquimediano. Em
K
{\displaystyle \mathbb {K} }
são equivalentes:
1[1'] Toda seqüência crescente [decrescente] limitada superiormente [inferiormente] de
K
{\displaystyle \mathbb {K} }
é convergente;
2[2']) Todo subconjunto
A
⊂
K
{\displaystyle A\subset \mathbb {K} }
não-vazio limitado superiormente [inferiormente] tem supremo [ínfimo];
3[3']) Seja
F
⊂
K
{\displaystyle F\subset \mathbb {K} }
um conjunto fechado limitado superiormente [inferiormente], então,
F
{\displaystyle F}
tem máximo e mínimo;
4)
K
{\displaystyle \mathbb {K} }
é conexo.
5) (Postulado de Dedekind) Dada uma partição
(
A
,
B
)
{\displaystyle (A,B)}
de
K
{\displaystyle \mathbb {K} }
, com
a
<
b
{\displaystyle a<b}
, para todo
a
∈
A
{\displaystyle a\in A}
, e
b
∈
B
{\displaystyle b\in B}
, isto é
(
A
,
B
)
{\displaystyle (A,B)}
é um corte de Dedekind, então, em
A
{\displaystyle A}
existe maior elemento, ou, em
B
{\displaystyle B}
, existe menor elemento.
6) (Propriedade dos intervalos encaixantes) Toda seqüência de intervalos encaixantes, fechados e limitados tem intersecção não-vazia. Isto é, seja
(
[
a
n
,
b
n
]
)
n
∈
N
{\displaystyle ([a_{n},b_{n}])_{n\in \mathbb {N} }}
uma seqüência de intervalos, satisfazendo
[
a
n
+
2
,
b
n
+
2
]
⊂
[
a
n
+
1
,
b
n
+
1
]
⊂
[
a
n
,
b
n
]
⊂
.
.
.
⊂
[
a
1
,
b
1
]
⊂
[
a
0
,
b
0
]
{\displaystyle [a_{n+2},b_{n+2}]\subset [a_{n+1},b_{n+1}]\subset [a_{n},b_{n}]\subset ...\subset [a_{1},b_{1}]\subset [a_{0},b_{0}]}
, para todo
n
∈
N
{\displaystyle n\in \mathbb {N} }
, então
⋂
n
∈
N
[
a
n
,
b
n
]
≠
∅
{\displaystyle \displaystyle \bigcap _{n\in \mathbb {N} }[a_{n},b_{n}]\not =\emptyset }
.
7)
K
{\displaystyle \mathbb {K} }
é seqüêncialmente completo, isto é, se (x_n)_{n \in \mathbb{N}} é uma seqüência em
K
{\displaystyle \mathbb {K} }
de Cauchy então (x_n) é convergente.
As equivalências
N
⇔
N
′
{\displaystyle N\Leftrightarrow N'}
são evidentes e serão deixadas como exercício.
1)
⇒
{\displaystyle \Rightarrow }
2)
Seja A nas condições de 2) , vamos mostrar que A tem supremo.
Como A
≠
∅
{\displaystyle \not =\emptyset }
, podemos pegar
a
0
∈
A
{\displaystyle a_{0}\in A}
e como A é limitado superiormente, existe
b
0
∈
K
{\displaystyle b_{0}\in \mathbb {K} }
majorante de A.
Seja
c
1
=
(
a
0
+
b
0
)
/
2
{\displaystyle c_{1}=(a_{0}+b_{0})/2}
, se
c
1
{\displaystyle c_{1}}
for majorante de A, então definimos
b
1
=
c
1
{\displaystyle b_{1}=c_{1}}
, e
a
1
=
a
0
{\displaystyle a_{1}=a_{0}}
e caso
c
0
{\displaystyle c_{0}}
não seja majorante de A, definimos
a
1
=
c
1
{\displaystyle a_{1}=c_{1}}
e
b
1
=
b
0
{\displaystyle b_{1}=b_{0}}
.
Suponha que
a
k
−
1
{\displaystyle a_{k-1}}
e
b
k
−
1
{\displaystyle b_{k-1}}
estejam definidas,
c
k
=
(
a
k
−
1
+
b
k
−
1
)
/
2
{\displaystyle c_{k}=(a_{k-1}+b_{k-1})/2}
, se
c
k
{\displaystyle c_{k}}
for majorante de A, então definimos
b
k
=
c
k
{\displaystyle b_{k}=c_{k}}
, e
a
k
=
a
k
−
1
{\displaystyle a_{k}=a_{k-1}}
e caso
c
k
{\displaystyle c_{k}}
não seja majorante de A, definimos
a
k
=
c
k
{\displaystyle a_{k}=c_{k}}
e
b
k
=
b
k
−
1
{\displaystyle b_{k}=b_{k-1}}
.
Definimos duas seqüências
(
a
n
)
n
∈
N
{\displaystyle (a_{n})_{n\in \mathbb {N} }}
e
(
b
n
)
n
∈
N
{\displaystyle (b_{n})_{n\in \mathbb {N} }}
que formam, respectivamente, uma seqüência monótona não-decrescente e uma seqüência monótona não-crescente. Claramente
a
0
{\displaystyle a_{0}}
é um limitante inferior de
(
b
n
)
{\displaystyle (b_{n})}
e
b
0
{\displaystyle b_{0}}
é um limitante superior de
(
a
n
)
{\displaystyle (a_{n})}
, e por '1) , concluimos que ambas seqüências são convergentes.
Sejam
a
=
lim
a
n
{\displaystyle a=\lim a_{n}}
e
b
=
lim
b
n
{\displaystyle b=\lim b_{n}}
.
Suponha, por absurdo que
a
>
b
{\displaystyle a>b}
, então
a
−
b
>
0
{\displaystyle a-b>0}
, tomando
ϵ
=
a
−
b
{\displaystyle \epsilon =a-b}
, como
(
a
n
)
→
{\displaystyle (a_{n})\rightarrow }
, existe
n
0
∈
N
{\displaystyle n_{0}\in \mathbb {N} }
tal que
a
−
ϵ
<
a
n
0
<
a
+
ϵ
⇒
a
−
(
a
−
b
)
<
a
n
0
<
a
+
(
a
−
b
)
⇒
b
<
a
n
0
{\displaystyle a-\epsilon <a_{n_{0}}<a+\epsilon \Rightarrow a-(a-b)<a_{n_{0}}<a+(a-b)\Rightarrow b<a_{n_{0}}}
. Portanto
b
−
a
n
0
>
0
{\displaystyle b-a_{n_{0}}>0}
, como
(
b
n
)
→
b
{\displaystyle (b_{n})\rightarrow b}
, definindo
ϵ
′
=
b
−
a
n
0
{\displaystyle \epsilon '=b-a_{n_{0}}}
, existe
n
1
∈
N
{\displaystyle n_{1}\in \mathbb {N} }
tal que,
b
−
ϵ
<
b
n
1
<
b
+
ϵ
⇒
b
−
(
b
−
a
n
0
)
<
b
n
1
<
b
+
(
b
−
a
n
0
)
⇒
a
n
0
<
b
n
1
{\displaystyle b-\epsilon <b_{n_{1}}<b+\epsilon \Rightarrow b-(b-a_{n_{0}})<b_{n_{1}}<b+(b-a_{n_{0}})\Rightarrow a_{n_{0}}<b_{n_{1}}}
. Absurdo, pois isso contradiz nossa construção de
(
a
n
)
{\displaystyle (a_{n})}
e
(
b
n
)
{\displaystyle (b_{n})}
.
Por construção, temos
a
n
≤
a
≤
b
≤
b
n
{\displaystyle a_{n}\leq a\leq b\leq b_{n}}
para todo
n
{\displaystyle n}
natural.
Livro-textos
Livro-virtuais
163p.]
Este wikilivro está sendo feito em maior parte pela tradução dos livros-virtuais:(1),(2); e procurando não estar muito longe dos conceitos apresentados pelos livro-textos usados nas melhores universidades
↑ U. BOTTAZZINI, Il Calcolo Sublime: Storia dell’Analisi Matematica da Euler a Weierstrass , Boringhieri 1981.
↑ C. B. BOYER, The History of the Calculus and its Conceptual Development , Dover 1949.
↑ C. H. EDWARDS, The Historical Development of the Calculus , Springer-Verlag 1979.
↑ Predefinição:Smallcaps , Elon Lages. Curso de Análise (vol. 1) . Rio de Janeiro: IMPA, CNPq, 1976. p. p,249, Teorema 4. ISBN 9-216-05138-8