Programar em C/Tipos de dados
'
Até agora você só viu as variáveis do tipo int
, que servem para guardar números inteiros. A linguagem C tem outros tipos fundamentais. São eles:
int
, para números inteiros entre -2147483648 e 2147483647, utiliza 4 bytes;char
, para caracteres individuais do padrão ASCII, utiliza 1 byte;float
, para reais entre (aproximadamente) 10-38 e 1038, utiliza 6 bytes, precisão de 8 dígitos;double
, para reais entre (aproximadamente) 10-4932 e 104932, utiliza 8 bytes, precisão de 15 dígitos;bool
, para indicar true (verdadeiro) ou false (falso), utiliza 2 bytes; Presente apenas no padrão C99 em diante.
Explicando bits e bytes
[editar | editar código-fonte]Podemos pensar na memória do computador como uma fita, uma grande fita feita de frames sequenciais.
Em cada um desses frames, podemos colocar uma certa tensão: tem tensão ou não tem tensão: se tem tensão associamos o valor 1, se não tem tensão associamos o valor 0. Daí termos a linguagem binária de zeros e uns.
Agora podemos fazer combinações se tivermos posição de zeros e uns, da direita para a esquerda.
- 00000000 1ª Combinação
- 00000001 2ª Combinação
- 00000010 3ª Combinação
- 00000011 4ª Combinação
- 00000100 5ª Combinação
- 00000101 6ª Combinação
- 00000110 7ª Combinação
- 00000111 8ª Combinação
- …
E na verdade podemos estender este conceito para um número infinito de combinações.
Ora o que aconteceu é que nos bastavam pouco menos de 256 combinações (8 bits ordenados) para termos uma combinação para cada letra, maiúscula e minúscula, número, pontos de exclamação, interrogação, etc. … e isso era o suficiente para a nossa comunicação. Mas para haver um certo consenso para que uma dada combinação desse um dado símbolo surgiu a tabela ASCII (surgiram outras tabelas quando se quis colocar os símbolos de outras línguas, como o japonês ou o chinês – ver tabela ISO) Portanto com 8 bits ou 8 casas conseguíamos ter qualquer símbolo que utilizamos. A esse conjunto de 8 bits chamamos de byte, mais convenientemente. Portanto, um byte tem 8 casas de zeros/uns, ou seja 2 elevado a 8 dá as 256 combinações. E o byte é a unidade básica que o C++ consegue operar e é representado pelo tipo char.
Pergunta: Quando tivermos mais do que 256 bytes acrescenta-se um outro byte?
- Sim. Com dois bytes o número de combinações é 256*256.
Pergunta: Qual a razão do computador usar apenas bytes como medida mínima? Será que não seria possível utilizar 7 bits ou 5 bits?
- A razão para isso é que a infraestrutura física (hardware) dos computadores atuais apenas aceita bytes nativamente. Porem seria possível projetar um novo tipo de computador que calculasse mais eficientemente utilizando se números diferentes de bits.
Números inteiros
[editar | editar código-fonte]Se dissermos que 2 bytes representam inteiros, poderemos utilizar as 65.536 combinações, pois 2 bytes - 16bits - temos 2 elevado a 16 = 65.536 e isso dar-nos-ia esses números todos. Assim se quisermos apenas os positivos com o zero temos de [0,65535].
Se quisermos ter números negativos e positivos podemos dividir esse valor a meio e dá 32.768 para cada lado positivo e negativo, mas como temos de ter o zero vamos roubar um valor ao lado positivo e então ficamos com o intervalo [-32768, 32767]. E ficamos com as mesmas 65.536 combinações.
Apresentamos inteiro com 2 bytes, mas eles podem ter 4 bytes, isso vai depender do processador do computador, e, com quantos bytes consegue ele lidar ao mesmo tempo.
Também existem outros tipos, como short (ou short int), que serve para inteiros menores, long (ou long int) para inteiros maiores. Qualquer tipo inteiro pode ser precedido por unsigned (o signed para COM negativos), para cortar os números negativos, permitindo maior capacidade de armazenamento de números positivos. Alguns compiladores aceitam o long long, para aumentar ainda mais o tamanho da variável, alguns desses só aceitam para o tipo int, outros também para o tipo double.
Podemos alterar a maneira como os dados são guardados com os modificadores de tipo. Você pode modificar os tipos de duas maneiras.
Tamanho: short
e long
[editar | editar código-fonte]Você pode modificar o tamanho de uma variável usando os modificadores de tipo, que são dois: short
e long
. Note que float
e char
não podem ser modificados em tamanho.
short
diminui o espaço necessário para guardar a variável (diminuindo também a gama de valores que esta pode assumir). Só pode ser usado comint
.long
aumenta o espaço tomado pela variável, e portanto aumenta seu valor máximo e/ou sua precisão. Pode ser usado comint
edouble
.- O padrão C de 1999 adicionou um terceiro modificador, suportado pelos compiladores mais recentes, inclusive o gcc:
long long
, que aumentaria ainda mais a capacidade da variável. Alguns deles suportam esse modificador apenas para o tipoint
, e outros suportam também paradouble
.
Uma observação é necessária: segundo o padrão, não existe nenhuma garantia de que uma variável short int
é menor que uma variável int
, nem que long int
é maior que int
. Apenas é garantido que int
não é maior que long
nem menor que short
. De fato, nos sistemas x86 de 32 bits (ou seja, a maioria dos computadores pessoais atualmente), o tamanho de int
é igual ao de long
. Geralmente, int
será o tamanho nativo do processador — ou seja, 32 bits num processador de 32 bits, 16 bits num processador de 16 bits etc.
Sinal: signed
e unsigned
[editar | editar código-fonte]Existe outro tipo de modificador, que define se o número vai ser guardado com sinal ou não. São os modificadores signed
e unsigned
, suportados pelos tipos inteiros apenas.
signed
diz que o número deve ser guardado com sinal, ou seja, serão permitidos valores positivos e negativos. Esse é o padrão, portanto esse modificador não é muito usado.unsigned
diz que o número deve ser guardado sem sinal. Com isso, o valor máximo da variável aumenta, já que não teremos mais valores negativos. Por exemplo, com uma variávelchar
podemos guardar valores de -128 a 127, mas com uma variávelunsigned char
pode guardar valores de 0 a 255.
Para usar esses modificadores, devemos colocá-los antes do nome do tipo da variável, sendo que o modificador de sinal deve vir antes do modificador de tamanho caso ambos sejam usados. Por exemplo:
unsigned char c; short int valor; unsigned long int resultado;
short int
e long int
para simplesmente short
e long
, respectivamente.Tabela de tipos inteiros
[editar | editar código-fonte]Convém ver a tabela de tipos inteiros.
Tipo Num de bits Formato para Intervalo leitura com scanf Inicio Fim char 8 %c -128 127 unsigned char 8 %c 0 255 signed char 8 %c -128 127 int 16 %d -32.768 32.767 unsigned int 16 %u 0 65.535 signed int 16 %i -32.768 32.767 short int 16 %hi -32.768 32.767 unsigned short int 16 %hu 0 65.535 signed short int 16 %hi -32.768 32.767 long int 32 %li -2.147.483.648 2.147.483.647 signed long int 32 %li -2.147.483.648 2.147.483.647 unsigned long int 32 %lu 0 4.294.967.295
Nota: O tipo long é 32 bits como int em computadores de arquitetura 32 bits e 64 bits em computadores de arquitetura 64 bits no padrão LP64 (Mac OS X e Unix).
Números de ponto flutuante
[editar | editar código-fonte]Os números de ponto flutuante são uma tentativa para guardar números reais, como 3,1415 (pi), -2,3333, 0,00015, 6,02 × 1023. Ao contrário dos números reais, os números representáveis pelo hardware são finitos. A maneira como os tipos de ponto flutuante são armazenados é abstrata para o programador, entretanto, o hardware segue o padrão IEEE 754 (Standard for Floating-Point Arithmetic).
O armazenamento é feito usando notação científica binária.
Decimal Notation | Scientific Notation | E Notation |
123.45 | 1.2345 x 102 | 1.2345E2 |
0.0051 | 5.1 x 10-3 | 5.1E-3 |
1,200,000,000 | 1.2 x 109 | 1.2E9 |
Os tipos float
e double
servem para guardar números de ponto flutuante. A diferença entre os dois é, além do intervalo de dados, a precisão. Geralmente, o tipo float
guarda dados (com sinal positivo ou negativo) de 3,4E-38 a 3,4E+38 (além do zero). Já double
suporta números tão pequenos quanto 1,7E-308 e no máximo 1,7E+308.
float 32 %f 3,4E-38 3.4E+38 double 64 %lf 1,7E-308 1,7E+308 long double 80/128 %Lf 3,4E-4932 3,4E+4932
Nota: O tipo long double trabalha em máquinas x64 no padrão LP64 (Mac OS X e Unix)
Bool
[editar | editar código-fonte]Este tipo surgiu porque muitas vezes apenas se quer ter 2 valores: sim/não ; verdadeiro/falso. Tem o tamanho de um byte e tem apenas dois valores 0 e 1 que corresponde a true e false.
Por que guardar um bool num byte quando se pode utilizar apenas um bit? A razão é que o computador usa no mínimo o byte, não o bit.
Endereços
[editar | editar código-fonte]Os vários locais na memória são identificados por um address, que tem uma lógica sequencial numerada. São necessários 16 bits para guardar o endereço de um byte. dito de outra forma são necessários 2 bytes para guardar a morada de um byte. será isto verdade?! isso quer dizer que se guardarmos os endereços de todos os bytes, só temos 1/3 da memória disponível para guardar valores. Bem isto é um pouco estranho, mas repare-se que apenas vamos guardar os addresses das variáveis reservadas. Depois as variáveis nem sempre são de 1 byte, por isso apenas iremos guardar o endereço do primeiro byte e não de todos. por fim faz sentido guardar o endereço de outro endereço? Os endereços de memória (addresses) são normalmente expressos em linguagem hexadecimal (base 16, utilizam os 10 algarismos mais as 6 primeiras letras – de a até f - do alfabeto para fazerem as 16).
Compatibilidade de dados na atribuição de valor
[editar | editar código-fonte]Se tentarmos colocar um valor diferente do tipo esperado da variável? Temos um problema de compatibilidade de dados:
- Caso 1: Declaramos um int e colocamos uma letra
- Aqui não teremos problemas. Os literais de caracteres são, nativamente, do tipo int. O resultado será um inteiro que contém o valor ASCII do caractere dado.
- Caso 2: Declaramos um int e colocamos uma string (sequência de caracteres)
- Aqui teremos um erro de compilação, em que nos diz que não conseguimos converter "const char [5]" em "int". Perceba com isso que o compilador tem alguns sistemas de conversão ― note o caso 3.
- Caso 3: Declaramos um int e colocamos um float
- Neste caso, se colocarmos 77.33, irá ser apenas guardado o valor 77, perdendo-se a parte decimal.
- Caso 4: overflow ― declaramos um short e colocamos um valor maior que o máximo
- Lembre-se que o tipo short guarda valores de –32767 a 32767. Se colocarmos 32768 (e o compilador não estender esses limites), não vai acontecer nenhum erro de compilação; o que resulta é que vai ser impresso um número negativo, –32767 (ou, como é comum em vários compiladores, –32768). A lógica disto tem a ver com a maneira como o computador guarda números negativos. Mas também podemos fazer uma analogia com as horas. Imaginemos que vamos somar 6 horas com 7 horas. O resultado seria 13, mas como não existe 13 no relógio, iríamos dar a volta nas horas e chegar ao 1. Assim o resultado será 1.
- Caso 5: underflow ― declaramos um short e colocamos um valor inferior ao mínimo possível.
- Aqui temos exatamente a mesma lógica do caso de overflow, mas desta vez é excedido o limite inferior e não o superior.
- Caso 6: declaramos um unsigned int e colocamos um número negativo
- O que acontece aqui é semelhante a um underflow. Mas o que ocorre é que o número é guardado como seria se fosse um int comum, negativo. O que muda na prática é a interpretação desse número, de acordo com o tipo de dado que lhe está atribuído. Se tentarmos lê-lo como um unsigned int, obteremos um valor positivo obtido pela mesma lógica do overflow/underflow; se o lermos como um (signed) int, obteremos o mesmo valor negativo que lhe atribuímos.
Converter um tipo de variável
[editar | editar código-fonte]A conversão de uma variável consiste em converter o tipo de uma variável em um outro. Imagine que você esteja trabalhando com uma variável do tipo float e por alguma razão queira eliminar os números que estão depois da vírgula.
Esta operação pode ser realizada de duas maneiras.
Conversões do tipo implícita: Consiste em uma modificação do tipo de variável que é feita automaticamente
pelo compilador.
- Ex:
int x; x = 7.123;
Conversões do tipo explícita: Também chamada de operação cast, consiste em forçar a modificação do tipo de variável usando o operador cast "( )".
- Ex:
int y; y = (int)7.123;
Veja um exemplo da conversão de tipo inteiro em caracteres. Aqui convertemos um número decimal em um caractere ASCII.
#include <stdio.h>
int main()
{
int y = 65;
char x;
x = (char) y;
printf("O numero inteiro: %d \n O caractere: %c \n\n", y, x);
return 0;
}
Literais
[editar | editar código-fonte]Em programação, um literal é uma notação que representa um valor constante. Exemplos de literais em C são 415, 19.52, 'C', "João". Esses exemplos representam os quatro tipos de literais em C: literais de inteiros, literais de reais, literais de caracteres e literais de strings. Só com esses exemplos já é possível deduzir como se usam os literais; mas é importante fazer algumas observações:
- Literais de inteiros podem ser especificados nas bases decimal, octal ou hexadecimal. Se o literal for prefixado com "0x" ou "0X", ele será interpretado como hexadecimal; se o prefixo for apenas "0", será interpretado como octal; ou se não houver prefixo, será interpretado como decimal.
- Literais de reais podem ser especificados na forma decimal (144.57) ou em notação científica (1.4457e+2). Lembre-se que o separador decimal é o ponto e não a vírgula, como seria usual.
- Literais de caracteres devem vir entre aspas simples (') e conter a representação de apenas um caractere1. Usos válidos seriam: 'c', '\n', '\x1b', '\033'. Se você quiser usar a aspa simples como caractere, preceda-a com uma barra invertida:
'\''
. - Literais de strings devem vir entre aspas duplas ("). Para usar aspas duplas dentro de strings, preceda-as com barra invertida:
"Ele disse \"Olá\"."
. Note que um literal de string adiciona o caractere nulo (\0
) ao final da string, pois ele é, em C, a maneira de delimitar o final de uma string.
Na verdade, segundo o padrão C, literais de caracteres podem conter a representação de mais um caractere, mas o uso deles seria para representar números e não sequências de caracteres; é um aspecto pouco utilizado da linguagem C.