Segundo Sousa (2009, p. 20) deve-se utilizar a regressão linear múltipla quando se está perante
observações de amostras com
variáveis,
,
,
, …,
cujos valores estão relacionados de forma linear entre si.
Um exemplo dado por Henriques (2009, p. 18) é a relação entre o volume de vendas efectuadas num dado período de tempo por um vendedor, a sua pontuação num teste de inteligência e os seus anos de experiência.
Sousa (2009, p. 20) define regressão linear simples como uma relação entre uma variável aleatória dependente,
, e duas ou mais variáveis independentes,
, com a seguinte expressão:
Que pode ser re-escrita na forma matricial como:

Onde:
:
|
matriz das observações da variável dependente;
|
:
|
matriz das observações da variável independente, ou matriz significativa do modelo;
|
:
|
vector dos parâmetros de regressão a serem estimados;
|
:
|
vector do erro que resulta do facto de ter características aleatórias.
|
Admite-se que
,
, ...,
são variáveis aleatórias independentes de média 0 e desvio padrão
.
Da mesma forma que na regressão simples se utiliza o método dos mínimos quadrados para estimar os parâmetros da regra de regressão, o mesmo acontece na regressão múltipla, da qual se obtém que o vector dos parâmetros da regressão é dado por:
Caso ocorra
, está-se perante um problema de regressão linear simples, que também pode ser resolvido desta forma.