Regressões estão entre as mais importantes técnicas, aproximar funções de valores coletados em experimentos é a atividade mais comum em ciência. Um cientista, ao longo de sua formação mede valores, testa teorias e infere sobre as medidas comportamentos simples e complexos, dado por equações. A ciência que se ensina nas universidades há centenas de anos é o ponto chave da Ciência de Dados e seu primeiro passo, o mais simples, é entender um comportamento com dependência linear através de regressões, achar a famosa “equação da reta”.
Abaixo um exemplo de implementação usando sci-kit learning, quando falamos de regressão linear, estamos aproximando os dados de uma equação como:

y = a*X + b,
a,b constantes a serem calculadas
X, vetor com as medidas
y, valor a ser calculado

Essa equação pode ser de uma reta,  um plano ou um hiperplano, dependendo da dimensionalidade de X. Quanto maior a dimensionalidade mais coeficientes “ai”  teremos que calcular na regressão.

Exemplo de implementação em python de um modelo de regressão linear: