1. O Despertar do Cientista de Dados Imagine acordar com o aroma do café recém-preparado e a perspectiva de resolver enigmas de dados. Sim, isso é o que um Cientista de Dados faz! O dia geralmente começa com uma reunião de equipe, uma “daily”, onde todos compartilham seus avanços e entendem se há algum bloqueio […]
Regressões estão entre as mais importantes técnicas, aproximar funções de valores coletados em experimentos é a atividade mais comum em ciência. Um cientista, ao longo de sua formação mede valores, testa teorias e infere sobre as medidas comportamentos simples e complexos, dado por equações. A ciência que se ensina nas universidades há centenas de anos é o ponto chave da Ciência de Dados e seu primeiro passo, o mais simples, é entender um comportamento com dependência linear através de regressões, achar a famosa "equação da reta".
Abaixo um exemplo de implementação usando sci-kit learning, quando falamos de regressão linear, estamos aproximando os dados de uma equação como:
y = a*X + b,
a,b constantes a serem calculadas
X, vetor com as medidas
y, valor a ser calculado
Essa equação pode ser de uma reta, um plano ou um hiperplano, dependendo da dimensionalidade de X. Quanto maior a dimensionalidade mais coeficientes "ai" teremos que calcular na regressão.
Exemplo de implementação em python de um modelo de regressão linear: