O texto da Mônica Scaramuzzo no Estadão fala sobre o que as empresas tradicionais estão fazendo em sua busca por evolução nos dias atuais e é muito interessante. Traz a visão do Gustavo Werneck, CEO da empresa, sobre o assunto que mais se fala dentro das indústrias: a visão 4.0 e data-driven, tomar ações baseadas […]
Regressões estão entre as mais importantes técnicas, aproximar funções de valores coletados em experimentos é a atividade mais comum em ciência. Um cientista, ao longo de sua formação mede valores, testa teorias e infere sobre as medidas comportamentos simples e complexos, dado por equações. A ciência que se ensina nas universidades há centenas de anos é o ponto chave da Ciência de Dados e seu primeiro passo, o mais simples, é entender um comportamento com dependência linear através de regressões, achar a famosa "equação da reta".
Abaixo um exemplo de implementação usando sci-kit learning, quando falamos de regressão linear, estamos aproximando os dados de uma equação como:
y = a*X + b,
a,b constantes a serem calculadas
X, vetor com as medidas
y, valor a ser calculado
Essa equação pode ser de uma reta, um plano ou um hiperplano, dependendo da dimensionalidade de X. Quanto maior a dimensionalidade mais coeficientes "ai" teremos que calcular na regressão.
Exemplo de implementação em python de um modelo de regressão linear: