O texto da Mônica Scaramuzzo no Estadão fala sobre o que as empresas tradicionais estão fazendo em sua busca por evolução nos dias atuais e é muito interessante. Traz a visão do Gustavo Werneck, CEO da empresa, sobre o assunto que mais se fala dentro das indústrias: a visão 4.0 e data-driven, tomar ações baseadas […]
Considerado um conjunto de aprendizado “ensamble learning” usado para classificação e regressão. É um dos modelos não paramétricos mais utilizados por cientistas de dados. A ideia é construir diversas árvores de decisão e optar pela saída que seja a moda em caso de classificação, ou a média no caso da regressão, das saídas de cada árvore individual. Uma maneira de buscar sair do overfitting causado pelo uso de uma única árvore de decisão.
É uma boa para testar ao feature importance das variáveis, ou seja, a importância preditiva de cada característica do vetor de entrada. Os hiperparâmetros são relativamente simples de entender e vale a pena sempre rodar esse algoritmo no começo e entender se á boas ideias por trás das inferências preditivas que essa técnica traz. O problema é a complexidade, ou seja, tempo e gasto computacional.
Quer saber mais? Da uma olhada nesse artigo do Analytics Vidhya