Home   >    Blog

K-Means

03/10/2019 
   |    

Técnica não supervisionada para resolver o problema do “clustering” e criar clusters. Podemos nomear esses clusters e criar novas labels e utilizá-las por exemplo depois para, a partir de outros parâmetros que não o que realizamos o clustering, prever essas labels. Conectar modelos não supervisionados com supervisionados faz parte das técnicas que usamos em Data Science.

Você especifica o valor de “k” inicialmente. mas existem técnicas bacanas para achar esse valor sistematicamente.
K-means é um problema NP-completo, ou seja, computacionalmente difícil, porém com algoritmos que convergem rapidamente para mínimos locais. Ele não funciona muito bem com clusters complexos, mas trabalha muito bem com dados bem separados, com estruturas globulares. Tem uma variação “k-medoids” que pode trabalhar com dados categóricos “categorical features”.

 

Passos:
1. Especifique o número de clusters (k)
2. k pontos de dados aleatórios são selecionados aleatoriamente como centros de cada cluster
3. Cada ponto de dados é atribuído ao centro do cluster mais próximo dele
4. Os centros de cluster são atualizados para a média dos pontos atribuídos
5. Os passos 3-4 são repetidos até que os centros de cluster permaneçam inalterados)

 

TAGS: 
Compartilhe
hello world!

Posts relacionados

20/11/2019
Grupo Gerdau Forma Cientista de Dados

O texto da Mônica Scaramuzzo no Estadão fala sobre o que as empresas tradicionais estão fazendo em sua busca por evolução nos dias atuais e é muito interessante. Traz a visão do Gustavo Werneck, CEO da empresa, sobre o assunto que mais se fala dentro das indústrias: a visão 4.0 e data-driven, tomar ações baseadas […]

Read More ->
14/11/2019
Inteligência Artificial Permite Olhar Através da Água

Um incrível trabalho de duas pesquisadoras, Derya Akkaynak e Tali Treibitz, da Universidade de Haifa em Israel resultou numa tecnologia chamada Sea-Thru que permite que seja removida toda água de uma foto. O resultado é uma reconstrução da imagem que foi tirada debaixo d'água, sem a água e fisicamente acuradas, com cores reais, mantendo saturação […]

Read More ->
03/10/2019
Como é a Aula Particular e Consultoria em Python Para Machine Learning

A área de “Business Analytics” cresce exponencialmente nas empresas, ela possui espaço para diversas atividades e contempla pelo menos três ou quatro importantes cargos: engenheiro de dados, cientista de dados, analista de dados e "data strategy". O intuito do acompanhamento através de consultorias ou aulas particulares é auxiliar você nesse universo caso tenha um curso […]

Read More ->

© 2021 Estudo de Dados
Desenvolvido por Freshlab Agência Digital

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram