Home   >    Blog

K-Means

03/10/2019 
   |    

Técnica não supervisionada para resolver o problema do “clustering” e criar clusters. Podemos nomear esses clusters e criar novas labels e utilizá-las por exemplo depois para, a partir de outros parâmetros que não o que realizamos o clustering, prever essas labels. Conectar modelos não supervisionados com supervisionados faz parte das técnicas que usamos em Data Science.

Você especifica o valor de “k” inicialmente. mas existem técnicas bacanas para achar esse valor sistematicamente.
K-means é um problema NP-completo, ou seja, computacionalmente difícil, porém com algoritmos que convergem rapidamente para mínimos locais. Ele não funciona muito bem com clusters complexos, mas trabalha muito bem com dados bem separados, com estruturas globulares. Tem uma variação “k-medoids” que pode trabalhar com dados categóricos “categorical features”.

 

Passos:
1. Especifique o número de clusters (k)
2. k pontos de dados aleatórios são selecionados aleatoriamente como centros de cada cluster
3. Cada ponto de dados é atribuído ao centro do cluster mais próximo dele
4. Os centros de cluster são atualizados para a média dos pontos atribuídos
5. Os passos 3-4 são repetidos até que os centros de cluster permaneçam inalterados)

 

TAGS: 
Compartilhe
hello world!

Posts relacionados

07/11/2023
O DIA A DIA DE UM CIENTISTA DE DADOS

1. O Despertar do Cientista de Dados Imagine acordar com o aroma do café recém-preparado e a perspectiva de resolver enigmas de dados. Sim, isso é o que um Cientista de Dados faz! O dia geralmente começa com uma reunião de equipe, uma “daily”, onde todos compartilham seus avanços e entendem se há algum bloqueio […]

Read More ->
06/11/2023
Quais os cargos na área da Ciência de Dados?

A área de Ciência de Dados é um mercado constituído por uma equipe multidisciplinar,  que envolve coleta de dados, análise, interpretação e consequentemente tomada de decisões estratégicas. Com o avanço da tecnologia e a crescente geração de dados, empresas e instituições têm buscado profissionais preparados para transformar dados caóticos em conhecimento e informações úteis para […]

Read More ->
05/11/2023
Casos de Sucesso de Empresas que usam Dados

A Revolução dos Dados nos Negócios Em um mundo onde os dados são considerados o "novo petróleo", muitas empresas estão se reinventando através da análise de dados. Essa transformação não é apenas uma tendência, mas uma necessidade para se manter relevante e competitivo no mercado. Empresas de todos os tamanhos e setores estão descobrindo o […]

Read More ->
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram