Es necesario entender estos de los algoritmos antes...
Te cuento que el Metodo de Clustering es un método descriptivo de aprendizaje no supervisado, que trata de buscar agrupamientos naturales en un conjunto de datos tal que tengan semajanzas. Ahora existen dos metodos de agrupacion, el jerarquico (arborecente, ej: como el reino animal) y el no jerarquico, estos no jerarquicos se dividen parametricos (segmentacion: es en donde se asumen que las densidades condicionales de los grupos tienen cierta forma parametrica conocida y se reduce a estimar los parametros) y no parametricos: que no asumen nada en como se agrupan los objetos, que es justo donde reside el algortimo k-meams.
Supongo que no lo has podido descifrar porque no has entendido muy bien el algoritmo, pero es uno de los más sencillos.
Bueno en si el k-meams clustering se utiliza para encontrar los k puntos más densos en un conjunto arbitrarios de datos Y bueno el algoritmo es sencillo:
1.-Tienes que dividir aleatoriamente el ejemplo en k conjuntos y calcular la media (el punto medio) de cada conjunto
2.-Reasignar cada ejemplo al conjunto con el punto medio más cercano.
3. Calcular los puntos medios de los k conjuntos.
4. Repetir los pasos 2 y 3 hasta que los conjuntos no varíen.
Cualquier consulta adicional con gusto
Nicolás
|