Boletín mugperu Digital - Julio 2009!
  Search 
Saturday, May 19, 2012 ..:: Foros de Discusión ::.. Register  Login
Foros MUGPERU Minimize
Subject: Datamining. Algoritmo K-Means
Prev Next
You are not authorized to post a reply.

Author Messages
BlackDevPeru
Posts:54

16/04/2005 10:16 AM  

Holas.

Bueno... Este es mi primer Thread con el que inicio mi participacion en el Portal.

Pregunta:

Como interpreto el algoritmo Cluster K-Means?. Para empezar, creo que SQL Server no tiene este algoritmo no?... Lo q pasa es que he utilizado SPSS para la parte de Datamining, y he obtenido resultados, el problema es que no entiendo muy bien como interpretar estos datos.

Si tuvieran alguna direccion sobre la interpretacion de este algoritmo en base a mis atributos que he ingresado les agradeceria.

Saludos y Suerte...

nnakason
Posts:111

20/04/2005 04:41 PM  

Es necesario entender estos de los algoritmos antes...

Te cuento que el Metodo de Clustering es un método descriptivo de aprendizaje no supervisado, que trata de buscar agrupamientos naturales en un conjunto de datos tal que tengan semajanzas.   Ahora existen dos metodos de agrupacion, el jerarquico (arborecente, ej: como el reino animal) y el no jerarquico, estos no jerarquicos se dividen parametricos (segmentacion: es en donde se asumen que las densidades condicionales de los grupos tienen cierta forma parametrica conocida y se reduce a estimar los parametros) y no parametricos: que no asumen nada en como se agrupan los objetos, que es justo donde reside el algortimo k-meams.

Supongo que no lo has podido descifrar porque no has entendido muy bien el algoritmo, pero es uno de los más sencillos.

Bueno en si el k-meams clustering se utiliza para encontrar los k puntos más densos en un conjunto arbitrarios de datos Y bueno el algoritmo es sencillo:

1.-Tienes que dividir aleatoriamente el ejemplo en k conjuntos y calcular la media (el punto medio) de cada conjunto

2.-Reasignar cada ejemplo al conjunto con el punto medio más cercano.

3. Calcular los puntos medios de los k conjuntos.

4. Repetir los pasos 2 y 3 hasta que los conjuntos no varíen.

Cualquier consulta adicional con gusto

Nicolás

 

 

BlackDevPeru
Posts:54

27/04/2005 06:58 AM  

Gracias Nicolas.
Si entiendo el algoritmo, lo que no entiendo, es como interpretar los resultados del mismo. Yo hice el proceso de mineria utilizando un software especializado, y me arroja unos resultados, pero no se muy bien como interpretarlos.
Supuestamente estoy analizando los consumos de medicamentos por diagnosticos, tipos de pacientes, servicio de atencion, etc... Todos estos parametros, y sus cantidades los he pasado como atributos para mi corrida, pero no entiendo muy bien los resultados.

Gracias, y mil disculpas por la demora en Reply.

BlackDevPeru
Posts:54

17/05/2005 01:59 PM  

Holas...
Despues de tiempo hago un reply en este thread. Despues de ver sobre algoritmos K-Means, y de utilizar un software no microsoft, finalmente vi la utilidad que tiene el sectorizar a un grupo de entidades.
Ese fue mi caso: Segmentacion de clientes en un hospital.
Un proyecto de este tipo deberia ser basico para todas las carreras, pues utiliza algoritmos muy sencillos para clasificar a un grupo de personas, cosa que es muy util en cualquier empresa.
Saludos.

PD: EL software que use fue el SPSS... hay alguna herramienta gratuita parecida y tan potente como esta?. Alguien tiene un manual de WEKA?.
Saludos.

Blanca_Rosa
Posts:8

22/09/2006 08:21 AM  
Hola:

No se si sea demasiado tarde, pero si gustas material de Weka en Castellano escribeme a blancarosasantos@hotmail.com y te los envio en seguida, son Manuales muy buenos para todos los niveles.

Un abrazo

Blanca Rosa
nnakason
Posts:111

24/09/2006 12:29 AM  
Solo como algo adicional, aqui en las Universidades Japonesas se usan dos importantes herramientas estadisticas que son Stata y R. Les recomiendo que las prueben son de primer nivel y han servido para proyectos como por ejemplo Robotica en Japon y de estudio del CO2 para la Nasa.

Blanca Rosa y BlackDevPeru podrian explicarnos acerca de Weka? Es un software tambien estadistico? Es libre?

Igualmente quedan cordialmente invitados a que en alguna oportunidad puedan presentarnos ante toda la comunidad estos proyectos reales en los cuales han usado estos algoritmos. De verdad que son temas muy interesantes que aportarian a todos.

Saludos cordiales

Nicolas Nakasone
Alessa
Posts:1

06/10/2009 03:56 PM  
Buenas

No se si me salga de la dicusion del foro pero tengo varias dudas acerca de este algoritmo de K-means, actualmente estoy implementando este algoritmo, pero a la hora de realizar pruebas con datos reales me ha causado dificulta

A grandes rasgos los pasos del algoritmo consiste en:
1. ubicar uno centroides y ubicar unos datos en un plano
2. Hallar la distancia que hay de cada dato a cada centroide
3. el dato que tenga la minima distancia a un centroide, obtiene una pertenencia
es decir si el dato uno esta mas cerca al centroide 4, el dato 1 pertence al grupo 4
Se hace interaciones hasta una convergencia

El algortimo en si lo entiendo,pero cuando quiero pasar a datos reales no se como a un dato le puedo asignar una coordenada en un plano

Mi pregunta es tengo una matriz de datos, pero bajo que criterio le asigna una coordenada a cada uno de los datos


Muchas Gracias... espero alguien me pueda colaborar.
You are not authorized to post a reply.



ActiveForums 3.7
        
Copyright 2001-2012 MUGPERU   Terms Of Use  Privacy Statement