Cluster No Jerárquico (Partitioning Cluster) en R

por | Mar 17, 2018 | Aprendizaje automático, R | 1 Comentario

Definición

Los métodos no jerárquicos categorizan los elementos según un número de cluster dado.

Necesitan que el número de particiones esté fijado a priori.

 

Herramientas de cluster no jerárquicos en Rlogo-r

Cálculo del número óptimo de clusters en R

  • Package NbClust implementa 30 indices para evaluar la estructura de los clusters y ayudar a determinar el número de clusters óptimo.
  • Paquete factoextra proporciona la función fviz_nbclust()
  • Paquete stats posee la función kmeans(). El método de Elbow calcula como de buenos son los clusters generados de 1 hasta N y se queda con el que mejor relacción ofrezca.

 

Creación de clusters en R

  • Paquete stats posee la función kmeans() que proporciona particiones con respecto a la distancia Euclidea.
  • Paquete cluster posee la función pam() que proporciona particionas alrededor de los medioides y la función clara() es un contanedora de pam puede trabajar con distancias arbitrarias para conjunto de datos grandes.
  • Paquete apcluster implementa el cluster de propagación por afinidad de Frey’s and Dueck’s (Analogo al implementado en Matlab)

1 Comentario

  1. Javier

    Buenas tardes !

    Muchas gracias por el artículo, es de gran interés.

    Una duda: en el caso de CLARA, ¿se puede aplicar con datos categóricos y binarios?

    Muchas gracias de antemano !

    Javier

    Responder

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *