Definición
Los métodos no jerárquicos categorizan los elementos según un número de cluster dado.
Necesitan que el número de particiones esté fijado a priori.
Herramientas de cluster no jerárquicos en R
Cálculo del número óptimo de clusters en R
- Package NbClust implementa 30 indices para evaluar la estructura de los clusters y ayudar a determinar el número de clusters óptimo.
- Paquete factoextra proporciona la función fviz_nbclust()
- Paquete stats posee la función kmeans(). El método de Elbow calcula como de buenos son los clusters generados de 1 hasta N y se queda con el que mejor relacción ofrezca.
Creación de clusters en R
- Paquete stats posee la función kmeans() que proporciona particiones con respecto a la distancia Euclidea.
- Paquete cluster posee la función pam() que proporciona particionas alrededor de los medioides y la función clara() es un contanedora de pam puede trabajar con distancias arbitrarias para conjunto de datos grandes.
- Paquete apcluster implementa el cluster de propagación por afinidad de Frey’s and Dueck’s (Analogo al implementado en Matlab)
Buenas tardes !
Muchas gracias por el artículo, es de gran interés.
Una duda: en el caso de CLARA, ¿se puede aplicar con datos categóricos y binarios?
Muchas gracias de antemano !
Javier