Cálculo de la ganancia de información en R

La ganancia de información no se puede entender sin antes tener claro el concepto de entropía. Entropía Entendemos la entropía como medida que nos determina cómo de predecible es un resultado para un juedo de datos, es decir el grado de desorden o de incertidumbre...

Cálculo de outliers en R: Distancia Gauss y Mahalanobis

Se muestra como calcular puntos outliers de un conjunto de datos utilizando los métodos de distancia de Gauss y distancia de Mahalanobis, para ello nos vamos a apoyar en el siguiente conjunto de datos: # Cargar los datos ventas= c( 1054, 1057, 1058, 1060, 1061, 1060,...

Construcción de la Matriz de términos en R

La matriz de términos es la base para la realización de tareas de minería de datos. La matriz de términos permitiría la visualización un histograma de frecuencias, ranking de términos de más frecuentes, para la construcción de nubes de palabras  o para aplicar un...