Uso: Clasificador de clases preestablecidas.
Descripción: Método de conjunto que construye múltiples árboles de decisión haciendo repetidamente remuestreo de los datos de entrenamiento con sustitución, y votando los árboles para hallar una predicción de consenso.
Variable dependiente: métricas y/o no métricas
Variables independientes: métricas y/o no métricas
Ejemplo en R: Clasificar tipo de flor atendiendo a sus características físicas como pueden ser el ancho y alto de los pétalos y sépalos.
# Carga el paquete especifico del método
library(ipred)
# Carga de datos inicial, tipos de flores con diferentes características
data(iris)
datos <- iris
View(datos)
# Selección de una submuestra del 70% de los datos
set.seed(101)
tamano.total <- nrow(datos)
tamano.entreno <- round(tamano.total*0.7)
datos.indices <- sample(1:tamano.total , size=tamano.entreno)
datos.entreno <- datos[datos.indices,]
datos.test <- datos[-datos.indices,]
# Ejecución del modelo de Bagging
modelo <- bagging(Species~., data=datos.entreno)
# Resumen del ajuste del modelo
modelo
##
## Bagging classification trees with 25 bootstrap replications
##
## Call: bagging.data.frame(formula = Species ~ ., data = datos.entreno)
# Hacer predicciones
predicciones <- predict(modelo, datos.test)
# Matriz de confusión
(mc <- with(datos.test,table(predicciones, Species)))
## Species
## predicciones setosa versicolor virginica
## setosa 15 0 0
## versicolor 0 11 3
## virginica 0 1 15
# % correcto
100 * sum(diag(mc)) / sum(mc)
## [1] 91.11111
0 comentarios