por Diego Calvo | Ago 30, 2018 | Big data, Scala, Spark
Añadir columna de unos Se suele añadir una coñumna de unos para en posteriores operaciones de reduce realizar recuentos por agrupación. val df = Seq( («id1», 1), («id1», 2), («id1», 3), («id1», 4), («id2», 1), («id2», 2), («id2», 3), («id3», 1), («id3», 2)... por Diego Calvo | Jun 20, 2018 | R
Eliminar columnas de un dataframe # Carga de datos a utilizar id <- c(1,2,3,4,5,6,7,8,9) valor <- c(7,1,12,4,5,16,71,38,19) categoria <- c(rep(«bajo»,3),rep(«medio»,3),rep(«alto»,3)) color <- c(rep(«rojo»,1),rep(«azul»,2), rep(«naranja»,2),rep(«morado»,1),... por Diego Calvo | Jun 28, 2017 | Bases de Datos
Las proyecciones consisten en guardar duplicados ordenados por uno o varios criterios, con el objetivo principal de mejorar el rendimiento de los accesos por valor a los datos en el caso de operaciones de consulta (ejecución de sentencias SELECT). La base de datos... por Diego Calvo | Jun 28, 2017 | Bases de Datos
Los almacenes de datos en columnas, son un tipo de base de datos relacional. En esencia consiste en partir la tabla lógica en tantos fragmentos como columnas tenga la tabla lógica. Cada elemento de la tabla inicial estará formado por los datos colocados la posición...