por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Los principales sistemas de almacenamiento de datos para ecosistemas Big Data son: HDFS: sistema de almacenamiento por excelencia de Hadoop. Apache HBase: sistema de gestión de bases de datos orientado a columnas que se ejecuta sobre el HDFS y se suele utilizar para... por Diego Calvo | Jul 5, 2018 | Big data
Las herramientas de ingesta de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Apache Nifi: herramienta ETL que se encarga de cargar datos de diferentes fuentes, los pasa por un flujo de procesos para su tratamiento, y los vuelca en otra... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Las herramientas de visualización de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Notebooks Jupyter Zeppelin Librerías gráficas Google Chart D3.js Plotty Herramientas de análisis gráfico Kibana Shiny Grabana Loggy Herramientas... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Los sistemas de mensajería proporcionan un canal de comunicación entre aplicaciones del ecosistema big data, esto sistemas suele implementar sistemas de colas, tales como: Apache Kafka: sistema de itermediación de mensajes basado en el modelo publicador/subcriptor.... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Los frameworks de procesamiento de datos ecosistemas Big Data se clasifican en los siguientes bloques: Batch – procesamiento por lotes Hadoop Map-reduce: motor de procesamiento batch o por lotes. Streaming – procesamiento en tiempo real Apache Storm...