por Diego Calvo | Nov 29, 2018 | Big data, Hadoop
Instalar y configurar un clúster Hadoop Pseudo-Distribuido (un solo nodo) Instalar la máquina Virtual Java. Instalar Hadoop. Configurar las variables de entorno. Configurar SSH Modificar ficheros de configuración Crear directorio de datos, donde almacenar HDFS Iniciar... por Diego Calvo | Jul 5, 2018 | Big data
Gestores de aplicaciones y recursos big data Hadoop Map-Reduce es un gestor de recursos distribuidos y procesamiento de datos. Proporciona una infraestructura de programación que proporciona algoritmos para realizar los cálculos distribuidos. YARN es un sistema... por Diego Calvo | Jul 5, 2018 | Big data
Las herramientas de ingesta de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Apache Nifi: herramienta ETL que se encarga de cargar datos de diferentes fuentes, los pasa por un flujo de procesos para su tratamiento, y los vuelca en otra... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Las herramientas de visualización de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Notebooks Jupyter Zeppelin Librerías gráficas Google Chart D3.js Plotty Herramientas de análisis gráfico Kibana Shiny Grabana Loggy Herramientas... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Los sistemas de mensajería proporcionan un canal de comunicación entre aplicaciones del ecosistema big data, esto sistemas suele implementar sistemas de colas, tales como: Apache Kafka: sistema de itermediación de mensajes basado en el modelo publicador/subcriptor....