por Diego Calvo | Nov 29, 2018 | Big data, Hadoop
Instalar y configurar un clúster Hadoop Pseudo-Distribuido (un solo nodo) Instalar la máquina Virtual Java. Instalar Hadoop. Configurar las variables de entorno. Configurar SSH Modificar ficheros de configuración Crear directorio de datos, donde almacenar HDFS Iniciar... por Diego Calvo | Jul 4, 2018 | Big data, Hadoop
Prerequisitos Tener instalado Hortonworks (Virtual Box) para Spark Visionar el ejemplo de Hola Mundo. Configurar ficheros productora/consumidor kafka Copiar ficheros de configuración para pruebas Desde la linea de comandos acceder la carpeta donde se guardan... por Diego Calvo | Jul 4, 2018 | Big data, Hadoop
Prerequisitos Tener instalado Hortonworks (Virtual Box) para Spark Arrancar kafka Antes de empezar evidentemente es necesario tener arrancada la máquina virtual de Hortonworks Acceder a Ambari Acceder al servicio de Kafka Arrancar el servicio mediante el botón... por Diego Calvo | Jul 3, 2018 | Big data
Apache Kafka Apache Flume RabbitMQ Definición Apache Kafka es un bus de mensajes optimizado para los flujos de datos de alta entrada y la repetición Apache Flume es un servicio distribuido que mueve de forma fiable y eficiente grandes cantidades de datos,... por Diego Calvo | Jun 27, 2018 | Big data, Spark
Definición de Kafka Apache Kafka es un sistema de intermediación de mensajes basado en el modelo publicador/suscriptor. Se considera un sistema persistente, escalable, replicado y tolerante a fallos. A estas características se añade la velocidad de lecturas y...