por Diego Calvo | Jun 27, 2018 | Big data, Hadoop, Spark
Definición de Zookeeper Zookeeper proporciona un servicio para la coordinación de procesos distribuidos altamente confiable, con el fin de dar solución a problemas de coordinación para grandes sistemas distribuidos. Servicios proporcionados por Zookeeper: Compartir... por Diego Calvo | Jun 27, 2018 | Big data, Spark
Definición de Kafka Apache Kafka es un sistema de intermediación de mensajes basado en el modelo publicador/suscriptor. Se considera un sistema persistente, escalable, replicado y tolerante a fallos. A estas características se añade la velocidad de lecturas y... por Diego Calvo | Jun 27, 2018 | Big data, Hadoop
Definición de Nifi Apache NiFi es una plataforma integrada de procesamiento y logística de datos en tiempo real, para automatizar el movimiento de datos entre diferentes sistemas de forma rápida, fácil y segura. Apache Hifi es una herramienta ETL que se encarga de... por Diego Calvo | Jun 26, 2018 | Big data
por Diego Calvo | Jun 26, 2018 | Big data
Captura La procedencia de grandes volumenes de datos (big data) se puede categorizar en: Generados por las personas: Correos electrónicos, mensajería instantánea, redes sociales, encuestas, marketing electrónico, Web, sistema ERP, Hojas de cálculo,…... por Diego Calvo | Jun 25, 2018 | Big data, Scala, Spark
Scala es un lenguaje funcional, orientado a objetos y multiplataforma que corre actualmente sobre la Maquina Virtual de Java. Por otro lado destacar la gran ventaja de integrar sin problemas bibliotecas desarrolladas en otros lenguajes de programación. Una vez...