arquitectura Archivos - Página 2 de 2

Apache Kafka

por Diego Calvo | Jun 27, 2018 | Big data, Spark

Definición de Kafka Apache Kafka es un sistema de intermediación de mensajes basado en el modelo publicador/suscriptor. Se considera un sistema persistente, escalable, replicado y tolerante a fallos. A estas características se añade la velocidad de lecturas y...

Apache Nifi

por Diego Calvo | Jun 27, 2018 | Big data, Hadoop

Definición de Nifi Apache NiFi es una plataforma integrada de procesamiento y logística de datos en tiempo real, para automatizar el movimiento de datos entre diferentes sistemas de forma rápida, fácil y segura. Apache Hifi es una herramienta ETL que se encarga de...

Arquitectura Big Data

por Diego Calvo | Jun 26, 2018 | Big data

Arquitectura Spark

por Diego Calvo | Jun 20, 2018 | Big data, Spark

Spark context SparkContext es el contexto básico de Spark, desde donde se crean el resto de variables. En la shell de Spark viene directamente instancia en la variable «sc», aunque en otros entornos hay que instanciarlo explícitamente. Problema que solo se puede...

Arquitectura Lambda (combinación de procesamiento batch y stream)

por Diego Calvo | Nov 15, 2017 | Big data

Antes de centrarnos en la arquitectura Lambda es conveniente especificar los dos tipos de procesamiento de datos que la componen: El procesamiento de datos en modo batch, es aquel que nos permite procesar volúmenes de datos en tiempos espaciados, por ejemplo cada 10...

Entradas siguientes »

Apache Kafka

Apache Nifi

Arquitectura Big Data

Arquitectura Spark

Arquitectura Lambda (combinación de procesamiento batch y stream)

Mi filosofía

Contacto

Aviso legal