por Diego Calvo | Nov 23, 2017 | Big data
Frameworks Batch Apache Hadoop Frameworks Stream Apache Storm Apache Samza Apache Kafka Apache Flink Frameworks híbrido Apache Spark Apache Flink por Diego Calvo | Nov 21, 2017 | Big data
Definición de Big Data El termino big data o datos masivos hacer referencia a un volumen de datos que superaba las capacidades del software habitualmente usado para ver capturar, administrar y procesar datos. Como la capacidad de computo es cada vez más elevada y la... por Diego Calvo | Nov 21, 2017 | Big data, Inteligencia de negocio
Datos estructurados (Structured Data) Los datos estructurados tienen perfectamente definido la longitud, el formato y el tamaño de sus datos. Se almacenan en formato tabla, hojas de cálculo o en bases de datos relacionales. Datos no estructurados (Unstructured... por Diego Calvo | Nov 15, 2017 | Big data
Antes de centrarnos en la arquitectura Lambda es conveniente especificar los dos tipos de procesamiento de datos que la componen: El procesamiento de datos en modo batch, es aquel que nos permite procesar volúmenes de datos en tiempos espaciados, por ejemplo cada 10... por Diego Calvo | Nov 7, 2017 | Big data, Python, Spark
Preparación del entorno de desarrollo Entorno Python Instalación del entorno de desarrollo: instalar Anaconda y PyCharm CE Otros entornos recomendados: Eclipse, Spyder (incluido en anaconda y Aton) Configurar y cambiar el entorno virtual Importar paquetes: pip install... por Diego Calvo | Jul 18, 2017 | Big data, Inteligencia de negocio
Definición de Machine Learning El aprendizaje automático o machine learning se encuadra como una disciplina de la inteligencia artificial. El principal objetivo que busca es crear sistemas que sean capaces de aprender automáticamente, es decir que sean capaces de...