por Eros Merino | Jul 9, 2020 | Aprendizaje automático, Big data, R
El objetivo de este modelo será predecir que calificación obtendrá una película en función de su presupuesto y de su duración Se va a usar el paquete de ggplot2movies, el cual almacena una serie de películas así como una serie de variables que las caracterizan.... por Eros Merino | Jul 6, 2020 | Big data, R, Spark
Spark es un motor ultrarrápido para el almacenamiento, procesamiento y análisis de grandes volúmenes de datos.Es de código abierto y se encuentra gestionado por la Apache Software Foundation. Apache Spark está especialmente diseñado para su implementación en Big data... por Fernando Campos | Feb 1, 2019 | Aprendizaje automático, Big data, R, Redes neuronales
Introducción En este post vamos a continuar estudiando el modelado de las series temporales como hicimos en el post Análisis de series temporales en R. ARIMA. En este post veremos un ejemplo en R de los modelos de Redes Neuronales Recurrentes de Elman y de Jordan.... por Fernando Campos | Nov 30, 2018 | Big data, Hadoop
Prerequisitos Tener instalado Java 8. Descargar e instalar Apache Kakfa Descargar la última version de Apache Kafka o bien usar cd /home/haddop/Descargas wget http://apache.rediris.es/kafka/2.0.0/kafka_2.11-2.0.0.tgz Nota: Si prefieres trabajar con Docker y... por Fernando Campos | Nov 29, 2018 | Bases de Datos, Big data, Hadoop
Prerequisitos Tener instalado Java8. Descargar HBase Buscar la última versión de HBase compatible con el sistema que tengas o bien usar wget cd /home/hadoop/Descargas wget http://apache.uvigo.es/hbase/2.1.1/hbase-2.1.1-bin.tar.gz Descomprimir el fichero... por Diego Calvo | Nov 29, 2018 | Big data, Hadoop
Instalar y configurar un clúster Hadoop Pseudo-Distribuido (un solo nodo) Instalar la máquina Virtual Java. Instalar Hadoop. Configurar las variables de entorno. Configurar SSH Modificar ficheros de configuración Crear directorio de datos, donde almacenar HDFS Iniciar...