por Diego Calvo | Sep 16, 2016 | Big data, Inteligencia de negocio
La minería de datos busca descubrir patrones en grandes volúmenes de datos, de tal manera que los patrones obtenidos permitan extraer conocimiento comprensible por el ser humano. La minería de datos consta de las siguientes fases: Selección del conjunto de datos:... por Diego Calvo | May 22, 2016 | Big data
Definición de Hive Apache Hive es una herramienta de de almacenamiento de datos que facilita la lectura, escritura y almacenamiento de grandes volúmenes de datos sobre sistemas HDFS o Amazon S3. Fue creado por Facebook y desarrollado por empresas como Netflix o Finra.... por Diego Calvo | May 20, 2016 | Big data, Hadoop
Definición de Hadoop: Apache Hadoop es un sistema distribuido que permite realizar procesamiento de grandes volúmenes de datos a través de clúster, fácil de escalar. A grandes rasgos se puede decir que Hadoop está compuesto por dos partes: Se ocupa del almacenamiento...