Minería de datos

La minería de datos busca descubrir patrones en grandes volúmenes de datos, de tal manera que los patrones obtenidos permitan extraer conocimiento comprensible por el ser humano. La minería de datos consta de las siguientes fases: Selección del conjunto de datos:...

Apache HIVE

Definición de Hive Apache Hive es una herramienta de de almacenamiento de datos que facilita la lectura, escritura y almacenamiento de grandes volúmenes de datos sobre sistemas HDFS o Amazon S3. Fue creado por Facebook y desarrollado por empresas como Netflix o Finra....

Apache Hadoop

Definición de Hadoop: Apache Hadoop es un sistema distribuido que permite realizar procesamiento de grandes volúmenes de datos a través de clúster, fácil de escalar. A grandes rasgos se puede decir que Hadoop está compuesto por dos partes: Se ocupa del almacenamiento...