Leer CSV en Databricks en Spark

por | Abr 26, 2018 | Big data, Python, Spark | 0 Comentarios

Cargar CSV en Databricks

Databricks Community Edition proporciona una interfaz gráfica para la carga de archivos.

Este interfaz se acceder en DataBase > Create New Table.

Una vez dentro se deben de indicar los campos:

Upload to DBF: nombre del fichero a cargar.
Select a Cluster to Preview the Table: Clúster sobre el que realizar las operaciones.

Cargar datos cvs en databricks

Cargar datos cvs en databricks 2

Leer ficheros

El acceso al fichero cargado se puede realizar mediante una consulta SQL de Spark

mis_datos = spark.sql("SELECT * FROM datos_csv")
display(mis_datos.select("*"))

resultado de una consulta sql spark

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *