por Diego Calvo | May 24, 2018 | Python
Definir entorno virtual desde linea de comandos > python -m venv entornovirtual_desarrollo Activar en entorno > ..\entornovirtual_desarrollo\Scripts\activate.bat (Para Windows) > ..\entornovirtual_desarrollo\bin\activate.bat (Para Linux) Desactivar el entorno... por Diego Calvo | May 21, 2018 | Python
Declarar una Matriz import numpy as np matrix_aux = [[1,2,3], [4,5,6]] m = np.array(matrix_aux) l = np.zeros((3, 3)) print(l) [[ 0. 0. 0.] [ 0. 0. 0.] [ 0. 0. 0.]] l = np.ones([3,3]) print(l) [[ 1. 1. 1.] [ 1. 1. 1.] [ 1. 1. 1.]] l = np.diag([1,1,1])... por Diego Calvo | Abr 26, 2018 | Big data, Python, Spark
Cargar CSV en Databricks Databricks Community Edition proporciona una interfaz gráfica para la carga de archivos. Este interfaz se acceder en DataBase > Create New Table. Una vez dentro se deben de indicar los campos: Upload to DBF: nombre del fichero a cargar.... por Adrian Atienza | Ene 17, 2018 | Python, Spark
from pyspark.ml import Pipeline from pyspark.ml.feature import VectorAssembler # Definir el ‘df’ Spark a utilizar df = spark.createDataFrame([ (‘line_1’, 100, 10, 1), (‘line_2’, 200, 20, 2), (‘line_3’, 300,... por Diego Calvo | Ene 17, 2018 | Python, Spark
from pyspark.ml import Pipeline from pyspark.ml.feature import VectorAssembler # Definir el ‘df’ Spark a utilizar df = spark.createDataFrame([ (‘line_1’, 1, 1, 1), (‘line_2’, 2, 2, 1), (‘line_3’, 3, 3, 1),... por Diego Calvo | Ene 17, 2018 | Python, Spark
Ejemplo de concatenación de tuberías (pipelines) Muestra un ejemplo de como se van incluyendo elementos a una tubería de tal forma que finalmente todos confluyan en un mismo punto, al que llamáramos «features» from pyspark.ml import Pipeline from pyspark.ml.feature...