La ruche de l'UDF, avec Python
Je suis nouveau sur python, les pandas, et la ruche et serait certainement apprécier quelques conseils.
J'ai le code python ci-dessous, que je voudrais transformer en un fichier UDF dans la ruche. Seulement, au lieu de prendre un csv en entrée, en faisant les transformations et d'exporter à un autre format csv, je voudrais faire un tableau de la ruche que l'entrée, puis exporter les résultats dans un nouveau répertoire de stockage de la table contenant les données transformées.
Code Python:
import pandas as pd
data = pd.read_csv('Input.csv')
df = data
df = df.set_index(['Field1','Field2'])
Dummies=pd.get_dummies(df['Field3']).reset_index()
df2=Dummies.drop_duplicates()
df3=df2.groupby(['Field1','Field2']).sum()
df3.to_csv('Output.csv')
OriginalL'auteur user3476463 | 2014-06-18
Vous devez vous connecter pour publier un commentaire.
Vous pouvez faire usage de la
TRANSFORM
de la fonction d'usage d'un UDF écrit en Python. Les étapes détaillées sont décrites ici et ici.OriginalL'auteur visakh