La ruche de l'UDF, avec Python

Je suis nouveau sur python, les pandas, et la ruche et serait certainement apprécier quelques conseils.

J'ai le code python ci-dessous, que je voudrais transformer en un fichier UDF dans la ruche. Seulement, au lieu de prendre un csv en entrée, en faisant les transformations et d'exporter à un autre format csv, je voudrais faire un tableau de la ruche que l'entrée, puis exporter les résultats dans un nouveau répertoire de stockage de la table contenant les données transformées.

Code Python:

import pandas as pd
data = pd.read_csv('Input.csv')
df = data
df = df.set_index(['Field1','Field2'])
Dummies=pd.get_dummies(df['Field3']).reset_index()
df2=Dummies.drop_duplicates()
df3=df2.groupby(['Field1','Field2']).sum()
df3.to_csv('Output.csv')

OriginalL'auteur user3476463 | 2014-06-18