Bin valeurs basées sur les plages avec des pandas
J'ai plusieurs fichiers CSV avec des valeurs de ce type dans un dossier:
GroupID.csv est le nom de fichier. Il y a plusieurs fichiers comme ça, mais les plages de valeurs sont définies dans le même fichier XML. Je suis en train de les regrouper
Comment puis-je le faire?
UPDATE1:
Basé sur BobHaffner les commentaires, j'ai fait ce
import pandas as pd
import glob path =r'path/to/files'
allFiles = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
df = pd.read_csv(file_,index_col=None, header=None)
df['file'] = os.path.basename('path/to/files/'+file_)
list_.append(df)
frame = pd.concat(list_)
print frame
pour obtenir quelque chose comme ceci:
J'ai besoin de grouper les valeurs basées sur les bacs à partir du fichier XML. Je serais vraiment reconnaissant de toute aide.
Il ya quelques questions ici. Je suggère d'essayer d'obtenir le csvs dans un dataframe comme une bonne première étape. Découvrez le glob module et les pandas read_csv() et la méthode concat()
Je peux le faire. Sur la concaténation, il avait perdu la trace du nom de fichier. Ne serait-il pas?
Vous pouvez créer un champ supplémentaire dans chaque dataframe avec le nom de fichier. Cela serait, à droite?
puis de les enchaîner
Oui, je vais le faire. @BobHaffner
Je peux le faire. Sur la concaténation, il avait perdu la trace du nom de fichier. Ne serait-il pas?
Vous pouvez créer un champ supplémentaire dans chaque dataframe avec le nom de fichier. Cela serait, à droite?
puis de les enchaîner
Oui, je vais le faire. @BobHaffner
OriginalL'auteur pam | 2015-07-31
Vous devez vous connecter pour publier un commentaire.
Pour seau de votre série, vous devez utiliser le
mp.cut()
function, comme ceci:Si vous souhaitez nommer les bacs de vous-même, vous pouvez utiliser le
labels=
argument, comme ceci:OriginalL'auteur firelynx