python pandas opérations sur les colonnes

Salut, je voudrais savoir la meilleure façon de faire des opérations sur les colonnes en python à l'aide de pandas.

J'ai un classique de la base de données que j'ai chargé comme un dataframe, et j'ai souvent à faire des opérations telles que pour chaque ligne, si la valeur dans la colonne intitulée " A "est supérieure à x puis remplacez cette valeur par colonne C' moins de la colonne "D"

pour l'instant je fais quelque chose comme

for i in len(df.index):
    if df.ix[i,'A'] > x :
        df.ix[i,'A'] = df.ix[i,'C'] - df.ix[i, 'D']

Je voudrais savoir si il existe un moyen plus simple de faire ce genre d'opérations et, plus important, le plus efficace que j'ai de grandes bases de données

J'avais essayé sans le pour je la boucle, comme dans R ou Stata, on m'a conseillé d'utiliser "un.tout" ou "un.toutes les" mais je n'en non rien trouver, que ce soit ici ou dans les pandas docs.

Merci par avance.

Le code contient une erreur: len(df.index) renvoie un nombre entier qui ne peut pas être réitéré. Il serait bon de le faire pour i in range(0, len(df.index)) afin de réitérer la dataframe

OriginalL'auteur Anthony Martin | 2013-08-12