Comment mettre à jour les valeurs dans une ligne spécifique dans un Python Pandas DataFrame?

Avec la belle méthodes d'indexation dans les Pandas je n'ai pas de problèmes lors de l'extraction des données de différentes façons. D'autre part, je suis encore confus sur la façon de modifier les données dans un DataFrame.

Dans le code suivant, j'ai deux DataFrames et mon objectif est de mettre à jour les valeurs dans une ligne spécifique dans la première df à partir des valeurs de la deuxième df. Comment puis-je y parvenir?

import pandas as pd
df = pd.DataFrame({'filename' :  ['test0.dat', 'test2.dat'], 
                                  'm': [12, 13], 'n' : [None, None]})
df2 = pd.DataFrame({'filename' :  'test2.dat', 'n':16}, index=[0])

# this overwrites the first row but we want to update the second
# df.update(df2)

# this does not update anything
df.loc[df.filename == 'test2.dat'].update(df2)

print(df)

donne

   filename   m     n
0  test0.dat  12  None
1  test2.dat  13  None

[2 rows x 3 columns]

mais comment puis-je obtenir ceci:

    filename   m     n
0  test0.dat  12  None
1  test2.dat  13  16

[2 rows x 3 columns]

La discussion à ce sujet: mise à Jour d'un dataframe dans les pandas lors de l'itération, ligne par ligne

InformationsquelleAutor Alexander | 2014-06-04

pandas python

44

Alors tout d'abord, pandas mises à jour à l'aide de l'indice de. Lorsqu'une commande de mise à jour ne permet pas de mettre à jour quoi que ce soit, vérifiez à la fois côté gauche et le côté droit. Si pour quelque raison vous êtes trop paresseux pour mettre à jour les indices à suivre votre logique d'identification, vous pouvez faire quelque chose le long des lignes de
```
>>> df.loc[df.filename == 'test2.dat', 'n'] = df2[df2.filename == 'test2.dat'].loc[0]['n']
>>> df
Out[331]: 
    filename   m     n
0  test0.dat  12  None
1  test2.dat  13    16
```
Si vous voulez le faire pour l'ensemble de la table, je suggère une méthode que je crois est supérieure à celles précédemment mentionnées: depuis votre identifiant est filename, ensemble filename que votre index, puis utilisez update() comme vous le souhaitiez. Les deux merge et la apply() approche contenir une surcharge inutile:
```
>>> df.set_index('filename', inplace=True)
>>> df2.set_index('filename', inplace=True)
>>> df.update(df2)
>>> df
Out[292]: 
            m     n
filename           
test0.dat  12  None
test2.dat  13    16
```
InformationsquelleAutor FooBar

Si vous avez un gros dataframe et seulement un peu de mise à jour des valeurs que j'utiliserais appliquer comme ceci:

import pandas as pd

df = pd.DataFrame({'filename' :  ['test0.dat', 'test2.dat'], 
                                  'm': [12, 13], 'n' : [None, None]})

data = {'filename' :  'test2.dat', 'n':16}

def update_vals(row, data=data):
    if row.filename == data['filename']:
        row.n = data['n']
    return row

df.apply(update_vals, axis=1)

Ce cas n'est pas valide à la ligne dans l'application de fonction ne seront pas liées à la dataframe et en tant que tel, il ne sera pas mis à jour stackoverflow.com/questions/54432583/...

InformationsquelleAutor zach

Il y a probablement quelques façons de le faire, mais une approche serait de fusionner les deux dataframes ensemble sur le nom de fichier/m de colonne, puis remplir la colonne " n " de la droite dataframe si une correspondance a été trouvée. Le n_x, n_y dans le code reportez-vous à gauche/à droite dataframes dans la fusion.

In[100] : df = pd.merge(df1, df2, how='left', on=['filename','m'])

In[101] : df
Out[101]: 
    filename   m   n_x  n_y
0  test0.dat  12  None  NaN
1  test2.dat  13  None   16

In[102] : df['n'] = df['n_y'].fillna(df['n_x'])

In[103] : df = df.drop(['n_x','n_y'], axis=1)

In[104] : df
Out[104]: 
    filename   m     n
0  test0.dat  12  None
1  test2.dat  13    16

InformationsquelleAutor chrisb

Vous devez vous connecter pour publier un commentaire.