Moyenne par ligne pour un sous-ensemble des colonnes tout en tenant compte des valeurs manquantes

J'ai obtenu un "DataFrame" qui a l'occasion de valeurs manquantes, et ressemble à quelque chose comme ceci:

          Monday         Tuesday         Wednesday 
      ================================================
Mike        42             NaN               12
Jenna       NaN            NaN               15
Jon         21              4                 1

Je voudrais ajouter un nouveau column à mon bloc de données où j'avais calculer la moyenne sur l'ensemble des columns pour chaque row.

Sens, pour Mikej'aurais besoin d'
(df['Monday'] + df['Wednesday'])/2mais pour Jennaje serais tout simplement utiliser df['Wednesday amt.']/1

Personne ne sait le meilleur moyen de prendre en compte cette variation des résultats à partir des valeurs manquantes et de calculer la moyenne?

source d'informationauteur scrollex

Vous pouvez tout simplement:

df['avg'] = df.mean(axis=1)

       Monday  Tuesday  Wednesday        avg
Mike       42      NaN         12  27.000000
Jenna     NaN      NaN         15  15.000000
Jon        21        4          1   8.666667

parce que .mean() ignore les valeurs manquantes par défaut: voir les docs.

Pour sélectionner un sous-ensemble, vous pouvez:

df['avg'] = df[['Monday', 'Tuesday']].mean(axis=1)

       Monday  Tuesday  Wednesday   avg
Mike       42      NaN         12  42.0
Jenna     NaN      NaN         15   NaN
Jon        21        4          1  12.5

Vous devez vous connecter pour publier un commentaire.