Moyenne par ligne pour un sous-ensemble des colonnes tout en tenant compte des valeurs manquantes
J'ai obtenu un "DataFrame" qui a l'occasion de valeurs manquantes, et ressemble à quelque chose comme ceci:
Monday Tuesday Wednesday
================================================
Mike 42 NaN 12
Jenna NaN NaN 15
Jon 21 4 1
Je voudrais ajouter un nouveau column
à mon bloc de données où j'avais calculer la moyenne sur l'ensemble des columns
pour chaque row
.
Sens, pour Mike
j'aurais besoin d'
(df['Monday'] + df['Wednesday'])/2
mais pour Jenna
je serais tout simplement utiliser df['Wednesday amt.']/1
Personne ne sait le meilleur moyen de prendre en compte cette variation des résultats à partir des valeurs manquantes et de calculer la moyenne?
source d'informationauteur scrollex
Vous devez vous connecter pour publier un commentaire.
Vous pouvez tout simplement:
parce que
.mean()
ignore les valeurs manquantes par défaut: voir les docs.Pour sélectionner un sous-ensemble, vous pouvez: