Comment obtenir un décompte des données manquantes / NaN par colonne dans 'pandas'?
Dans R je peux rapidement voir un nombre de données manquantes à l'aide de la summary
de commande, mais l'équivalent pandas
DataFrame méthode, describe
ne signalent pas ces valeurs.
Je cueille, je peux faire quelque chose comme
len(mydata.index) - mydata.count()
pour calculer le nombre de valeurs manquantes pour chaque colonne, mais je me demande si il y a une meilleure idiome (ou si mon approche est la même droite).
source d'informationauteur orome
Vous devez vous connecter pour publier un commentaire.
Les deux
describe
etinfo
indiquer le nombre de non-valeurs manquantes.Pour obtenir le nombre de disparus, votre soln est correct
Que vous pourriez faire cela aussi
Comme un petit plus, pour obtenir le pourcentage manquant par DataFrame colonne, combinant @Jeff et @utilisateurs de réponses ci-dessus vous permet de vous:
Ce n'est pas tout à fait un résumé complet, mais il vous donnera une idée rapide de votre colonne de données au niveau de l'
Je ne peux pas faire de commentaires pour l'instant, mais pour ajouter à la réponse de Jeff, mais
si vous n'avez pas de soins de colonnes qui avait Nan et vous voulais juste vérifier globale
il suffit d'ajouter une seconde .somme() pour obtenir une valeur unique.
une Série n'aura besoin que d'un .sum() et un Panneau() aurait besoin de trois