Quelle est la meilleure façon de la somme de toutes les valeurs dans une Pandas dataframe?
J'ai pensé à ces deux méthodes. Est-il une meilleure?
>>> import pandas as pd
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]})
>>> print df.sum().sum()
42
>>> print df.values.sum()
42
Veux juste m'assurer que je ne suis pas en manque de quelque chose de plus évident.
OriginalL'auteur Bill | 2016-08-03
Vous devez vous connecter pour publier un commentaire.
Est à la base un tableau numpy
Est le numpy somme méthode est plus rapide
Est-il plus rapide tout simplement parce que l'un des appels de fonction à l'autre ou est-il une plus la différence fondamentale?
deux raisons. L'un,
df.values.sum()
est unnumpy
fonctionnement et la plupart du temps,numpy
est plus performant. Deux,numpy
sommes sur tous les éléments dans un tableau, indépendamment de la dimensionnalité.pandas
nécessite deux appels distincts àsum
un pour chaque dimension.OriginalL'auteur piRSquared