Parcelle nombre d'occurrences de Pandas DataFrame
J'ai un DataFrame avec deux colonnes. L'un d'eux contenant les horodatages et un autre id de l'action. Quelque chose comme ça:
2000-12-29 00:10:00 action1
2000-12-29 00:20:00 action2
2000-12-29 00:30:00 action2
2000-12-29 00:40:00 action1
2000-12-29 00:50:00 action1
...
2000-12-31 00:10:00 action1
2000-12-31 00:20:00 action2
2000-12-31 00:30:00 action2
Je voudrais savoir combien d'actions d'un certain type ont été réalisées dans un certain jour.
I. e. pour tous les jours, j'ai besoin de compter le nombre d'occurrences de actionX et tracer ces données avec la date sur l'axe X et le nombre d'occurrences de actionX sur les axes Y, pour chaque date.
Bien sûr, je peux compter actions pour chaque jour naïvement juste en parcourant mon dataset. Mais quelle est la "bonne façon" de faire avec les pandas/matplotlib?
OriginalL'auteur Timofey | 2014-01-24
Vous devez vous connecter pour publier un commentaire.
À partir de
Vous pouvez faire
mais peut-être il y a encore plus simple. le ci-dessus devrait fonctionner de toute façon.
Si vous souhaitez utiliser le compte comme un DataFrame, je ne puis le transformer
counts = df.groupby([df.day.to_period('D'), 'col_name']).agg(len)
, que j'ai besoin de regrouper les données par jour et non par heure exacte de l'index. Cela a fonctionné et m'a donné multiindexed objet de Série. Cependant je ne peux pas encore tracé de ces données que je ne peux pasunstack
. J'ai posé la question sur ce problème ici stackoverflow.com/questions/21352520/pandas-unstack-doesnt-work, et il semble qu'il y a un bug. Mais commeunstack
ne fonctionne pas, peut-être il ya une autre façon de tracer ces données? MerciOriginalL'auteur mkln
Vous pouvez obtenir le compte en utilisant
ou vous pouvez tracer directement à l'aide de cette méthode
Vous pouvez aussi tout simplement mettre les résultats à
count
et puis parcelle séparément. C'est en supposant que votre index est déjà dans datetimeindex format, sinon, suivez les instructions de @mkln ci-dessus.order()
pour le pipelineOriginalL'auteur David Hagan