Parcelle timeseries d'histogrammes en Python

Je suis en train de tracer une série de temps d'histogrammes en Python. Il y a eu une question similaire, à ce sujet, mais dans la R. Donc, en gros, j'ai besoin de la même chose, mais je suis vraiment mal dans R. Il n'y a généralement 48 valeurs par jour dans mon dataset. Où - 9999 représente des données manquantes. Voici l'échantillon de données.

J'ai commencé avec la lecture dans les données et la construction d'un pandas DataFrame.

import pandas as pd
df = pd.read_csv('sample.csv', parse_dates=True, index_col=0, na_values='-9999') 
print df

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 336 entries, 2008-07-25 14:00:00 to 2008-08-01 13:30:00
Data columns (total 1 columns):
159.487691046    330  non-null values
dtypes: float64(1)

Maintenant, je peux regrouper les données par jour:

daily = df.groupby(lambda x: x.date())

Mais là je suis coincé. Je ne sais pas comment l'utiliser avec matplotlib pour obtenir mon timeseries d'histogrammes. Toute aide appréciée, pas nécessairement à l'aide de pandas.

OriginalL'auteur abudis | 2013-06-11

Faire un histogramme et l'utilisation matplotlib est pcolor.

Nous devons bin les groupes de manière uniforme, donc, nous faisons des bacs manuellement en fonction de la plage de votre échantillon de données.

In [26]: bins = np.linspace(0, 360, 10)

Appliquer histogram à chaque groupe.

In [27]: f = lambda x: Series(np.histogram(x, bins=bins)[0], index=bins[:-1])

In [28]: df1 = daily.apply(f)

In [29]: df1
Out[29]: 
            0    40   80   120  160  200  240  280  320
2008-07-25    0    0    0    3   18    0    0    0    0
2008-07-26    2    0    0    0   17    6   13    1    8
2008-07-27    4    3   10    0    0    0    0    0   31
2008-07-28    0    7   15    0    0    0    0    6   20
2008-07-29    0    0    0    0    0    0   20   26    0
2008-07-30   10    1    0    0    0    0    1   25    9
2008-07-31   30    4    1    0    0    0    0    0   12
2008-08-01    0    0    0    0    0    0    0   14   14

Suivant votre lié exemple, dans R, l'axe horizontal doit être des dates, et l'axe vertical doit être la gamme de bacs. L'histogramme des valeurs sont une "carte de chaleur."

In [30]: pcolor(df1.T)
Out[30]: <matplotlib.collections.PolyCollection at 0xbb60e2c>

Parcelle timeseries d'histogrammes en Python

Il reste à étiquette axes. Cette réponse être de quelque aide.

l'ajout de livre de cuisine!
Merci! Cela devrait le faire. J'ai totalement oublié de mentionner que - 9999 manque un nombre et doit être disarded. L'ajouter à la question.
Ce qui est très cool!

OriginalL'auteur Dan Allan

Vous devez vous connecter pour publier un commentaire.