Lecture d'un fichier csv avec une colonne d'horodatage, avec des pandas
Quand le faire:
import pandas
x = pandas.read_csv('data.csv', parse_dates=True, index_col='DateTime',
names=['DateTime', 'X'], header=None, sep=';')
avec cette data.csv
fichier:
1449054136.83;15.31
1449054137.43;16.19
1449054138.04;19.22
1449054138.65;15.12
1449054139.25;13.12
(la 1ère colonne est un timestamp UNIX, c'est à dire de secondes écoulées depuis le 1/1/1970), j'obtiens cette erreur quand le rééchantillonnage des données toutes les 15 secondes avec x.resample('15S')
:
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex
C'est comme le "datetime" l'information n'a pas été analysée:
X
DateTime
1.449054e+09 15.31
1.449054e+09 16.19
...
Comment importer un .CSV avec la date stockée en tant que timestamp avec les pandas module?
Puis une fois que je serai en mesure d'importer le fichier CSV, comment accéder à la lignes pour lesquelles la date > 2015-12-02 12:02:18 ?
source d'informationauteur Basj
Vous devez vous connecter pour publier un commentaire.
Ma solution est semblable à Mike:
Utilisation
to_datetime
et passerunit='s'
pour analyser les unités comme des timestamps unix, ce sera beaucoup plus rapide:Timings:
et
Donc à l'aide d'
to_datetime
est plus de 2x plus rapide sur ce petit jeu de données, je m'attends à une échelle beaucoup mieux que les autres méthodesVous pouvez analyser la date vous-même:
Le résultat: