Spécifiez correcte dtypes aux pandas.read_csv pour datetimes et les booléens

Je suis le chargement d'un fichier csv dans une Pandas DataFrame. Pour chaque colonne, comment dois-je préciser quel est le type de données qu'il contient à l'aide de la dtype argument?

  • Je peux le faire avec numérique de données (code en bas)...
  • Mais comment puis-je spécifier temps de données...
  • et catégorique de données tels que les facteurs ou les booléens? J'ai essayé np.bool_ et pd.tslib.Timestamp sans chance.

Code:

import pandas as pd
import numpy as np
df = pd.read_csv(<file-name>, dtype={'A': np.int64, 'B': np.float64})
  • Jetez un oeil à la date_parser-arguments ici. Concernant la boolen valeur: Comment vos données stockées? Le NumPy Docs état de la np.bool_ est booléenne stockées en octets (peut-être que vous êtes à l'aide de cordes à la place?)
InformationsquelleAutor elgehelge | 2013-11-20