python pandas extrait année de datetime — df['année'] = df['date'].l'année n'est pas de travail

Désolé pour cette question qui me semble répétitif - je attendre la réponse va me faire sentir comme un bonehead... mais je n'ai pas eu de chance, à l'aide des réponses aux questions similaires sur DONC.

Je suis de l'importation de données à travers read_csv, mais pour une raison que je ne peux pas comprendre, je ne suis pas en mesure d'extraire de l'année ou le mois de la dataframe série df['date'].

date    Count
6/30/2010   525
7/30/2010   136
8/31/2010   125
9/30/2010   84
10/29/2010  4469

df = pd.read_csv('sample_data.csv',parse_dates=True)

df['date'] = pd.to_datetime(df['date'])

df['year'] = df['date'].year
df['month'] = df['date'].month

Mais cela renvoie:

AttributeError: 'Série' objet n'a pas d'attribut "année"

Merci à l'avance.

Mise à JOUR:

df = pd.read_csv('sample_data.csv',parse_dates=True)

df['date'] = pd.to_datetime(df['date'])

df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month

cela génère les mêmes "AttributeError: 'Série' objet n'a pas d'attribut 'dt' "

SUIVI:

Je suis en utilisant Spyder 2.3.1 avec Python 3.4.1 64 bits, mais impossible de mettre à jour les pandas à une version plus récente (actuellement sur 0.14.1). Chaque suivant génère une erreur de syntaxe non valide:

HTML:

conda update pandas

conda install pandas==0.15.2

conda install -f pandas

Des idées?

où est l'année à venir? Êtes-vous essayer d'accéder à une ligne (df["date"][0].year?
J'ai un fichier csv avec les dates et les autres colonnes qui sortirent tous de SQL as string de données. En essayant de créer la nouvelle année et le mois de colonnes à utiliser pour le regroupement. le csv a ~5000 lignes.
Oui mais le df["date"] est un 'pandas.core.series.Series' objet. ce qui devrait df['date'].year être?
Si vous utilisez la version 0.15.0 ou plus, alors vous pouvez df['year'] = df['date'].dt.year
Je veux juste créer 2 colonnes... pour un an et un mois que les nombres entiers.
essayé df['date'].dt.année, EdChum.
voir ma mise à jour, il faut travailler dans votre version de pandas, vous pouvez poster la version que vous utilisez

InformationsquelleAutor MJS | 2015-05-22

Si vous êtes en cours d'exécution d'une récente-ish version de pandas, alors vous pouvez utiliser l'attribut datetime dt pour accéder à l'datetime composants:

In [6]:

df['date'] = pd.to_datetime(df['date'])
df['year'], df['month'] = df['date'].dt.year, df['date'].dt.month
df
Out[6]:
        date  Count  year  month
0 2010-06-30    525  2010      6
1 2010-07-30    136  2010      7
2 2010-08-31    125  2010      8
3 2010-09-30     84  2010      9
4 2010-10-29   4469  2010     10

MODIFIER

Il semble que vous utilisez une ancienne version de pandas dans lequel cas, la suivante devrait fonctionner:

In [18]:

df['date'] = pd.to_datetime(df['date'])
df['year'], df['month'] = df['date'].apply(lambda x: x.year), df['date'].apply(lambda x: x.month)
df
Out[18]:
        date  Count  year  month
0 2010-06-30    525  2010      6
1 2010-07-30    136  2010      7
2 2010-08-31    125  2010      8
3 2010-09-30     84  2010      9
4 2010-10-29   4469  2010     10

Concernant la raison pour laquelle il n'a pas analyser ce dans un datetime dans read_csv vous avez besoin pour passer de la position de votre colonne ([0]) parce que quand True il tente d'analyser les colonnes [1,2,3] voir le docs

In [20]:

t="""date   Count
6/30/2010   525
7/30/2010   136
8/31/2010   125
9/30/2010   84
10/29/2010  4469"""
df = pd.read_csv(io.StringIO(t), sep='\s+', parse_dates=[0])
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns (total 2 columns):
date     5 non-null datetime64[ns]
Count    5 non-null int64
dtypes: datetime64[ns](1), int64(1)
memory usage: 120.0 bytes

Donc, si vous passez param parse_dates=[0] à read_csv il ne devrait pas y avoir besoin d'appeler to_datetime sur la "date" de la colonne après le chargement.

Ed - vous aviez raison, je suis sur 0.14.1. toutes mes excuses, je vais essayer de mettre à jour.
Mes mises à jour devrait fonctionner sur votre version, notez également la parse_dates=[0] pour read_csv va analyser correctement les chaînes date en datetime objets de sorte que vous n'avez pas besoin de l'appoint to_datetime appel

InformationsquelleAutor EdChum

Cela fonctionne:

df['date'].dt.year

Maintenant:

df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month

donne à cette trame de données:

        date  Count  year  month
0 2010-06-30    525  2010      6
1 2010-07-30    136  2010      7
2 2010-08-31    125  2010      8
3 2010-09-30     84  2010      9
4 2010-10-29   4469  2010     10

InformationsquelleAutor Mike Müller

2

Ce qui a fonctionné pour moi a été la mise à niveau des pandas à la dernière version:

À partir de la Ligne de Commande n':
```
conda update pandas
```
InformationsquelleAutor Jimmy
1

Quand utiliser dt accesseur

Une source de confusion quand tourne autour de l'utilisation .year et quand utiliser .dt.year.

Le premier est un attribut pour mp.DatetimeIndex objets; le dernier pour mp.Série objets. Considérez ceci dataframe:
```
df = pd.DataFrame({'Dates': pd.to_datetime(['2018-01-01', '2018-10-20', '2018-12-25'])},
                  index=pd.to_datetime(['2000-01-01', '2000-01-02', '2000-01-03']))
```
La définition de la série et l'index se ressemblent, mais la pd.DataFrame constructeur convertit en différents types:
```
type(df.index)     # pandas.tseries.index.DatetimeIndex
type(df['Dates'])  # pandas.core.series.Series
```
La DatetimeIndex objet direct year attribut, tandis que le Series objet doit utiliser le dt accesseur. De même pour month:
```
df.index.month               # array([1, 1, 1])
df['Dates'].dt.month.values  # array([ 1, 10, 12], dtype=int64)
```
Un subtil mais la différence importante à noter est que df.index.month donne un tableau NumPy, tandis que df['Dates'].dt.month donne une Pandas de la série. Ci-dessus, nous utilisons mp.De la série.les valeurs de pour extraire le tableau NumPy représentation.

InformationsquelleAutor jpp

Vous devez vous connecter pour publier un commentaire.

Quand utiliser dt accesseur

Quand utiliser `dt` accesseur