Drop ligne dans les Pandas de la Série et de nettoyer les index

J'ai une Pandas Série et basé sur un nombre aléatoire je veux choisir une ligne (5 dans l'exemple de code ci-dessous) et de la baisse de la ligne. Lorsque la ligne est abandonnée je veux créer un nouvel index pour les lignes restantes (0 à 8). Le code ci-dessous:

print 'Original series: ', sample_mean_series
print 'Length of original series', len(sample_mean_series)
sample_mean_series = sample_mean_series.drop([5],axis=0)
print 'Series with item 5 dropped: ', sample_mean_series
print 'Length of modified series:', len(sample_mean_series)
print sample_mean_series.reindex(range(len(sample_mean_series)))

Et c'est la sortie:

Original series:  
0    0.000074
1   -0.000067
2    0.000076
3   -0.000017
4   -0.000038
5   -0.000051
6    0.000125
7   -0.000108
8   -0.000009
9   -0.000052
Length of original series 10
Series with item 5 dropped:  
0    0.000074
1   -0.000067
2    0.000076
3   -0.000017
4   -0.000038
6    0.000125
7   -0.000108
8   -0.000009
9   -0.000052
Length of modified series: 9
0    0.000074
1   -0.000067
2    0.000076
3   -0.000017
4   -0.000038
5         NaN
6    0.000125
7   -0.000108
8   -0.000009

Mon problème est que la ligne numéro 8 est supprimé. Je souhaite supprimer la ligne "5 NaN" et de garder -0.000052 avec un indice de 0 à 8. C'est ce que je veux qu'il ressemble:

0    0.000074
1   -0.000067
2    0.000076
3   -0.000017
4   -0.000038
5    0.000125
6   -0.000108
7   -0.000009
8   -0.000052

OriginalL'auteur Jonas | 2013-01-23

9

Un peu prêter à confusion, reindex ne signifie pas "créer un nouvel index". Pour créer un nouvel index, tout de céder à la index attribut. Donc, à votre dernière étape, il suffit de ne sample_mean_series.index = range(len(sample_mean_series)).

Merci pour cette claire & concise réponse! Cependant, je suis confus de ce qui SE passe dans Ahlden l'exemple. Est la re-index en disant: "créer une nouvelle série de lacunes dans les indices, où tout manque indices sont remplis avec des valeurs NaN"? Il semble que c'est ce qui se passe, mais cela semble fou. Aussi, serait-il si les indices sont a, b, c, e au lieu de 0, 1, 2, 4 ?
Oui, c'est principalement ça. À l'aide de reindex[blah] juste sélectionne des lignes, un peu comme faire df.ix[blah], et comme ça il vous donne NaN, si ceux que vous demandez n'existe pas. Elle a quelques options pour remplir les NaNs, mais je n'ai jamais vraiment compris le point de réindexer, sans parler de son nom.
en fait, il y a un reset_index méthode qui numérote automatiquement les lignes pour vous.

OriginalL'auteur BrenBarn
9

Voici un one-liner:
```
In [1]: s
Out[1]:
0   -0.942184
1    0.397485
2   -0.656745
3    1.415797
4    1.123858
5   -1.890870
6    0.401715
7   -0.193306
8   -1.018140
9    0.262998
```
- Je utiliser le Series.drop méthode à la baisse de la ligne 5 et ensuite utiliser reset_index de re-numéroter les indices consécutifs. Sans l'aide de reset_index, les indices de sauter de 4 à 6 par pas de 5.

Par défaut, reset_index permettra de déplacer l'index d'origine dans un DataFrame et de retour aux côtés de la série de valeurs. En passant drop=True empêche que cela se produise.
```
In [2]: s2 = s.drop([5]).reset_index(drop=True)

In [3]: s2
Out[3]:
0   -0.942184
1    0.397485
2   -0.656745
3    1.415797
4    1.123858
5    0.401715
6   -0.193306
7   -1.018140
8    0.262998
Name: 0
```
Pourriez-vous veuillez expliquer votre réponse?
J'ai expliqué ma réponse et mis à jour pour être plus clair.

OriginalL'auteur Zelazny7

Vous devez vous connecter pour publier un commentaire.