Une façon d'obtenir des cartographies de l'étiquette de codeur en langage Python pandas?
Je suis la conversion de chaînes en catégorique valeurs dans mon jeu de données en utilisant le morceau de code suivant.
data['weekday'] = pd.Categorical.from_array(data.weekday).labels
Par exemple,
index weekday
0 Sunday
1 Sunday
2 Wednesday
3 Monday
4 Monday
5 Thursday
6 Tuesday
Après encodage, le jour de la semaine, mon dataset s'affiche comme ceci:
index weekday
0 3
1 3
2 6
3 1
4 1
5 4
6 5
Est il possible que je peux savoir que le dimanche a été cartographiés à 3, mercredi 6 et ainsi de suite?
OriginalL'auteur Gingerbread | 2017-02-13
Vous devez vous connecter pour publier un commentaire.
La meilleure façon de le faire peut être d'utiliser l'étiquette de l'encodeur de sklearn bibliothèque.
Quelque chose comme ceci:
OriginalL'auteur Algor Troy
Vous pouvez créer un dictionnaire supplémentaire avec la cartographie:
OriginalL'auteur chinskiy
Un simple & manière élégante de faire de même.
et vous êtes fait, découvrez ci-dessous
OriginalL'auteur Abhishek
Il y a beaucoup de façons de le faire. Vous pouvez envisager de
pd.factorize
,sklearn.preprocessing.LabelEncoder
etc. Toutefois, dans ce cas précis, vous avez deux options qui vous conviennent le mieux:De passer par votre propre méthode, vous pouvez ajouter les catégories:
L'autre option est de les valeurs de la carte directement à l'aide d'un
dict
OriginalL'auteur ssm
Faire un premier catégorique de la série:
Puis, inspecter ses "catégories":
OriginalL'auteur John Zwinck
Si vous avez numérique et catégorique à la fois de type de données dans dataframe
Vous pouvez utiliser : ici X est mon dataframe avoir catégorielles et numériques de deux variables
Ou vous pouvez essayer ceci:
Remarque: Cette technique est bonne si vous n'êtes pas intéressé à les convertir en arrière.
OriginalL'auteur Vikas Gupta