comment créer des mannequins pour certaines colonnes par les pandas get_dummies() la méthode?
df = pd.DataFrame({'A': ['x', 'y', 'x'], 'B': ['z', 'u', 'z'],
'C': ['1', '2', '3'],
'D':['j', 'l', 'j']})
Je veux juste la Colonne A et D pour obtenir les nuls pas pour la Colonne B. Si j'ai utilisé pd.get_dummies(df)
, toutes les colonnes transformé en nuls.
Je veux que le résultat final contenant toutes les colonnes , ce qui signifie que la colonne C et de la colonne B à la sortie,comme 'A_x','A_y','B','C','D_j','D_l'
.
OriginalL'auteur Jack | 2016-05-17
Vous devez vous connecter pour publier un commentaire.
Il peut être fait sans la concaténation, à l'aide de get_dummies() avec les paramètres requis
OriginalL'auteur knagaev
Ajoutant au-dessus de réponses parfaites, dans le cas où vous avez un grand ensemble de données avec beaucoup d'attributs, si vous ne souhaitez pas spécifier à la main toutes les nuls vous le souhaitez, vous pouvez faire de jeu de différences:
OriginalL'auteur Patric Fulop
Il suffit de sélectionner les deux colonnes que vous voulez
.get_dummies()
pour -column
noms l'indiquent colonne de la source et étiquette de la variable représentée comme variable binaire, etpd.concat()
l'origine des colonnes que vous souhaitez inchangé:Ajout de quelques détails, espérons que cette aide.
mais je veux que le résultat final contenant toutes les colonnes , ce qui signifie que la colonne C et de la colonne B à la sortie.
Le ci-dessus a des mannequins pour les colonnes
A
etD
. Qui d'autres colonnes que vous voulez? Pourriez-vous peut-être montrer ce que le résultat souhaité?Je pense avoir mis à jour le résultat @StefanJansen
OriginalL'auteur Stefan