Peut sklearn forêt aléatoire de traiter directement catégorique fonctionnalités?

Dire que j'ai catégorique de la fonctionnalité, de la couleur, qui prend les valeurs

['rouge', 'bleu', 'vert', 'orange'],

et je veux l'utiliser pour prédire quelque chose dans une forêt aléatoire. Si je "one-hot" coder (c'est à dire je l'ai changer pour quatre variables muettes), comment dois-je dire à sklearn que les quatre variables muettes sont vraiment une variable? Plus précisément, lorsque sklearn est au hasard de sélectionner les fonctions à utiliser dans les différents nœuds, il devrait inclure le rouge, le bleu, le vert et l'orange mannequins ensemble, ou il ne devrait pas inclure l'un d'eux.

J'ai entendu dire qu'il n'y a aucun moyen de le faire, mais j'imagine que il doit y avoir un moyen de traiter avec les variables catégorielles sans arbitrairement de codage comme des numéros ou quelque chose comme ça.

InformationsquelleAutor hahdawg | 2014-07-12