À l'aide des données catégoriques que des fonctionnalités dans sklean LogisticRegression

Je suis en train d'essayer de comprendre comment utiliser les données catégorielles en tant que fonctions dans sklearn.linear_model's LogisticRegression.

Je comprends bien sûr j'ai besoin de coder.

  1. Ce que je ne comprends pas, c'est comment passer de l'codé en fonction de la régression Logistique il est donc traitée comme une catégorie de fonction, et non de l'interprétation de la valeur int qu'il a obtenu lors de l'encodage standard quantifiables fonctionnalité.

  2. (Moins important) quelqu'un Peut-il expliquer la différence entre l'utilisation de preprocessing.LabelEncoder(), DictVectorizer.vocabulary ou tout simplement l'encodage des données catégorielles vous-même avec une simple dict? Alex A. commentaire ici touche sur le sujet, mais pas très profondément.

Surtout avec le premier!

OriginalL'auteur Optimesh | 2015-11-28