Analyse de régression linéaire avec des caractéristiques de chaîne / catégorie (variables)?

Régression des algorithmes semblent être de travailler sur les fonctions représentées par des nombres.
Par exemple:

Analyse de régression linéaire avec des caractéristiques de chaîne /catégorie (variables)?

Cet ensemble de données ne contient pas catégorique fonctions/variables. Il est assez clair que la façon de faire de régression sur ces données et de prédire les prix.


Mais maintenant, je veux faire une analyse de régression sur les données qui contiennent catégorique caractéristiques:

Analyse de régression linéaire avec des caractéristiques de chaîne /catégorie (variables)?

Il y a 5 caractéristiques: DistrictConditionMaterialSecurityType


Comment puis-je faire de régression sur ces données? Dois-je transformer toute cette chaîne/catégorique de données de numéros manuellement? Je veux dire, si je dois créer des règles de codage et selon les règles de transformer toutes les données en valeurs numériques. Est-il un moyen simple de transformer la chaîne de données de numéros sans avoir à créer ses propres règles de codage manuellement? Peut-être il ya un certain nombre de bibliothèques dans Python qui peuvent être utilisées pour qui? Y at-il des risques que le modèle de régression sera d'une certaine manière incorrecte à cause du "mauvais encodage"?

source d'informationauteur Chichi | 2015-11-30