Informations calcul du Gain avec Scikit-learn
Je suis à l'aide de Scikit-learn pour la classification de textes. Je veux calculer le Gain d'Informations pour chaque attribut à l'égard d'une classe dans un (rare) document-terme de la matrice.
Le Gain d'Informations est défini comme H(Classe) - H(Classe | Attribut), où H est l'entropie.
À l'aide de weka, ce qui peut être accompli avec la InfoGainAttribute. Mais je n'ai pas trouvé cette mesure, scikit-learn.
Cependant, il a été suggéré que la formule ci-dessus pour plus d'Informations Gain est de la même mesure que l'information mutuelle. Cela correspond également à la définition de wikipedia.
Est-il possible d'utiliser un paramétrage spécifique pour l'information mutuelle dans scikit-learn pour accomplir cette tâche?
OriginalL'auteur Characeae | 2017-10-15
Vous devez vous connecter pour publier un commentaire.
Vous pouvez utiliser scikit-learn
mutual_info_classif
voici un exemple
ce sera la sortie d'un dictionnaire de chaque attribut, c'est à dire de l'élément dans le vocabulaire que les clés et leurs informations de gain de valeurs
ici est un exemple de la sortie
OriginalL'auteur sgDysregulation