tf-idf fonction de poids en utilisant des sklearn.feature_extraction.texte.TfidfVectorizer

cette page: http://scikit-learn.org/stable/modules/feature_extraction.html mentionne:

Que tf–idf est très souvent utilisé pour les fonctions de texte, il y a aussi une autre classe appelée TfidfVectorizer qui combine toutes les option de CountVectorizer et TfidfTransformer dans un modèle unique.

puis j'ai suivi le code et l'utilisation fit_transform() sur mon corpus. Comment faire pour obtenir le poids de chaque fonction calculée par fit_transform()?

J'ai essayé:

In [39]: vectorizer.idf_
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-39-5475eefe04c0> in <module>()
----> 1 vectorizer.idf_

AttributeError: 'TfidfVectorizer' object has no attribute 'idf_'

mais cet attribut est manquant.

Grâce

  • À en juger par la examles dans la documentation, je dirais que vous êtes censé utiliser la valeur de retour de vectorizer.fit_transform(corpus).
  • la valeur de retour est un scipy sparse_matrix qui stockent du normalisée en fonction.
InformationsquelleAutor fast tooth | 2014-05-21