Comment fonctionne removeSparseTerms dans R?

Je suis en utilisant le removeSparseTerms méthode dans la R et il a fallu une valeur de seuil à l'entrée. J'ai lu aussi que plus la valeur est élevée, plus la valeur sera le nombre de termes retenus dans le retour de la matrice.

Comment cette méthode de travail et quelle est la logique derrière cela? Je comprends le concept de rareté, mais ne ce seuil indiquer le nombre de documents devraient à terme être présents, ou tout autre ratio, etc?

source d'informationauteur London guy