Déterminer si le texte est en anglais?

Je suis en utilisant à la fois Nltk et Scikit Learn à faire certains de traitement de texte. Cependant, dans ma liste de documents que j'ai quelques documents qui ne sont pas en anglais. Par exemple, les activités suivantes pourraient être remplies:

[ "this is some text written in English", 
  "this is some more text written in English", 
  "Ce n'est pas en anglais" ] 

Pour les fins de mon analyse, je veux toutes les peines qui ne sont pas en anglais pour être supprimés dans le cadre de pré-traitement. Cependant, est-il une bonne façon de le faire? J'ai cherché sur Google, mais ne peut pas trouver quelque chose de précis qui me permettra de reconnaître si les chaînes sont en anglais ou pas. Est-ce quelque chose qui n'est pas offert que la fonctionnalité soit Nltk ou Scikit learn? MODIFIER j'ai vu des questions à la fois comme cette et cette mais les deux sont pour mots individuels... Pas de "document". Je boucle à travers chaque mot dans une phrase pour vérifier si l'ensemble de la phrase est en anglais?

Je suis à l'aide de Python, de sorte que les bibliothèques qui sont en Python serait préférable, mais je peux changer de langue si nécessaire, juste pensé que Python serait le meilleur pour cette.

OriginalL'auteur ocean800 | 2017-04-12