Convertir HTML en texte brut en JS sans navigateur environnement

J'ai un CouchDB voir le plan de la fonction qui génère un résumé d'un document HTML (première x caractères de texte). Malheureusement je n'ai pas d'environnement de navigateur pour convertir HTML en texte brut.

Actuellement, je utiliser ce multi-étape regexp

html.replace(/<style([\s\S]*?)<\/style>/gi, ' ')
    .replace(/<script([\s\S]*?)<\/script>/gi, ' ')
    .replace(/(<(?:.|\n)*?>)/gm, ' ')
    .replace(/\s+/gm, ' ');

alors que c'est un très bon filtre, il n'est évidemment pas parfait et quelques restes de glisser à travers, parfois. Est-il un meilleur moyen de convertir en texte brut sans un environnement de navigateur?

il peut venir vers le bas à l'aide de regex que vous avez énumérés, pour l'essentiel, de remplace et ensuite à l'aide d'une liste spécifiée remplace, tels que :actif; pour compléter le nettoyage.
stackoverflow.com/a/29706729/3338098 préserve de nouvelles lignes et de bandes de balises html

OriginalL'auteur Erik Aigner | 2013-03-02