Performant d'analyse de pages avec Node.js et XPath

Je suis dans le web scraping avec Node.js. Je voudrais utiliser XPath que je peux générer des semi-automatiquement avec plusieurs sortes de GUI. Le problème est que je ne peux pas trouver une façon de le faire efficacement.

  1. jsdom est extrêmement lent. C'est l'analyse 500KiB fichier de une minute avec une pleine charge CPU et une lourde empreinte mémoire.
  2. Bibliothèques populaires pour analyse HTML (par exemple,cheerio) ni de support de XPath, ni exposer conforme au W3C DOM.
  3. Efficace d'analyse HTML est, bien évidemment, mis en œuvre dans WebKit, donc à l'aide d' phantom ou casper serait une option, mais ceux-ci exigent d'être en cours d'exécution dans une manière spéciale, et pas seulement node <script>. Je ne peut pas compter sur le risque impliqué par ce changement. Par exemple, il est beaucoup plus difficile de trouver comment exécuter node-inspector avec phantom.
  4. Spooky est une option, mais c'est buggy assez, de sorte qu'il ne fonctionne pas sur ma machine.

Quel est le bon chemin pour parser une page HTML avec XPath alors?