Web Scraping avec Scala

Demandais juste si quelqu'un connaît un site web de grattage de la bibliothèque qui prend avantage de la Scala succincte de la syntaxe. Jusqu'à présent, j'ai trouvé Chafe, mais cela semble mal documentés et mis à jour. Je me demandais si quelqu'un là-bas a fait racler avec Scala et a des conseils. (Je suis en train de l'intégrer dans un Scala cadre plutôt que d'utiliser un grattoir écrit, par exemple, Python.)

  • Le racleur de libs qui peu travaillé pour moi sont httpunit et interface htmlunit. Mais ils sont les bibliothèques Java et non explicitement Scala.
  • Lorsqu'ils sont confrontés à un problème similaire, j'ai trouvé ce Scala HTML bibliothèque utile. C'est un peu vieux, mais encore a fait le tour pour moi. J'ai enveloppé avec un TAS de construire ici. HTH
  • Juste pour informer que j'ai écrit un souteneur Jsoup: github.com/filosganga/ssoup
  • J'ai écrit un DSL pour construire de grattage Akka acteur systèmes, il utilise JSoup et de jet-client sous le capot. Le DSL fourni manipule un immuable contexte (inspiré par pulvérisation de routage), on peut trouver ici: github.com/bfil/scalescrape
  • J'aime vraiment cet article montrant comment le faire racler avec akka: foat.me/articles/ramper avec akka