extrait de chaîne unique à partir de HTML à l'aide de Ruby/Mécaniser (et Nokogiri)

Je suis de l'extraction des données à partir d'un forum. Mon script basé sur fonctionne bien. Maintenant, j'ai besoin d'extraire la date et de l'heure (21 Déc 2009, 20:39) de même post. Je ne peux pas le faire fonctionner. J'ai utilisé FireXPath pour déterminer le xpath.

Exemple de code:

 require 'rubygems'
 require 'mechanize'

   post_agent = WWW::Mechanize.new
    post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')
    puts  post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
    puts  post_page.parser.at_xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
    puts post_page.parser.xpath('//[@id="post1960370"]/tbody/tr[1]/td/div[2]/text()')

toutes mes tentatives se soldent avec une chaîne vide ou un message d'erreur.


Je ne trouve aucune documentation sur l'utilisation de Nokogiri au sein de Mécaniser. Le Mécaniser la documentation dit au bas de la page:

Après que vous avez utilisé Mécaniser pour naviguer jusqu'à la page que vous avez besoin de gratter, puis gratter à l'aide Nokogiri méthodes.

Mais quelles méthodes? Où puis-je lire à leur sujet avec des échantillons et explique la syntaxe? Je n'ai rien trouvé sur Nokogiri du site.

OriginalL'auteur Radek | 2010-01-22