NokoGirlはじめ
無性にHTMLをパースしたくなってきたので、はじめての nokogiri を使ってみたよ。
まずはインストール。
$ sudo aptitude install libxml2-dev $ sudo aptitude install libxslt-dev $ sudo gem1.8 install nokogiri
次に簡単なサンプルコードを動かしてみる。
require 'rubygems' require 'nokogiri' html = '<html><body> <div id="taro" class="name">太郎</div> <div id="hanako" class="name">花子</div> </body></html>' doc = Nokogiri::HTML(html) p doc.css("#taro") #=> <div id="taro" class="name">太郎</div> p doc.css(".name") #=> <div id="taro" class="name">太郎</div><div id="hanako" class="name">花子</div> p doc.css(".name").map {|e| e.text } #=> ["太郎", "花子"] p doc.css("div") #=> <div id="taro" class="name">太郎</div><div id="hanako" class="name">花子</div>
css的な感じに要素を指定できるのがうれしいね。これはいいかも。