NokoGirlはじめ

片腕マシンガール【初回限定生産 】 [DVD2枚組 ]

無性にHTMLをパースしたくなってきたので、はじめての nokogiri を使ってみたよ。

まずはインストール。

$ sudo aptitude install libxml2-dev
$ sudo aptitude install libxslt-dev
$ sudo gem1.8 install nokogiri

次に簡単なサンプルコードを動かしてみる。

require 'rubygems'
require 'nokogiri'
html = '<html><body>
  <div id="taro" class="name">太郎</div>
  <div id="hanako" class="name">花子</div>
</body></html>'
doc = Nokogiri::HTML(html)
p doc.css("#taro") #=> <div id="taro" class="name">太郎</div>
p doc.css(".name") #=> <div id="taro" class="name">太郎</div><div id="hanako" class="name">花子</div>
p doc.css(".name").map {|e| e.text } #=> ["太郎", "花子"]
p doc.css("div") #=> <div id="taro" class="name">太郎</div><div id="hanako" class="name">花子</div>

css的な感じに要素を指定できるのがうれしいね。これはいいかも。