plaggerのEntryFullTextを書いてみるeweek

atmarkとかやりたかったんだけど、簡単にかけそうなものから。

handle: http://www\.eweek\.com/article
extract: <span class="Article_Title">(.*?)</span>.*?class="Article_Content".*?><p><br>(.*)<!-- start ziffimage //-->.*?Check out eWEEK.com
extract_capture: title body

眞鍋かをりのページを読みたかったんだけど、フィルタうまくかけず。。。

handle: http://manabekawori\.cocolog\-nifty\.com/blog
extract: <div class="entry-body-text">(.*?)<div class="entry-trackback">
extract_capture: body

feedに広告が入ってるやつがうまくとりだせなかったり、、、
うーん。

追記：@ITのnewsもとってみようとしてみた

handle: http://www\.atmarkit\.co\.jp/news/
extract: <!-- #BeginEditable "%93%E0%97e" -->(.*?)<!-- #EndEditable --></H1>.*?<!-- #BeginEditable "%96%7B%95%B6" -->(.*?)<!-- #EndEditable -->
extract_capture: title body

これでも全部がとれるわけじゃない。。。っておもったら、miyagawaさんのコメントにあるように
rssadがはいってるやつがとれないようだ。

追記2： handle_force
うえの、@ITのやつは、

handle:

を

handle_force:

にすれば無事に読める感じでした。