plaggerのEntryFullTextを書いてみるeweek
atmarkとかやりたかったんだけど、簡単にかけそうなものから。
handle: http://www\.eweek\.com/article extract: <span class="Article_Title">(.*?)</span>.*?class="Article_Content".*?><p><br>(.*)<!-- start ziffimage //-->.*?Check out eWEEK.com extract_capture: title body
眞鍋かをりのページを読みたかったんだけど、フィルタうまくかけず。。。
handle: http://manabekawori\.cocolog\-nifty\.com/blog extract: <div class="entry-body-text">(.*?)<div class="entry-trackback"> extract_capture: body
feedに広告が入ってるやつがうまくとりだせなかったり、、、
うーん。
追記:@ITのnewsもとってみようとしてみた
handle: http://www\.atmarkit\.co\.jp/news/ extract: <!-- #BeginEditable "%93%E0%97e" -->(.*?)<!-- #EndEditable --></H1>.*?<!-- #BeginEditable "%96%7B%95%B6" -->(.*?)<!-- #EndEditable --> extract_capture: title body
これでも全部がとれるわけじゃない。。。っておもったら、miyagawaさんのコメントにあるように
rssadがはいってるやつがとれないようだ。
追記2: handle_force
うえの、@ITのやつは、
handle:
を
handle_force:
にすれば無事に読める感じでした。