2006-04-14から1日間の記事一覧

plaggerのEntryFullTextを書いてみる、テンカウント

http://b.hatena.ne.jp/entrylist?url=http%3A%2F%2Ftencount.blogdb.jp%2F&sort=eid handle: http://tencount.blogdb.jp/? extract: <strong><font size="4">(.*?)</font>(.*?)<table width="100%" border="0" cellpadding="30" cellspacing="0"> extract_capture: title body</table></strong>

plaggerのEntryFullTextを書いてみる、japan.zdnet.com,eweekのもひとつ

japan.zdnet.com handle: http://japan\.zdnet\.com/news extract: <div class="article_header">.*?<h1>(.*?)</h1>(.*?) extract_capture: title bodyeweekがほかのサイトもフィードしてるようだったので handle: http://www\.extremetech\.com/article extract: <span class="headline">(.*?)</span>.*?(</div>

plaggerのEntryFullTextを書いてみる、wired.com,newsforge

Hotwiredは、普通にそのまま全文とれてたので、wired.com, newsforge ただしwiredblogs.tripod.com は、しらない。。 handle: http://www\.wired\.com/news extract: <div class="pgTitle">.*?<h1 class="lg">(.*?)</h1>.*?(<p class="byline">.*?)<div class="clear"> extract_capture: title bodynewsforge handle: http://.*?\.newsforge\</div></p></div>…

plagger、delete_entryとEntryFullText

うーん、EntryFullTextでdelete_entryしたものも、先に流れてるような気がする。 具体的にはpermalinkをrewriteしたというログがでるので、考える。 フィルタの位置がわるいのかなぁともおもったんだけど、よくわからず。。。 feedがredirectされるから?と…

plaggerのEntryFullTextを書いてみる、いろいろ

完全に動作するとはかぎらないようだけど。。。The Register handle: .*?http://www\.theregister\.co extract: <div id="Article">.*?</div><h2>(.*?)</h2>(.*?)<div class="IconsBtm"> extract_capture: title bodyこれもregsiterの1つ handle: .*?http://www\.reghardware\.co extract: <div id="Article"><h2>(.*?)</h2>(.*?)<div id="RelatedBox">…</div></div></div>