2006-04-01から1ヶ月間の記事一覧

plagger からGoogle desktop のプラグインとかあったらなぁ

gmailで読んでればgmailの未読でもいいのかなぁとか ニュースとかウェブとかをうまく使えばいいのかなぁとかGoogle Desktop: Other Plug-ins http://desktop.google.com/plugins/c/all.htmlここみはってたらそのうち誰か書いてくれないかな。。。作るならGoo…

plagger Subscription::LivedoorReaderをdebianでいれる

dh-make-perl --cpan JSON::Syck --buildしたらエラー きをとりなおして rm -rf YAML-Syck-0.41/ dh-make-perl --cpan YAML::Syck --build dh-make-perl YAML-Syck-0.41/詳しくエラー Found: YAML-Syck 0.41 (libyaml-syck-perl arch=any) String found wher…

perl XML::OPML...

うーん、parseやadd_outlineはうまくいくが、 insertがだめだぁ。。。 まぁparseできればいいのかな。。 ちょとなおそうとしたけど、階層が2になった時点で他のライブラリつかったほうがいいかなとおもった

plagger をdebian on VMware playerで

Knoppix for Plaggerとかんがえてみたけど、そこまでしなくてもよさそなんで ノートPCで実行すると考える(追記:普通のdebian用にもなるということを、ほかにインストールして気づいたかも。) 1.VMware Player Download | VMware Player http://www.vmware…

plaggerでcyclingnews.com

newsisfree経由でしかみれないのかなあ。。。 handle: http://www\.cyclingnews\.com/ extract: <h3 class="red">(.*?)</h3>(.*?)</b></p> extract_capture: title body

plaggerでbloglinesのNYTimes全文フィードできね。。

どうもpermalinkを上書きしてログインページにとばされるようだ。。。 configからURLで指定したときはいけるんだがなぁ。。。 どうやったら書き換えないでいけるんだろ。

plaggerでNewsIsFreeからのサイト

EntryFullTextを雛型にかいたから、いらないのもよみこんでるかも。。。 (何行か削れそうなきがするけど、これでとりあえず動いてる) permalinkをみるべきなのか、linkをみるべきなのか???? package Plagger::Plugin::Filter::NewsIsFree; use strict; …

plaggerのEntryFullTextを書いてみる、テンカウント

http://b.hatena.ne.jp/entrylist?url=http%3A%2F%2Ftencount.blogdb.jp%2F&sort=eid handle: http://tencount.blogdb.jp/? extract: <strong><font size="4">(.*?)</font>(.*?)<table width="100%" border="0" cellpadding="30" cellspacing="0"> extract_capture: title body</table></strong>

plaggerのEntryFullTextを書いてみる、japan.zdnet.com,eweekのもひとつ

japan.zdnet.com handle: http://japan\.zdnet\.com/news extract: <div class="article_header">.*?<h1>(.*?)</h1>(.*?) extract_capture: title bodyeweekがほかのサイトもフィードしてるようだったので handle: http://www\.extremetech\.com/article extract: <span class="headline">(.*?)</span>.*?(</div>

plaggerのEntryFullTextを書いてみる、wired.com,newsforge

Hotwiredは、普通にそのまま全文とれてたので、wired.com, newsforge ただしwiredblogs.tripod.com は、しらない。。 handle: http://www\.wired\.com/news extract: <div class="pgTitle">.*?<h1 class="lg">(.*?)</h1>.*?(<p class="byline">.*?)<div class="clear"> extract_capture: title bodynewsforge handle: http://.*?\.newsforge\</div></p></div>…

plagger、delete_entryとEntryFullText

うーん、EntryFullTextでdelete_entryしたものも、先に流れてるような気がする。 具体的にはpermalinkをrewriteしたというログがでるので、考える。 フィルタの位置がわるいのかなぁともおもったんだけど、よくわからず。。。 feedがredirectされるから?と…

plaggerのEntryFullTextを書いてみる、いろいろ

完全に動作するとはかぎらないようだけど。。。The Register handle: .*?http://www\.theregister\.co extract: <div id="Article">.*?</div><h2>(.*?)</h2>(.*?)<div class="IconsBtm"> extract_capture: title bodyこれもregsiterの1つ handle: .*?http://www\.reghardware\.co extract: <div id="Article"><h2>(.*?)</h2>(.*?)<div id="RelatedBox">…</div></div></div>

plaggerのEntryFullTextを書いてみるeweek

atmarkとかやりたかったんだけど、簡単にかけそうなものから。 handle: http://www\.eweek\.com/article extract: <span class="Article_Title">(.*?)</span>.*?class="Article_Content".*?><p><br>(.*).*?Check out eWEEK.com extract_capture: title body眞鍋かをりのページを読みたかったんだけど、</p>…

plaggerのEntryFullTextを書いてみるitmedia

handle_force: http://www\.itmedia\.co\.jp/news/articles extract: <div class="newart">.*?<h1>(.*?)</h1>.*?(.*?) extract_capture: title body</div>

plaggerのEntryFullTextを書いてみるatmark

newsは前のところにかいた。。。追記とかやめときゃよかったか。。。もっかいのせとこ。。。 handle: http://www\.atmarkit\.co\.jp/news/ extract: (.*?)</H1>.*?(.*?) extract_capture: title bodyimのしたのやつはだいたいこれでとれる? handle_force: http:…

plagger のデータをbrowserで表示しまくる、その2

prototype.jsとscriptaculous.jsが必要だった。。。 けどscriptaculousは全然つかってないので、よみこまなくてもすむかぁ1.plaggerread.htmlと同じディレクトリにprototype.jsを置く 2.plaggerread.htmlと同じディレクトリにscというディレクトリを作りscri…

plagger のデータをbrowserで表示しまくる

iframe使いまくって、Publish::CSV出力されたデータをひたすら画面に表示。 キーバインドはemacs風+vi風AM05:15ころちょと修正@getnext,getprev AM05:30ころpythonをやめてperlに移行パーツは4つで、html*1,js*1,cgi(pl)*2plaggerread.html <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title> 4/1 </title> <script src="prototype.js"></meta></head></html>