すらいむがあらわれた

こまんど >  たたかう  にげる

Subscription::Config + CustomFeed::Simple + Filter::EntryFullTextが凄い

PlaggerでFeed以外のページを扱えないだろうか?といろいろ調べてみたところ、やっぱり扱えるようです。


以下、Plagger
@IT: .NET TIPS 日付順インデックス
http://www.atmarkit.co.jp/fdotnet/dotnettips/index/date.html
の.NET TipsのHTMLを抽出してGmailなどに転送する方法です。


http://subtech.g.hatena.ne.jp/otsune/20060601/atmarkithoge
をまねして@IT用のyamlを書く。
atmarkit-misc.yaml


handle: http://www\.atmarkit\.co\.jp/
extract: (?:<!-- #BeginEditable "(?:%96%7B%95%B6|%93%E0%97e)" -->)
(.*?)(?:<!-- #EndEditable -->)
extract_capture: body
たまにこれに引っかからない記事があるんだけど、原因は追求できてません。


config.yamlの該当箇所をこんな感じで書く。
globalと出力部分はお好みで。


plugins:
- module: Subscription::Config
config:
feed:
- url: http://www.atmarkit.co.jp/fdotnet/dotnettips/index/date.html
meta:
follow_link: /dotnettips/

- module: CustomFeed::Simple

- module: Filter::ResolveRelativeLink

- module: Filter::EntryFullText
config:
store_html_on_failure: 1

- module: Filter::BreakEntriesToFeeds

出力をGmailにしたら、Gmailの受信トレイに380通くらいのメールがどっさり。
.NET Tipsをまるまる自分のGmailに転送成功。

本って捨てられないですよね

id:naoya氏は本を読まないタイプの人*1なのかと思っていたら、結構本を持ってるんですね。
http://d.hatena.ne.jp/naoya/20060604/1149377759
他人の本棚を見るのが好きなので、おもわず写真に載っている本をいろいろ観察してしまいました。。。
RubyやCの本がありますね。おやC#の本も。資格試験の参考書らしきものも。
そして整理を経て残った本にはオライリーが多い。


私もオライリーの本をよく買いますが、まだ捨てたり売ったりしたことがありません。オライリーの本には1冊1冊に購入に至るまでの思い入れがあるんです。いつか欲しい!と思い続けて、ある日ついに決心してレジに持って行ったり、Amazonで購入ボタンを押したりとか。そうやって買ったオライリー本をちゃんと全て読破してるかどうかはまた別なのですが。。。

*1:悪い意味ではありません。1冊を熟読するか、Web系のプログラミングだと仕様書がWeb上にあることも多いので書籍ではなくそういう仕様を読むタイプなのかなと