Plaggerでまぐまぐ!のバックナンバーを読む

先日書いた通り初めてのPerlを読み始めた。JavaScriptの数倍の早さで読み進んでる。今8章。トレーニングコースのテキストが元になっているだけあって内容がわかりやすく、しかも文章がかなり読みやすい。少し不満なのは練習問題が少ないことかな。

そこで、練習問題不足を補うために結城さんのPerlクイズのバックナンバーを読んでみることにしたんだけど、フィードが最新15件分しか出力されていない。htmlで読んでもいいんだけど、これPlaggerで出来る…はずと思いチャレンジしてみた。

EFT - magmag.yaml

author: watta
custom_feed_handle: http://blog\.mag2\.com/m/log/\d{10}/
custom_feed_follow_link: /m/log/\d{10}/\d+\.html$
handle: http://blog\.mag2\.com/m/log/\d{10}/\d+\.html
extract: (<pre><tt>.*?</tt></pre>)
extract_capture: body

config.magmag.yaml

global:
  plugin_path:
    - /path/to/plagger/assets/plugins
  assets_path: /path/to/plagger/assets
  timezone: Asia/Tokyo

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://blog.mag2.com/m/log/0000015670/

  - module: Filter::Rule
    rule:
      module: Deduped

  - module: Filter::EntryFullText
    config:
      force_upgrade: 1

  - module: Filter::BreakEntriesToFeeds

  - module: Publish::Gmail
    config:
      mailto: example+plagger@gmail.com
      mailfrom: example@gmail.com
      mailroute:
        via: smtp_tls
        host: smtp.gmail.com:587
        username: example
        password: password
?page=10とかをたどってないので最初のページにある20件しか取得できてない
これを改善するために試行錯誤してたんだけど、改めてcustom_feed_handlecustom_feed_follow_linkの意味を考えてみたら\?page=\d+とかを着けても意味無いんじゃないかと思えてきた。pagerをたどっていってそこでfollow_linkしてくれるようには出来ないのかな。
Gmailでスレッドとしてまとまってくれない
これはGmail側の問題かな。FromもToもSubjectも一緒なのになぜだろう。

と、ここまで書いてから色々調べてたら、assetsディレクトリのplファイルが、yamlの設定だけでは簡単にEFTをとってこれない場合に必要ぽいことがわかった。あとで他のをまねして書いてみる。

今の知識じゃ無理そうだ。