読者です 読者をやめる 読者になる 読者になる

PlaggerのEntryFullTextとかCustomFeedConfigとか

NHKオンラインのEntryFullText

custom_feed_handle: http://www\.nhk.or\.jp/event/prog/prog_main\.html
custom_feed_follow_link: /event/prog/.*?\.html$
handle: http://www\.nhk.or\.jp/event/prog/.*?\.html$
extract: <title>(.*?)</title>.*?<!--イベント概略-->(.*?)<!--イベント詳細end-->
extract_capture: title body

ミュージックマシーン跡地のCustomFeedConfig

match: http://www\.musicmachine\.jp/
extract: <tr>.*?<td bgcolor="#009933"><font color="#FFFFFF">(.*?)</font></td>.*?</tr>.*?<td>(.*?)</td>
extract_capture: title body

そのまんま日記のCustomFeedConfig

match: http://www\.zunou\.com/higashi/diary2\.cgi
extract: <table border=2 cellpadding=0 width=90%><TR><TD bgcolor="floralwhite"><dl><dt><img src="./IMAGE/diary(?:new)?.gif" width=30 height=16><font size=3 color="black"><B>(.*?</B></font><font color="black">.*?)<P><dd>(.*?)</font></dl></TD></TR></table>
extract_capture: title body
extract_after_hook: $data->{title} =~ s!</B></font><font color="black">!!;

FM FUJIゲスト情報のCustomFeedConfig

match: http://www\.fmfuji\.co\.jp/guest\.html
extract_xpath:
  title: //table[@cellspacing="1"]//tr[position()>1]
extract_after_hook: |
  $data->{title} =~ s!<td.*?>(.*?)</td>!\1 !g;
  $data->{title} =~ s!<tr>(.*?)</tr>!\1!;