ネットサービスとかGoogleとか豆知識とか。

Index > RSS > Yahoo! Pipesに任意のウェブページを切り取って分割できるFetch Pageモジュールが追加された
RSS
2007年12月07日 13:31

Yahoo! Pipesに任意のウェブページを切り取って分割できるFetch Pageモジュールが追加された

  • このエントリーをはてなブックマークに追加
  • ... PV
スポンサード リンク

Yahoo! Pipes任意のウェブページを切り取って分割できるFetch Pageモジュールが追加されたようです。(via Pipes Blog » Blog Archive » New “Fetch Page” module and nice web path enhancement…)

かなり気になったので、早速試してみました。

Fetch Pageモジュールに入力する項目は以下の3つです。

URL:
取得したいページのURLを入力します。

Cut content from ... to ...
Fromとtoに文字列を入力。ページからコンテンツを切り取りたい範囲を指定する。

Split using delimiter:
ここで指定した文字列で切り取ったコンテンツを分割する。特にコンテンツに繰り返し部分がある場合に有効。

たとえば、はてなブックマークのトップページにある「最近の人気エントリー」を抽出したい場合は以下のようにします。

pipes-fetch-page-1.gif

↑ まずは以下のように入力
URL: http://b.hatena.ne.jp/

Cut content
from: <h3><span><a href="/hotentry">最近の人気エントリー</a></span></h3>
to: <li id="more-hotentry"><a href="/hotentry">もっと見る</a></li>

これで出力のプレビューを見てみると、以下のように表示されます。(クリックで拡大)

pipes-fetch-page-2.gif

プレビューではソースをみることもできます。(クリックで拡大)

pipes-fetch-page-3.gif

ソースを見ながら delimiter に指定する文字列を探します。

pipes-fetch-page-4.gif

↑ ここでは <div class="entry-body"> を指定してみました。

そうすると、以下のように出力されます。(クリックで拡大)

pipes-fetch-page-5.gif

↑ このように、おおよそエントリーごとに内容を切り出せていることがわかります。

Fetch Pageモジュールでできるのはこんな感じです。

なお、これがそのままフィードになるわけではありません。RSSフィードとして書き出したいなら、そのほかのモジュールと組み合わせて、itemのtitleやlink、descriptionを構築してあげる必要があります。