F.Ko-Jiの「一秒後は未来」

Yahoo! Pipesに任意のウェブページを切り取って分割できるFetch Pageモジュールが追加された

Yahoo! Pipes任意のウェブページを切り取って分割できるFetch Pageモジュールが追加されたようです。(via Pipes Blog » Blog Archive » New “Fetch Page” module and nice web path enhancement…)

かなり気になったので、早速試してみました。

Fetch Pageモジュールに入力する項目は以下の3つです。

URL:
取得したいページのURLを入力します。

Cut content from … to …
Fromとtoに文字列を入力。ページからコンテンツを切り取りたい範囲を指定する。

Split using delimiter:
ここで指定した文字列で切り取ったコンテンツを分割する。特にコンテンツに繰り返し部分がある場合に有効。

たとえば、はてなブックマークのトップページにある「最近の人気エントリー」を抽出したい場合は以下のようにします。

pipes-fetch-page-1.gif

↑ まずは以下のように入力
URL: http://b.hatena.ne.jp/

Cut content
from: <h3><span><a href=”/hotentry”>最近の人気エントリー</a></span></h3>
to: <li id=”more-hotentry”><a href=”/hotentry”>もっと見る</a></li>

これで出力のプレビューを見てみると、以下のように表示されます。(クリックで拡大)

pipes-fetch-page-2.gif

プレビューではソースをみることもできます。(クリックで拡大)

pipes-fetch-page-3.gif

ソースを見ながら delimiter に指定する文字列を探します。

pipes-fetch-page-4.gif

↑ ここでは <div class=”entry-body”> を指定してみました。

そうすると、以下のように出力されます。(クリックで拡大)

pipes-fetch-page-5.gif

↑ このように、おおよそエントリーごとに内容を切り出せていることがわかります。

Fetch Pageモジュールでできるのはこんな感じです。

なお、これがそのままフィードになるわけではありません。RSSフィードとして書き出したいなら、そのほかのモジュールと組み合わせて、itemのtitleやlink、descriptionを構築してあげる必要があります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など