F.Ko-Jiの「一秒後は未来」ではウェブやSEO、API、RSSといった技術的ネタから、ちょっとした豆知識や梅酒、エンタメ系まで様々な情報を不定期にお届けしています。

F.Ko-Jiの「一秒後は未来」 > RSS > SUP(Simple Update Protocol) - 効率的なフィードのクロールを実現するためのプロトコル

SUP(Simple Update Protocol) - 効率的なフィードのクロールを実現するためのプロトコル

  • B!
スポンサード リンク

更新されたフィードを効率的にクロールするための Simple Update Protocol (SUP) というプロトコルが FriendFeed の開発者によって提案されているそうです。

フィードがブログやサイトの更新情報を伝えるものなら、SUPはフィードそのものの更新情報を伝えるためのプロトコルだと理解することができます。

以下は関連記事を読んで私なりに解釈したSUPの説明です。

通常、あるフィードが更新されているかどうかはそのURLをリクエストしてみなければ分かりません。

たとえばクローラーが FriendFeed の全ユーザのフィードを定期的にチェックしていたとすると、クローラーはある順番にしたがって定期的に全フィードのURLをリクエストするでしょう。これでは更新の取得に遅延が発生してしまいます。

しかし、SUPを利用すればどのフィードが更新されているかをあらかじめ知ることができます。

たとえばクライアントは、FriendFeedのサーバに対して「ある期間内に更新されたフィードはどれですか?」と聞くことができます。サーバは更新されたフィードのSUP-IDをリストにして返します。それによってクローラーは確実に更新されているフィードを知ることができ、効率的にフィードをクロールすることができます。

要するに、はてなブックマークやTwitterやdel.icio.usやFeedBurnerといった、多数のフィードを配信しているサービスがSUPを実装していると、かなり有用なわけです。

すでに FriendFeed では http://friendfeed.com/api/sup.json からSUPフィードを取得することができます。

SUPを利用した場合の処理の流れは次のようになるでしょう。

  1. フィードを配信するサーバは、RSSやAtomに特別なlinkタグをつけます。そのlinkタグにSUP-IDが含まれていて、クライアントはそのSUP-IDとフィードのURLをデータベースに格納しておきます。
  2. クライアントはSUPフィードをリクエストします。
  3. リクエストを受けたサーバは、(指定された)期間内に更新されたフィードを確認し、それらのSUP-IDをリスト化し、SUPのフォーマットにしてレスポンスを返します。
  4. クライアントはSUPフィードを解析し、含まれるSUP-IDをデータベースと照合してURLを取得し、そのURLをクロールします。

これによりクライアント側は更新されたフィードを素早く知ることができ、サーバ側はリクエストの負荷を下げることができます。また、SUP-IDは完全にランダムな文字列なので、SUPによってプライベートなフィードのURLが外部に漏れるもこともありません。

SUP はオープンソースで、来月にリリースが予定されているそうです。

【関連記事】
» フィード更新速度を加速する新プロトコルsup - huixingの日記
» Speed Up RSS? FriendFeed's Going to Try - ReadWriteWeb
» FriendFeed Blog: Simple Update Protocol: Fetch updates from feeds faster
» simpleupdateprotocol - Google Code

[2010-01-12] RSS フィードの URL が変わりました。お手数ですが RSS リーダーへの再登録をお願いします。
Subscribe with livedoor Reader Add to Google Subscribe with Fastladder My Yahoo!に追加 Bloglinesで閲読登録 はてなRSSに追加 エキサイトリーダーに登録


コメントを投稿

(承認されるまでコメントは表示されません。)

RSS

English version

前のエントリー: « 松木里菜の関連検索ワードに出る「劇団ひとり」の謎
次のエントリー: 大雨で濡れた靴をフリーペーパーを使って乾かす »

トラックバック

このエントリーのトラックバックURL:

この一覧は、次のエントリーを参照しています: SUP(Simple Update Protocol) - 効率的なフィードのクロールを実現するためのプロトコル:

» RSSの購読を効率化するための PubSubHubbub というプロトコルがあるらしい from F.Ko-Jiの「一秒後は未来」
記事を書いてからRSSリーダーにその記事が反映されるまでにタイムラグはつきもの。最近はTwitterのリアルタイム性が注目されていてRSSリーダーはだめだ... [詳しくはこちら]

タイトル:

URL:

リンク用HTMLタグ:

Agile Media Network

AMN Partner Blog

広告掲載について

東京ナイロンガールズ
最近の注目記事
持っているガジェット
powered by Gadget Party
最近のつぶやき
えもにゅ

↑ 気持ち記録サービス「えもにゅ」です

このブログの読者になる

F.Ko-Jiの「一秒後は未来」 - RSSフィード

クマでもわかるこのブログの便利な更新チェック方法

DailyFeed

あわせて読みたいブログパーツ

フィードメーター - F.Ko-Jiの「一秒後は未来」

月別アーカイブ


<< March 2010
SuMoTuWeThFrSa
 123456
78910111213
14151617181920
21222324252627
28293031 
人気エントリー
TopHatenar
携帯からのアクセスは
QRコード
http://mob.fkoji.com/