GoogleはTwitterのリアルタイムストリームからブログの更新を見つけている?
以前からなんとなく思っていたことで確証はあまりないのですが、TwitterとGoogle Readerがなんらかの連携をしているような気がしています。
いつもブログを書いたらTwitterに投稿するようにしているのですが、Twitterに投稿するとその数分後にはもうGoogle Readerにその記事が現れている、ということが最近よくあるのです。
特にブログを更新する際にpingを飛ばしているわけでもなく、もうFeedBurnerも使っていないし、PubSubHubbubに対応しているわけでもありません。
そこで考えられるのが、GoogleがTwitterのリアルタイムストリームを利用してブログの更新を見つけているのではないか、ということです。
TwitterにはGoogleが未発見のURLが多数流れる
昨年末、GoogleはTwitterと提携をして公開タイムライン(Firehose)を取得できるようになりました。当然そこに流れるURLにはGoogleがまだ見つけていないものが多数あるはずです。
そもそもGoogleは rel=”nofollow” がついているリンクは辿らないので、Twitterのウェブ上のタイムライン上に現れる URL からはクロールしません。
新URLを発見することはできても、単純にウェブ検索のインデックスとしてそのURLを含められるわけではないのです。
Web検索でなければ使える
そこで考えられるのが、Google Readerとの連携です。つまりブログ(フィード)の更新通知(ping)の代わりにTwitterのストリームを利用するということです。フィードであればnofollowなどそもそも関係ないし、いち早く更新を見つけられるのはGoogleにとって嬉しいことだと思います。
方法はおそらく簡単で、
- TwitterのストリームにURLが流れる
- そのURLからブログのURLを推測
- ブログのURLからフィードのURLを取得
- FeedFetcherがフィードをクロール
- Google Readerに記事が現れる
ということをやっているのではないかと。
これらはあくまで推測にすぎませんが、Googleはフィードもリアルタイムに近づけたがっているので、こういうことをやっててもおかしくないです。
なので、フィードの配信とTwitterへの通知はセットでやっておくと良いことあるんじゃないかと思っているのですが。
コメントを残す