F.Ko-Jiの「一秒後は未来」

スパムフィードとブログ検索の悩ましい関係

クチコミOPMLジェネレータでは、各ブログ検索での検索結果のフィードをOPMLにして出力しています。私自身もいくつかのキーワードで検索結果を購読しているのですが、最近のスパムフィードの多さには驚きます。

ここで言うスパムフィードとは、次のようなものです。

フィードに大量のキーワードを記述してブログ検索で多く検索されるようにし、アイテムのリンク先にはリダイレクトURLを設定してフィードと無関係なサイトにリダイレクトさせる

ブログ検索の中には、この手のスパムが排除されていないものが多くあります。しかも、ブログ検索の検索結果にはRSSフィードに掲載されている内容がそのまま利用されていることが多いです。また、Yahoo!ブログ検索ではリンク先がすべてリダイレクトURLになっているので、一体どこに飛ばされるの分からない仕様になっています。Googleブログ検索ではRSSフィードのURLすら表示されません。

もちろん検索結果の内容を見ればユーザ自身でスパムかどうかを判断できますが、検索結果をRSSで受け取っている場合はどうでしょうか。もしユーザがアイテムのリンク先を直接開くタイプのRSSリーダーを使っているとすると、彼らはスパムであることを予期することなくリンク先を開くことになるでしょう。少々危険かもしれません。

そのため最近は、ブログ検索でも単純に更新日時の新しい順に検索結果を表示せず、コンテンツの内容等で検索結果の順位を変えて表示するようになっています。「ブログ検索で新鮮な情報を検索できるようにしたいけど、スパムのせいでそうはいかない。」というのがブログ検索の悩みどころでしょう。

ちなみに某ブログ検索が「フィードとサイトのドメインの一致」をインデクシングの条件に挙げているのには、このようなスパムフィードの排除という目的があると考えられます。が、危険性のないドメインのホワイトリストくらいは作ってほしいものですね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など