F.Ko-Jiの「一秒後は未来」ではウェブやSEO、API、RSSといった技術的ネタから、ちょっとした豆知識や梅酒、エンタメ系まで様々な情報を不定期にお届けしています。

F.Ko-Jiの「一秒後は未来」 > 検索王の見る検索 > 動的URLと重複コンテンツとクローラーの負荷

動的URLと重複コンテンツとクローラーの負荷

  • B!
スポンサード リンク

Googleが動的URLについて「Official Google Webmaster Central Blog」で述べている内容と、それに対する解説記事「Google、動的URLの扱いに新見解「動的URLのままで問題なし」:渡辺隆広のサーチエンジン情報館 - CNET Japan」を読んでみました。

ややこしいですね、、。

  • Googleが扱える動的URLのパラメータ数に制限はない
  • 複数の動的URLで重複コンテンツがあれば、Googleは無駄なパラメータを探そうとする
  • URLを静的化してもよいが、複数のURLでコンテンツが重複しないようにね

うーん、動的URLのままでコンテンツが重複していたとしても、「Googleが勝手に無駄なパラメータを見つけるから大丈夫」ということかな。ただ、場合によってはGoogleが間違えることだってありえます。そう考えると静的URLのほうがいいのかもと思います。

しかし、そもそも動的URLの場合であっても、すべてのコンテンツが異なるもの(異なるの度合いはわからないけど)であれば、Googleは無駄なパラメータ探しをしないと思います。そのほうが効率的ですし。

Googleが無駄なパラメータを見つける方法は定かではありませんが、無駄なパラメータを省略した結果として1000個の動的URLが重複扱いされたとすると、その1000個のURLに対するクロール負荷が無駄なものだったということになります。

クローラーが1日にクロールするページ数には上限があるはずです。検索エンジンにサイトの最新の内容をなるべく早く登録/更新してもらうという意味でも、クローラーの負荷を減らすという意味でも、最初からサイト運営者側で重複するコンテンツのURLをユニークにしておくことは重要でしょう。

そのためにはURLを適切に静的化する以外に、robots.txtで不要パラメータに対するクロールをブロックするとか、.htaccessやmod_rewriteで301リダイレクトさせるといった複数の対策をしておく必要があります。

ただ、Googleが提示している例のように「セッションIDまでも静的URLにしているようなサイト」が増えてしまうと問題なので、「そんな無駄なことをされるよりは動的URLのまま処理できるようにしよう」という考えに至ったんだと思います。

[2010-01-12] RSS フィードの URL が変わりました。お手数ですが RSS リーダーへの再登録をお願いします。
Subscribe with livedoor Reader Add to Google Subscribe with Fastladder My Yahoo!に追加 Bloglinesで閲読登録 はてなRSSに追加 エキサイトリーダーに登録


コメントを投稿

(承認されるまでコメントは表示されません。)

Google / SEO / 検索王の見る検索

English version

前のエントリー: « パケ・ホーダイ ダブルに移行するにあたって気をつけておきたいこと
次のエントリー: 松木里菜「ブレイク5秒前」朝日新聞 夕刊(2008-09-29) »

トラックバック

このエントリーのトラックバックURL:

タイトル:

URL:

リンク用HTMLタグ:

Agile Media Network

AMN Partner Blog

広告掲載について

東京ナイロンガールズ
最近の注目記事
持っているガジェット
powered by Gadget Party
最近のつぶやき
えもにゅ

↑ 気持ち記録サービス「えもにゅ」です

このブログの読者になる

F.Ko-Jiの「一秒後は未来」 - RSSフィード

クマでもわかるこのブログの便利な更新チェック方法

DailyFeed

あわせて読みたいブログパーツ

フィードメーター - F.Ko-Jiの「一秒後は未来」

月別アーカイブ


<< March 2010
SuMoTuWeThFrSa
 123456
78910111213
14151617181920
21222324252627
28293031 
人気エントリー
TopHatenar
携帯からのアクセスは
QRコード
http://mob.fkoji.com/