F.Ko-Jiの「一秒後は未来」

AmazonのURL正規化は重複コンテンツを防ぐため

404 Blog Not Found:http://www.amazon.co.jp/ の「二枚舌」に学ぶ究極のSEOより。

検索エンジンにインデクシングされているAmazonのサイトのURLが、すべてある決まったフォーマットに“正規化”されている、という話です。

これぞ、SEOである。URL中に入った検索ワードというのは、非常に効果が高いのである。Wikipediaやはてなキーワードが検索で上位になる理由も、これが大きいと思われる。

この理由も確かにあると思います。が、以前紹介した「Googleの検索ランキングアルゴリズムの構成要素と推測される53個の要因」によると、URLに含まれるキーワードは2.8ポイントでそれほど重要ではないとされていました。

基本的にAmazonがやっているこの“正規化”の最も大きな理由は重複コンテンツを排除するためです。

重複コンテンツについては以下のページに詳しくあります。
重複コンテンツが招くSEOトラブル :: SEM ilog (セミログ)

重複コンテンツとは、同一コンテンツが複数のURLに存在する状態を指す。検索エンジンは重複したコンテンツは基本的に登録を行うことはない。もし同じコンテンツを重複してインデックスしていくと、ある検索クエリに対する検索結果として同一内容を持つ異なるURLを複数表示することになり、検索利用者の検索体験の質低下を招くからだ。従ってGoogleはもっとも評価が高い、あるいは一定以上の評価を受けたページのみを登録するし、Yahoo!は重複コンテンツと判定すればクロールをしないようになっている。

Amazonにとってはアフィリエイトリンクによってこの重複コンテンツが大量に発生してしまうため、それらを確実に外部リンクとするためには、URLをきちんと統一させるしかないのです。そのためには検索エンジンのクローラーに対して301を返す必要があります。

そういう背景をふまえた上で、じゃあどういうURLにリダイレクトさせるのがSEO的に良いかと考えると、商品名や著者名などのキーワードを含むほうが良い、ということになっているのでしょう。

重複コンテンツといえば、最近はRSS経由のリンクにref=rssといったトラッキングパラメータが付いているものも多く、そのURLが検索エンジンに登録されていることも多々あります。これはrobots.txtで検索エンジンにインデックスされないようにするなどの対策が必要だと考えられます。

ちなみに楽天のリンクはUserAgentをGooglbotにしてもレスポンスは302 Foundでした。302はSEOにあまり意味がないと聞いたことがあるのですが大丈夫なのでしょうか。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など