F.Ko-Jiの「一秒後は未来」

眠れないのでGoogleの特許を読んでみる

Googleの新たなランキング手法が明らかになったそうです。この英語の特許文書を読めば全てが分かります。英語に自信のあるあなたの出番ですよー。

はい、自分で読みます。

最初に書いてあるのは、サーチエンジンに登録されてからの日数(age)がポイントであるということです。確かに情報源のページがあって、それから徐々に他のページが派生していくと考えられます。つまり、ある情報について老舗であればあるほどスコアが高くなるという仕組みのようです。

それから、あるページへの関連付けが一定期間中にどれくらいの割合で変化したかがポイントであるということです。つまり、より短期間により多くのページの興味を惹きつけたページほどスコアが高くなる仕組みです。

また、ある一定期間にある検索結果の中からどのくらいクリックされたかというデータを、履歴データという物に持っていて、スコアに影響を与えるようです。計算機では把握できない部分をユーザからのフィードバックで補おうという考えでしょう。履歴データには他にも、

  • あるキーワードに関連して頻繁に出現するキーワード情報
  • 期間によって異なった検索結果を導くキーワード
  • 新鮮さがどれくらい失われているか
  • ある期間にページへのリンクがどのくらい出現し、どのくらい消えたか
  • リンクの新鮮さ(確かに時間が経つとGoogleの順位が下がることある。うん。)
  • アンカーテキスト(リンクのタグで囲まれたテキスト)の変化
  • トラフィックパターン(?)
  • ユーザがそのページに滞在した時間(これは検索結果の中からそのページがクリックされてから、別のページがクリックされるまでに経過した時間のようだ。なるほどね。)
  • ドメインに関する情報(ネームサーバーにないドメインのページはスコアを下げるとか)
  • 過去のランキングデータ
  • どのくらいユーザがお気に入りに登録したり、そこから削除したりしたか??
  • アンカーテキストの成長プロファイル(どんな風にアンカーテキストが増えているかというもの?)
  • 独立したピアのつながり
  • ドキュメントのトピック

などが(履歴データとして)含まれているようです。あとはよく知られたページランクアルゴリズムの説明だと思います。

特許のClaimsの部分だけであまりに長すぎてぐだぐだになってしまいましたが、Googleにはページのランク付けにこのような技術を利用している(もしくは利用しようとしている)ということです。んー、すごいです。意図的にランキング操作をするのはかなり大変な気がします。結局のところGoogleで高い順位を目指すには、より良い中身のコンテンツを作ることが一番の近道である、ということに私も同感です。

関連エントリー

generated by 関連エントリーリストジェネレータ

  1. 雑貨 より:

    SEOって奥が深いですね…

  2. rec より:

    はじめましてrecと申します。

    いい情報をありがとうございました。

    勉強になりました。

    事後報告となりますが、

    まったりんさんの記事の一部を

    引用させていただきました。

    問題があるようでしたら削除しますので

    コメントにてご要望ください。

  3. rec より:

    たびたびすみません。recです。

    先ほどのコメントに違う記事へのURLを

    記入してしまいました。

    正しくはこちらのリンクです。

    コメント欄を汚してしまってすみません。

    ご迷惑でしたら削除してください。

  4. F.Ko-Ji より:

    >>雑貨さん

    そうですねー。

    「検索」自体が奥深いですよね。

  5. F.Ko-Ji より:

    >>recさん

    とんでもございません。^^

    こんなつたない文章を引用してくださって

    ありがたく思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など