Googleのサイトリンクについて触れている特許が存在していた
Googleのサイトリンク(検索したときに検索結果の下に複数表示されるサイト内ページへのリンク)に関する技術的な情報は、さほど公開されていないように思いますが、2005年に書かれた特許(2006年12月発行)に少し言及されている部分があるようです。(via: Google’s Listings of Internal Site Links for Top Search Results)
ちょっと古いものなので役立つかどうかは微妙ですが、Googleがどういう仕組みでサイトリンクを選択しようとしているのか(もしくはしていたのか)を知るには良いかもしれません。
たとえば次のような情報に基づいてサイトリンクは選択されている(いた)そうです。
- そのページが何回アクセスされているか
- 訪問者がどのくらいの時間そのページに滞在しているか
- ページをスクロールするか、スクロールせずにリンクをクリックするか
- 検索で使われたクエリにそのページがどのくらいマッチしているか
- そのページで購買が発生しやすいか
- 人がそのページに興味を示すであろうことを示すその他の情報
ページのスクロールなどの行動はどうやらツールバーを利用して取得するようです。このようなデータに基づいて抽出されたリンクがどのような順番で並ぶかというと、
- Popularity associated with a web page. (そのページのポピュラリティ)
- Likelihood that the information on a web page will be accessed by a user. (ユーザがそのページの情報にアクセスする可能性)
- Likelihood that the information will be useful to a user submitting a search query, (その情報が検索クエリに対して役立つ可能性)
- Other factors associated with the quality of a web page. (ウェブページの品質に関連した他の要因)
といった情報にもとづいているようです。
そもそもサイトリンクはユーザが検索エンジンから簡単にサイト内のページにアクセスできるようにあるものなので、アクセス数などが考慮されるのは納得のいくところだと思われます。
実際、このブログのサイトリンクも最初はアクセス数が多い記事が表示されていたりしました。ウェブマスターツールで非表示にしたり、ページ内のナビゲーションリンクの位置などを調整したりした結果、最近は比較的良いサイトリンクが表示されています。
特許本文はこちらから。
United States Patent Application: 0060287985
コメントを残す