Google はどのようにして、検索した人がどのページで答えを見つけたかを判断しているのか。
正直わからないし、企業秘密だろうけど、多分、「検索キーワード」と「開かれたページのURL」を1セッション毎に保存して集積して共通項を割り出してるんじゃないかな。
通常、ユーザーは、検索フレーズ毎に、一つ以上のページを開く。ユーザーは、答えが見つからなければ、
- 検索キーワードを変更する
- next リンクを押して次の検索結果ページへ移動
- Google から離脱 (Firefox などの検索バーから直接打たれるケースを除く)
ユーザーはどれかしらのページをクリック -> 検索を終える。答えが見つからない場合は、また検索ページに戻ってきて、新たにページをクリックする。答えが見つからないケースは、どのページもクリックされないみなされる。
つまり、実際に、クリックされたページに答えが書いてあるなし如何に関わらず、検索エンジン側は、ユーザーがそこでアクションを終えたかどうかを見ているのではないか、と推測。
例えば、A さん、Bさん、Cさん のユーザーが同じ検索フレーズ「腰痛 ストレッチ」で検索したとする。検索結果に並ぶページの中から
- Aさん:1、2、3 のページをクリックして離脱
- Bさん:2、4 のページをクリックして離脱
- Cさん:5 のページをクリックして離脱
の場合、2 のサイトが答えを出したとみなし、そのサイトの順位を上げているのではないだろうか。(答えを本当に提示しているかは別として)
これが、何千、何万、それ以上のデータの蓄積によって形成される順位となると、大方、答えを持っているケースが上の方に来る、と考えて問題ないだろう。
ただ、Bot による意図的な検索も混じるだろうけど、最近の Google Capcha に使われる技術では、ワンクリックで人間かどうかをほぼ見極めれるので、同等の機能を検索結果のページのリンクに忍ばせれば、怪しい動きはデータから除外できる。仮にファルスポジティブを除外してしまったところで、十分なデータが集まれば、それはそれで機能する。
もし、この推測があたっているならば、やはり、クリックしてもらうためのタイトル付けというのは、依然として重要だということ。
Postscripts
言い換えたら、単に、ビッグデータの中で共通してクリックされているページ、ってだけのこと。それだけ。
2015年から、RankBrain という AI ベースのアルゴリズムを採用しているとのこと。RankBrain(ランクブレイン)とは?ランクブレインの役割とSEO対策について|SEOラボ