日本国内でネット検索する場合、ほとんどがGoogleのエンジンを使うことになります。
Yahoo!Japanもかつては別のサーチエンジンを使っていましたが、2018年現在ではGoogleのエンジンを使っています。
日本国内において、SEO対策を考えるといことは、Googleのサーチエンジンに対して対策するということとほぼ同じ意味になります。
それで、まず考えることはGoogleさんが何をしているかということを簡単に理解しておく。
検索結果が表示されるまでの4ステップ
新しくホームページを立ち上げたり、WordPressで新しい記事を書いたりした瞬間に、ただちにGoogleの検索結果に表示されるということはない。
検索結果に表示されるまでには、それなりの手順がある。
- ページの発見
- クロール
- インデックス
- 検索結果の配信
という4つのステップを通らないと検索結果に表示されることはない。
STEP1 ページの発見
当たり前にことだが、Googleに自分のサイトやページの存在を見つけてもらわないと話にならない。
いくらネットの巨人Googleさんでも、存在を知らないものを検索結果に表示できない。
しかしページを公開して、じ~っと待っていても、いつ見つけてもらえるかわからない。深い深い森の中で1本の小さな木を見つけてもらうようなもの。なかなか見つけてもらえないでしょう。
Googleが新しいページを発見する方法はざっくりいうと2つあります。
- 既知のページからのリンクをたどって発見する
- サイトやページの所有者に手を挙げてもらう
1については、次項に説明するボットがリンクを次々とたどって新しいページや変更があったページ、逆に無くなったページを探していく感じです。
これだと、どこからもリンクされていない孤立したサイトは発見されないことに!?
リンクされていいたとしても、見つけてもらうまで時間がかかると考えられます。
2については、Googleさんにこちらから「私はココにいます! 見に来てください!!」と教えてあげるものです。
具体的には、サイトマップ(sitemap.xml)を設置してGoogleに教えます。
ちなみにこのブログのサイトマップはこちら
サイトマップというのは、自分のサイトにはこのようなページがありますというリストです。
XMLというフォーマットで書かれています。
WordPressでプラグインを使えばサイトマップとかXMLとかの知識がなくても、自動で生成してくれます。(自分で書くのは大変ですから)
このブログのサイトマップもプラグインで自動生成しています。
このサイトマップをGoogleさんに教えには、サーチコンソール(Search Console)というサービスにサイトマップを登録します。
サーチコンソールと一緒にGoogle Analytics(アナリティクス)というのも利用するのが定番です。
ここまでが、自力でやらなければならないことです。
STEP2 クロール
ここからは、Googleさんの中で行われることです。私たちが特に何かをすることはありません(というかできません)。
クロールとは、Googleが実際に自分のサイトを見に来て、1ページずつデータを取得していくことです。
といっても、Googleの中の人が人力で見ていくわけではなく、クローラーというロボット(ボット)が巡回してデータを取得していきます。
ロボットとはプログラムという意味です。ペッパーくんのようなロボットではないです。
この時に役に立つのが先ほどのサイトマップです。
まさに地図です。テーマパークの会場案内図です。サイトマップがあることで効率よく巡回することができます。
逆に、巡回してほしくないページを設定することもできます。「関係者以外立入禁止」とか「Staff Only」みたいな感じです。
robot.txt というファイルを使えば、巡回を許可するところと拒否するところの設定ができます。
robots.txt ファイルについて(Google サーチコンソール ヘルプ)
禁止区域にはクローラーは入ってこないので、検索結果に表示されることはなくなります。
STEP3 インデックス
インデックスとは、文字通り「目次」とか「索引」という意味です。クローラーが集めてきたデータを検索しやすい形にしてGoogleのデータベースに保存します。
集めてきたデータは、そのままでは検索しにくいです。
想像してみてください。切手サイズからビルの屋上の看板のサイズまでありとあらゆるサイズの書類の山を。しかも巨大な山がいくつもある状態を。
そして、その中からたった一つの書類に書かれた一文を探し出すとしたらどうでしょう。
とても探し出せないですし、探せたとしても膨大な時間がかかってしまいます。
インデックス(インデックス化)とは、雑多で膨大な山となった書類を、1ページずつ内容を解析して調べやすい形にして整理していきます。
昔は検索キーワードがそのものが入っているかどうかというような比較的単純なものでしたが、人工知能(AI)の発達・進化に伴い、文脈や関連キーワードなども連想してインデックス化するようです。
実際にネット検索で調べているのは、このGoogle内にインデックス化されたデータです。
キーワードをもとにその都度、ボットが世界中を飛び回って探してくるわけではありません。
検索結果に表示されるためには、第一歩としてインデックス登録される必要があるということです。
逆に、あえてインデックスに登録させないこともできます。
HTMLヘッダーのメタタグに noindex を設定すれば、ページをクロールしててもインデックスされません。
noindex を使用して検索インデックス登録をブロックする(Google サーチコンソール ヘルプ)
新しくサイトを立ち上げたり、ブログ記事を書いたりしても、すぐに検索結果に反映されないのは「発見 → クロール → インデックス」というプロセスに時間がかかるため。
場合によっては数日かかったりします。
STEP4 検索結果の配信
先にも書きましたが、ネット検索をしたときに、実際に検索する場所はGoogleでインデックスされたデータです。
検索キーワードから、(Googleさんが)最もふさわしいと思われる順番に表示されるのはご存知の通り。
検索結果の上位に以下の表示されるかというのが「SEO (Search Engine Optimization / サーチエンジン最適化)」や「SEM (Search Engine Marketing / サーチエンジンマーケティング)」で、そのための一連の手法を「SEO対策」とか「SEM対策」といいます。
ただ、Googleは検索結果の表示順を決める具体的な方法は開示していません。どのように計算してランキングしているのかは誰にもわかりません。
具体的なアルゴリズム(計算方法)はわかりませんが、Googleの目的は「ユーザーの質問に高い精度で答えること」
そのための評価基準は公表・非公表を含めて200以上ともいわれています。
Google評価基準を一つ一つ追いかけてもそれほど意味はありません。常に変わるものなのでキリがありません。
それよりも、検索する人の立場に寄り添って、より高い精度で問題解決となるコンテンツを作ることに注力することが重要です。
「ページ数が多い」とか「キーワードが入っていれば良い」とか「○文字以上あるから良い」ということだけではなく、「ユーザーにとって明確な答えや役立つ情報がある」ということが大前提になります。
言ってみれば、コンテンツ(ページや記事)ひとつひとつの質が問われるということです。
逆に言えば、Googleのいう質の高いコンテンツ、つまりユーザーの立場に立って質問に高い精度で答えるコンテンツを掲載していければ、それだけでSEO対策になりますね。(難易度高い・・・)
まず、コンテンツの質を上げることに気を遣ってみるのが、一番の近道かもしれません。