どうも七草です。
先日からBloggerで「Search Console」を使っているわけですが、また問題発生ということで、メールを頂戴しました。
何が問題で、どう対応するかを以下に記しておきますが、特に困ったのが、「Search Console」にあるというツール「robots.txtテスター」が見つからなかったという点です。その点の顛末も含め、書くことにします。
「「カバレッジ」の問題が新たに 検出されました」というメール
先日、メールをチェックしたところ、上記のタイトルのメールが、Googleの「Search Console」から来ていました。「問題」と言われては平静ではいられません。どういうことなのか、私製艦娘型録の記事を書いた後、調べることにしました。「robots.txt によりブロックされましたが、インデックスに登録しました」の意味
「Search Console」にて、その「問題」を詳しく見てみると、上記のような文言が目に付きました。「robots.txt によりブロックされましたが、インデックスに登録しました」とはどういうことでしょうか? ネット上の詳しそうな方の解釈によれば、以下の通りです。つまり、本ブログは「robots.txt」というファイルの設定で、検索結果に載せたくないページに対するGoogleの検索エンジン登録ロボットの巡回を制限しているわけですが、にもかかわらず「検索結果に載ることになるよ」ということです。
本ブログの場合、何が「検索結果に載せたくないページ」かというと、ブログ内で検索をかけた場合の検索結果のページとか、「ラベル」(他のブログで言う「タグ」)ごとに一覧になってるページとか、だそうで。これは何も本ブログだけの設定ではないようです(私は何もいじってないですし)。
本ブログのプラットフォームである「Blogger」は、「robots.txt」を自動的に作ってくれている親切設計なのですが、そのデフォルトの内容が、上記のようなページを「検索結果に出させないようにするわ」なのに、Googleの検索エンジンロボット側は「でもページがあるみたいだから、載せるね」と言っているわけですね。
なんというか。「Blogger」も同じGoogleのサービスなのだから、お互いの齟齬が起きないようにできないものか、とは思うんですけど…。
対応にはrobots.txtの修正が必要だけど
この「問題」への具体的な対応策は、その「robots.txt」の記述について、何らかの修正を施さなければならないようです。どうやってそれをしたらいいか、しばしネットを彷徨ってみました。どうやら「robots.txtテスター」という、それ用のツールが「Search Console」内に用意されているらしく。これを使えば、本ブログの「robots.txt」を閲覧し、修正できるようでした(「ようでした」というのが伏線っぽいですが^^;)。
robots.txtテスターが見当たらない
しかし、「Search Console」の中をいくら探しても、その「robots.txtテスター」は見つかりませんでした。どこにあるんだ、としばらく探してしまいました。結局、ネットの巷を徘徊し、某所の記事からリンクを見つけました。「robots.txtテスター」のアドレスは以下の通りです。
リンクから辿るのが嫌な方は「Search Console」内のヘルプで「robots.txtテスター」と検索すると、上の画像のように出てくると思います。
https://www.google.com/webmasters/tools/robots-testing-tool
やっと見つけたけど使えない?
さっそく使おう、と思って画面を見ましたが、表示されているのは「プロパティが表示されない場合は、プロパティをアカウントに追加できます。」という記述のみ。とりあえず「プロパティを追加」を押して追加(?)しましたが、「で?」という感じで先に進みません。話が違う。
↑追加はしてみましたが、「確認の詳細」を押してみても… |
↑これ以上、特に進展しなさそう |
「Search Console」のヘルプを掘っていくと、以下のような文言が発見され、この「次のツール」の中に「robots.txtテスター」も含まれていました。
次のツールやレポートは、まだ新しい Search Console に実装されていませんが、下記のリンクからアクセスできます。Search Console チームは、このようなアイテムの置き換え計画に取り組んでいます。いつかは分かりませんが、「Search Console」は大きなアップデートを行ったようで、古いバージョンの「Search Console」の機能の幾つかはまだ新バージョンに実装されていないようです。上記の文言では「まだ使える」みたいに書かれていますが、いつの間にか使えなくなっていても驚きません。
robots.txtテスターの代わりはURL検査ツールらしい
じゃあどうするのか? ヘルプを更に見ていくと、「旧バージョンの Search Console から新バージョンの Search Console に移行する」という項で、各機能の新旧対応表を見つけました。旧バージョンの Search Console から新バージョンの Search Console に移行する - Search Console ヘルプ
こちらには以下のような記述があります。
robots.txt や noindex を確認する: URL 検査ツールを使用すると、特定のページのインデックス登録済みバージョンまたはライブ バージョンについて、robots.txt や noindex のステータスを検査できます。「URL検査ツール」というのは、「Search Console」最上部にあるウィンドウのことですよね。いつもインデックス依頼をするために、新しい記事のURLを入れていますが、同じような要領でrobots.txtも確認できるということでしょうか。
さらに検索などして、「robots.txt」は基本的にルートディレクトリに設置されているという情報を得ました。つまり本ブログのrobots.txtのアドレスは、「https://im-gdgd-epi.blogspot.com/robots.txt」ということになります。
このアドレスを「URL検査ツール」に入れてみると、確かにこのアドレスの情報が出てきた…ようです。
しかしながら、肝心の現状でどのように記述されているかという内容はここでは分かりません。どういう風に書いてあって、どう直せばいいかを知りたいのですが。
トップのURL末尾に「/robots.txt」を付ければrobots.txtが確認できる
逆に思いついたのが、「このアドレスにブラウザで直接アクセスすれば見えるんじゃないか」ということ。やってみたところ、期待通り下のように確認することができました。最初からそうすればよかった。これでやっと、スタート地点に立てました。このrobot.txtの記述をどうにかして修正することができれば、たぶん解決できるのでは、ということです。
そもそも、この警告に対応すべきか?
しかし、その前に気になる記載を見つけてしまいました。しばしば参考にさせて頂いている「Blogger」の運用解説ブログ「ブロギングライフ」の、以下の記事の見解によると、この問題については、必ずしも対応しなければいけない、というわけではなさそうです。そこまで気にしないでもいいのかもしれない
詳しくはリンク先でお読みいただくとして、ここでは要約を試みます。つまり、そのブログ内での検索や「ラベル」を押して出てくるページを、Googleの検索結果に出したいか否かは、個々のブログ管理者の判断次第だし、ぶっちゃけ現状では放置でも問題ない、ということかと。
それによって、1.放置か、2.Googleの検索結果に出す方向で修正するか、3.出さない方向で修正するか、の3つの選択肢から好きなのを採ればよい、ということですね。
当ブログは現状のまま放置です
私としては、現状、1.放置を選ぼうと思います。「警告が出っぱなし」というのも嫌なのですが、今のところ、あんまりこういうことで労力を使いたくないのです(ここまで調べるのだって疲れましたx_x;)。また状況が動くようなことがあれば対応しますけど。上記2.3.の具体的な方法については、上記「ブロギングライフ」さんの記事(「robots.txt によりブロックされたURLがインデックスされ警告を受けた場合の対処法」の見出しの部分)が参考になると思います。放置は嫌だ、という方はご覧ください。
0 件のコメント:
コメントを投稿