「クロール済み – インデックス未登録」はサイト全体の品質を考えるべき

「クロール済み - インデックス未登録」はサイト全体の品質を考えるべき

ページを更新したのに「インデックスされない」という話を最近よく聞きます。

インデックスされない原因はさまざまですが、「インデックス未登録」には以下の2パターンあります。

  • 検出 – インデックス未登録
  • クロール済み – インデックス未登録

「検出 – インデックス未登録」はページが更新されたことを検出したけどインデックスはまだという状態。一方、「クロール済み – インデックス未登録」はGooglebotがページをクロールしたけどインデックスはまだという状態です。

今回は「クロール済み – インデックス未登録」についての質問が『English Google SEO office-hours』であり、John Mueller氏が回答していました。

何度クロールしてもインデックスしないことはあり得る

質問の内容は以下の通り

Like, what’s the possible reason that maybe when certain pages didn’t get indexed, even though they were crawled multiple times?

何度もクロールされているにも関わらずインデックスされないページがある場合、何が考えられるかといった質問です。

「クロール済み – インデックス未登録」ということですね。この状態は本当に良く悩みとして聞かれるので理由が気になるところですが、John氏の回答は以下の通りでした。

It can happen. I would assume it’s not that frequently because, usually, when we decide to crawl something, we’re also pretty happy to go off and index it.

さらに次のように続けています。

But it can happen that we crawl a page and then, in the end, decide, actually, we don’t need to index it.

多くの場合、クロールしたらインデックスを作成するため頻繁に起こることではないとした一方で、最終的にインデックスする必要がないと判断することがあるようです。

何を基準としてインデックスするかしないかを判断するのか気になるところですが、そのことについても言及していました。

One common– I guess, like some common situations where that can happen which perhaps don’t apply in your case is if there is an error code on the page.
We have to crawl it first, and then we see the error code.
If there’s a noindex on the page, we also have to crawl it first, and then we see the noindex.
If the page is complete duplicate of something else that we’ve already seen, then we crawl it, we see it’s a duplicate, but we focus on the primary page again.

ページがnoindexされている場合は、noindexを確認するためにクロールする。つまり、インデックスする必要はないけどエラーコードを確認する目的でクロールしているということですね。

また、完全な重複コンテンツと判断された場合にもインデックスはされないとのこと。

Googlebotがページをクロールしたけど、すでにみたことあるページ(既存のページ)に重複していることを確認。そのためインデックスせず、すでに存在している主要なページにフォーカスするようです。

なるほど、といった内容ですね。

また、以下のような一言も付け加えています。

But it can also happen that we crawl something and then, by the time we get to indexing, we decide, oh, well actually, we want to get something else from the website instead.

インデックスされないページではなく、サイト内にフォーカスしているのでしょうか。この一言についてはニュアンスが難しいところです。

なんにせよ、何度クロールしてもインデックスしないことはあり得るということですね。

ページにフォーカスしすぎずサイト全体の品質を考えるべき

何度もクロールされてもインデックスされないことについて、質問者はJohn氏に以下のような質問もしました。

So for this one gets something else, does it have some example factors, like what other factors that may cause the Googlebot to decide, oh, we don’t want to index it at the end?

Googlebotが「インデックスさせたくない」と判断する要因の例はあるかどうかといった質問ですね。

John氏は以下のように回答しました。

I don’t know offhand.

SEO office-hoursは対話式なので、パッと今思い浮かばないという感じでしょうか。

技術的な問題がないものと仮定したら、一般的にはnoindex、重複コンテンツ、コンテンツの質といったところでしょうか。重複コンテンツも大きくみたら「コンテンツの質」に当てはまるところではあると思います。

質問者は、先の質問の意図として以下の理由があると述べています。

So the reason we ask this is we want to know except page quality and some technical SEO factors, like you just mentioned above, like some in noindex meta tag, like something other than that, is there any other factors that may use to determine that whether this page is worth of indexing or not?

このことについてJohn氏は以下のように回答しました。

I don’t think we have anything specific otherwise documented.

特に文書化されたものはないとしつつ、以下のように続けています。

So if you’re sure that, from a technical point of view, everything is OK, I wouldn’t assume that the quality of that specific page is a problem, but rather kind of the perceived quality of that part of the website or the whole website itself. That’s kind of the place where I would try to see what you can do to improve things, not just that individual page that didn’t get indexed, but kind of what is the bigger picture around that page.

技術的な問題がないのであればと前置きをした上で、特定のページの品質が問題だとは考えず、サイトの一部やサイト全体の品質が問題だと考えるべきと話しています。

先に述べた重複コンテンツのことも指していると思われますが、サイトの全体の品質がページをインデックスするかどうかの指標にもなるということでしょうか。

サイト全体の品質というと大きく聞こえますが、個々のコンテンツの質を高めていけばサイト全体の質も上がります。コンテンツの質についてはGoogleもいくつかのドキュメントで示しているため、読んだことがない人は一読してみるといいですよ。

今回の内容は『English Google SEO office-hours from March 4, 2022』の14:12あたりで確認できます。

役に立った!と思ったら他の人にシェアしてね
  • URLをコピーしました!

コメント

コメントする