2022年2月18日のEnglish Google SEO office-hoursで、異なるフォーマットで同じ内容を扱った場合に重複コンテンツとなるかという主旨の質問がありました。
重複コンテンツはサイト全体の評価に影響するため、Webサイト運営において避けたい事象の1つ。
重複コンテンツの考え方としてJohn Mueller氏が回答していたため、その内容を紹介します。
重複コンテンツではないが、検索結果には同時に表示される
今回の質問な内容は以下のとおり、
We’ll have to come to the PDF file a case study I submitted to my website. Now I want to present it as well as HTML Book Article. Does this have any negative impact from my side?
つまり、PDFファイルとしてWebサイトで公開し、それをHTMLという別のフォーマットで紹介したら、重複コンテンツになるのか?といった意図の質問ですね。
この質問に対するJohn氏の回答は次のようでした。
We wouldn’t be in a duplicate content because it’s different content.
さらに以下のように続けています。
Even if the primary piece of content on there is the same, the the whole thing around it is different. So I’m kind of from that level, we wouldn’t see it as duplicate content. I think at most, the difficulty might be that in the search results, it can happen that both of these show up at the same time.
PDFとHTMLでは、コンテンツが同じでもそもそものフォーマットが異なるため重複コンテンツとはならないと述べています。
ただし、検索結果には両方表示される可能性があるため、以下のような対策をするよう示唆しています。
I, from my point of view, I wouldn’t see it as a negative when it comes to SEO, but maybe you have strategic reasons to kind of have either the PDF or the HTML page more visible.
SEO面ではマイナス評価になることはなくても、どちらかのコンテンツを見やすくするような戦略をした方が良いとのこと。
たしかに、同じコンテンツが同一検索画面に表示されてしまうのはユーザーの混乱や分散を招くため、よりスポットを当てたい方を見やすくする必要はありますね。
インデックスしたいコンテンツをcanonicalで決める
コンテンツが両方インデックスされて検索結果に表示されてしまう場合、どのように対処すればいいのか?
質問者は次のようにJohn氏に問いかけました。
if I want the HTML to be index, I would need to set a canonical PDF
この問いかけに対してJohn氏の回答は以下のとおりです。
Yes. You can decide the canonical on the PDF with HTML. You can definitely also use no index in the headers for PDF files.
canonicalタグは正規表現と言われるタグで、2つの同じコンテンツがあったときに「こちらが正規URLですよ」とクローラーに伝えるもの。
2つのコンテンツがインデックスしてしまう場合、スポットを当てたいコンテンツをcanonicalとすることが有効ということ。
上記の場合は、HTMLをcanonicalとしてPDFからHTMLに向けてcanoncalタグを決める。あるいは、PDFをインデックスしないようno indexをheaderに入力してしまうということですね。
今回の内容をまとめると以下のようになります。
- 異なるフォーマットであれば同じ内容でも重複コンテンツとはならない
- 同内容のコンテンツがインデックスされる場合は、どちらかにcanonicalを決める
もし自身のWebサイト内に異なるフォーマットで同内容のコンテンツを扱っている場合は、検索結果を注意して見てみましょう。
また、今回は重複コンテンツにはならないケースでしたが、自身のWebサイト内で重複コンテンツが発生してる場合にもcanonicalタグは有効ですよ。
『English Google SEO office-hours from February18,2022 』の17:10あたりで内容を確認できます。ご自身でチェックしてみてください。
コメント