TOP

重複コンテンツはSEO的に地雷!評価を下げない対策とは

重複コンテンツはSEO的に地雷!評価を下げない対策とは
九段さん
重複コンテンツはSEOに不利になる」って聞いたんですが、本当ですか?

no-img2
記事Pro
スタッフ
本当です。基本的にGoogleは重複コンテンツを望んでいません。よりよい検索結果を表示する上で、重複コンテンツは邪魔になるからです。

九段さん
どんなコンテンツが具体的にダメなんでしょうか?

no-img2
記事Pro
スタッフ
ではこの記事では、重複コンテンツの定義やその種類について説明しますね。またコンテンツの評価を落とさないためにできることもご紹介します。

1.Googleに訊く!重複コンテンツとは

重複コンテンツについて理解する上で、Googleの公式見解を知るのは重要です。
Googleによる重複コンテンツの定義は以下のとおりです。

“一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。多くの場合、偽装を意図したものではありません。”

出典:“重複コンテンツの作成を避ける”, Google検索セントラル

九段さん
つまり、ほぼ同じような内容のコンテンツが重複コンテンツなんですね。

そこそこ情報が似ているコンテンツはネット上に山ほどあります。
固有名詞や言葉の説明・特定の出来事やサービス・商品・場所について書く場合など、どうしても内容は似通います。

あるいはほかの著作物を引用した結果、同じ文章が複数のページに存在するケースもあるでしょう。
引用について詳しくは以下の記事をご覧ください。

関連記事:「記事中での引用の書き方を徹底解説!【URLのみはNG?】

no-img2
記事Pro
スタッフ
広い意味では多くのコンテンツをある意味「重複コンテンツ」と呼べますが、極端に重複していなければ問題はありません。一方Googleが言及している、重複度が非常に高いか完全に一致している重複コンテンツはトラブルの元になりえるため、注意が必要です。

1-1.重複コンテンツの種類はさまざま

1-1.重複コンテンツの種類はさまざま

重複コンテンツと一口に言っても、その種類はさまざまにあります。
また重複コンテンツが発生する過程もさまざまです。
たまたま生まれる重複コンテンツもあれば、意図的な重複コンテンツもあります。

結論から先にいうと重複コンテンツすべてが問題になるわけではありません。
しかし中にはGoogleのペナルティ対象となりえる重複コンテンツがあります。

no-img2
記事Pro
スタッフ
運営しているサイトがペナルティを受けないように、まずは重複コンテンツの種類を理解することが大切です。ここからは、以下の5タイプの重複コンテンツを見ていきましょう。

  • URLや技術上のミスによる重複コンテンツ
  • 定型文の繰り返しや類似コンテンツ
  • シンジケーション
  • アンテナサイト
  • ミラーサイト

1-1-1.URLや技術上のミス

1-1-1.URLや技術上のミス

重複コンテンツが生成される一つの理由は「URLや技術上のミス」です。

具体的には、以下の理由で重複コンテンツが生まれることがあります。

  • 「www」ありと「www」なしのURLが両方インデックスされている
  • テストサイトをクローラーに読み込まれてインデックスされた(ステージングサイトのインデックス)
  • セキュア通信バージョン(https:)と従来バージョン(http:)の両方がインデックスされた
  • 検索機能(並び替えやフィルタ)で同じ情報に別々のURLが生成されている
  • 同じコンテンツでPC用とスマートフォン用のURLが別々にある
no-img2
記事Pro
スタッフ
先述のGoogleの公式見解にあるように、このタイプの重複コンテンツはもちろん偽装を目的にしているわけではなく、単なる技術上の問題です。悪意により作られたわけではないため、Googleからペナルティを受ける心配はないでしょう。ただしSEO評価でマイナスになる恐れがあるため、対処するにこしたことはありません。

1-1-2.定型文の繰り返しや類似コンテンツ

1-1-2.定型文の繰り返しや類似コンテンツ

別の重複パターンは「定型文の繰り返しや類似コンテンツの存在」です。

先述のGoogleのページ「重複コンテンツの作成を避ける」では、具体例として以下のケースを挙げています。

  • 定型文の繰り返し:著作権に関する説明をすべてのページの下部に表示する
  • 類似コンテンツの存在:旅行サイトで2つの都市を別々のページで紹介しているが、ページ内の情報は同じ
九段さん
定型文の繰り返しは特によくありそうなケースですね。

no-img2
記事Pro
スタッフ
後述するように、定型文をまったく使ってはいけないわけではありません。しかし長々として定型文の使いまわしは避けた方が無難です。

1-1-3.シンジケーション

1-1-3.シンジケーション

シンジケーション」も重複コンテンツの例です。
(コンテンツ)シンジケーション」とは「コンテンツを自身のサイトのみで公開するのではなく、第三者機関に配信・公開させること」です。

no-img2
記事Pro
スタッフ
例えば九段さんがブログ記事を書いて、それを「Yahoo!ニュース」に転載してもらうのがシンジケーションです。シンジケーションの例としては、Yahoo!ニュースや「新R25」「SmartNews」「Gunosy」などが有名です。

九段さん
シンジケーションはなぜ行われるんですか?

no-img2
記事Pro
スタッフ
自身のサイトの認知度が低いと、記事を見てくれるユーザーは限られます。その点、大手サイトにシンジケーションできると認知度アップを期待できます。ただし双方の同意のもとだとしても、同じ記事を別々の場所で公開するわけですから、これも重複コンテンツです。

九段さん
シンジケーションをすると、どのような不都合が想定されますか?

no-img2
記事Pro
スタッフ
オリジナルページではなく記事提供先のページのみが検索結果に表示される、ないしは上位表示されることがあります。先ほどの例だと、九段さんのコンテンツページではなくYahoo!ニュースのみが表示されるか、九段さんのページより上位に表示されるかもしれません。Googleのジョン・ミューラー氏はこの点について以下のようにコメントしています。

“(訳文)我々は検索結果に1つのコンテンツを表示させる。それはシンジケート先のコンテンツかもしれないし、あなたのサイトのコンテンツかもしれない。あなたのオリジナルページが常に表示される保証はない”

出典:“English Google SEO office-hours from September 25, 2020”, Google Search Central

no-img2
記事Pro
スタッフ
「新R25」のようにオリジナルページにGoogleの評価が集まるようにしているメディアもありますが、後述する適切な対策をしないとSEOでマイナスになりかねません。

1-1-4.アンテナサイト

1-1-4.アンテナサイト

別の重複コンテンツは「アンテナサイト」です。

「アンテナサイト」とは「まとめサイトをさらにまとめたサイト」です。
運営者は「RSS」と呼ばれる仕組みを使い、ほかのサイトの記事情報を自動的に拾います。
サイトには「Google AdSense」などのクリック型広告を貼って収益を得ます。

no-img2
記事Pro
スタッフ
つまり「他人のまわしで相撲を取る」ようなサイトです。Google AdSenseはこのようなコンテンツに関して以下のように述べています。

“ユーザーにとって価値がほとんどないページでの広告配信と広告の過度な表示は、修正が行われるまで制限または無効にされる場合があります。

以下は許可されないページの一例であり、これらに限定されません。(略)
・手動によるレビューやキュレーションなしで、自動生成されるコンテンツのページ”

出典:“広告のプレースメントに関するポリシー”, Google AdSenseヘルプ

ほかのWebページを自動でコピペし、手を加えずにAdSense広告を貼るようなサイトは、広告配信停止のペナルティを受ける恐れがあります。
実際に広告配信停止と検索結果からのページ除外措置を受けた事例があります。

実際の事例については、下記のリンクをご覧ください。↓

出典:“楽をしようと自動でRSS情報収集し自動でアンテナサイト運営した結果。”, ヘイテンカイテンオープン

no-img2
記事Pro
スタッフ
Googleはオリジナリティーがあり情報豊かな記事コンテンツを重視しています。Googleのポリシーにあった方法でアンテナサイトを作れる場合は別として、安易なコピー記事を作るのはよくありません。

1-1-5.ミラーサイト

1-1-5.ミラーサイト

別の重複コンテンツの例は「ミラーサイト」です。

ミラーサイト」は「Webサイト全部か一部をコピーしたサイト」です。
同じ情報のものを別のページに写すことから、ミラー(鏡)サイトと呼ばれています。

運営者の承諾なしにミラーサイトを作るのは「著作権侵害」に該当します。
SEOどうこう以前に法律的にNGです。

しかしミラーサイトは正当な理由で作られることもあります。
例えば一つのサイトにアクセスが集中するとサーバーに負荷がかかる場合、ミラーサイトを用意することでアクセスを分散可能です。

総務省の公式HPでは、災害時のサーバーの機能停止を防ぐ手段として、ミラーサイトの使用を推奨しています。

参照:“事例11 自治体の公式Webサイト等の負荷軽減”, 総務省

九段さん
よい目的と手段でミラーサイトを作る場合は問題ないんじゃないですか?

no-img2
記事Pro
スタッフ
ポリシーとしてはもちろん問題ありません。しかし同じコンテンツには変わりないため、やはり重複コンテンツとみなされます。このことを裏付ける証拠として、第三者がわざとミラーサイトを作って他人のサイトの評価を下げようとするケースがあります。SEOで不利にさせたくない場合は、後述する対策が必要です。

2.Googleは重複コンテンツが嫌い?

2.Googleは重複コンテンツが嫌い?

Googleはある程度重複コンテンツの発生を「仕方のないもの」と見ています。
Googleのスパム対策チームのリーダーだったマット・カッツ氏は以下の発言をしています。

“(訳文)重複するコンテンツがすべてスパムなわけではない。そう判断してしまったら検索結果の質は向上するどころか損なわれてしまいかねない。実際は以下の流れになる。Googleは重複コンテンツを探して見つけると、しばしばそれらを一つのまとまったコンテンツのようにする。我々が実質的に同じ2つのページを検索結果に返そうとしているとしよう。どうするかわかるかい?だいたいの場合「それらのページは重複してるから、2つのページを見せるのではなく、1つのページのみ表示させよう」と考え、別のページを締め出すんだ。”

出典:”How does Google handle duplicate content?”, Google Search Central

このコメントにあるように「重複コンテンツ=Googleから目をつけられる」と考える必要はありません。
悪意のない重複コンテンツの発生で、いきなりペナルティをくらうことはないでしょう。

しかし重複コンテンツである以上、検索結果に表示されないか検索順位が下がってしまう可能性があります。

no-img2
記事Pro
スタッフ
この措置は検索ユーザーにとって親切です。想像してみてください。もし上位10サイト中、同じコンテンツが4つも5つもでてきたら使い勝手が悪いですよね?ユーザーに満足してもらえる検索サービスを提供することがGoogleにとって重要ですから、やはり重複コンテンツは望ましいものとはいえません。

no-img2
記事Pro
スタッフ
まとめると「SEOは別としてGoogleがさほど問題にしない重複コンテンツ」と「はっきり嫌う重複コンテンツ」があります。以下は問題にならない重複コンテンツです。

  • 複数のURLがあるサイト
  • シンジケーション
  • 一部のミラーサイト

以下は、ペナルティになるかもしれない重複コンテンツです。

  • アンテナサイト
  • 悪質なミラーサイト

3.重複コンテンツのSEOリスク

すでに説明してきたとおり、重複コンテンツにはSEO上ないしはポリシー上のリスクがあります。

重複コンテンツを作成または放置する場合に考えられるリスクを3つご紹介します。

3-1.Googleからペナルティ判定される

3-1.Googleからペナルティ判定される

Googleからのペナルティ判定」は重大なリスクです。

先述のとおり、ほとんどの場合は重複コンテンツがスパムとして見なされることはありません。
「適切に処理してほしい」と思われたとしても「悪質」とは判断されません。

しかし検索順位を意図的に操作しようと他人のコンテンツを盗用したり、同じコンテンツを大量生産したりする行為は悪質と判断され、ペナルティ対象になりえます。

no-img2
記事Pro
スタッフ
Googleの公式見解は以下のとおりです。

“ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。”

出典:“重複コンテンツの作成を避ける”, Google検索セントラル

no-img2
記事Pro
スタッフ
要は、自力で記事を書かずに無断で他人の著作物に頼るコンテンツはGoogleから認められないということです。

3-2.被リンク評価が枝分かれする

3-2.被リンク評価が枝分かれする

被リンクの評価が分散してしまう」のも重複コンテンツのデメリットです。

被リンク」とは、ほかのサイトから自分のサイトへ向けて貼られたリンクで、Googleは良質な被リンクがあるサイトを評価します。
つまり被リンクが多ければ多いほどサイト評価は高くなるわけです。

しかし重複コンテンツがあると、本来なら1つのURLに集中するはずの被リンク評価が枝分かれします。
例えば同じ情報のページが4つある場合、1つのページなら100の評価を受けられるのに、それが35・30・25・10のように分かれるかもしれません。

no-img2
記事Pro
スタッフ
Googleが最終的にどのように処理するかはわかりません。状況によりうまく処理してくれることもあるでしょう。しかし可能性がある以上、適切な対策を施すにこしたことはありません。

3-3.検索結果表示のレギュラーから外される

3-3.検索結果表示のレギュラーから外される

検索結果表示から外されてしまう」リスクもあります。

Googleは「Webクローラー」と呼ばれるソフトウェアでWebページを探し、ページにあるリンクをたどりながらWebページのデータを蓄積していきます。
最終的にGoogleの検索インデックスには何千億ものWebページが登録されます。

no-img2
記事Pro
スタッフ
Googleは巨大な図書館で、Webページは本のようなものです。図書館が本の種類やテーマを分析して分類・所蔵するように、Googleも膨大な数のWebサイトを管理しています。では九段さんが図書館の管理者だとして、もし背表紙が少し違うだけの同じ書籍をたくさん見つけたらどうしますか?

九段さん
全部は棚に置かずに一冊か一部だけ残して、ほかはバックヤードに置いておくと思います。

no-img2
記事Pro
スタッフ
同じようなことをGoogleも行います。重複コンテンツすべてを検索結果に表示させずに、特定のページのみを表示させることがあるんです。

九段さん
ページの質どうこうではなく、重複コンテンツゆえにそのような処理がされるのは残念ですね。

4.SEOに響く重複コンテンツの対策

九段さん
重複コンテンツのマイナスポイントがわかりました。SEO効果を高めるためには、具体的にどうしたらよいでしょうか?

no-img2
記事Pro
スタッフ
では、重複コンテンツの調べ方と具体的な対処策を重複コンテンツの種類ごとに簡単に解説します。

4-1.重複コンテンツを調べる

4-1.重複コンテンツを調べる

まず行うべきなのは「重複コンテンツの調査」です。

調査する方法には以下のようなものがあります。

  • 自身のページの一部をGoogle検索にかけてほかのページが表示されるか見る
  • 「CCD」などコピーコンテンツチェックのツールを使う
  • 「Googleサーチコンソール」の「カバレッジ」の「除外」ステータスに「重複しています」とあるか見る
  • チェックしたいURLの末尾に「&filter=0」を追記する

4番目の「&filter=0」を使うと、除外されたページを含めての検索もできます。

no-img2
記事Pro
スタッフ
これらのツールを駆使して、重複コンテンツの有無を確認してください。

4-2.URLや技術上のミス

4-2.URLや技術上のミス

no-img2
記事Pro
スタッフ
URLや技術上のミスにより重複コンテンツがある場合は、以下の方法を試してください。

  • 「www」の有無が原因:301リダイレクトの設定
  • テストサイトをインデックスされた(ステージングサイトのインデックス):301リダイレクトの設定、「noindex」の設定
  • セキュア通信バージョン(https:)と従来バージョン(http:)の両方がインデックスされた:301リダイレクトの設定、「noindex」の設定
  • 検索機能(並び替えやフィルタ)で同じ情報に別々のURLが生成されている:「noindex」の設定
  • 同じコンテンツでPC用とスマートフォン用のURLが別々にある:canonicalを設定

ほかにもさまざまなパターンが考えられますが、URLの正規化や特定のページのインデックス登録拒否(noindex)がメインの対策です。

4-3.定型文の繰り返しや類似コンテンツ

4-3.定型文の繰り返しや類似コンテンツ

定型文の繰り返しがある場合は、可能な限り定型文の使用を少なくしましょう。
1-1-2でご紹介した例でいえば、著作権の説明を全ページに表示するのではなく、短い要約を入れて詳細ページに飛ばすリンクを入れることをGoogleは推奨しています。

no-img2
記事Pro
スタッフ
ただし先述のように、定型文すべてを一律に排除しなければいけないわけではありません。要約はOKであるため、ライター紹介などコンパクトな文章であれば問題ないと考えられます。

類似コンテンツについても、できるだけ少なくするのがポイントです。
同じく1-1-2の例でいうと、旅行サイトで2つの都市を別々のページで紹介している場合、両方の都市を一つのページでまとめて紹介するか、各ページに独自の情報を含めるよう、Googleはすすめています。

no-img2
記事Pro
スタッフ
基本的に各ページがユニークな内容になるよう意識するのがポイントです。

関連記事:「記事の作り方の基本手順解説!失敗しない4つのステップとは?

4-4.シンジケーション

4-4.シンジケーション

シンジケーションを行う際は、以下の対策を実行できます。

  • 配信先の記事に「rel=”canonical”」を追加してもらう
  • 配信先の記事に「noindex」の設定
  • そもそも記事配信しない
no-img2
記事Pro
スタッフ
配信先の記事に1・2番目の方法を実施してもらうことは、配信先がシンジケーションしたページからのアクセスを期待できないことを意味します。相手の同意があって成り立つ方法であるため、ハードルは上がります。難しいようなら、自身のサイトへの流入が減ることを覚悟でシンジケーションのメリットをとるか、記事配信をやめるのが手です。

4-5.アンテナサイト

4-5.アンテナサイト

アンテナサイトに関しては、すでに事例をとおして説明したとおり避けた方がよいです。
少なくともGoogle Adsenseを貼るのはNGと考えましょう。

4-6.ミラーサイト

4-6.ミラーサイト

悪意のあるミラーサイトは論外です。
無断で他人のコンテンツを複製するのは著作権に触れるため(正式な「引用」は別)、決して行うべきではありません。

一方、サーバー負荷分散など正当な目的の場合は「noindex」の設定をするか「canonical」タグで正規URLを明確にすればOKです。

4-7.第三者が自分のコンテンツを勝手にコピーした場合

4-7.第三者が自分のコンテンツを勝手にコピーした場合

自身の操作ではなく、第三者が無断で自分のコンテンツをコピーするケースもあります。
この点について、Googleは以下の見解を出しています。

“まれに、コンテンツを無断でホストしている外部サイトの URL が Google のアルゴリズムで選択されることがあります。別のサイトが著作権法に違反してご自分のコンテンツを複製しているとお考えの場合は、そのサイトの管理者に連絡して削除をリクエストすることをおすすめします。さらに、デジタル ミレニアム著作権法に基づく通知を提出することによって、権利侵害にあたるページを Google の検索結果から除外するよう Google にリクエストできます。”

出典:“重複コンテンツの作成を避ける”, Google検索セントラル

no-img2
記事Pro
スタッフ
残念ながら、盗用した第三者のページが検索結果で選ばれてしまうことがあります。しかし著作権を侵害された場合は、Googleへのリクエストを出せます。

5.まとめ

重複コンテンツが発生するのはある程度仕方のないことです。

Googleの公式見解にもあるとおり、すべての重複コンテンツが悪意を持って作成されるわけではありません。
意図せずに作られてしまうこともあれば、意図的であっても正当な目的で作られることもあります。

一方、自身の利益や第三者へのダメージを与えるために重複コンテンツを作るユーザーも存在します。

no-img2
記事Pro
スタッフ
悪意のある重複コンテンツは絶対に作るべきではありません。また正当な目的があるか意図せずに発生した重複コンテンツに関してはペナルティの対象とはならないでしょう。とはいえSEOの観点からマイナスになる可能性があるため、ご紹介した対策を適宜講じてください。