重複コンテンツ:原因と解決策

Joost de Valk

Joost de ValkはYoastの創設者であり、チーフプロダクトオフィサーです。 彼はインターネット起業家であり、yoastを設立する隣にはいくつかのスタートアップに投資し、助言しています。 主な専門分野は、オープンソースソフトウェア開発とデジタルマーケティングです。

Googleのような調査エンジンに問題がある–それは’重複した内容’と呼ばれる。 重複したコンテンツとは、類似したコンテンツがウェブ上の複数の場所(Url)に表示され、その結果、検索エンジンは検索結果にどのURLを表示するかを知 これは、webページのランキングを傷つけることができ、人々が同じコンテンツの異なるバージョンへのリンクを開始すると、問題が悪化するだけです。 この記事では、重複したコンテンツのさまざまな原因を理解し、それぞれの解決策を見つけるのに役立ちます。

  • 重複コンテンツとは何ですか?
    • これを例で説明しましょう
  • コンテンツの重複の原因
    • URLの概念の誤解
    • セッションId
    • トラッキングとソートに使用されるURLパラメータ
    • スクレーパーとコンテンツシンジケーション
    • パラメータの順序
    • コメントページネーション
    • プリンタに優しいページ
    • WWW対非WWW
  • 概念的な解決策: ‘canonical’URL
  • 重複コンテンツの特定の問題
  • 重複コンテンツの実用的な解決策
    • 重複コンテンツの回避
    • 301重複コンテンツのリダイレクト
    • リンクを使用して
    • 元のコンテンツにリンクする
  • 結論:重複したコンテンツは修正可能であり、修正する必要があります

重複したコンテンツとは何ですか?

重複コンテンツは、web上の複数のUrlで利用可能なコンテンツです。 複数のURLが同じコンテンツを表示するため、検索エンジンは検索結果の上位に表示するURLを知りません。 したがって、両方のUrlを下位にランク付けし、他のwebページを優先する可能性があります。

この記事では、主に重複したコンテンツの技術的な原因とその解決策に焦点を当てます。 重複したコンテンツに関するより広い視点を取得し、それがコピーまたはスクレープされたコンテンツ、さらにはキーワードの共食いにどのように関連しているかを知りたい場合は、この記事を読むことをお勧めします:重複したコンテンツとは何ですか。

の例でこれを説明してみましょう

重複したコンテンツは、道路標識が同じ目的地のために二つの異なる方向を指す交差点にあることに例え さらに悪いことに、最終的な目的地はあまりにも異なっていますが、わずかにしかありません。 読者として、あなたはあなたが来たコンテンツを得るので気にしませんが、検索エンジンはもちろん、同じコンテンツを2回表示したくないので、検

‘キーワードx’に関する記事がに表示され、同じ内容がにも表示されるとしましょう。 このような状況は架空のものではありません:それは現代のコンテンツ管理システムの多くで起こります。 それからあなたの記事が何人かのbloggersによって選ばれ、他は第2につながるが、そのうちのいくつかは最初のURLにつながることを言おう。 これはサーチエンジンの問題が本当の性質を示すときである:それはあなたの問題である。 これらのリンクは両方とも異なるUrlを促進するため、重複したコンテンツが問題になります。 それらがすべて同じURLにつながっていれば、’キーワードx’のためのランキングのあなたのチャンスはより高い。

あなたのランキングが重複した内容問題に苦しんでいるかどうか知らなければ、これらの重複した内容の発見用具は見つけるのを助ける!

コンテンツが重複する原因

コンテンツが重複する理由には、数多くの理由があります。 それらのほとんどは技術的なものです:人間が同じコンテンツを2つの異なる場所に配置することを決定することはあまり頻繁ではありません。 あなたが投稿を複製し、もちろん偶然にそれを公開した場合を除きます。 しかし、そうでなければ、それは私たちのほとんどに不自然に感じます。

しかし、多くの技術的な理由があり、開発者がブラウザやユーザーのようには考えていないので、主に起こります。 前に述べたに表示される記事を取ります。 あなたが開発者に尋ねると、彼らはそれが一度だけ存在すると言うでしょう。

URLの概念を誤解

いいえ、その開発者は怒っていない、彼らは単に別の言語を話しているだけです。 CMSはおそらくwebサイトに電力を供給し、そのデータベースには1つの記事しかありませんが、webサイトのソフトウェアでは、データベース内の同じ記事を複数のUrlを介して取得することができます。 これは、開発者の目には、その記事の一意の識別子は、記事がデータベースに持っているIDであり、URLではないためです。 しかし、検索エンジンの場合、URLはコンテンツの一意の識別子です。 あなたがそれを開発者に説明するならば、彼らは問題を起こし始めるでしょう。 そして、この記事を読んだ後、あなたもすぐに解決策を提供することができるでしょう。

セッションId

訪問者を追跡し、ショッピングカートに購入したいアイテムを保存するなど、訪問者を許可することがよくあります。 それを行うためには、あなたは彼らに”セッションを与える必要があります。’会議は訪問者があなたの場所でし、買物車の項目のような事を含むことができるものをの短い歴史である。 訪問者があるページから別のページにクリックしたときにそのセッションを維持するには、そのセッションの一意の識別子(セッションIDと呼ばれる)をどこかに保存する必要があります。 最も一般的な解決策は、cookieを使用してそれを行うことです。 ただし、検索エンジンは通常、cookieを保存しません。

その時点で、一部のシステムはURLでセッションIdを使用するようにフォールバックします。 これは、webサイト上のすべての内部リンクがそのセッションIDをそのURLに追加し、そのセッションIDがそのセッションに一意であるため、新しいURL

トラッキングとソートに使用されるURLパラメータ

コンテンツが重複するもう1つの原因は、リンクのトラッキングなど、ページのコンテンツを変更しないURLパラメータを使用していることです。 検索エンジンでは、は同じURLではありません。 後者は、あなたがソースの人々がから来たものを追跡することを可能にするかもしれませんが、それはまた、あなたがうまくランク付けすることを困難に

もちろん、これはトラッキングパラメータのためだけではありません。 それはあなたがコンテンツの重要な部分を変更しないURLに追加することができますすべてのパラメータのために行く,そのパラメータは、”製品のセッ

スクレーパーとコンテンツシンジケーション

重複したコンテンツの理由のほとんどは、あなたまたはあなたのウェブサイトの”障害”のいずれかです。 ただし、他のウェブサイトでは、お客様の同意の有無にかかわらず、お客様のコンテンツを使用することがあります。 それらはあなたの元の記事に常につながらないし、従ってサーチエンジンは’それを得ないし、同じ記事の更に別の版を取扱わなければならない。 あなたのサイトがより人気があるほど、あなたが得るより多くのスクレーパーが得られ、この問題はますます大きくなります。

パラメータの順序

もう一つの一般的な原因は、CMSがきれいなUrlを使用するのではなく、/?id=1&cat=2のようなUrlを使用することです。IDは記事を指し、catはカテゴ URL/?cat=2&id=1は、ほとんどのウェブサイトシステムで同じ結果を表示しますが、検索エンジンでは完全に異なります。

コメントページネーション

私の最愛のWordPressではなく、いくつかの他のシステムでは、あなたのコメントをページネーションするオプションがあります。 これにより、コンテンツが記事のURLと記事のURL+/comment-page-1/、/comment-page-2/などで複製されます。

プリンターに優しいページ

コンテンツ管理システムがプリンターに優しいページを作成し、記事ページからリンクしている場合、特にブロックしない限り、Googleは通常それらを見つけるでしょう。 今、あなた自身に尋ねなさい:どの版をGoogleに示してほしいか。 あなたのadsおよび周辺内容との1つ、またはあなたの記事だけを示す1か。

WWW vs.non-WWW

これは本の中で最も古いものの一つですが、時には検索エンジンが間違っていることがあります。WWW vs.non-WWW重複コンテンツ、あなたのサイトの両方のバージョンがアクセス可能な場合。 別の、あまり一般的ではない状況ですが、私も見てきたのは、HTTPとHTTPSの重複コンテンツで、同じコンテンツが両方に配信されます。

概念的な解決策:「正規の」URL

すでに見てきたように、いくつかのUrlが同じコンテンツにつながるという事実は問題ですが、解決できます。 ある出版物で働く一人の人は、通常、特定の記事の”正しい”URLが何であるかを非常に簡単に伝えることができますが、同じ会社内の三人に尋ねると、三つの異な コンテンツの一部の”正しい”URLは、検索エンジンによって正規のURLと呼ばれます。

皮肉なサイドノート

Canonicalは、神聖な本のリストが作成され、本物として受け入れられたローマカトリックの伝統に由来する用語です。 彼らは新約聖書の標準的な福音書として知られていました。 皮肉なことに、ローマ-カトリック教会が約300年と数多くの戦いをかけてその標準的なリストを考え出し、最終的に同じ物語の四つのバージョンを選んだということです…

重複したコンテンツの問題を特定する

あなたのサイトに重複したコンテンツの問題があるのか、あなたのコンテンツに重複したコンテンツの問題があるのかどうかはわからないかもしれません。 Googleを使用することは、重複したコンテンツを見つける最も簡単な方法の1つです。

このような場合に非常に役立つ検索演算子がいくつかあります。 キーワードXの記事を含むサイト上のすべてのUrlを検索する場合は、次の検索フレーズをGoogleに入力します:

site:example.com intitle:"Keyword X"

Googleは、あなたにすべてのページが表示されますexample.com そのキーワードが含まれています。 クエリのintitle部分をより具体的にするほど、重複したコンテンツを取り除くのが簡単になります。 同じ方法を使用して、web全体で重複するコンテンツを識別できます。 あなたの記事の完全なタイトルが’キーワードXだったとしましょう–なぜそれは素晴らしいです’、あなたが検索します:

intitle:"Keyword X - why it is awesome"

そしてGoogleはそのタイトルに一致させるすべての場所を与える。 いくつかのスクレーパーがタイトルを変更する可能性があるので、時にはそれも、あなたの記事から一つまたは二つの完全な文章を検索する価値があ 場合によっては、そのような検索を行うと、結果の最後のページに次のような通知が表示されることがあります:

これは、Googleがすでに結果を”デduping”しているという兆候です。 それはまだ良くないので、リンクをクリックして他のすべての結果を見て、それらのいくつかを修正できるかどうかを確認する価値があります。

Read more:DIY:duplicate content check”

Duplicate content

どのURLがコンテンツの正規URLであるかを決めたら、正規化のプロセスを開始する必要があります(うん、私は知っている、三回大声で速く言ってみてください)。 つまり、検索エンジンにページの正規版について伝え、できるだけ早く見つけられるようにする必要があります。 問題を解決するには、好みの順に4つの方法があります:

  1. 重複コンテンツを作成しない
  2. 重複コンテンツを正規URLにリダイレクトする
  3. 重複ページに正規リンク要素を追加する
  4. 重複ページから正規ページにHTMLリンクを追加する

重複コンテンツを回避する

重複コンテンツの上記の原因のいくつかは、それらに非常に簡単な修正があります:

  • あなたのUrlにセッションIDはありますか?
    これらはしばしばシステムの設定で無効にすることができます。
  • プリンタに優しいページが重複していますか?
    これらは完全に不要です:あなただけの印刷スタイルシートを使用する必要があります。
  • WordPressでコメントページネーションを使用していますか?
    99%のサイトでこの機能を無効にする必要があります(設定”議論の下で)。
  • あなたのパラメータは別の順序ですか?
    常に同じ順序でパラメータを配置するスクリプトを構築するようにプログラマに指示します(これはしばしばURLファクトリと呼ばれます)。
  • トラッキングリンクの問題はありますか?
    ほとんどの場合、パラメータベースのキャンペーントラッキングではなく、ハッシュタグベースのキャンペーントラッキングを使用できます。
  • WWWと非WWWの問題はありますか?
    一つを選んで、一つを他のものにリダイレクトすることによってそれに固執する。 また、Googleウェブマスターツールで設定することができますが、ドメイン名の両方のバージョンを主張する必要があります。あなたの問題がそれほど簡単に修正されていない場合、それはまだ努力する価値があるかもしれません。 目標は、重複したコンテンツが完全に表示されないようにすることです。

    301重複したコンテンツのリダイレクト

    使用しているシステムがコンテンツの間違ったUrlを作成するのを完全に防ぐことは不可能ですが、リダイレ これがあなたにとって論理的でない場合(私が理解できる)、開発者と話している間にそれを覚えておいてください。 重複したコンテンツの問題の一部を取り除く場合は、古い重複したコンテンツUrlをすべて適切な正規Urlにリダイレクトするようにしてください。

    リンクの使用

    間違ったURLであることがわかっていても、記事の重複したバージョンを削除したくない、または削除できないことがあります。 この特定の問題を解決するために、検索エンジンは標準的なリンク要素を導入しました。 サイトの<head>セクションに配置されており、次のようになります:

    <link rel="canonical" href="http://example.com/wordpress/seo-plugin/" />

    正規リンクのhrefセクションに、記事の正しい正規URLを配置します。 Canonicalをサポートする検索エンジンがこのリンク要素を見つけると、ソフト301リダイレクトを実行し、そのページによって収集されたリンク値の大部分をカノニカルページに転送します。

    このプロセスは301リダイレクトよりも少し遅いので、GoogleのJohn Muellerが述べたように、301リダイレクトを行うことができれば好ましいでしょう。

    続きを読む: rel=canonical•それが何であり、どのように(そうでない)使用するか”

    元のコンテンツにリンクする

    上記のいずれかを行うことができない場合、コンテンツが表示されるサイトの<head>セクションを制御していない可能性がある場合は、記事の上または下に元の記事にリンクを追加することは常に良いアイデアです。 それの記事にリンクを加えることによってあなたのRSSの供給のこれをしたいと思うかもしれない。 一部のスクレーパーはそのリンクをフィルタリングしますが、他の人はそれを残すかもしれません。 Googleがあなたの元の記事を指しているいくつかのリンクに遭遇した場合、それが実際の正規バージョンであることがすぐにわかります。

    結論:重複したコンテンツは修正可能であり、修正する必要があります

    重複したコンテンツはどこでも発生します。 私はまだ少なくとも小さな重複したコンテンツの問題を持っていない1,000ページ以上のサイトに遭遇していません。 それはあなたが常に目を維持する必要があるものですが、それは修正可能であり、報酬は豊富になることができます。 あなたの質の内容はあなたの場所から重複した内容を取り払うことによってランキングで、ちょうど急上昇できる!

    続きを読む:Rel=canonical:the ultimate guide”

コメントを残す

メールアドレスが公開されることはありません。

More: