Duplicate Content: Ursachen und Lösungen

Joost de Valk

Joost de Valk ist der Gründer und Chief Product Officer von Yoast. Er ist ein Internetunternehmer, der neben der Gründung von Yoast in mehrere Startups investiert und diese beraten hat. Seine Kernkompetenzen sind Open Source Softwareentwicklung und digitales Marketing.

Suchmaschinen wie Google haben ein Problem – es heißt ‚Duplicate Content‘. Duplicate Content bedeutet, dass ähnliche Inhalte an mehreren Stellen (URLs) im Web angezeigt werden und Suchmaschinen daher nicht wissen, welche URL in den Suchergebnissen angezeigt werden soll. Dies kann das Ranking einer Webseite beeinträchtigen, und das Problem wird nur noch schlimmer, wenn die Leute anfangen, auf die verschiedenen Versionen desselben Inhalts zu verlinken. Dieser Artikel wird Ihnen helfen, die verschiedenen Ursachen von Duplicate Content zu verstehen und die Lösung für jeden von ihnen zu finden.

  • Was ist Duplicate Content?
    • Lassen Sie uns dies anhand eines Beispiels veranschaulichen
  • Ursachen für doppelten Inhalt
    • Missverständnis des Konzepts einer URL
    • Sitzungs-IDs
    • URL-Parameter zum Verfolgen und Sortieren
    • Scraper und Content Syndication
    • Reihenfolge der Parameter
    • Kommentar-Paginierung
    • Druckerfreundliche Seiten
    • WWW vs. Nicht-WWW
  • Konzeptionelle Lösung: eine ‚kanonische‘ URL
  • Probleme mit doppelten Inhalten identifizieren
  • Praktische Lösungen für doppelte Inhalte
    • Doppelte Inhalte vermeiden
    • 301 Doppelte Inhalte umleiten
    • Links verwenden
    • Zurück zum ursprünglichen Inhalt verlinken
  • Fazit: Duplicate Content ist fixierbar und sollte behoben werden

Was ist Duplicate Content?

Duplicate Content ist Inhalt, der auf mehreren URLs im Web verfügbar ist. Da mehr als eine URL denselben Inhalt anzeigt, wissen Suchmaschinen nicht, welche URL in den Suchergebnissen höher aufgeführt werden soll. Daher können sie beide URLs niedriger einstufen und anderen Webseiten den Vorzug geben.

In diesem Artikel konzentrieren wir uns hauptsächlich auf die technischen Ursachen von Duplicate Content und deren Lösungen. Wenn Sie eine umfassendere Perspektive auf doppelte Inhalte erhalten und erfahren möchten, wie sie sich auf kopierte oder gekratzte Inhalte oder sogar auf Keyword-Kannibalisierung beziehen, empfehlen wir Ihnen, diesen Beitrag zu lesen: Was ist doppelter Inhalt.

Lassen Sie uns dies anhand eines Beispiels veranschaulichen

Duplicate Content kann mit einer Kreuzung verglichen werden, an der Verkehrszeichen in zwei verschiedene Richtungen für dasselbe Ziel weisen: Welche Straße sollten Sie nehmen? Erschwerend kommt hinzu, dass das endgültige Ziel auch anders ist, aber nur ein bisschen. Als Leser macht es Ihnen nichts aus, weil Sie den Inhalt erhalten, für den Sie gekommen sind, aber eine Suchmaschine muss auswählen, welche Seite in den Suchergebnissen angezeigt werden soll, da sie natürlich nicht denselben Inhalt zweimal anzeigen möchte.

Angenommen, Ihr Artikel über ‚Keyword x‘ erscheint bei und der gleiche Inhalt erscheint auch bei . Diese Situation ist nicht fiktiv: Sie tritt in vielen modernen Content-Management-Systemen auf. Dann nehmen wir an, Ihr Artikel wurde von mehreren Bloggern aufgenommen und einige von ihnen verlinken auf die erste URL, während andere auf die zweite verlinken. Dies ist, wenn das Problem der Suchmaschine seine wahre Natur zeigt: Es ist Ihr Problem. Der doppelte Inhalt ist Ihr Problem, da diese Links beide für unterschiedliche URLs werben. Wenn sie alle auf dieselbe URL verlinken würden, wären Ihre Chancen auf ein Ranking für ‚Keyword x‘ höher.

Wenn Sie nicht wissen, ob Ihre Rankings unter Problemen mit doppelten Inhalten leiden, helfen Ihnen diese Tools zur Erkennung doppelter Inhalte dabei, dies herauszufinden!

Ursachen für doppelte Inhalte

Es gibt Dutzende von Gründen für doppelte Inhalte. Die meisten von ihnen sind technisch: Es kommt nicht oft vor, dass ein Mensch beschließt, denselben Inhalt an zwei verschiedenen Stellen zu platzieren, ohne klarzustellen, welches das Original ist. Es sei denn, Sie haben einen Beitrag geklont und ihn versehentlich veröffentlicht. Aber ansonsten fühlt es sich für die meisten von uns unnatürlich an.

Es gibt jedoch viele technische Gründe, und dies geschieht hauptsächlich, weil Entwickler nicht wie ein Browser oder gar ein Benutzer denken, geschweige denn wie eine Suchmaschinenspinne – sie denken wie ein Programmierer. Nehmen Sie den Artikel, den wir bereits erwähnt haben und der auf und erscheint. Wenn Sie den Entwickler fragen, werden sie sagen, dass es nur einmal existiert.

Missverständnis des Konzepts einer URL

Nein, dieser Entwickler ist nicht verrückt geworden, er spricht nur eine andere Sprache. Ein CMS wird wahrscheinlich die Website betreiben, und in dieser Datenbank gibt es nur einen Artikel, aber die Software der Website ermöglicht es nur, dass derselbe Artikel in der Datenbank über mehrere URLs abgerufen wird. Dies liegt daran, dass in den Augen des Entwicklers die eindeutige Kennung für diesen Artikel die ID ist, die der Artikel in der Datenbank hat, nicht die URL. Für die Suchmaschine ist die URL jedoch die eindeutige Kennung für einen Inhalt. Wenn Sie das einem Entwickler erklären, werden sie anfangen, das Problem zu bekommen. Und nachdem Sie diesen Artikel gelesen haben, können Sie ihnen sogar sofort eine Lösung anbieten.

Session-IDs

Sie möchten häufig den Überblick über Ihre Besucher behalten und es ihnen beispielsweise ermöglichen, Artikel, die sie kaufen möchten, in einem Warenkorb zu speichern. Um dies zu tun, müssen Sie ihnen eine Sitzung geben. Eine Sitzung ist eine kurze Geschichte dessen, was der Besucher auf Ihrer Website getan hat, und kann Dinge wie die Artikel in seinem Warenkorb enthalten. Um diese Sitzung beizubehalten, wenn ein Besucher von einer Seite zur anderen klickt, muss die eindeutige Kennung für diese Sitzung – die sogenannte Sitzungs–ID – irgendwo gespeichert werden. Die häufigste Lösung ist, dies mit Cookies zu tun. Suchmaschinen speichern jedoch normalerweise keine Cookies.

Zu diesem Zeitpunkt greifen einige Systeme auf die Verwendung von Sitzungs-IDs in der URL zurück. Dies bedeutet, dass jeder interne Link auf der Website diese Sitzungs-ID zu seiner URL hinzufügt, und da diese Sitzungs-ID für diese Sitzung eindeutig ist, wird eine neue URL und damit doppelter Inhalt erstellt.

URL-Parameter zur Nachverfolgung und Sortierung

Eine weitere Ursache für doppelte Inhalte ist die Verwendung von URL-Parametern, die den Inhalt einer Seite nicht ändern, z. B. bei Tracking-Links. Sie sehen, für eine Suchmaschine sind und nicht dieselbe URL. Letzteres könnte es Ihnen ermöglichen, zu verfolgen, aus welcher Quelle die Leute kamen, aber es könnte es auch schwieriger für Sie machen, gut zu ranken – sehr ein unerwünschter Nebeneffekt!

Dies gilt natürlich nicht nur für Tracking-Parameter. Dies gilt für jeden Parameter, den Sie einer URL hinzufügen können, der den wichtigen Inhalt nicht ändert, unabhängig davon, ob dieser Parameter zum Ändern der Sortierung für eine Reihe von Produkten oder zum Anzeigen einer anderen Seitenleiste dient: Alle verursachen doppelten Inhalt.

Scraper und Content Syndication

Die meisten Gründe für doppelte Inhalte sind entweder die Schuld von Ihnen oder Ihrer Website. Manchmal verwenden jedoch andere Websites Ihre Inhalte mit oder ohne Ihre Zustimmung. Sie verlinken nicht immer auf Ihren Originalartikel, und daher ‚bekommt‘ die Suchmaschine ihn nicht und muss sich mit einer weiteren Version desselben Artikels befassen. Je beliebter Ihre Website wird, desto mehr Scraper erhalten Sie, wodurch dieses Problem immer größer wird.

Reihenfolge der Parameter

Eine weitere häufige Ursache ist, dass ein CMS keine schönen, sauberen URLs verwendet, sondern URLs wie /?id=1&cat=2, wobei ID auf den Artikel und cat auf die Kategorie verweist. Die URL /?cat=2&id=1 wird die gleichen Ergebnisse in den meisten Website-Systeme machen, aber sie sind völlig anders für eine Suchmaschine.

Paginierung von Kommentaren

In meinem geliebten WordPress, aber auch in einigen anderen Systemen, gibt es eine Option, um Ihre Kommentare zu paginieren. Dies führt dazu, dass der Inhalt über die Artikel-URL und die Artikel-URL + / comment-page-1 /, /comment-page-2 / usw. dupliziert wird.

Druckerfreundliche Seiten

Wenn Ihr Content-Management-System druckerfreundliche Seiten erstellt und Sie von Ihren Artikelseiten aus auf diese verlinken, werden diese normalerweise von Google gefunden, es sei denn, Sie blockieren sie ausdrücklich. Fragen Sie sich jetzt: Welche Version soll Google anzeigen? Die mit Ihren Anzeigen und peripheren Inhalten oder die, die nur Ihren Artikel zeigt?

WWW vs. non-WWW

Dies ist eine der ältesten im Buch, aber manchmal verstehen Suchmaschinen es immer noch falsch: WWW vs. non-WWW Duplicate Content, wenn beide Versionen Ihrer Website zugänglich sind. Eine andere, weniger häufige Situation, die ich aber auch gesehen habe, ist HTTP vs. HTTPS Duplicate Content, bei dem derselbe Inhalt über beide bereitgestellt wird.

Konzeptionelle Lösung: eine ‚kanonische‘ URL

Wie wir bereits gesehen haben, ist die Tatsache, dass mehrere URLs zu demselben Inhalt führen, ein Problem, das jedoch gelöst werden kann. Eine Person, die bei einer Publikation arbeitet, kann Ihnen normalerweise recht einfach sagen, was die ‚richtige‘ URL für einen bestimmten Artikel sein sollte, aber manchmal, wenn Sie drei Personen innerhalb desselben Unternehmens fragen, erhalten Sie drei verschiedene Antworten …

Das ist ein Problem, das angegangen werden muss, da es am Ende nur eine (URL) geben kann. Diese ‚korrekte‘ URL für einen Inhalt wird von den Suchmaschinen als kanonische URL bezeichnet.

Ironische Randnotiz

Kanonisch ist ein Begriff aus der römisch-katholischen Tradition, in der eine Liste heiliger Bücher erstellt und als echt akzeptiert wurde. Sie wurden als die kanonischen Evangelien des Neuen Testaments bekannt. Die Ironie ist, dass die römisch-katholische Kirche ungefähr 300 Jahre und zahlreiche Kämpfe brauchte, um diese kanonische Liste zu erstellen, und sie wählten schließlich vier Versionen derselben Geschichte …

Identifying duplicate contents issues

Sie wissen möglicherweise nicht, ob Sie ein Problem mit doppelten Inhalten auf Ihrer Website oder mit Ihren Inhalten haben. Die Verwendung von Google ist eine der einfachsten Möglichkeiten, doppelte Inhalte zu erkennen.

Es gibt mehrere Suchoperatoren, die in solchen Fällen sehr hilfreich sind. Wenn Sie alle URLs auf Ihrer Website finden möchten, die Ihren Keyword X-Artikel enthalten, geben Sie den folgenden Suchbegriff in Google ein:

site:example.com intitle:"Keyword X"

Google zeigt Ihnen dann alle Seiten auf example.com die dieses Schlüsselwort enthalten. Je spezifischer Sie diesen intitle Teil der Abfrage machen, desto einfacher ist es, doppelten Inhalt auszusondern. Sie können dieselbe Methode verwenden, um doppelte Inhalte im gesamten Web zu identifizieren. Nehmen wir an, der vollständige Titel Ihres Artikels war ‚Keyword X – warum es großartig ist‘, nach dem Sie suchen würden:

intitle:"Keyword X - why it is awesome"

Und Google würde Ihnen alle Websites geben, die diesem Titel entsprechen. Manchmal lohnt es sich sogar, nach ein oder zwei vollständigen Sätzen aus Ihrem Artikel zu suchen, da einige Scraper den Titel ändern können. In einigen Fällen zeigt Google bei einer solchen Suche möglicherweise einen solchen Hinweis auf der letzten Ergebnisseite an:

Dies ist ein Zeichen dafür, dass Google die Ergebnisse bereits ‚de-duping‘. Es ist immer noch nicht gut, also lohnt es sich, auf den Link zu klicken und sich alle anderen Ergebnisse anzusehen, um zu sehen, ob Sie einige davon beheben können.

Lesen Sie mehr: DIY: Duplicate Content Check „

Praktische Lösungen für Duplicate Content

Sobald Sie sich entschieden haben, welche URL die kanonische URL für Ihren Inhalt ist, müssen Sie einen Prozess der Kanonisierung starten (ja, ich weiß, versuchen Sie, das dreimal schnell laut zu sagen). Dies bedeutet, dass wir Suchmaschinen über die kanonische Version einer Seite informieren und sie so schnell wie möglich finden lassen müssen. Es gibt vier Methoden zur Lösung des Problems in der Reihenfolge ihrer Präferenz:

  1. Keinen doppelten Inhalt erstellen
  2. Doppelten Inhalt zur kanonischen URL umleiten
  3. Hinzufügen eines kanonischen Linkelements zur doppelten Seite
  4. Hinzufügen eines HTML-Links von der doppelten Seite zur kanonischen Seite

Doppelten Inhalt vermeiden

Einige der oben genannten Ursachen für doppelten Inhalt lassen sich sehr einfach beheben:

  • Gibt es Sitzungs-IDs in Ihren URLs?
    Diese können oft nur in den Einstellungen Ihres Systems deaktiviert werden.
  • Haben Sie doppelte druckerfreundliche Seiten?
    Diese sind völlig unnötig: Sie sollten nur ein Druck-Stylesheet verwenden.
  • Verwenden Sie die Paginierung von Kommentaren in WordPress?
    Sie sollten diese Funktion (unter Einstellungen “ Diskussion) auf 99% der Websites deaktivieren.
  • Sind Ihre Parameter in einer anderen Reihenfolge?
    Weisen Sie Ihren Programmierer an, ein Skript zu erstellen, um die Parameter immer in der gleichen Reihenfolge zu platzieren (dies wird oft als URL-Factory bezeichnet).
  • Gibt es Probleme mit Tracking-Links?
    In den meisten Fällen können Sie anstelle der parameterbasierten Kampagnenverfolgung die Hashtag-basierte Kampagnenverfolgung verwenden.
  • Haben Sie WWW vs. Nicht-WWW-Probleme?
    Wählen Sie einen und bleiben Sie dabei, indem Sie den einen zum anderen umleiten. Sie können auch eine Voreinstellung in den Google Webmaster-Tools festlegen, müssen jedoch beide Versionen des Domainnamens beanspruchen.

Wenn Ihr Problem nicht so einfach behoben werden kann, lohnt es sich möglicherweise, sich die Mühe zu machen. Das Ziel sollte sein, zu verhindern, dass Duplicate Content vollständig angezeigt wird, da dies bei weitem die beste Lösung für das Problem ist.

301 Duplicate Content umleiten

In einigen Fällen ist es unmöglich, das von Ihnen verwendete System vollständig daran zu hindern, falsche URLs für Inhalte zu erstellen, aber manchmal ist es möglich, sie umzuleiten. Wenn dies für Sie nicht logisch ist (was ich verstehen kann), denken Sie daran, wenn Sie mit Ihren Entwicklern sprechen. Wenn Sie einige der Probleme mit doppelten Inhalten beseitigen, stellen Sie sicher, dass Sie alle alten URLs mit doppelten Inhalten auf die richtigen kanonischen URLs umleiten.

Verwenden von Links

Manchmal möchten oder können Sie eine doppelte Version eines Artikels nicht entfernen, selbst wenn Sie wissen, dass es sich um die falsche URL handelt. Um dieses spezielle Problem zu lösen, haben die Suchmaschinen das kanonische Linkelement eingeführt. Es befindet sich im Abschnitt <head> Ihrer Site und sieht folgendermaßen aus:

<link rel="canonical" href="http://example.com/wordpress/seo-plugin/" />

Im Abschnitt href des kanonischen Links geben Sie die korrekte kanonische URL für Ihren Artikel ein. Wenn eine Suchmaschine, die Canonical unterstützt, dieses Linkelement findet, führt sie eine weiche 301-Weiterleitung durch und überträgt den größten Teil des von dieser Seite gesammelten Linkwerts auf Ihre Canonical-Seite.

Dieser Prozess ist jedoch etwas langsamer als die 301-Weiterleitung. Wenn Sie also nur eine 301-Weiterleitung durchführen können, wäre dies vorzuziehen, wie von John Mueller von Google erwähnt.

Weiterlesen: rel=canonical • Was es ist und wie man es (nicht) benutzt „

Zurück zum ursprünglichen Inhalt verlinken

Wenn Sie nichts von dem oben Genannten tun können, möglicherweise weil Sie den <head> Abschnitt der Website, auf der Ihr Inhalt erscheint, nicht kontrollieren, ist es immer eine gute Idee, einen Link zurück zum ursprünglichen Artikel über oder unter dem Artikel hinzuzufügen. Vielleicht möchten Sie dies in Ihrem RSS-Feed tun, indem Sie einen Link zurück zu dem darin enthaltenen Artikel hinzufügen. Einige Scraper filtern diesen Link heraus, andere lassen ihn möglicherweise drin. Wenn Google auf mehrere Links stößt, die auf Ihren Originalartikel verweisen, wird es früh genug herausfinden, dass dies die tatsächliche kanonische Version ist.

Fazit: Duplicate Content ist fixierbar und sollte behoben werden

Duplicate Content passiert überall. Ich habe noch keine Website mit mehr als 1.000 Seiten gefunden, die nicht mindestens ein kleines Problem mit doppelten Inhalten hat. Es ist etwas, das Sie ständig im Auge behalten müssen, aber es ist reparierbar, und die Belohnungen können reichlich sein. Ihre Qualitätsinhalte könnten in den Rankings aufsteigen, indem Sie doppelte Inhalte von Ihrer Website entfernen!

Lesen Sie weiter: Rel=canonical: Der ultimative Leitfaden „

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

More: