Das neue Google Tag rel=”canonical” zur Bekämpfung von Duplicate Content

Das neue Google Tag rel=”canonical” zur Bekämpfung von Duplicate Content

Google hat ein neues Tag entwickelt, um dem Googlebot die Erkennung von Duplicate Content zu erleichtern: rel=”canonical”. Hierbei geht es primär darum eine bevorzugte URL anzugeben. Seiten mit selbem oder ähnlichem Content, die unter der gleichen URL aufgerufen werden können, können so gezielt abgeschwächt werden.

Wo liegt das Problem?

Angenommen wir haben einen Shop der Handtücher verkauft. Eine Produkt URL könnte also z.B. aussehen:
h**p://www.handtuecher.de/product.php?item=spongebob

Durch das Aufrufen der Seite aus einer Kategorie heraus oder durch das Hinzufügen weiterer Optionen kann sich zwar die URL verändern, der Content der Seite bleibt aber gleich - Duplicate Content entsteht.
h**p://www.handtuecher.de/product.php?item=spongebob&category=kids

Die gleiche Seite könnte auch durch Tracking- oder Session URLs mehrfach aufrufbar sein:
h**p://www.handtuecher.de/product.php?item=spongebob&trackingid=1234&sessionid=5678

Hier soll nun das neue Tag rel=”canonical” Abhilfe schaffen.

Wie funktioniert das in der Praxis?

Recht einfach. Auf der Seite, die unter mehreren URLs aufrufbar sein kann, muss folgender Link mit dem Attribut in den <head> Bereich der Seite kopiert werden:
<link rel=”canonical” href=”h**p://www.handtuecher.de/product.php?item=spongebob” />

Somit werden alle Duplicate Content URLs automatisch von Google erkannt und nicht weiter gewertet.

Hier einige Fragen und Antworten:

Ist rel=”canonical” ein Hinweis oder eine Pflichtangabe?
Es ist ein Hinweis der aber stark gewertet wird. Die Empfehlung des Webmasters in Verbindung mit anderen Bewertungskriterien von Google soll letztendlich zum meist relevanten Ergebnis in den Suchergebnissen führen.

Kann ich einen relativen Pfad zur Angabe der kanonischen URL verwenden, zum Beispiel <link rel=”canonical” href=”product.php?item=spongebob” />?
Ja, relative Pfade werden erkannt und gewertet. In Verbindung mit der Angabe einer <base> URL werden relative Pfadangaben also ganz normal aufgelöst und gewertet.

Was passiert wenn die rel=”canonical” einen 404 Fehler zurückliefert?
Der Content der Domain wird weiterhin gespidert um die Webseite mit dem Ursprungscontent zu finden. Es wird aber natürlich empfohlen, das die Angabe der kanonischen URL immer eine real existierende Seite betrifft.

Kann rel=”canonical” auf einen Redirect angewendet werden?
Ja, es kann eine URL mit einem Redirect als kanonische URL angegeben werden. Google verfolgt diesen dann wie gewohnt und wird versuchen, das Ziel des Redirects zu verarbeiten und der kanonischen URL zuzuordnen.

Weitere Fragen und Antworten könnt ihr auf englisch im offiziellen Google Webmaster Central Blog lesen.

Bedeutet rel=”canonical” das Ende von Duplicate Content? Werdet ihr das Tag sofort einsetzen? Was ist eure Meinung zu dem Thema?


bookmark bookmark bookmark bookmark bookmark bookmark bookmark bookmark bookmark bookmark bookmark bookmark
tabs-top


12 Kommentare zu “Das neue Google Tag rel=”canonical” zur Bekämpfung von Duplicate Content”

  1. Christian says:

    Beschäftigen wir uns auch gerade mit. IMHO ist es doch erstmal besser DC komplett zu vermeiden und wenn man ihn schon erkannt hat mit 301, noindex und nofollow zu bekämpfen. So kann der Bot doch auch viel effektiver spidern, oder? Ich meine der muss dann nicht die zig Seiten mit canonical anschauen, sondern kommt erst gar nicht auf den DC.

    Hier ist auch noch ein netter Artikel darüber.
    http://www.conversationmarketing.com/2009/02/3-reasons-to-use-rel-canonical.htm

  2. Seodeluxe says:

    Hallo Christian, da hast Du einerseits natürlich recht - es gilt natürlich schon bei der Planung eines Projektes eventuellen Duplicate Content zu vermeiden. Die zig Seiten, von denen Du schreibst, schaut sich der Bot aber eh zwangsläufig alle an. Aber es kann nun gezielt ein Dokument als Contentquelle angegeben werden, vielfach war ja die Zuordnung was das Original und was Duplicate Content war schlichtweg nicht zufriedenstellend.

  3. [...] Google  hat ein neues Tag zur Bekämpfung von Duplicate Content eingeführt. Nähere Informationen gibt es bei Thomas Zeithaml und auf Seodeluxe. [...]

  4. [...] Zeit ist das rel-Attribut ja mal wieder im Gespräch, diesmal im Zusammenhang mit den kanonischen URLs. So richtig Furore hat es aber damals bei der Einführung von rel=”nofollow” [...]

  5. mr.gene says:

    Ich werde es vorerst nicht nutzten. Bisher denke ich, dass es mit dem DC noch nicht so schlimm sein sollte in meinem einfachen Blog. Die Anfragen mit “www” leite ich aber schon er 302 auf “ohne www” um, sodass da zumindest nix doppelt gefunden wird ;)

  6. Weiterleitungen gehen z.B. in einem Shop System nicht. Hier zwei URLs die einen anderen Navigationseinstieg haben, aber dennoch zum selben Content führen:

    shop.de/Produkte/HantuchXY
    shop.de/Suche/H/Handtuch/HandtuchXY

    Genau dafür sollte man es nutzen!

  7. SEOdiot says:

    Oh, schande über mich - hatte diesen Feed ja noch gar nicht abonniert? Ist jetzt aber nachgeholt…

    Meine Einstellung liegt auch eher bei der von Christian. Also am besten DC schon von vorneherein vermeiden anstatt das Kind aus dem Brunnen zu holen versuchen, wenn es schon reingefallen ist. Allein schon, um eine umfangreiche Website auch überhaupt für eigene Tools wie Linkchecker fit zu machen. Wie oft habe ich Xenu bei einem neuen Projekt schon den Speicher sprengen und sich mit einem GPF verabschieden sehen…

    Deswegen werde ich dieses Tag nicht prinzipiell nutzen, sondern nur selektiv, da wo es nötig bzw. sinnvoll ist. Verschieden sortierte Produktlisten lassen sich ja beispielsweise aus Usability-Sicht nicht vermeiden. Und diese per robots.txt zu entschärfen kann auch je nach URL-Struktur ein ganz schönes Gefiesel sein. Dort ist dieses Tag also ideal. Wie eben auch bei so manchen anderen Sonderkonstellationen, wo es sicher einen brutalen Mehraufwand bedeutet, wenn man es “klassisch” löst.

    Aber für alle anderen Zwecke? Da werd ich es erst mal nicht einsetzen. Außer in meinem Blog, da hab ich einfach mal testweise ein Plugin installiert, das die canonicals verwaltet, damit ich es in der Praxis kennenlerne und ggf. auch entsprechend bei Kunden einsetzen kann, wenn ich dort über ein derartiges Problem stolpere.

  8. [...] welche Google bevorzugt behandeln soll. Die eigentliche Seite wird dann nicht weiter bewertet. Auf SEOdeluxe gibt es noch ein paar tiefere Einblicke von [...]

  9. SEO-Designer says:

    Hallo zusammen,

    also
    wenn im header rel=”canonical” steht, dann bedeutet “das ist mein doppelten content”,

    oder grade umgekehrt:

    wenn so was wie rel=”canonical” im header steht, dann bedeutet es - “das ist mein unique content”.

    Wie ist es genau richtig?

  10. Seodeluxe says:

    Es bedeutet: “Das ist mein uniquer Content. Du findest ihn vielleicht öfter im Netz, aber das Original ist von mir.”

  11. [...] seodeluxe.de googlewebmastercentral.blogspot.com [...]

  12. Dallmeier says:

    Das mit dem Head-Bereich und der URL habe ich verstanden.

    Aber nicht so ganz den praktischen Einsatz. Bedeutet das, wenn ich zwei (oder mehrere) Domains mit statischen Seiten habe, dass ich dann bei jeder Seite auch die direkte Unterseite mit angebe?

    Also:
    domain.de/seite1.html gäbe es auch auf domain2.de/seite1.html. Wäre dann in canonical eben domain.de/seite1.html einzutragen?

Kommentar hinterlassen