Seodeluxe Blog

Artikel rund um Online Marketing

Google hat ein neues Tag entwickelt, um dem Googlebot die Erkennung von Duplicate Content zu erleichtern: rel=“canonical“. Hierbei geht es primär darum eine bevorzugte URL anzugeben. Seiten mit selbem oder ähnlichem Content, die unter der gleichen URL aufgerufen werden können, können so gezielt abgeschwächt werden.

Wo liegt das Problem?

Angenommen wir haben einen Shop der Handtücher verkauft. Eine Produkt URL könnte also z.B. aussehen:
h**p://www.handtuecher.de/product.php?item=spongebob

Durch das Aufrufen der Seite aus einer Kategorie heraus oder durch das Hinzufügen weiterer Optionen kann sich zwar die URL verändern, der Content der Seite bleibt aber gleich – Duplicate Content entsteht.
h**p://www.handtuecher.de/product.php?item=spongebob&category=kids

Die gleiche Seite könnte auch durch Tracking- oder Session URLs mehrfach aufrufbar sein:
h**p://www.handtuecher.de/product.php?item=spongebob&trackingid=1234&sessionid=5678

Hier soll nun das neue Tag rel=“canonical“ Abhilfe schaffen.

Wie funktioniert das in der Praxis?

Recht einfach. Auf der Seite, die unter mehreren URLs aufrufbar sein kann, muss folgender Link mit dem Attribut in den <head> Bereich der Seite kopiert werden:
<link rel=“canonical“ href=“h**p://www.handtuecher.de/product.php?item=spongebob“ />

Somit werden alle Duplicate Content URLs automatisch von Google erkannt und nicht weiter gewertet.

Fragen und Antworten

Ist rel=“canonical“ ein Hinweis oder eine Pflichtangabe?
Es ist ein Hinweis der aber stark gewertet wird. Die Empfehlung des Webmasters in Verbindung mit anderen Bewertungskriterien von Google soll letztendlich zum meist relevanten Ergebnis in den Suchergebnissen führen.

Kann ich einen relativen Pfad zur Angabe der kanonischen URL verwenden, zum Beispiel <link rel=“canonical“ href=“product.php?item=spongebob“ />?
Ja, relative Pfade werden erkannt und gewertet. In Verbindung mit der Angabe einer <base> URL werden relative Pfadangaben also ganz normal aufgelöst und gewertet.

Was passiert wenn die rel=“canonical“ einen 404 Fehler zurückliefert?
Der Content der Domain wird weiterhin gespidert um die Webseite mit dem Ursprungscontent zu finden. Es wird aber natürlich empfohlen, das die Angabe der kanonischen URL immer eine real existierende Seite betrifft.

Kann rel=“canonical“ auf einen Redirect angewendet werden?
Ja, es kann eine URL mit einem Redirect als kanonische URL angegeben werden. Google verfolgt diesen dann wie gewohnt und wird versuchen, das Ziel des Redirects zu verarbeiten und der kanonischen URL zuzuordnen.

Weitere Fragen und Antworten könnt ihr auf englisch im offiziellen Google Webmaster Central Blog lesen.

Bedeutet rel=“canonical“ das Ende von Duplicate Content? Werdet ihr das Tag sofort einsetzen? Was ist eure Meinung zu dem Thema?

11 comments

  • Beschäftigen wir uns auch gerade mit. IMHO ist es doch erstmal besser DC komplett zu vermeiden und wenn man ihn schon erkannt hat mit 301, noindex und nofollow zu bekämpfen. So kann der Bot doch auch viel effektiver spidern, oder? Ich meine der muss dann nicht die zig Seiten mit canonical anschauen, sondern kommt erst gar nicht auf den DC.

    Hier ist auch noch ein netter Artikel darüber.

    Antworten
  • Hallo Christian, da hast Du einerseits natürlich recht – es gilt natürlich schon bei der Planung eines Projektes eventuellen Duplicate Content zu vermeiden. Die zig Seiten, von denen Du schreibst, schaut sich der Bot aber eh zwangsläufig alle an. Aber es kann nun gezielt ein Dokument als Contentquelle angegeben werden, vielfach war ja die Zuordnung was das Original und was Duplicate Content war schlichtweg nicht zufriedenstellend.

    Antworten
  • Ich werde es vorerst nicht nutzten. Bisher denke ich, dass es mit dem DC noch nicht so schlimm sein sollte in meinem einfachen Blog. Die Anfragen mit „www“ leite ich aber schon er 302 auf „ohne www“ um, sodass da zumindest nix doppelt gefunden wird 😉

    Antworten
  • Weiterleitungen gehen z.B. in einem Shop System nicht. Hier zwei URLs die einen anderen Navigationseinstieg haben, aber dennoch zum selben Content führen:

    shop.de/Produkte/HantuchXY
    shop.de/Suche/H/Handtuch/HandtuchXY

    Genau dafür sollte man es nutzen!

    Antworten
  • Oh, schande über mich – hatte diesen Feed ja noch gar nicht abonniert? Ist jetzt aber nachgeholt…

    Meine Einstellung liegt auch eher bei der von Christian. Also am besten DC schon von vorneherein vermeiden anstatt das Kind aus dem Brunnen zu holen versuchen, wenn es schon reingefallen ist. Allein schon, um eine umfangreiche Website auch überhaupt für eigene Tools wie Linkchecker fit zu machen. Wie oft habe ich Xenu bei einem neuen Projekt schon den Speicher sprengen und sich mit einem GPF verabschieden sehen…

    Deswegen werde ich dieses Tag nicht prinzipiell nutzen, sondern nur selektiv, da wo es nötig bzw. sinnvoll ist. Verschieden sortierte Produktlisten lassen sich ja beispielsweise aus Usability-Sicht nicht vermeiden. Und diese per robots.txt zu entschärfen kann auch je nach URL-Struktur ein ganz schönes Gefiesel sein. Dort ist dieses Tag also ideal. Wie eben auch bei so manchen anderen Sonderkonstellationen, wo es sicher einen brutalen Mehraufwand bedeutet, wenn man es „klassisch“ löst.

    Aber für alle anderen Zwecke? Da werd ich es erst mal nicht einsetzen. Außer in meinem Blog, da hab ich einfach mal testweise ein Plugin installiert, das die canonicals verwaltet, damit ich es in der Praxis kennenlerne und ggf. auch entsprechend bei Kunden einsetzen kann, wenn ich dort über ein derartiges Problem stolpere.

    Antworten
  • Hallo zusammen,

    also
    wenn im header rel=“canonical“ steht, dann bedeutet „das ist mein doppelten content“,

    oder grade umgekehrt:

    wenn so was wie rel=“canonical“ im header steht, dann bedeutet es – „das ist mein unique content“.

    Wie ist es genau richtig?

    Antworten
    • Es bedeutet: „Das ist mein uniquer Content. Du findest ihn vielleicht öfter im Netz, aber das Original ist von mir.“

      Antworten
  • Das mit dem Head-Bereich und der URL habe ich verstanden.

    Aber nicht so ganz den praktischen Einsatz. Bedeutet das, wenn ich zwei (oder mehrere) Domains mit statischen Seiten habe, dass ich dann bei jeder Seite auch die direkte Unterseite mit angebe?

    Also:
    domain.de/seite1.html gäbe es auch auf domain2.de/seite1.html. Wäre dann in canonical eben domain.de/seite1.html einzutragen?

    Antworten
  • Hallo Marcell,
    ich hätte die gleiche Frage wie Dallmeier. Bei welchen Seiten im Head Bereich trage ich jetzt genau das link rel canonical ein? Ich finde es ohnehin seltsam im head bereich einen link anzugeben – aber gut, mache ich gerne. Wir haben das Problem von doppelten metatags und titles. Ich habe eine Seite (seite1.html) und – nehmen wir an – zwei Seiten (seite2.html und seite3.html) mit dem selben Inhalt, die wir aber nicht indiziert haben wollen.

    Schreibe ich jetzt auf allen drei Seiten im head-Bereich den link canonical seite1.html – code rein??

    Und die links auf unserer Plattform, die auf die Seite verweisen? Muss da der rel=“canonical“ auch rein oder eben nur im Head-Bereich der Seiten?

    Und noch eine andere Frage – wie verschachtel mehrere rel=“..“ Angaben hintereinander? Ich brauche nämlich teilweise noch eine rel=“(Seitengrößenangabe)“ und einen rel“nofollow“

    Vielen Dank für eine Antwort

    Thomas

    Antworten
    • Das sind aber viele Fragen Thomas… wollen wir mal sehen: auf jeder Seite einfach die absolute URL als rel=“canonical“ rein, um Duplicate mit z.B. Parametern dran auszuschließen. Wenn Du drei Seiten hast, dann hast Du auch drei verschiedene Canonicals, ja.

      Das Problem mit doppelten Titles und Metatags ist ein eigenständiges: hier also einfach nachbessern und unique umschreiben. Canonical hat in Links nichts zu suchen, nicht verwechseln mit dem rel=“nofollow“, das einen ganz anderen Zweck erfüllen soll. Mehrere Angaben verschachteln halte ich nicht für sinnvoll, wofür soll denn eine Seitengrößenangabe gut sein? Ansonsten einfach mit dem Komma versuchen wie bei dem Metatag robots.

      Ich hoffe, das hilft Dir weiter.
      Marcell

      Antworten
  • Hallo!
    Ich bin durch die Google-Suche auf Ihren wirklich sehr interessanten Blog aufmerksam geworden. Bezüglich des Absatzes „Canonical URL“ stellt sich für mich nun folgende Frage:
    Als Konstrukt wird angenommen, das folgende URL-Konstellation existiert:
    h**p://beispiel.de
    h**p://www.beispiel.de
    h**p://example.com
    h**p://www.example.com
    h**p://muster.info
    h**p://www.muster.info

    Nun sollen – zwecks Vermeidung doppelten Contents – sämtliche Anfragen zur Seite h**p://www.muster.info gelangen. Unter h**p://www.muster.info existiert eine index.html, die letzten Endes als Vorschaltseite (rechtliche Hinweise etc.) vor ein Forum (Forensoftware vBulletin 4.1.4) dient.

    Ist es nun ausreichend, in die index.html zu implementieren oder muss dieses Tag dann auch noch im Header der Forensoftware „eingepflanzt“ werden?

    Ich habe schon etliche Seiten über sog. 301-Weiterleitungen gefunden, nur verwirren die mich mehr als sie mir dienlich sind. Ich hoffe daher, das Sie mir evtl. bei der Beantwortung meiner Frage behilflich sein bzw. mir mit weiteren Hinweisen weiterhelfen können.
    Für eine kurze Rückantwort Ihrerseits wäre ich Ihnen sehr verbunden und verbleibe mit freundlichen Grüßen
    Holger Walter

    Antworten