Heute habe ich versucht, auf einer meiner Websites zu suchen, da ich dachte, ich hätte eine Seite über diese oder jene und habe bei meiner Suche Folgendes verwendet:
site:m2osw.com upload
Ich habe angefangen, die Ergebnisse zu durchsuchen und konnte nicht genau die Seite finden, die ich suchte, aber ich habe festgestellt, dass eine meiner Websites, "blah.m2osw.com", in den Ergebnissen auftauchte!
Dies war eine große Überraschung für mich, da diese Site seit langer Zeit die richtige kanonische URL hat und auf eine andere Domain verweist. Etwas wie das:
<link rel="canonical"
type="text/html"
title="Home Page"
href="https://exdox.com"/>
Ich dachte, wann immer Sie eine Canonical hatten, würde es Google anweisen, dort nachzuschauen, aber jetzt habe ich Zweifel und denke, dass diese Canonicals möglicherweise nicht domänenübergreifend funktionieren? Ich dachte, ich hätte irgendwo gelesen, dass es der beste Weg ist, eine Test-Site an einem beliebigen Ort zu haben und die Test-Site auf die reale Site zu verweisen, damit Google die reale Site und nicht die Test-Site indiziert ...
Wissen Sie, ob diese Canonical von https://blah.m2osw.com
korrekt aussieht oder ob ich noch etwas hinzufügen müsste (d. H. Die Roboter = NOINDEX zum Beispiel ...)
<meta rel="canonical" type="text/html" title="Home Page" href="https://exdox.com"/>
Das ist falsch. Dies sollte ein link
-Element sein, kein meta
-Element. Zum Beispiel:
<link rel="canonical" href="https://exdox.com">
Die Attribute type
und title
sind in diesem Zusammenhang irrelevant.
Gibt "site:" Seiten zurück, die sonst nicht zurückgegeben würden?
Dies ist jedoch richtig. Der Google site:
-Operator gibt tatsächlich URLs zurück, die bei einer normalen Google-Suche normalerweise nicht zurückgegeben würden. Das Link-Element rel="canonical"
verhindert nicht unbedingt, dass beide Seiten indiziert werden , aber es weist Google an, dies zu tun Geben Sie die kanonische Seite in den SERPs zurück, wenn dies möglich ist. (Der Operator site:
gibt die Seiten zurück, die indexiert sind .) Ob Google diesen Ratschlägen folgt, liegt jedoch bei Google. Wenn Google (nach eigener Analyse) nicht der Meinung ist, dass die deklarierte "kanonische" URL nicht wirklich kanonisch (dh ausreichend ähnlich) ist, kann sie ignoriert werden. Von Google Webmaster-Zentralblog - Behandlung legitimer domänenübergreifender Inhaltsduplikationen
Obwohl das Link-Element rel = "canonical" als Hinweis und nicht als absolute Anweisung angesehen wird, versuchen wir, es nach Möglichkeit zu befolgen.
UPDATE: Wenn dies eine "Test-Site" ist, sollte sie wahrscheinlich überhaupt nicht indiziert werden und das rel="canonical"
-Tag ist meistens irrelevant. Sie sollten entweder noindex
(Robots meta
-Tag oder X-Robots-Tag
HTTP-Antwortheader) oder robots.txt
blockieren oder den Zugriff auf andere Weise einschränken (pwd, IP-Einschränkung usw.) .
Wissen Sie, ob diese kanonische Version von https://blah.m2osw.com korrekt aussieht?
Dies ist ein Beispiel für eine wirklich lustige Frage;)
Auf den Punkt gebracht: