webentwicklung-frage-antwort-db.com.de

Verhindern, dass ein Link auf einer Seite indiziert und befolgt wird

Ich habe im Beitrag gelesen, wie sich der Wert nofollow auf Crawler/Indizierungen auswirkt. Die Informationen aus den Antworten der Post enden jedoch 2012.

In meinem Fall habe ich eine Dateiseite, die von Google indiziert wird. Auf dieser Seite gibt es jedoch einen Download-Link (endet mit ? Download ). Ich bin mir nicht sicher, ob der Link auch indexiert war, aber ich würde das gerne wissen: Wie kann ich sicherstellen, dass ein Link auf einer Seite nicht indexiert und verfolgt wird?

Benutze ich die robots.txt-Datei und übergebe so etwas? -

Disallow: /*?download$

Oder setze ich einfach rel="nofollow" auf den Download-Link?

Was mache ich außerdem mit den möglicherweise bereits indizierten Download-Links?

Vielen Dank!

UPDATE:

Laut Googles nofollowdocs:

Im Allgemeinen folgen wir ihnen nicht. Dies bedeutet, dass Google keinen PageRank- oder Ankertext über diese Links überträgt. Im Wesentlichen führt die Verwendung von nofollow dazu, dass wir die Ziellinks aus unserer Gesamtgrafik des Webs entfernen. Die Zielseiten können jedoch weiterhin in unserem Index angezeigt werden, wenn andere Websites ohne Verwendung von nofollow auf sie verlinken oder wenn die URLs in einer Sitemap an Google gesendet werden.

Ich nehme also an, dass die Angabe, dass die "Seiten möglicherweise noch in unserem Index enthalten sind" darauf hindeutet, dass die Links, die nofollow verwenden, im Allgemeinen nicht indexiert werden - mit den in der genannten Ausnahmen docs.

Ich denke, das regelt es, aber wenn jemand zusätzliche Informationen hat, um dies zu unterstützen, fühlen Sie sich willkommen.

3
lesssugar

Wenn Sie wirklich verhindern möchten, dass ein Link indiziert oder verfolgt wird, können Sie Folgendes tun:

  1. Wenn Sie eine serverseitige Skriptsprache verwenden oder über einen ausreichenden Apache-Zugriff verfügen, ändern Sie den Code so, dass an die nicht zu indizierende Seite ein HTTP 410-Statuscode angehängt ist. Dies bedeutet, dass die Seite endgültig gelöscht ist. Dadurch wird die vorherige Seite effektiv aus dem Google-Index entfernt.

  2. Fügen Sie im HTML zwischen <head> und </head><meta name="ROBOTS" content="NOINDEX,NOFOLLOW"> hinzu, um die Roboter anzuweisen, die Seite nicht zu indizieren.

Was nun alle geheimen Seiten betrifft, die Sie in Zukunft erstellen möchten, schlage ich vor, ein Formular mit der Methode POST anstelle von GET und mit der folgenden Art von Code zu erstellen:

<form method="POST" action="http://example.com/path/to/secret">
  <input type="submit" value="button label">
</form>

Auf diese Weise können Sie mithilfe von Skripts verhindern, dass Benutzer auf diese geheime URL zugreifen und sie nur manuell in die Adressleiste eingeben.

2
Mike

Nichts auf der Welt macht einen echten Link für Google unauffindbar.

Selbst wenn Sie Ihr http://example.com/page?download schließen, indem Sie mit robots.txt crawlen, die Download-Seite mit noindex dekodieren und den Link mit nofollow kennzeichnen - das reicht aus, um Erhalten Sie einen einzelnen eingehenden Backlink zu Ihrem http://example.com/page?download , und die Seite wird gecrawlt.

Verwenden Sie deshalb einen besseren Button anstelle eines Links

<form method="get" action="file.exe">
  <button type="submit">Download</button>
</form>
1
Evgeniy

Sie sollten `rel =" nofollow "für externe Links auf Ihrer Seite verwenden, zum Beispiel Links zu Artikeln in anderen Blogs oder Produkten usw.

Und verwenden Sie Disallow in robots.txt für interne Seiten.

0
knif3r