| |||||||
| Google Hier werden sämtliche Themen rund um die Suchmaschinenoptimierung für Google behandelt. |
![]() |
| | Themen-Optionen | Thema durchsuchen | Ansicht |
|
#1
| |||
| |||
| Hallo an alle, ich habe eine Frage zur korrekten Syntax, wenn man den Googlebot mittels robots.txt von bestimmten Seiten ausschließen will. Ist wahrscheinlich eine Anfängerfrage, aber ich habe hier im Forum gelesen, dass sich manche Leute mit einer fehlerhaften robots.txt-Datei schon böse in den Fuss geschossen haben. Das möchte ich natürlich vermeiden... Zu meiner Frage: ich weiss, dass die allgemeine robots.txt-Syntax folgendermaßen aussieht: User-Agent: * Disallow: / Nun zum konkreten Beispiel. Meine Website ist ungefähr folgendermaßen aufgebaut: http://www.domain.de/produktgruppe-1/produkt-a/produkt-a.html http://www.domain.de/produktgruppe-1/produkt-b/produkt-b.html http://www.domain.de/produktgruppe-1/produkt-c/produkt-c.html http://www.domain.de/produktgruppe-2/produkt-a/produkt-a.html usw... Wie lautet nun der korrekte Code in der robots.txt-Datei, wenn ich den Googlebot daran hindern will, in Produktgruppe 1 die Seite produkt-a.html zu besuchen, alle anderen Seiten aber weiter indexiert werden sollen? Meine erste Idee hierzu war: User-Agent: * Disallow: /produkt-a.html Aber dies hätte wohl zur Konsequenz, dass auch die gleichnamige Seite produkt-a.html in Produktgruppe 2 nicht mehr indexiert würde. Oder? Der zweite Ansatz wäre dann, folgendermßen vorzugehen: User-Agent: * Disallow: /produktgruppe-1/produkt-a/produkt-a.html Bei diesem Ansatz habe ich jedoch die Befürchtung, gleich die gesamte Produktgruppe 1 von der Indexierung auszuschließen. Oder ist diese Befürchtung unbegründet? Wäre nett, wenn mir hier jemand weiterhelfen könnte. Viele Grüße, Matthias |
|
#2
| |||
| |||
| Hallo Matthias Dein 2. Ansatz ist richtig. Deine Befürchtung ist unbegründet. Nur diese eine Seite wird gesperrt, nicht die ganze Produktgruppe-1. Und auf Produktgruppe-2 hat das ebenfalls keinen Einfluss. Gruss Xenos |
|
#3
| |||
| |||
| Hallo Xenos, danke für die schnelle Antwort. Noch eine kurze Nachfrage, um das Prinzip besser zu verstehen. Mit User-Agent: * Disallow: http://www.domain.de/produktgruppe-1/produkt-a/produkt-a.html müsste es dann eigentlich genauso funktionieren. Richtig? D.h. auch hier wird nur Produkt a in Produktgruppe 1 von der Indexierung ausgeschlossen, während alle anderen Seiten der Domain weiterhin für den Googlebot erreichbar bleiben. Ist das korrekt? Viele Grüße, Matthias |
|
#4
| |||
| |||
| Hi Matthias Nein, dieser Syntax ist nicht korrekt. Zumindest nicht nach dem Standard-Protokoll von 1994. Du schreibst "User-Agent: *", sprichst dann aber vom Googlebot. - Wenn du nur den Googlebot ausschliessen willst, sieht das so aus: User-agent: Googlebot Disallow: /produktgruppe-1/produkt-a/produkt-a.html Gruss Xenos |
![]() |
| Themen-Optionen | Thema durchsuchen |
| Ansicht | |
|
|
Ähnliche Themen | ||||
| Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
| Ausversehen falsche robots.txt | StephanZ | 4 | 05-09-2006 13:44 | |
| MSN und robots.txt | YeeHa | MSN | 3 | 18-01-2006 16:35 |
| Ausschluß dynamischer Seiten per robots.txt | Mario670 | 3 | 01-12-2005 01:14 | |
| Robots.txt | jr-ewing | Suchmaschinenoptimierung allgemein | 6 | 29-11-2005 01:13 |