Question 1

Was passiert bei einem Syntax-Fehler in robots.txt?

Accepted Answer

Google ignoriert nur die fehlerhafte Zeile, nicht die ganze Datei - ist also tolerant. Andere Bots (besonders ältere) können die ganze Datei verwerfen, was effektiv „alles erlaubt” bedeutet. Sauberer Syntax ist also Pflicht.

Question 2

Wie funktioniert das Allow-Pattern?

Accepted Answer

Allow überschreibt vorherige Disallows für denselben Pfad-Prefix oder spezifischer. Allow: /privat/oeffentlich-zugaenglich/ in Kombination mit Disallow: /privat/ erlaubt nur den einen Unterordner. Reihenfolge ist egal - die spezifischste Match-Regel gewinnt, nicht die letzte.

Question 3

Funktionieren Wildcards in robots.txt?

Accepted Answer

Ja, aber begrenzt. * matcht beliebig viele Zeichen (Disallow: /*.pdf$ blockt alle PDFs). $ markiert das Ende der URL. Andere Regex-Features (Klammern, Zeichenklassen) sind nicht Teil des Standards und werden meist ignoriert.

Question 4

Was bedeutet ein User-Agent: * mit Disallow: /

Accepted Answer

Komplett-Block für alle Bots - die Seite wird nicht gecrawlt. Wenn das versehentlich live geht, fliegt deine Site aus dem Google-Index. Search Console schlägt Alarm, aber das kann bis zu 24h dauern. Validator-Check vor Production-Deploy ist daher wichtig.

Question 5

Werden die getesteten URLs gespeichert?

Accepted Answer

Domain anonymisiert für 24h. Inhalt der robots.txt ist öffentlich - kein Logging.

robots.txt Validator

So funktioniert das Tool

Typische Anwendungsfälle

Nach robots.txt-Änderung verifizieren

Bug-Report-Vorbereitung

Migration: alte vs. neue Site

Bot-spezifische Pfad-Tests

Häufige Fragen

Verwandte Tools

Komplettcheck

SEO-Audit

Accessibility-Audit