Question 1

Welche User-Agents soll ich nennen?

Accepted Answer

User-agent: * gilt für alle. Häufige spezielle: Googlebot, Bingbot, Slurp (Yahoo), DuckDuckBot, Baiduspider (China), YandexBot (Russland), GPTBot (OpenAI), CCBot (Common Crawl, Trainingsdaten für AI). Beachte: Order matters - die spezifischste Match-Regel gewinnt.

Question 2

Disallow blockt das Indexieren?

Accepted Answer

Nein, nur das Crawlen. Eine bereits indexierte URL kann weiterhin in den SERPs erscheinen (oft als „leere” Beschreibung). Um die Indexierung zu verhindern, brauchst du <meta name="robots" content="noindex"> auf der Seite selbst - was wiederum nur funktioniert, wenn die Seite crawlbar bleibt. Daher: noindex (Meta) + Allow (robots.txt).

Question 3

Sollte ich /_next/static blocken?

Accepted Answer

In Pixzls eigener robots.txt war diese Regel früher drin, wurde aber entfernt - Crawler brauchen Zugriff auf Assets (CSS, JS, Bilder), um die Page korrekt rendern zu können. Ohne Asset-Zugriff degradiert das Layout-Verständnis von Google, was schlechtere Rankings bedeuten kann.

Question 4

Kann ich robots.txt für Subdomains separat haben?

Accepted Answer

Ja, und das ist sogar PFLICHT - robots.txt gilt nur pro Subdomain. www.pixzl.de und app.pixzl.de brauchen jeweils eine eigene robots.txt im Root. status.pixzl.de wäre nochmal separat.

Question 5

Werden die generierten Dateien gespeichert?

Accepted Answer

Nein. Der Output entsteht in deinem Browser aus dem von dir eingegebenen Pattern - kein Server-Roundtrip, kein Logging.

robots.txt Generator

So funktioniert das Tool

Typische Anwendungsfälle

Neue Site aufsetzen

Staging-Site komplett blocken

Spezifische Crawler limitieren

Sensitive Verzeichnisse ausschließen

Häufige Fragen

Verwandte Tools

Komplettcheck

SEO-Audit

Accessibility-Audit