llms.txt — die neue robots.txt fuer AI-Engines
llms.txt ist ein emergierender Standard, um AI-freundliche Content-Quellen am Domain-Root zu deklarieren. Was es tut, wer es liest, wie du diese Woche eines ausspielst.
Was llms.txt ist
llms.txt ist eine Markdown-formatierte Datei im Root deiner Domain (/llms.txt), die die kanonischen, maschinenlesbaren Informationsquellen fuer AI-Konsum deklariert. Stell es dir als kuratiertes Inhaltsverzeichnis fuer LLMs vor: statt 500 Seiten zu crawlen und zu raten, was autoritativ ist, kann eine AI-Engine deine llms.txt lesen und weiss, welche 20 Seiten deine kanonischen Produkt-, Preis-, FAQ-Informationen tragen.
Wie es aussieht
Minimal-valide llms.txt:
# DeineMarke
> Ein-Satz-Beschreibung, was dein Unternehmen/Produkt macht.
## Dokumentation
- [Produkt-Uebersicht](https://yoursite.com/product): was wir tun, Kern-Features
- [Preise](https://yoursite.com/pricing): Pakete und Limits
- [API-Referenz](https://yoursite.com/api): vollstaendige Endpoint-Liste
## Vergleich
- [vs. Wettbewerber A](https://yoursite.com/vs/comp-a)
- [vs. Wettbewerber B](https://yoursite.com/vs/comp-b)
## Support
- [FAQ](https://yoursite.com/faq)
- [Kontakt](https://yoursite.com/contact)Wer llms.txt heute liest
Adoption teilweise, aber wachsend. Anthropics Claude hat explizite Unterstuetzung, Perplexity hat signalisiert, dass sie es parsen, und mehrere kleinere Research-Engines (und zunehmend Developer-Tools — IDE-Assistenten, Doc-Generatoren) lesen es routinemaessig. Google und OpenAI haben sich nicht formal committed, aber auch nicht signalisiert, dass sie es ignorieren. Kosten-Nutzen ueberwaeltigend pro Ausspielen.
Wann llms.txt ausspielen — wann ueberspringen?
Ausspielen, wenn:
- Mehr als 50 indexierbare Seiten (Signal-to-Noise profitiert von Kuration).
- Du Komplexes verkaufst (API, SaaS, professionelle Services), wo die falsche zitierte Seite schlimmer als keine Citation ist.
- Du mehrere Sprachvarianten hast (DE/EN/FR) und AI-Engines wissen sollen, welche fuer deinen Primaer-Markt kanonisch ist.
Ueberspringen, wenn:
- Weniger als 20 Seiten und Homepage bereits klare Zusammenfassung.
- Du AI-Engines aktiv vom Konsum ausschliessen willst (dann ueber robots.txt blocken).
Haeufige Fehler
- Zu viele Seiten gelistet. llms.txt ist eine Kurations-Datei, keine Sitemap. Ziel: 10–30 Eintraege gruppiert nach Sektion.
- H1 vergessen. Ohne
# DeineMarkeoben kann AI-Engine keine Entity-Identitaet etablieren. - Tiefe Blog-Posts verlinken. Auf Evergreen-Pillar-Content verlinken. Zeitkritische Posts gehoeren in den RSS-Feed oder die Sitemap.
- Sprachen ohne Declaration mischen. Bei mehrsprachiger Site
/llms.txtfuer die Primaer-Sprache, plus/en/llms.txt,/de/llms.txtpro Locale.
Verifizieren, dass es wirkt
Drei Checks:
- `curl https://yourdomain.com/llms.txt` liefert 200 + plain text (nicht 404, nicht 301-anywhere).
- Claude oder Perplexity nach deiner Marke fragen und Citation-Muster ansehen. Seiten aus deiner llms.txt-Liste sollten ueberproportional erscheinen.
- Longitudinaler AI-Visibility-Track zur Pruefung, ob Citation-Count nach Deploy stieg. Zwei Wochen reichen meist fuer Signal.