Standards

llms.txt — die neue robots.txt fuer AI-Engines

llms.txt ist ein emergierender Standard, um AI-freundliche Content-Quellen am Domain-Root zu deklarieren. Was es tut, wer es liest, wie du diese Woche eines ausspielst.

von Robert Langner·Veroeffentlicht: 2026-02-20·6 Min. Lesezeit

llms.txtTechnicalStandards

robots.txt sagte Suchmaschinen, was sie crawlen duerfen. llms.txt sagt AI-Engines, was sie *verstehen* sollen. Der Standard ist jung, aber Adoption beschleunigt — und Ausspielen ist ein 30-Minuten-Job, der deine Site zukunftssicher macht.

Was llms.txt ist

llms.txt ist eine Markdown-formatierte Datei im Root deiner Domain (/llms.txt), die die kanonischen, maschinenlesbaren Informationsquellen fuer AI-Konsum deklariert. Stell es dir als kuratiertes Inhaltsverzeichnis fuer LLMs vor: statt 500 Seiten zu crawlen und zu raten, was autoritativ ist, kann eine AI-Engine deine llms.txt lesen und weiss, welche 20 Seiten deine kanonischen Produkt-, Preis-, FAQ-Informationen tragen.

Wie es aussieht

Minimal-valide llms.txt:

# DeineMarke

> Ein-Satz-Beschreibung, was dein Unternehmen/Produkt macht.

## Dokumentation
- [Produkt-Uebersicht](https://yoursite.com/product): was wir tun, Kern-Features
- [Preise](https://yoursite.com/pricing): Pakete und Limits
- [API-Referenz](https://yoursite.com/api): vollstaendige Endpoint-Liste

## Vergleich
- [vs. Wettbewerber A](https://yoursite.com/vs/comp-a)
- [vs. Wettbewerber B](https://yoursite.com/vs/comp-b)

## Support
- [FAQ](https://yoursite.com/faq)
- [Kontakt](https://yoursite.com/contact)

Wer llms.txt heute liest

Adoption teilweise, aber wachsend. Anthropics Claude hat explizite Unterstuetzung, Perplexity hat signalisiert, dass sie es parsen, und mehrere kleinere Research-Engines (und zunehmend Developer-Tools — IDE-Assistenten, Doc-Generatoren) lesen es routinemaessig. Google und OpenAI haben sich nicht formal committed, aber auch nicht signalisiert, dass sie es ignorieren. Kosten-Nutzen ueberwaeltigend pro Ausspielen.

Wann llms.txt ausspielen — wann ueberspringen?

Ausspielen, wenn:

Mehr als 50 indexierbare Seiten (Signal-to-Noise profitiert von Kuration).
Du Komplexes verkaufst (API, SaaS, professionelle Services), wo die falsche zitierte Seite schlimmer als keine Citation ist.
Du mehrere Sprachvarianten hast (DE/EN/FR) und AI-Engines wissen sollen, welche fuer deinen Primaer-Markt kanonisch ist.

Ueberspringen, wenn:

Weniger als 20 Seiten und Homepage bereits klare Zusammenfassung.
Du AI-Engines aktiv vom Konsum ausschliessen willst (dann ueber robots.txt blocken).

Haeufige Fehler

Zu viele Seiten gelistet. llms.txt ist eine Kurations-Datei, keine Sitemap. Ziel: 10–30 Eintraege gruppiert nach Sektion.
H1 vergessen. Ohne # DeineMarke oben kann AI-Engine keine Entity-Identitaet etablieren.
Tiefe Blog-Posts verlinken. Auf Evergreen-Pillar-Content verlinken. Zeitkritische Posts gehoeren in den RSS-Feed oder die Sitemap.
Sprachen ohne Declaration mischen. Bei mehrsprachiger Site /llms.txt fuer die Primaer-Sprache, plus /en/llms.txt, /de/llms.txt pro Locale.

Verifizieren, dass es wirkt

Drei Checks:

`curl https://yourdomain.com/llms.txt` liefert 200 + plain text (nicht 404, nicht 301-anywhere).
Claude oder Perplexity nach deiner Marke fragen und Citation-Muster ansehen. Seiten aus deiner llms.txt-Liste sollten ueberproportional erscheinen.
Longitudinaler AI-Visibility-Track zur Pruefung, ob Citation-Count nach Deploy stieg. Zwei Wochen reichen meist fuer Signal.

Haeufige Fragen

Ist llms.txt ein W3C-/IETF-Standard?

Noch nicht — Community-Vorschlag mit Traction 2024–2025. Standards-Bodies haben nicht ratifiziert. Pragmatisch: trotzdem ausspielen, Kosten trivial, adoptierende Engines werden deins nutzen.

Ersetzt llms.txt die robots.txt?

Nein. Komplementaer. robots.txt deklariert, was AI-Bots *crawlen* duerfen. llms.txt deklariert, was AI-Bots aus crawlbaren Inhalten *bevorzugt lesen* sollen.

Sensitive Content-Pfade in llms.txt aufnehmen?

Nein. Nur oeffentliche, kanonische, evergreen Seiten. Login-geschuetzter, intern-only oder experimenteller Content bleibt draussen.