llms.txt
Estándar propuesto para publicar un archivo Markdown en la raíz de un sitio web que permite a los modelos de lenguaje entender y utilizar el contenido del sitio de forma eficiente durante la inferencia.
¿Qué es?
llms.txt es un estándar propuesto por Jeremy Howard (fast.ai) en septiembre de 2024 para colocar un archivo Markdown en la ruta /llms.txt de un sitio web. Su propósito es ofrecer a los modelos de lenguaje una versión concisa, estructurada y legible del contenido más importante del sitio — sin el ruido del HTML, la navegación, los anuncios ni el JavaScript.
Es análogo a robots.txt y sitemap.xml, pero con un objetivo diferente:
robots.txtindica a los rastreadores qué acceso es aceptablesitemap.xmllista todas las páginas indexables para motores de búsquedallms.txtofrece un resumen curado y enlaces a contenido detallado para modelos de lenguaje
¿Por qué importa?
Los modelos de lenguaje enfrentan una limitación fundamental al interactuar con sitios web: las ventanas de contexto son demasiado pequeñas para procesar un sitio completo, y convertir HTML complejo a texto plano es impreciso y ruidoso.
llms.txt resuelve esto proporcionando:
- Contexto inmediato — un resumen del sitio que cabe en una ventana de contexto
- Navegación estructurada — enlaces a archivos Markdown detallados organizados por sección
- Información curada — solo el contenido relevante, sin duplicación ni ruido
- Formato legible por humanos y máquinas — Markdown es el formato más ampliamente entendido por los LLMs actuales
¿Cómo se usa?
En la inferencia
El caso de uso principal es durante la inferencia — cuando un usuario pide información a un modelo de lenguaje. Por ejemplo:
- Un desarrollador incluye la documentación de una librería en su IDE con asistente de IA
- Un chatbot con capacidad de búsqueda consulta un sitio para responder preguntas
- Un agente de IA necesita entender la estructura de un servicio para interactuar con él
Formato del archivo
El archivo sigue una estructura específica en Markdown:
# Nombre del proyecto
> Descripción breve con información clave
Detalles adicionales sobre el proyecto.
## Sección
- [Título del enlace](https://url): Notas opcionales sobre el archivo
## Optional
- [Título del enlace](https://url): Contenido secundario que puede omitirseLa sección «Optional» tiene un significado especial: los enlaces allí pueden omitirse si se necesita un contexto más corto.
Variantes comunes
Muchos sitios publican variantes expandidas:
/llms.txt— el archivo base con resumen y enlaces/llms-full.txt— versión expandida con el contenido completo de cada enlace incrustado
Implementación en este sitio
Este sitio publica dos archivos generados automáticamente en el pipeline de conocimiento:
/llms.txt— índice con título, tipo y resumen en inglés de cada nodo de conocimiento/llms-full.txt— contenido completo de cada artículo en formato plano
Ambos se regeneran con cada ejecución de pnpm generate y se sirven como archivos estáticos desde public/.
Relación con otros estándares
| Estándar | Audiencia | Propósito |
|---|---|---|
robots.txt | Rastreadores | Control de acceso |
sitemap.xml | Motores de búsqueda | Índice de páginas |
llms.txt | Modelos de lenguaje | Resumen curado del sitio |
| MCP | Agentes de IA | Protocolo de herramientas y contexto |
llms.txt y MCP son complementarios: llms.txt proporciona contenido estático legible, mientras que MCP habilita interacciones dinámicas con herramientas y servicios.
Adopción
Desde su propuesta en 2024, llms.txt ha sido adoptado por proyectos de documentación técnica, sitios de comercio electrónico, instituciones educativas y sitios personales. La especificación es deliberadamente simple — un archivo Markdown con convenciones mínimas — lo que facilita su adopción sin herramientas especializadas.
Referencias
- The /llms.txt file — Jeremy Howard, 2024. Especificación original del estándar.
- llms.txt in Different Domains — llmstxt.org. Sitio oficial del estándar llms.txt.
- FastHTML llms.txt — llmstxt.org. Sitio oficial con especificación y ejemplos de implementación.
- What is llms.txt? A practical guide — Hall, 2025. Guía práctica de implementación.