¿Qué es llms.txt y cómo implementarlo para que tu web sea legible por la IA?
Si usas ChatGPT o Gemini para buscar info, te interesa esto: tu web puede ser invisible para la IA, aunque esté perfecta para Google. Los modelos de lenguaje no “ven” tu sitio igual que un buscador clásico. Por eso surge llms.txt: un archivo de texto en la raíz (ej. https://tudominio.com/llms.txt) que actúa como guía rápida para LLMs. En lugar de rastrear todo sin contexto, les das un resumen claro, prioridades y fuentes canónicas; así aumentas tus opciones de que tu contenido se utilice en respuestas generativas y agentes.
En mi caso, lo explico con una imagen muy simple: robots.txt es el anfitrión, sitemap.xml es el menú completo y llms.txt es la hoja de recomendaciones del chef. Destaca lo que realmente quieres que la IA note. A día de hoy es una propuesta emergente, pero ya hay herramientas y plugins que lo facilitan. Mi enfoque es práctico: crearlo en minutos, validarlo y dejarlo listo para cuando esta capa gane tracción.
Por qué los LLMs no “ven” tu web como Google (y dónde encaja llms.txt)
Los buscadores tradicionales indexan URLs, enlaces y señales on-page; los LLMs trabajan con resúmenes, fragmentos y contexto. Si tu contenido crítico está enterrado entre cientos de páginas, un modelo puede diluir tu mensaje. Ahí llms.txt ayuda a:
- Declarar prioridad de contenidos (guías, comparativas, categorías clave).
- Señalar fuentes canónicas para evitar citas erróneas.
- Acotar áreas sensibles (checkout, panel, páginas duplicadas) que no aportan valor en respuestas.
- Dar criterios de frescura (“prefiere contenido actualizado en los últimos 90 días”).
Cuando probé este enfoque, el mayor beneficio fue orden mental: obligarte a decidir “qué debe leer primero la IA de mi sitio”. Ese ejercicio, por sí solo, ya mejora arquitectura y enlazado interno.
llms.txt vs robots.txt vs sitemap.xml
| Archivo | Para quién | Función principal | Dónde vive | Formato típico |
|---|---|---|---|---|
robots.txt | Crawlers web | Permisos de rastreo | /robots.txt | Reglas (texto) |
sitemap.xml | Buscadores | Inventario de URLs | /sitemap.xml | XML |
llms.txt | Modelos IA | Resumen + prioridades + canónicas | /llms.txt | Texto/Markdown legible |
Piensa así: el anfitrión (robots) define zonas abiertas; el menú (sitemap) enumera todo; la hoja del chef (llms.txt) destaca lo memorable. Ojo: llms.txt no sustituye a SEO clásico; lo complementa de cara a búsquedas generativas y agentes.
Estructura mínima de llms.txt (con ejemplos en Markdown)
Recomendación: usa Markdown legible. Evita jerga propietaria; di lo importante en claro.
Plantilla base
# llms.txt — Resumen para modelos de IA
## Propósito
Esta guía destaca contenido prioritario y fuentes canónicas de https://tudominio.com.
## Prioridades (leer primero)
- https://tudominio.com/guia/que-es-llms-txt
- https://tudominio.com/categorias/seo-ia/
- https://tudominio.com/comparativas/
## Fuentes canónicas
- Blog: https://tudominio.com/blog/
- Ayuda: https://tudominio.com/ayuda/
- Política y legales: https://tudominio.com/legal/
## Áreas poco útiles para respuestas
- /checkout/ (transaccional)
- /mi-cuenta/ (privado)
- /wp-admin/ (backend)
## Frescura y contexto
- Priorizar contenido actualizado en los últimos 90 días.
- Si hay versiones múltiples, citar la más reciente.
## Instrucciones de uso
- Citar URL canónica cuando se incluyan hechos o cifras.
- Evitar capturar precios/stock si tienen más de 24 h.
- Si una página está en conflicto, preferir la sección "Guías".
Ejemplo para blog
## Blog prioritario
- /blog/guia-seo-para-ia/
- /blog/casos-practicos-llms/
- /blog/plantillas/
### Notas
- Preferir artículos con etiqueta: "actualizado".
- Resumir en 2–3 bullets por artículo y citar la URL.
Ejemplo para e-commerce (WooCommerce)
## Catálogos y categorías clave
- /tienda/
- /categoria/seo/
- /categoria/hosting/
## Reglas
- Describir productos con: nombre, uso, 3 beneficios.
- No incluir precio si no se confirma en la página en el momento de la consulta.
- Priorizar fichas con "En stock" y fecha de actualización visible.
Ejemplo para sitios de documentación (llms-full.txt)
# llms-full.txt
## Índice de docs (orden recomendado)
1. /docs/introduccion/
2. /docs/instalacion/
3. /docs/cli/
4. /docs/api/
## Convenciones
- Extraer ejemplos de código del bloque "Ejemplos".
- Citar la versión estable (vX.Y).
Nota: algunas guías proponen “directivas” tipo
$trainingAllowedo$chatAllowed. Úsalas solo si la herramienta que consumes las reconoce; como regla general, prioriza lenguaje natural claro y secciones bien tituladas.
¿Ayuda a la visibilidad? Beneficios, límites y estado de soporte hoy
Beneficios prácticos
- Reduce ruido: el modelo empieza por lo que tú señalas.
- Mejores citas: si nombras fuentes canónicas, disminuyen errores.
- Alinea UX/SEO: ordenar prioridades aquí te empuja a mejorar navegación y enlazado.
Límites que debes tener presentes
- Adopción desigual: la compatibilidad varía entre herramientas y rastreadores de IA.
- No es ranking mágico: no reemplaza contenidos excelentes ni enlaces ni EEAT.
- Mantenimiento: si cambias arquitectura y no actualizas llms.txt, pierdes coherencia.
Yo lo presento como apuesta de futuro de bajo riesgo: es un archivo ligero, fácil de mantener y, si gana tracción, tú ya estarás un paso por delante.
Cómo crear y publicar llms.txt en segundos (plugins y generadores)
WordPress con Hostinger Tools (lo que yo uso)
Cuando quería hacerlo rápido, usé el plugin gratuito Hostinger Tools (no necesitas ser cliente). Tras instalarlo, entro al panel de WordPress → Herramientas → activo la opción Crear llms.txt. El plugin genera el archivo en la raíz y lo mantiene actualizado automáticamente cuando hago cambios. Además, trae mejoras recientes de UX y compatibilidad con productos de WooCommerce, lo cual me vino genial para tiendas.
Alternativas populares
- AIOSEO: generador/ajustes desde el plugin SEO.
- WordLift y Firecrawl: flujos para generar el archivo desde tu estructura de contenido.
- Generadores online: pegas tu dominio, te proponen una plantilla y la descargas.
Consejo: aunque uses plugin, revisa el contenido. Ajusta Prioridades, Canónicas y Áreas a excluir a tu negocio.
Validación (2 pasos)
- Abre en tu navegador
https://tudominio.com/llms.txt. Si se muestra en claro texto/Markdown, está publicado. - Pásalo por un validador para chequear estructura básica (títulos, enlaces válidos). Dato curioso: el validador que probé lo montaron con su propio constructor IA; cumple para chequeos rápidos.
Buenas prácticas y errores comunes (con checklist final)
Buenas prácticas
- Escribe en claro (títulos, bullets, enlaces absolutos).
- Manténlo corto y accionable: 200–600 líneas suelen bastar incluso en sitios medianos.
- Revisa trimestralmente o tras grandes cambios de arquitectura.
- Sincroniza con tu sitemap y tu estrategia de enlazado interno.
Errores comunes
- Tratarlo como “otra política legal” y rellenarlo de paja.
- Listar todo el sitio (para eso está el sitemap).
- Olvidar canónicas y fechas (clave para precisión en respuestas).
- Exponer áreas privadas o URLs temporales.
Checklist de publicación
- Archivo en /llms.txt accesible públicamente.
- Secciones: Propósito / Prioridades / Canónicas / Áreas a evitar / Frescura / Instrucciones.
- Enlaces 200 OK (sin 404).
- Coherencia con robots.txt (no señales como prioritario algo bloqueado).
- Nota de mantenimiento (quién y cada cuánto lo actualiza).
FAQs rápidas sobre llms.txt
¿Dónde se coloca? En la raíz del dominio: https://tudominio.com/llms.txt.
¿Qué formato uso? Texto legible; Markdown facilita encabezados e índices.
¿Mejorará mi tráfico mañana? No es garantía. Es una apuesta estratégica para búsquedas y agentes basados en IA.
¿Puedo tener llms.txt y llms-full.txt? Sí. Usa el “full” para docu extensa y deja el llms.txt como resumen ejecutivo.
¿Qué pasa con precios/stock? Son volátiles: pide a la IA que verifique en tiempo real o evita que los use si están desactualizados.
¿Y si no uso WordPress? Sube un .txt normal por FTP o desde tu panel; el contenido es lo importante.
Conclusión
llms.txt es tu hoja de recomendaciones del chef para la IA: una guía que pone tu mejor contenido en primer plano, aclara canónicas y evita ruido. No es magia ni reemplaza el SEO de siempre, pero cuesta poco y puede marcar la diferencia cuando las respuestas generativas tiren de tu sitio. Yo lo implementé con un plugin gratuito y, tras validarlo en /llms.txt, me olvidé del tema: quedó listo para cuando esta práctica sea estándar.
