¿Qué es llms.txt y cómo implementarlo para que tu web sea legible por la IA?

Si usas ChatGPT o Gemini para buscar info, te interesa esto: tu web puede ser invisible para la IA, aunque esté perfecta para Google. Los modelos de lenguaje no “ven” tu sitio igual que un buscador clásico. Por eso surge llms.txt: un archivo de texto en la raíz (ej. https://tudominio.com/llms.txt) que actúa como guía rápida para LLMs. En lugar de rastrear todo sin contexto, les das un resumen claro, prioridades y fuentes canónicas; así aumentas tus opciones de que tu contenido se utilice en respuestas generativas y agentes.

En mi caso, lo explico con una imagen muy simple: robots.txt es el anfitrión, sitemap.xml es el menú completo y llms.txt es la hoja de recomendaciones del chef. Destaca lo que realmente quieres que la IA note. A día de hoy es una propuesta emergente, pero ya hay herramientas y plugins que lo facilitan. Mi enfoque es práctico: crearlo en minutos, validarlo y dejarlo listo para cuando esta capa gane tracción.

Por qué los LLMs no “ven” tu web como Google (y dónde encaja llms.txt)

Los buscadores tradicionales indexan URLs, enlaces y señales on-page; los LLMs trabajan con resúmenes, fragmentos y contexto. Si tu contenido crítico está enterrado entre cientos de páginas, un modelo puede diluir tu mensaje. Ahí llms.txt ayuda a:

  • Declarar prioridad de contenidos (guías, comparativas, categorías clave).
  • Señalar fuentes canónicas para evitar citas erróneas.
  • Acotar áreas sensibles (checkout, panel, páginas duplicadas) que no aportan valor en respuestas.
  • Dar criterios de frescura (“prefiere contenido actualizado en los últimos 90 días”).

Cuando probé este enfoque, el mayor beneficio fue orden mental: obligarte a decidir “qué debe leer primero la IA de mi sitio”. Ese ejercicio, por sí solo, ya mejora arquitectura y enlazado interno.

llms.txt vs robots.txt vs sitemap.xml

ArchivoPara quiénFunción principalDónde viveFormato típico
robots.txtCrawlers webPermisos de rastreo/robots.txtReglas (texto)
sitemap.xmlBuscadoresInventario de URLs/sitemap.xmlXML
llms.txtModelos IAResumen + prioridades + canónicas/llms.txtTexto/Markdown legible

Piensa así: el anfitrión (robots) define zonas abiertas; el menú (sitemap) enumera todo; la hoja del chef (llms.txt) destaca lo memorable. Ojo: llms.txt no sustituye a SEO clásico; lo complementa de cara a búsquedas generativas y agentes.

Estructura mínima de llms.txt (con ejemplos en Markdown)

Recomendación: usa Markdown legible. Evita jerga propietaria; di lo importante en claro.

Plantilla base

# llms.txt — Resumen para modelos de IA

## Propósito
Esta guía destaca contenido prioritario y fuentes canónicas de https://tudominio.com.

## Prioridades (leer primero)
- https://tudominio.com/guia/que-es-llms-txt
- https://tudominio.com/categorias/seo-ia/
- https://tudominio.com/comparativas/

## Fuentes canónicas
- Blog: https://tudominio.com/blog/
- Ayuda: https://tudominio.com/ayuda/
- Política y legales: https://tudominio.com/legal/

## Áreas poco útiles para respuestas
- /checkout/   (transaccional)
- /mi-cuenta/  (privado)
- /wp-admin/   (backend)

## Frescura y contexto
- Priorizar contenido actualizado en los últimos 90 días.
- Si hay versiones múltiples, citar la más reciente.

## Instrucciones de uso
- Citar URL canónica cuando se incluyan hechos o cifras.
- Evitar capturar precios/stock si tienen más de 24 h.
- Si una página está en conflicto, preferir la sección "Guías".

Ejemplo para blog

## Blog prioritario
- /blog/guia-seo-para-ia/
- /blog/casos-practicos-llms/
- /blog/plantillas/

### Notas
- Preferir artículos con etiqueta: "actualizado".
- Resumir en 2–3 bullets por artículo y citar la URL.

Ejemplo para e-commerce (WooCommerce)

## Catálogos y categorías clave
- /tienda/
- /categoria/seo/
- /categoria/hosting/

## Reglas
- Describir productos con: nombre, uso, 3 beneficios.
- No incluir precio si no se confirma en la página en el momento de la consulta.
- Priorizar fichas con "En stock" y fecha de actualización visible.

Ejemplo para sitios de documentación (llms-full.txt)

# llms-full.txt
## Índice de docs (orden recomendado)
1. /docs/introduccion/
2. /docs/instalacion/
3. /docs/cli/
4. /docs/api/

## Convenciones
- Extraer ejemplos de código del bloque "Ejemplos".
- Citar la versión estable (vX.Y).

Nota: algunas guías proponen “directivas” tipo $trainingAllowed o $chatAllowed. Úsalas solo si la herramienta que consumes las reconoce; como regla general, prioriza lenguaje natural claro y secciones bien tituladas.

¿Ayuda a la visibilidad? Beneficios, límites y estado de soporte hoy

Beneficios prácticos

  • Reduce ruido: el modelo empieza por lo que tú señalas.
  • Mejores citas: si nombras fuentes canónicas, disminuyen errores.
  • Alinea UX/SEO: ordenar prioridades aquí te empuja a mejorar navegación y enlazado.

Límites que debes tener presentes

  • Adopción desigual: la compatibilidad varía entre herramientas y rastreadores de IA.
  • No es ranking mágico: no reemplaza contenidos excelentes ni enlaces ni EEAT.
  • Mantenimiento: si cambias arquitectura y no actualizas llms.txt, pierdes coherencia.

Yo lo presento como apuesta de futuro de bajo riesgo: es un archivo ligero, fácil de mantener y, si gana tracción, tú ya estarás un paso por delante.

Cómo crear y publicar llms.txt en segundos (plugins y generadores)

WordPress con Hostinger Tools (lo que yo uso)

Cuando quería hacerlo rápido, usé el plugin gratuito Hostinger Tools (no necesitas ser cliente). Tras instalarlo, entro al panel de WordPress → Herramientas → activo la opción Crear llms.txt. El plugin genera el archivo en la raíz y lo mantiene actualizado automáticamente cuando hago cambios. Además, trae mejoras recientes de UX y compatibilidad con productos de WooCommerce, lo cual me vino genial para tiendas.

Alternativas populares

  • AIOSEO: generador/ajustes desde el plugin SEO.
  • WordLift y Firecrawl: flujos para generar el archivo desde tu estructura de contenido.
  • Generadores online: pegas tu dominio, te proponen una plantilla y la descargas.

Consejo: aunque uses plugin, revisa el contenido. Ajusta Prioridades, Canónicas y Áreas a excluir a tu negocio.

Validación (2 pasos)

  1. Abre en tu navegador https://tudominio.com/llms.txt. Si se muestra en claro texto/Markdown, está publicado.
  2. Pásalo por un validador para chequear estructura básica (títulos, enlaces válidos). Dato curioso: el validador que probé lo montaron con su propio constructor IA; cumple para chequeos rápidos.

Buenas prácticas y errores comunes (con checklist final)

Buenas prácticas

  • Escribe en claro (títulos, bullets, enlaces absolutos).
  • Manténlo corto y accionable: 200–600 líneas suelen bastar incluso en sitios medianos.
  • Revisa trimestralmente o tras grandes cambios de arquitectura.
  • Sincroniza con tu sitemap y tu estrategia de enlazado interno.

Errores comunes

  • Tratarlo como “otra política legal” y rellenarlo de paja.
  • Listar todo el sitio (para eso está el sitemap).
  • Olvidar canónicas y fechas (clave para precisión en respuestas).
  • Exponer áreas privadas o URLs temporales.

Checklist de publicación

  • Archivo en /llms.txt accesible públicamente.
  • Secciones: Propósito / Prioridades / Canónicas / Áreas a evitar / Frescura / Instrucciones.
  • Enlaces 200 OK (sin 404).
  • Coherencia con robots.txt (no señales como prioritario algo bloqueado).
  • Nota de mantenimiento (quién y cada cuánto lo actualiza).

FAQs rápidas sobre llms.txt

¿Dónde se coloca? En la raíz del dominio: https://tudominio.com/llms.txt.
¿Qué formato uso? Texto legible; Markdown facilita encabezados e índices.
¿Mejorará mi tráfico mañana? No es garantía. Es una apuesta estratégica para búsquedas y agentes basados en IA.
¿Puedo tener llms.txt y llms-full.txt? Sí. Usa el “full” para docu extensa y deja el llms.txt como resumen ejecutivo.
¿Qué pasa con precios/stock? Son volátiles: pide a la IA que verifique en tiempo real o evita que los use si están desactualizados.
¿Y si no uso WordPress? Sube un .txt normal por FTP o desde tu panel; el contenido es lo importante.

Conclusión

llms.txt es tu hoja de recomendaciones del chef para la IA: una guía que pone tu mejor contenido en primer plano, aclara canónicas y evita ruido. No es magia ni reemplaza el SEO de siempre, pero cuesta poco y puede marcar la diferencia cuando las respuestas generativas tiren de tu sitio. Yo lo implementé con un plugin gratuito y, tras validarlo en /llms.txt, me olvidé del tema: quedó listo para cuando esta práctica sea estándar.

Scroll al inicio