# GEO: cómo hacer que ChatGPT y Claude citen tu sitio web (Guía 2026)

> Esta es la versión Markdown limpia de https://claudecodeguia.com/geo-guia/, optimizada para consumo por agentes de IA. Última actualización: mayo 2026.

El SEO tradicional pelea por entrar al top 10 de Google. **GEO (Generative Engine Optimization)** juega un partido distinto: el 83% de las citas de Google AI Overview vienen de páginas fuera del top 10. Esta guía explica, con datos reales y código, cómo configurar tu sitio en una hora para que ChatGPT, Claude, Perplexity y Copilot lo encuentren y lo citen.

## ¿Qué es GEO y por qué importa en 2026?

**GEO (Generative Engine Optimization)** es el conjunto de prácticas que hacen que tu sitio web sea visible y citable por motores de búsqueda generativos como ChatGPT, Claude, Perplexity, Google AI Overview y Microsoft Copilot. A diferencia del SEO clásico, GEO no se trata de subir posiciones: se trata de **ayudar a la IA a entender lo que ya tienes**.

El término fue acuñado en el paper [«GEO: Generative Engine Optimization»](https://arxiv.org/abs/2311.09735), publicado por investigadores de Princeton e IIT Delhi en KDD 2024. Su hallazgo central: la visibilidad en respuestas de IA aumenta hasta un **115% si añades citas autoritativas**, **43% con citas directas** de fuentes creíbles, y **33% con estadísticas relevantes**.

Los datos de tráfico también explican por qué hablamos de GEO ahora: las búsquedas con IA crecieron **527% interanual** en la primera mitad de 2025, ChatGPT alcanzó **900 millones de usuarios semanales activos** en febrero de 2026, y el tráfico referido por IA convierte a una tasa **5 veces mayor** que la búsqueda tradicional. Aun así, todavía representa menos del 1% del tráfico total.

> «GEO es una estrategia de visibilidad de marca, no de tráfico. Vale la pena dedicarle una hora, no una semana.» — [@HiTw93](https://x.com/HiTw93/status/2050931710066565374)

## SEO vs GEO: cuatro diferencias clave

| Aspecto | SEO tradicional | GEO |
|---|---|---|
| Objetivo | Top 10 de Google | Ser citado en respuestas de IA |
| Métrica clave | Posición + clics | Citas + tasa de retrieval-to-citation |
| Señales que importan | PageRank, backlinks, CTR | Estructura clara, fuentes confiables, datos específicos |
| Origen de las citas | Top 10 resultados | 83% fuera del top 10 |

El foso de PageRank ya no protege a los grandes en la era IA. Si tu README o documentación están bien escritos, puedes salir citado en lugar de un sitio enorme con contenido mediocre.

## Los cuatro tipos de crawlers de IA

| Tipo | Ejemplos | Qué hacen | Recomendación |
|---|---|---|---|
| Entrenamiento | GPTBot, ClaudeBot, CCBot | Toman tu contenido para entrenar modelos | Bloquear si quieres opt-out |
| Búsqueda y retrieval | OAI-SearchBot, Claude-SearchBot, PerplexityBot | Buscan en tiempo real para responder | **Permitir siempre** |
| Disparados por usuario | ChatGPT-User, Claude-User | Se activan cuando alguien pega tu URL | **Permitir siempre** |
| No declarados | Bytespider | No siguen las reglas | Bloquear |

El error más caro: bloquear OAI-SearchBot pensando que proteges tu contenido. Lo que en realidad hiciste fue desaparecer de los resultados de búsqueda de ChatGPT.

## Cómo configurar robots.txt para IA

```
# Búsqueda y retrieval: permitir
User-agent: OAI-SearchBot
Allow: /

User-agent: Claude-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

# Disparados por usuario: permitir
User-agent: ChatGPT-User
Allow: /

# Entrenamiento: bloquear (opcional)
User-agent: GPTBot
Disallow: /

# No declarados: bloquear
User-agent: Bytespider
Disallow: /

Sitemap: https://tudominio.com/sitemap.xml
```

## Cómo crear tu archivo llms.txt

`llms.txt` es un estándar nuevo, similar a `robots.txt` pero diseñado para consumo de IA. Según BuiltWith, más de **840.000 sitios** ya lo han desplegado, incluyendo Anthropic, Cloudflare, Stripe y Vercel. Pero la encuesta de SE Ranking sobre 300.000 dominios muestra una adopción real de solo el **10%**: estás temprano y eso es una ventaja.

Formato simple en `/llms.txt`:

```markdown
# Nombre de tu proyecto

> Descripción en una línea de qué es esto.

## Enlaces

- [Documentación](https://tudominio.com/docs)
- [GitHub](https://github.com/tu/proyecto)
- [Blog](https://tudominio.com/blog)

## Sobre nosotros

Párrafo corto explicando el proyecto, propósito, características clave.
```

Después de crearlo, envíalo a [directory.llmstxt.cloud](https://directory.llmstxt.cloud/), [llmstxt.site](https://llmstxt.site/) y al repositorio `llms-txt-hub` en GitHub.

## Por qué necesitas también llms-full.txt

Mientras `llms.txt` es el resumen, `llms-full.txt` es la versión completa: típicamente entre 30 y 60 KB con descripciones, casos de uso, comparativas y extractos del README. El análisis de CDN de Mintlify muestra que **`llms-full.txt` recibe entre 3 y 4 veces más tráfico que `llms.txt`**. Cuando un sistema de IA encuentra el resumen, casi siempre va a buscar la versión completa.

## Rutas Markdown: alimenta a la IA con contenido limpio

Una página HTML típica de 15.000 tokens se convierte en un documento Markdown de 3.000 tokens. **Eso es 80% menos ruido para la IA**. Añade al `<head>`:

```html
<link rel="alternate" type="text/markdown" href="/pagina.md" />
```

Claude Code y Cursor ya envían cabeceras `Accept: text/markdown` por defecto. Es **HTTP/1.1 content negotiation estándar desde 1997**: no es magia, es protocolo.

**Importante**: nunca devuelvas contenido distinto a bots y a humanos basado en User-Agent. Eso es cloaking y Google penaliza.

## Registro en buscadores

1. **Google Search Console**: verifica tu dominio, envía sitemap.xml.
2. **Bing Webmaster Tools**: subestimado pero crítico — Copilot, DuckDuckGo y Yahoo usan el índice de Bing. Si no estás en Bing, no estás en ninguno.
3. **IndexNow**: protocolo en Bing Webmaster que te permite avisar inmediatamente al publicar contenido nuevo. URLs indexadas en minutos.
4. **Perplexity Publisher Program**: postúlate en [pplx.ai/publisher-program](https://pplx.ai/publisher-program). Si te aprueban, recibes reparto 80/20 y analíticas.

## Cada proyecto necesita su propia página

Las páginas citadas tienen títulos con mayor similitud semántica a la pregunta del usuario, y los slugs en lenguaje natural (`/proyectos/pake`) son citados más que los IDs opacos (`/page?id=47`). La IA toma decisiones antes de leer el cuerpo.

No concentres todo en una página gigante con anclas. La granularidad de cita de la IA es la URL, no el ancla.

## Datos del paper de Princeton

Los tres factores con mayor impacto:

- **+115%**: añadir citas autoritativas con enlace a la fuente original
- **+43%**: incluir citas directas de fuentes creíbles
- **+33%**: añadir estadísticas relevantes con números concretos

Hallazgos prácticos del [geo-citation-lab](https://github.com/yaojingang/geo-citation-lab) (602 prompts, decenas de miles de páginas):

- **Especificidad**: páginas con datos reales, definiciones claras y comparativas tienen 50% más impacto.
- **Profundidad**: páginas de alto impacto promedian 2.000 palabras y 10+ encabezados. Las de bajo impacto: 170 palabras (gap 10x).
- **Sweet spot**: 1.000–3.000 palabras.
- **FAQ no funciona**: el formato puro de FAQ perjudica la tasa de citas.

## Diferencias entre plataformas

| Plataforma | Estilo de cita | Estrategia óptima |
|---|---|---|
| ChatGPT | Pocas fuentes, profundamente. Impacto por cita: 5x el de Google. | Profundidad. Pocas páginas excelentes y largas. |
| Perplexity | Más del doble de fuentes que ChatGPT. | Volumen. Múltiples páginas medianas. |
| Claude | Cita conservadoramente, prioriza fuentes verificables. | Autoridad. Citas externas y datos concretos. |
| Bing/Copilot | Única IA donde JSON-LD ayuda directamente. | Mantén schema markup limpio. |

**83% de las citas globales son contenido en inglés**. Si tu objetivo es audiencia internacional, necesitas versión en inglés.

## Lo que NO funciona en GEO

- `<meta name="ai-content-url">` y `<meta name="llms">`: sin especificación, sin adopción.
- `/.well-known/ai.txt`: propuestas competidoras, ninguna ganadora.
- Comentarios HTML con pistas para IA: parsers los eliminan.
- Servir Markdown distinto a bots vía User-Agent: cloaking, Google penaliza.
- Meta tags «AI-friendly» no oficiales: ruido, no señal.

**JSON-LD no es tan útil**: SearchVIU testó 5 sistemas de IA y ninguno encontró datos solo en JSON-LD. La única excepción es Bing/Copilot. Mantén tu JSON-LD existente para Bing y rich results de Google, pero no esperes que ChatGPT o Claude te citen más por añadirlo.

## Cómo verificar si tu GEO funciona

1. **Test directo con prompts**: una vez por semana ejecuta los mismos 5 prompts en ChatGPT, Claude, Perplexity y Google AI Overview. Modo incógnito.
2. **Logs de servidor / Cloudflare**: filtra `OAI-SearchBot`, `Claude-SearchBot`, `PerplexityBot`. Ver al crawler descargar tu `llms.txt` es la mejor señal.
3. **Bing Webmaster Tools → AI Performance**: único panel oficial con datos de citas (cubre Copilot, DuckDuckGo, Yahoo).
4. **Referrers en analytics**: vigila tráfico desde `chat.openai.com`, `claude.ai`, `perplexity.ai`. Es la prueba definitiva.

El reporte del CJR Tow Center analizó 200 citas generadas por IA y encontró **153 con errores** parciales o totales. Haz el trabajo estructural pero no tomes una cita de IA como prueba de palabras exactas.

## Cómo implementar GEO con Claude Code en una hora

1. **Abre tu proyecto en Claude Code**: navega a la carpeta y ejecuta `claude`.
2. **Pídele que cree el robots.txt clasificado**: «Crea un robots.txt que permita OAI-SearchBot, Claude-SearchBot y PerplexityBot, bloquee Bytespider, e incluya el sitemap.»
3. **Genera tu llms.txt y llms-full.txt**: «Lee README.md y archivos principales. Genera resumen llms.txt y completo llms-full.txt siguiendo llmstxt.org.»
4. **Añade rutas Markdown**: «Para cada HTML, genera versión .md y añade `link rel='alternate' type='text/markdown'` al `<head>`.»
5. **Verifica**: pide a Claude Code que valide el llms.txt resultante. Commit y deploy.

## Recursos oficiales

- [GEO: Generative Engine Optimization (Princeton/IIT Delhi, KDD 2024)](https://arxiv.org/abs/2311.09735)
- [llmstxt.org](https://llmstxt.org/) — Especificación del estándar
- [geo-citation-lab](https://github.com/yaojingang/geo-citation-lab) — Investigación abierta con 602 prompts
- [Why ChatGPT Cites One Page Over Another (Ahrefs)](https://ahrefs.com/blog/why-chatgpt-cites-pages/)
- [IndexNow Documentation](https://www.indexnow.org/documentation)
- [Artículo original de @HiTw93](https://x.com/HiTw93/status/2050931710066565374)

---

**Versión web (HTML)**: https://claudecodeguia.com/geo-guia/  
**Versión inglesa**: https://claudecodeguia.com/en/geo-guide/  
**Sitio principal**: https://claudecodeguia.com/
