Por Qué ChatGPT y Perplexity No Recomiendan Tu Sitio Web (Y Cómo Solucionarlo)

Por Qué ChatGPT y Perplexity No Recomiendan Tu Sitio Web (Y Cómo Solucionarlo)
Imagina la situación. Un cliente potencial está buscando exactamente lo que tú ofreces. En vez de teclear en Google, le pregunta a Perplexity: "¿Cuál es la mejor agencia de diseño web en [tu ciudad]?" La respuesta llega en segundos. Menciona tres empresas. La tuya no está entre ellas. Una de las que sí aparece es tu competidor directo, que tiene menos experiencia que tú, un portafolio más pequeño y precios más altos.
Eso duele. Y tiene una explicación concreta.
No es suerte. No es que los sistemas IA tengan preferencias arbitrarias. Hay errores técnicos y de contenido específicos que hacen que un sitio sea invisible para los motores generativos. Son solucionables. Pero primero tienes que saber cuáles tienes.
Cómo verificar tu visibilidad en sistemas IA ahora mismo
Antes de hablar de errores, conviene hacer un diagnóstico rápido. Puedes hacerlo en menos de 15 minutos:
Test 1 — Búsqueda directa de marca: Abre ChatGPT, Perplexity, Claude y Gemini. Escribe exactamente: "¿Qué sabes sobre [nombre de tu empresa]?" Si la respuesta es "No tengo información específica sobre esta empresa" o similar, tienes visibilidad nula.
Test 2 — Búsqueda de categoría: Escribe la consulta que usaría un cliente real. Por ejemplo: "Recomiéndame una agencia de SEO en Madrid especializada en e-commerce." ¿Apareces? ¿Aparece tu competidor?
Test 3 — Búsqueda de problema: Escribe un problema que tu servicio resuelve: "¿Cómo mejorar el posicionamiento web de una tienda online?" ¿Tu contenido es citado como fuente?
Si fallaste los tres tests, tienes trabajo por hacer. Si pasaste alguno pero no todos, los errores específicos de abajo te dirán exactamente qué corregir.
Los 7 errores GEO que mantienen tu sitio invisible
Error 1: Bots IA bloqueados en robots.txt
Este es el error más común y el más fácil de corregir. Muchos sitios tienen reglas en robots.txt que inadvertidamente bloquean a los bots de los principales sistemas IA.
El problema suele originarse de dos formas. Primera: una directiva Disallow: / para User-agent: * sin excepciones explícitas para los bots de IA. Segunda: plugins de WordPress o configuraciones de seguridad que bloquean automáticamente todos los bots no reconocidos.
Para verificar si tienes este problema, ve directamente a tudominio.com/robots.txt y busca menciones de GPTBot, PerplexityBot, ClaudeBot y Applebot. Si no aparecen explícitamente permitidos y tienes una regla general de Disallow, estás bloqueado.
La corrección:
``` User-agent: GPTBot Allow: /
User-agent: ChatGPT-User Allow: /
User-agent: PerplexityBot Allow: /
User-agent: ClaudeBot Allow: /
User-agent: Applebot Allow: /
User-agent: Amazonbot Allow: / ```
Añade estas líneas antes de cualquier regla Disallow para User-agent: *. El efecto de esta corrección es inmediato desde el punto de vista técnico, aunque los bots pueden tardar días o semanas en re-rastrear tu sitio.
Error 2: Sin archivo llms.txt
Ya lo hemos explicado en detalle en nuestro artículo específico sobre llms.txt, pero vale resumirlo aquí: sin llms.txt, los sistemas IA no tienen ningún punto de orientación sobre qué es tu empresa y qué contenido es relevante.
Cuando un LLM rastrea tu sitio, procesa el contenido HTML disponible. Pero si no hay un archivo de contexto estructurado, tiene que inferir quién eres y qué haces a partir del contenido disperso de tus páginas. Eso es ineficiente y frecuentemente inexacto.
Tu competidor que aparece en Perplexity probablemente tiene llms.txt. O al menos tiene un contenido más estructurado que compensa su ausencia.
El test para este error: visita tudominio.com/llms.txt. Si obtienes un error 404, no tienes el archivo. Crea uno esta semana.
Error 3: Contenido no extraíble por IA
Este error es más sutil pero muy impactante. Los sistemas IA buscan fragmentos de texto claros, directos y autónomos que puedan citar sin perder significado fuera de contexto. Si tu contenido está escrito pensando únicamente en la experiencia de lectura humana, puede que no sea fácilmente extraíble.
Síntomas concretos de contenido no extraíble:
Párrafos largos sin estructura interna. Un bloque de texto de 400 palabras sobre "los beneficios del diseño web profesional" sin encabezados intermedios, listas o definiciones es difícil de parsear para un LLM que busca información específica.
Definiciones implícitas en lugar de explícitas. "El SEO técnico es fundamental para el éxito de tu web" no es una definición. "El SEO técnico es el conjunto de optimizaciones que mejoran la capacidad de los motores de búsqueda para rastrear, indexar y renderizar un sitio web" sí lo es, y es citable.
Información clave en imágenes o PDFs. Si tus casos de estudio, precios o datos importantes están solo en imágenes o documentos no indexables, los sistemas IA no pueden acceder a ellos.
Contenido sin contexto temporal. Un artículo sin fecha de publicación visible, sin indicación de cuándo fue escrito, pierde valor para los sistemas IA que priorizan información actualizada.
La corrección implica revisar tu contenido más importante y reformularlo con:
- Definiciones explícitas de términos clave
- Encabezados H2/H3 que sean preguntas o afirmaciones completas
- Datos y estadísticas con fuente y fecha
- Resúmenes al principio de los artículos largos (los "TL;DR" que los LLMs adoran)
Error 4: Sin señales de autor y autoridad
Aquí está uno de los errores más subestimados. Los sistemas IA, especialmente cuando buscan fuentes para citar en respuestas sobre temas especializados, priorizan contenido de autores identificables con autoridad demostrable en ese campo.
Si todos tus artículos tienen como autor "Equipo Editorial" o simplemente no tienen autor visible, estás cediendo ventaja a competidores que sí identifican a sus expertos.
Las señales de autor que los sistemas IA valoran:
Nombre real y visible en el artículo. No el nombre de la empresa; el nombre de la persona que lo escribió.
Bio del autor en el artículo o enlazada. Incluyendo años de experiencia, especialización y si es posible credenciales verificables.
Página de autor dedicada. Una URL específica (/es/autor/nombre-apellido) que liste todos los artículos de esa persona y su información profesional.
Presencia verificable fuera del sitio. LinkedIn, publicaciones en medios del sector, menciones en otros sitios. Esto es lo que diferencia un "experto declarado" de un "experto verificable."
Schema markup de autor. El marcado JSON-LD de tipo Person vinculando al autor con su contenido y sus credenciales externas.
Un estudio de SE Ranking de enero de 2026 analizó 500 sitios citados frecuentemente por Perplexity en consultas sobre marketing digital y encontró que el 87% tenía páginas de autor individuales con bios detalladas. En el grupo de sitios raramente citados, ese porcentaje era del 23%.
Error 5: Sin schema markup
El schema markup es el lenguaje que los sistemas IA prefieren para entender el contexto de un contenido. No es solo para SEO en Google; es la forma más eficiente de comunicar a un LLM de qué trata una página y cómo está estructurada.
Los errores más comunes con schema markup:
No tener ninguno. Sorprendentemente común incluso en sitios técnicamente bien construidos.
Schema markup solo en la home. El marcado tiene que estar en cada página importante, especialmente en los artículos del blog y las páginas de servicios.
Article schema sin información de autor. Un Article sin campo "author" completo pierde la mitad de su valor para GEO.
FAQ schema en páginas que no tienen formato de preguntas y respuestas. Esto confunde a los sistemas de validación y puede penalizar la confiabilidad percibida del sitio.
Los tipos de schema más relevantes para GEO en 2026:
- Article — Para todos los artículos de blog y guías
- FAQPage — Para páginas con secciones de preguntas frecuentes
- HowTo — Para tutoriales y guías paso a paso
- LocalBusiness — Para negocios con presencia física o local
- Service — Para páginas de servicios específicos
- Person — Para páginas de autor y perfiles de equipo
Puedes verificar el estado de tu schema markup con la herramienta de Prueba de Resultados Enriquecidos de Google (search.google.com/test/rich-results). Es gratuita y muestra errores y advertencias.
Error 6: Contenido renderizado solo con JavaScript
Este es un error técnico que tiene un impacto desproporcionado en la visibilidad GEO. Si tu sitio web renderiza el contenido principal mediante JavaScript del lado del cliente (como muchas aplicaciones React o Vue sin SSR), los bots que no ejecutan JavaScript no pueden acceder a ese contenido.
Muchos bots de sistemas IA, especialmente los de ciclos de entrenamiento (no los de búsqueda en tiempo real), tienen capacidades limitadas o nulas de ejecución de JavaScript. Para ellos, una página React que carga su contenido dinámicamente es una página en blanco.
Cómo verificar si tienes este problema: desactiva JavaScript en tu navegador (en Chrome: DevTools → Settings → Disable JavaScript) y navega por tu sitio. ¿Ves el contenido principal? ¿O solo una pantalla en blanco o un loader infinito?
Si tu contenido desaparece sin JavaScript, tienes este problema. Las soluciones técnicas son:
Server-Side Rendering (SSR): El servidor genera el HTML completo antes de enviarlo al navegador. Next.js, Nuxt.js y otros frameworks lo soportan de forma nativa.
Static Site Generation (SSG): El HTML se genera en el momento del build y se sirve como HTML estático. Ideal para contenido que no cambia en tiempo real.
Pre-rendering: Herramientas como Prerender.io detectan cuando el visitante es un bot y sirven una versión pre-renderizada del HTML.
Error 7: Sin menciones de marca externas
Los sistemas IA construyen su comprensión de quién eres a partir de múltiples fuentes, no solo de tu propio sitio. Si no hay menciones de tu empresa en ningún otro lugar de internet, los sistemas IA tienen muy poca base para recomendarte.
Esto no significa que necesites 500 backlinks. Significa que necesitas presencia contextual en las fuentes que los LLMs consideran confiables.
Las fuentes más valiosas para menciones de marca en el contexto GEO:
Google Business Profile actualizado. Parece obvio pero muchos lo descuidan. Un perfil de Google Business con información completa, reseñas recientes y posts regulares es una fuente que los sistemas de Google consultan directamente.
LinkedIn de la empresa y del equipo. Los perfiles de LinkedIn tienen alta autoridad percibida en los corpus de entrenamiento de los LLMs. Un perfil de empresa activo con publicaciones regulares es una señal positiva.
Menciones en medios digitales del sector. Un artículo de opinión en un blog relevante del sector, una entrevista en un podcast especializado, o una mención en un artículo de referencia de tu industria tienen más peso que cien menciones en directorios genéricos.
Reddit y foros especializados. Perplexity en particular tiene acceso directo a Reddit. Si tu empresa es mencionada positivamente en hilos relevantes de Reddit, eso influye en las recomendaciones de Perplexity.
Casos de éxito de clientes publicados fuera de tu sitio. Si tus clientes mencionan tu trabajo en sus propias webs, blogs o redes sociales, cada mención es una señal de autoridad externa.
Checklist de autodiagnóstico GEO
Usa esta tabla para auditar tu sitio ahora mismo. Marca cada punto con ✓ (correcto), ✗ (error) o ? (no verificado).
| Área | Elemento a verificar | Cómo verificarlo |
|---|---|---|
| Acceso bots | GPTBot permitido en robots.txt | Ver tudominio.com/robots.txt |
| Acceso bots | PerplexityBot permitido en robots.txt | Ver tudominio.com/robots.txt |
| Acceso bots | ClaudeBot permitido en robots.txt | Ver tudominio.com/robots.txt |
| llms.txt | Archivo existe en raíz | Ver tudominio.com/llms.txt |
| llms.txt | Contiene descripción de empresa | Revisar contenido del archivo |
| llms.txt | Lista páginas principales | Revisar contenido del archivo |
| Contenido | Artículos tienen autor identificado | Revisar 5 artículos del blog |
| Contenido | Definiciones explícitas en artículos clave | Revisar 5 artículos del blog |
| Contenido | Datos con fuente y fecha | Revisar 5 artículos del blog |
| Autoría | Página de autor existe | Ver /autor/ o /equipo/ |
| Schema | Article schema en artículos | Rich Results Test |
| Schema | FAQPage schema si aplica | Rich Results Test |
| Schema | LocalBusiness si aplica | Rich Results Test |
| Técnico | Contenido visible sin JavaScript | DevTools → Disable JS |
| Técnico | Velocidad de carga < 3s | PageSpeed Insights |
| Marca | Google Business Profile activo | Google Business |
| Marca | LinkedIn de empresa activo | |
| Marca | Menciones en medios externos | Búsqueda manual de marca |
Si tienes 5 o más ✗, tienes una oportunidad real de mejorar tu visibilidad GEO en las próximas 8-12 semanas con trabajo sistemático.
Si tienes entre 10 y 18 ✗, el problema es estructural. No es una cuestión de ajustes menores; necesitas una estrategia GEO completa.
El patrón detrás de los 7 errores
Mirando los 7 errores en conjunto, hay un patrón claro: todos tienen que ver con hacer que tu sitio sea legible, confiable y encontrable para sistemas que no son humanos.
Los humanos que visitan tu web traen contexto. Saben más o menos qué es una "agencia SEO" y pueden inferir lo que haces a partir del diseño, el tono y la navegación. Los sistemas IA no tienen ese contexto implícito. Necesitan señales explícitas: "esto es lo que soy, esto es en lo que soy experto, esto es lo que dices de mí gente que no soy yo."
Cada uno de los 7 errores es una ausencia de esa señal explícita. Corregirlos no requiere reconstruir tu sitio; requiere añadir capas de información estructurada sobre lo que ya tienes.
Preguntas frecuentes
¿Cuánto tiempo tardaré en ver resultados después de corregir estos errores?
Perplexity puede mostrar mejoras en 2-4 semanas, ya que rastrea con relativa frecuencia. Google AI Overviews puede tardar 4-8 semanas en reflejar cambios. ChatGPT depende de sus ciclos de entrenamiento, que son menos frecuentes; para consultas en tiempo real (ChatGPT con búsqueda web), el impacto puede ser más rápido.
¿Tengo que corregir los 7 errores a la vez?
No. Prioriza por impacto: empieza por el robots.txt (Error 1), luego el schema markup (Error 5) y luego el contenido de autor (Error 4). Estos tres tienen el mayor impacto a corto plazo y son relativamente rápidos de implementar.
Mi competidor apareció en ChatGPT pero nosotros tenemos más experiencia. ¿Por qué?
La experiencia real no es automáticamente visible para los sistemas IA. Lo que ven es la experiencia documentada, estructurada y señalizada de forma que puedan identificarla. Tu competidor probablemente tiene esa documentación en formato más accesible para los LLMs, independientemente de la experiencia real de cada empresa.
¿Es posible que estemos bloqueando bots IA sin saberlo?
Absolutamente. El escenario más común es una agencia de desarrollo que configuró el robots.txt hace 3-5 años con reglas agresivas para evitar el scraping, antes de que existieran los bots de sistemas IA. Nadie revisó el archivo desde entonces. Verifica tu robots.txt hoy.
¿Dónde puedo obtener ayuda profesional para una auditoría GEO completa?
Ofrecemos auditorías GEO completas que cubren los 7 errores descritos aquí, más un análisis personalizado de tu sector y competencia. El resultado es un plan de acción priorizado con plazos y responsables. Más información sobre nuestra auditoría GEO →
---
La visibilidad en sistemas IA en 2026 no es un privilegio de las grandes empresas. Es cuestión de hacer bien las cosas técnicas y de contenido que, en su mayoría, son las mismas que hacen un buen sitio web en general. La diferencia es que ahora hay un cliente adicional al que tienes que atender: el modelo de lenguaje que está leyendo tu sitio para decidir si mereces ser recomendado.
