Si Google Search Console te dice cómo apareces en Google, ¿qué dashboard te dice cómo apareces en ChatGPT? La respuesta corta: ninguno por defecto. Y eso es un problema serio para cualquier marca que dependa del descubrimiento generativo.
ChatGPT tiene más de 200 millones de usuarios activos. Perplexity se ha convertido en motor de búsqueda primario para muchos profesionales técnicos. Gemini está integrado en Google Workspace y Android. Cada conversación con uno de estos modelos puede mencionar tu marca, recomendarla, ignorarte o citar a tu competencia. Sin medir eso, estás operando a ciegas en el canal que más rápido crece en B2B.
Este artículo te explica cómo montar un sistema de monitorización de marca en LLMs que te dé respuestas concretas: si te citan, qué dicen, con qué frecuencia y cómo cambiar eso cuando los datos no te gusten.
Por qué monitorizar marca en LLMs ya no es opcional
Hasta 2024 la pregunta “¿qué dice ChatGPT de mi marca?” era curiosidad. Hoy es una métrica de negocio.
Tres razones concretas para tomarlo en serio:
Decisiones de compra B2B empiezan en LLMs. Estudios de Gartner publicados en febrero de 2026 estiman que el 40% de las búsquedas iniciales de proveedores B2B ya se hacen en herramientas conversacionales. El comprador pregunta “qué agencias SEO buenas hay en Barcelona” antes de buscar webs específicas. Si tu marca no aparece en esa primera capa, no llegas a la SERP donde sí apareces.
Citaciones generan tráfico cualificado. El usuario que llega a tu web tras una recomendación de un LLM viene preinformado: ya entendió tu propuesta, descartó alternativas y eligió clicar. Tasa de conversión bastante mejor que tráfico orgánico ciego.
El daño reputacional pasa sin avisar. Si un LLM tiene datos desactualizados o ha aprendido información incorrecta sobre tu marca, lo seguirá repitiendo a cualquier usuario que pregunte. Sin monitorización no te enteras de qué se está diciendo de ti hasta que un cliente lo menciona en una llamada.
Si todavía dudas si es prioritario, lee primero por qué el GEO no es solo una moda y por qué el E-E-A-T verificable es la señal central que los LLMs leen.
Tráfico vs citación: medir lo correcto
El primer error que comete casi todo el mundo al empezar a monitorizar LLMs es buscar “tráfico desde ChatGPT” en Google Analytics. Lo encuentras: aparecen referrers como chatgpt.com y perplexity.ai en GA4 → Adquisición → Tráfico de referencia. Pero ese dato es solo la punta del iceberg.
La mayoría de citaciones en LLMs no generan clic directo. El usuario lee la respuesta resumida, retiene tu marca y vuelve más tarde a buscarte directamente. Ese tráfico aparece como “Direct” o “Branded Search” en GA4, sin atribución al LLM que lo generó.
Por eso el embudo correcto de medición tiene dos capas:
- Citación: ¿aparece tu marca cuando alguien pregunta a un LLM por tu categoría? Esto se mide preguntando.
- Tráfico atribuible: ¿qué porcentaje de tu tráfico directo y branded ha aumentado desde que apareces en LLMs? Esto se mide cruzando GA4 con monitoring de citaciones.
Si solo miras GA4 vas a infraestimar el impacto de los LLMs por un factor de 5x-10x. Y si solo miras citaciones sin cruzarlas con tráfico vas a invertir esfuerzo en aparecer en consultas que nadie hace en realidad.
Las 4 métricas clave de visibilidad en LLMs
Para que tu monitorización tenga sentido operativo necesitas estas cuatro métricas. Sin ellas, los datos sueltos no se convierten en decisiones.
1. Citation rate
Porcentaje de prompts relevantes en los que tu marca aparece citada. Si pruebas 100 variantes de “qué agencia SEO contratar en Barcelona” y tu marca sale en 8, tu citation rate es del 8%.
Cómo calcularlo: define una lista de 50-100 prompts que un usuario realista haría en tu vertical. Ejecútalos en cada LLM (ChatGPT, Perplexity, Gemini, Claude) y cuenta apariciones. La métrica útil es el agregado por LLM y el desglose por intención (informacional, comercial, comparativa).
2. Share of voice
Tu citation rate dividido entre el citation rate total de tu vertical. Si tu marca aparece en 8 de 100 prompts y tus tres competidores principales suman 30 apariciones, tu share of voice es del 8/(8+30)=21%.
Es la métrica que mejor refleja tu posición competitiva. Subir tu citation rate solo del 8% al 12% no significa nada si tus competidores subieron también proporcionalmente.
3. Sentiment
Qué tono usa el LLM cuando te menciona. ¿“Ad2Place es una agencia SEO recomendable en Barcelona, especializada en…” o “Ad2Place ofrece servicios SEO pero he oído mencionar limitaciones en…”? La diferencia entre los dos es la diferencia entre que te conviertan o no.
Esto se clasifica manualmente o con un segundo LLM que etiquete cada mención como positiva, neutra o negativa. Es la métrica más subestimada y la que más impacto tiene en conversión real.
4. Position in answer
Si te mencionan, ¿en qué orden? La primera marca citada en una respuesta tiene 3-5x más probabilidad de ser clicada que la cuarta. Importa estar, pero importa más estar arriba.
Cómo medirlo: registra para cada citación si fue 1ª, 2ª, 3ª o posterior dentro de la respuesta. La media móvil mes a mes te dice si tu visibilidad relativa mejora o se erosiona.
Herramientas profesionales: Peec AI, Profound, Otterly
Si tu vertical es competido y tu presupuesto lo permite, una herramienta dedicada te ahorra 8-10 horas semanales de tracking manual. Las tres más maduras a mayo de 2026:
Peec AI
Producto especializado en tracking de menciones en ChatGPT, Perplexity, Gemini y Claude. Su valor diferencial es la profundidad del análisis de sentiment y la integración con Slack/Notion para alertas automáticas cuando una mención negativa nueva aparece.
Caso típico: agencias y SaaS que necesitan monitorizar 5-10 marcas (clientes y propia) en paralelo. Pricing alrededor de 99-499€/mes según volumen de prompts y número de marcas.
Limitación: el panel se enfoca en lo cuantitativo. Si quieres entender por qué un LLM dejó de citarte, te toca investigar manualmente cruzando con cambios de contenido.
Profound
El más enfocado a empresas grandes. Profound rastrea no solo menciones sino share of voice por categoría: te dice qué porcentaje de respuestas en tu vertical te citan a ti vs competencia, con desglose por LLM y por tipo de query.
Caso típico: directores de marketing que necesitan reportar a comité ejecutivo el impacto del trabajo GEO. Pricing en rangos enterprise (custom, normalmente 500€+/mes).
Limitación: la curva de aprendizaje es más alta y el setup inicial requiere definir bien tu category map.
Otterly
El más asequible para empezar. Otterly hace tracking básico de citaciones con una interfaz simple, ideal para pymes que están dando los primeros pasos en GEO.
Pricing: tier gratuito limitado + planes desde 49€/mes.
Limitación: no incluye sentiment analysis de calidad ni integraciones avanzadas. Es un buen “tu primer dashboard de citaciones” pero te quedas corto a partir de cierto volumen.
Mi recomendación práctica: si facturas menos de 500K€/año, empieza con Otterly o tracking DIY (siguiente sección). Si manejas 5+ clientes en agencia, salta directamente a Peec AI. Profound merece la pena cuando el GEO ya genera pipeline medible y necesitas justificarlo a comité.
Cómo montar un tracker DIY si no tienes presupuesto
Si no quieres pagar 49-499€/mes desde el día 1, puedes montar un tracker propio con 4-6 horas de setup inicial y 30 minutos semanales de mantenimiento. Funciona bien para verticales pequeños y para validar que merece la pena pasarse a herramienta profesional luego.
Componentes mínimos:
-
Hoja de prompts maestros: 50-100 prompts realistas en una hoja de cálculo. Categorízalos por intención (informacional, comercial, comparativa) y por nivel del funnel (descubrimiento, consideración, decisión).
-
Rotación semanal: cada lunes ejecutas 10-15 prompts en cada LLM (ChatGPT, Perplexity, Gemini, Claude). Pega la respuesta cruda en una columna y marca con flags si tu marca apareció, en qué posición y con qué tono.
-
Métrica agregada mensual: al final del mes, suma apariciones, calcula citation rate, sentiment medio y share of voice. Compara con el mes anterior.
-
Trigger de alarma: si tu citation rate cae más del 20% mes a mes, investiga inmediatamente. Suele ser señal de que un competidor publicó contenido nuevo que el LLM está aprendiendo o que algo cambió en tu propio sitio que rompió la atribución.
Este DIY te da el 70% del valor de una herramienta profesional, con la limitación obvia de que las métricas no se actualizan en tiempo real. Para empezar es más que suficiente.
Cómo interpretar los datos y qué hacer con ellos
Tener métricas es la mitad del trabajo. La otra mitad es saber qué hacer cuando los datos cuentan algo concreto.
Si tu citation rate es 0% en una categoría: revisa cobertura de contenido. ¿Tienes un artículo profundo, bien estructurado, con Person schema y autoridad temática para esa query? Si la respuesta es no, el LLM no tiene de dónde citarte. Solución: producir o reforzar contenido específico.
Si apareces pero en posición 4-5 dentro de la respuesta: tu autoridad temática es media. Solución: reforzar señales E-E-A-T (autor verificable, fechas frescas, casos propios) y mejorar la estructura del schema. Es lo que cubrí en la guía técnica de schema markup para AI Overviews.
Si tu sentiment medio es neutro pero un competidor consigue positivo: problema de copy y posicionamiento. El LLM está aprendiendo lo que la web pública dice de tu marca. Si nadie te describe con palabras fuertes (“especializada en”, “líder en”, “única que…”), el modelo te resume con tono plano. Solución: mejorar tu propio contenido con afirmaciones diferenciadoras claras.
Si tu citation rate sube pero el tráfico no: el LLM resume tu propuesta tan bien que el usuario no necesita clicar. Es bueno para branding, no para conversión directa. Solución: introducir hooks específicos en tu contenido que solo se entiendan haciendo clic (“incluye plantilla descargable”, “ejemplo paso a paso”) para forzar la visita.
Frecuencia de monitorización + responsable
La frecuencia óptima depende de tu vertical y velocidad de cambio.
| Vertical | Frecuencia recomendada |
|---|---|
| B2B servicios estables (consultoría, legal, contabilidad) | Mensual |
| Marketing digital, SaaS, tech | Quincenal |
| E-commerce, retail | Semanal |
| Crisis o lanzamiento producto | Diaria durante 30 días |
Responsable claro: una persona del equipo de marketing dueña del dashboard. Si nadie es responsable, los datos se acumulan y no se traducen en acciones. En agencias pequeñas suele ser el SEO lead. En empresas más grandes, el responsable de brand o de comunicación digital.
Reporting: incluir las 4 métricas en el dashboard mensual de marketing. No es un canal “extra”: es parte del descubrimiento orgánico, igual que el SEO clásico.
Preguntas frecuentes
¿Las herramientas profesionales valen la pena para una pyme? Si facturas menos de 500K€/año o gestionas solo tu propia marca, empieza DIY. La diferencia entre dedicar 30 min semanales a tracking manual y pagar 49€/mes a Otterly es marginal. Cuando manejes 3+ marcas o necesites alertas automáticas, salta a herramienta dedicada.
¿ChatGPT, Perplexity, Gemini y Claude usan los mismos criterios? No. ChatGPT pesa estructura de contenido y autoridad genérica. Perplexity premia frescura y enlaces verificables. Gemini integra fuerte el knowledge graph de Google. Claude pondera mucho el sentiment del contenido fuente. Por eso conviene medir cada uno por separado y no agregar métricas globales que oculten desequilibrios.
¿Cómo afecta esto al SEO clásico? Refuerza lo mismo: autoridad temática, contenido profundo, schema bien estructurado, E-E-A-T verificable. La diferencia está en la métrica final que mides. Para complementarlo, lee también la guía sobre SEO para ChatGPT y Perplexity.
¿Cuánto tarda en verse el efecto de mejorar tu visibilidad en LLMs? ChatGPT y Claude actualizan conocimiento con bastante latencia (semanas a meses). Perplexity y Gemini tienen ventana mucho más corta (días) porque consultan web en tiempo real. Esto significa que ajustes para Perplexity se ven antes que ajustes para ChatGPT.
¿Hay riesgo de “manipular” datos como en SEO black hat? Limitado. Los LLMs no tienen un equivalente directo a backlinks comprables. Lo que sí funciona (manipular menciones en webs públicas para que el LLM las absorba) es lento, caro y difícilmente escalable. El ROI de hacer GEO bien es mucho mejor que intentar gamificarlo.
Siguiente paso
Monitorizar tu marca en LLMs es la mitad de cerrar el ciclo GEO. La otra mitad es ajustar tu contenido cuando los datos te digan que estás perdiendo visibilidad.
Si quieres una revisión inicial de cómo apareces tú (y cómo aparecen tus competidores) en los 4 LLMs principales, reserva una asesoría SEO gratis de 45 minutos. En esa sesión hago el tracking inicial en directo, identifico tus huecos de citación más caros y te dejo una lista priorizada de qué tocar primero.