La medibilidad del tráfico generado por IA varía mucho según el tipo de tráfico, ya que no es lo mismo un crawler de training que un click humano desde una cita, ni un fetcher on-demand que un agente navegando. Esta tabla resume el estado actual a mayo de 2026, clasificando por servicio, nivel de medibilidad y huella que verás en logs o analítica.
🟢 Alto · 🟡 Medio · 🟠 Bajo · 🔴 Nulo
1. Crawlers de training y search/RAG
Bots que indexan tu sitio, no ejecutan JS y solo son visibles en server logs. Una nota importante, AIO y AI Mode no hacen fetch en tiempo real tras una consulta, sino que tiran del índice de Google ya cacheado por Googlebot, así que no verás un hit en logs correlacionado con una búsqueda concreta ni puedes forzar un fetch en una conversación con AI Mode.
| Servicio |
Nivel |
Huella |
| Google Search / AIO / AI Mode |
🟢 |
UA Googlebot + JSON oficial + rDNS *.googlebot.com. El mismo crawler alimenta Search e índice para AIO/AI Mode |
| Google Gemini training + grounding |
⚠️ |
Google-Extended no es un UA, solo token de robots.txt. El crawling lo hace con UAs Googlebot existentes |
| OpenAI training + search |
🟢 |
UAs GPTBot, OAI-SearchBot + JSON oficial de IPs |
| Anthropic training + search |
🟡 |
UAs ClaudeBot, Claude-SearchBot. Sin JSON oficial de IPs |
| Perplexity (indexación declarada) |
🟡 |
UA PerplexityBot. Cloudflare lo deslistó de Verified Bots (ago 2025) |
| Apple training |
🟢 |
UA Applebot. Verificación estable |
| Amazon training |
🟢 |
UA Amazonbot. Verificación estable |
| Meta training |
🟢 |
UA Meta-ExternalAgent. Verificación estable |
| Common Crawl |
🟢 |
UA CCBot. Verificación estable. Dataset abierto usado por múltiples modelos |
| ByteDance training |
🔴 |
UA Bytespider, pero ignora robots.txt sistemáticamente y hay reportes de spoofing. Volúmenes agresivos (1.4M hits/día reportados). Requiere bloqueo a nivel server/CDN |
| Perplexity stealth crawler |
🔴 |
UA Chrome 124 falsificado cuando se bloquea el oficial |
| xAI Grok crawler |
🔴 |
UA falsificado sistemáticamente, "impossible to block" según Cloudflare |
2. Fetchers on-demand (disparados por usuario o grounding)
Se disparan cuando un humano pide algo o cuando un LLM hace grounding/web search en vivo. Aquí sí verás hits en logs correlacionados con consultas concretas, a diferencia de AIO/AI Mode.
| Servicio |
Nivel |
Huella |
| ChatGPT (browsing + agent fetch) |
🟢 |
UAs ChatGPT-User, ChatGPT Agent + JSON oficial + Web Bot Auth (HTTP Message Signatures) desde ago 2025 |
| Vertex AI Agents |
🟢 |
UA Google-CloudVertexBot |
| Gemini grounding / URL Context tool |
🟠 |
Sin UA específico documentado. El fetch lo hace la infra Google y se observa como UA escueto Google |
| Claude (fetch para grounding) |
🟡 |
UA Claude-User. Sin JSON oficial |
| Perplexity (fetch para grounding) |
🟡 |
UA Perplexity-User. Mismo paquete deslistado por Cloudflare |
| Amazon (fetch on-demand) |
🟢 |
UA Amzn-User |
| Mistral (fetch on-demand) |
🟢 |
UA MistralAI-User |
3. Clicks humanos desde citas en chatbots
Cómo se ve un click humano que llega desde una cita en un chatbot, tanto en server logs como en tu herramienta de analytics.
| Origen |
Nivel |
Huella |
| Perplexity web |
🟢 |
perplexity.ai / referral, Referer consistente |
| ChatGPT web, citation links (todos los planes) |
🟢 |
utm_source=chatgpt.com desde jun 2025 |
| ChatGPT web, inline links (Plus / Pro / Team) |
🟢 |
Referer preservado, aparece como chatgpt.com / referral |
| Copilot (copilot.microsoft.com) |
🟢 |
copilot.microsoft.com / referral |
| Gemini web (gemini.google.com) |
🟢 |
gemini.google.com / referral |
| Claude web |
🟡 |
Path con fecha claude.ai/referral/YYYY-MM-DD, requiere regex para agrupar |
| Gemini app iOS |
🟡 |
UA GeminiiOS/x.x.x con GoogleWv/1.0 (WKWebView) identificable en logs. Referer stripped, cae en Direct en GA4. Descubierto por mí en logs (oct 2025). |
Gemini, UA Google genérico (resto de superficies) |
🟠 |
Gemini usa UA escueto Google para gran parte de su tráfico, sin documentación oficial. Imposible distinguir origen (app, web, grounding, etc.) |
| Apps móviles ChatGPT, Claude, Perplexity |
🔴 |
Comportamiento no documentado oficialmente por los proveedores. Reportado consistentemente por la industria, los clicks desde apps móviles strippean Referer y la mayoría no llevan UTM. Estimaciones de 20-40% del tráfico IA mal atribuido a Direct por este motivo |
| ChatGPT web, inline links (plan Free) |
🔴 |
Referer stripped, cae en Direct |
| Gemini app Android |
🔴 |
Sin UA propio documentado. Cae bajo Google genérico o Direct |
4. Experiencias generativas integradas en SERP
AIO y AI Mode dentro de google.com, Copilot Search dentro de bing.com. Mezcladas con orgánico clásico en GA4 en ambos casos. Bing es bastante más transparente que Google en su panel para webmasters.
| Origen |
Nivel |
Huella |
| AI Overviews (Google) |
🔴 |
Clicks e impresiones incluidos en totales de Search Console, pero sin filtro para aislarlos (google / organic en GA4) |
| AI Mode (Google) |
🔴 |
Clicks e impresiones agregados al "Web" search type de Search Console desde 17 jun 2025, sin filtro dedicado |
| Copilot Search + Bing AI summaries |
🟡 |
Mezclado con bing / organic en GA4, pero el AI Performance report de Bing Webmaster Tools (feb 2026) sí muestra citations, grounding queries, páginas citadas y mapping query↔página. Solo visibilidad de citation, no clicks al sitio. Pero, en Microsoft Clarity tenemos además share of authority y AI referral traffic. |
5. Navegadores agénticos
Browsers Chromium pilotados por LLM. Visibles en GA4 como humanos. UA Chrome estándar, ninguno tiene UA propio dedicado salvo Google-Agent. La única señal fiable cuando ejecutan tareas agénticas es Web Bot Auth, si la firman.
| Browser / Agent |
Nivel |
Huella |
| Google-Agent (Gemini Agent + Chrome Auto-Browse) |
🟢 |
UA propio con string compatible; Google-Agent + JSON oficial (user-triggered-agents.json) + Web Bot Auth (identidad agent.bot.goog) desde mar 2026. Heredó de Project Mariner (cerrado 4 may 2026). Único agente con UA propio |
| ChatGPT Atlas (modo agent) |
🟡 |
Sin UA propio, pero firma con Web Bot Auth cuando opera en modo agent (registrado como signed agent chatgpt-agent en Cloudflare). Navegación humana normal indistinguible |
| Perplexity Comet |
🟠 |
Sin UA propio. Algunas peticiones del asistente incluyen "Perplexity" en UA. Sin Web Bot Auth documentado |
| Claude for Chrome (extensión) |
🔴 |
UA Chrome del usuario, indistinguible. Sin Web Bot Auth |
| Dia (The Browser Company) |
🔴 |
UA Chromium estándar, indistinguible. Sin Web Bot Auth |
Conclusiones
Citas con clicks en chatbots desde desktop
Es el tramo más limpio. Perplexity pasa Referer consistente, ChatGPT incluye utm_source=chatgpt.com en las citation links de todos los planes desde junio 2025, Copilot y Gemini web pasan Referer estándar, y Claude requiere agrupar paths por fecha con regex pero se hace. Adobe Analytics lanzó la dimensión "Conversational AI tools" en agosto de 2025, Amplitude también identifica LLMs en sus default channel rules, y GA4 sacó su canal nativo "AI Assistant" el 13 de mayo de 2026. En Plausible, Matomo o cualquier sistema con reglas de canal personalizadas puedes montártelo manualmente.
Citas con clicks en chatbots desde móvil
Android cae en Direct casi sin excepciones e iOS solo deja huella en logs vía GeminiiOS (UA descubierto por mi). Las apps de ChatGPT, Claude y Perplexity strippean Referer y no llevan UTM, con estimaciones de industria del 20-40% del tráfico IA misatribuido a Direct por este motivo, y los canales nativos de las herramientas de analytics no resuelven esto.
Cubren los grandes proveedores con referrer detectable (ChatGPT, Gemini, Claude, en algunos casos Perplexity y Copilot) pero no lo que llega sin referrer ni UTM, que es exactamente donde está el agujero del móvil. Si solo miras a estos canales, el tráfico de las apps móviles te queda fuera.
Citas sin clicks
El último problema, y el más difícil de resolver, son las citaciones sin click, esto es, la marca mencionada en respuestas IA sin que el usuario clique. Más allá del impacto en CTR orgánico, suficientemente documentado, el dato relevante es el click dentro del propio AIO. Pew Research midió un 1% en julio de 2025, lo que significa que aunque tu marca aparezca citada en el AIO, solo un usuario de cada cien clica la fuente y el resto se queda en Google o cierra la pestaña.
Search Console agrega clicks e impresiones de AIO y AI Mode al total sin filtro para aislarlos, y las impresiones entre mayo 2025 y abril 2026 estuvieron infladas por un bug que Google reconoció oficialmente.
Bing va por delante de Google en transparencia ya que el AI Performance report en Bing Webmaster Tools, lanzado en febrero 2026, muestra citations, grounding queries, páginas citadas y desde marzo el mapping query↔página. Lo único que no da son clicks al sitio, solo visibilidad de citation. Fuera de la SERP el problema se repite en los chatbots.
Los prompt trackers rotan unos pocos prompts predefinidos sobre LLMs no deterministas que cambian de respuesta hora a hora. Dan la punta, de la punta, del iceberg. Los de escala masiva como Sistrix o Ahrefs, dan un poquito más. El volumen de menciones que recibe una marca en las conversaciones de millones de usuarios no se puede observar, y no parece que vaya a cambiar a corto plazo porque las APIs de los LLMs no exponen esos datos.
Agentes navegando
Los agentic browsers tipo Atlas, Comet, Claude for Chrome o Dia se ven en GA4 como humanos normales porque, técnicamente, lo son, con UA Chrome estándar, cookies y navegación humana. Aquí demostré que no eran identificados como bots y ejecutaban Google Analytics.
Ninguno tiene un UA dedicado propio, lo cual es un problema para el tráfico agéntico. La excepción es Google, que con Google-Agent, el UA lanzado el 20 de marzo de 2026 para Project Mariner y heredado por Gemini Agent y Chrome Auto-Browse tras el cierre de Mariner el 4 de mayo de 2026, es el único agente navegacional mainstream que se identifica explícitamente en logs. Tiene su propio fichero de IPs (user-triggered-agents.json) y está experimentando con Web Bot Auth, el estándar IETF de firma criptográfica. ChatGPT Atlas también firma con Web Bot Auth cuando entra en modo agent pero sin UA propio, mientras que Comet, Claude for Chrome y Dia son indistinguibles.
Web Bot Auth es hoy la única señal fiable para distinguir un agente legítimo de un spoofer, dado que el UA es trivial de falsificar y la firma criptográfica requiere acceso a la clave privada del agente.
Qué fuente sirve para qué
La medición de visibilidad en LLMs sale de combinar varias fuentes parciales ya que cada fuente cubre una parte distinta del problema:
- Server logs (cruzados con datos de CDN o WAF): identificación de crawlers, fetchers y agentes con UA propio. Te dice quién entra a leer y con qué frecuencia (bots o users).
- Herramientas de analytics (Adobe Analytics, GA4, Amplitude, Plausible, Matomo, Piwik PRO o la que uses): clicks humanos desde citas en chatbot web, con sus canales nativos o personalizados. Con esto mides sesiones, conversiones y revenue generado por tráfico IA. Asume que aquí no está todo, un porcentaje considerable es Direct.
- Search Console: agrega AIO y AI Mode al total pero no los separa. Puedes inferir algún prompt mediante RegEx, no es fiable.
- Bing Webmaster Tools (AI Performance report): única fuente que muestra citations dentro de Copilot y Bing AI summaries, con grounding queries y páginas citadas. Te da visibilidad de citation, no de los clicks. Aquí te enseño a descargarte toda la data sin ir página a página.
- Microsoft Clarity (Citations dashboard): grounding queries, cited pages y share of authority dentro de Copilot y experiencias AI de partners de Microsoft, más AI referral traffic medido desde el propio script de Clarity. Como lo que hay en BWT en la parte de citations pero añade la sesión y el share of authority como KPI
- Prompt trackers: aproximación ínfima de las citations en LLMs. Para mi son el negocio de la certidumbre prefabricada.