Estado de medibilidad del tráfico IA

La medibilidad del tráfico generado por IA varía mucho según el tipo de tráfico, ya que no es lo mismo un crawler de training que un click humano desde una cita, ni un fetcher on-demand que un agente navegando. Esta tabla resume el estado actual a mayo de 2026, clasificando por servicio, nivel de medibilidad y huella que verás en logs o analítica.

🟢 Alto · 🟡 Medio · 🟠 Bajo · 🔴 Nulo

1. Crawlers de training y search/RAG

Bots que indexan tu sitio, no ejecutan JS y solo son visibles en server logs. Una nota importante, AIO y AI Mode no hacen fetch en tiempo real tras una consulta, sino que tiran del índice de Google ya cacheado por Googlebot, así que no verás un hit en logs correlacionado con una búsqueda concreta ni puedes forzar un fetch en una conversación con AI Mode.

Servicio Nivel Huella
Google Search / AIO / AI Mode 🟢 UA Googlebot + JSON oficial + rDNS *.googlebot.com. El mismo crawler alimenta Search e índice para AIO/AI Mode
Google Gemini training + grounding ⚠️ Google-Extended no es un UA, solo token de robots.txt. El crawling lo hace con UAs Googlebot existentes
OpenAI training + search 🟢 UAs GPTBot, OAI-SearchBot + JSON oficial de IPs
Anthropic training + search 🟡 UAs ClaudeBot, Claude-SearchBot. Sin JSON oficial de IPs
Perplexity (indexación declarada) 🟡 UA PerplexityBot. Cloudflare lo deslistó de Verified Bots (ago 2025)
Apple training 🟢 UA Applebot. Verificación estable
Amazon training 🟢 UA Amazonbot. Verificación estable
Meta training 🟢 UA Meta-ExternalAgent. Verificación estable
Common Crawl 🟢 UA CCBot. Verificación estable. Dataset abierto usado por múltiples modelos
ByteDance training 🔴 UA Bytespider, pero ignora robots.txt sistemáticamente y hay reportes de spoofing. Volúmenes agresivos (1.4M hits/día reportados). Requiere bloqueo a nivel server/CDN
Perplexity stealth crawler 🔴 UA Chrome 124 falsificado cuando se bloquea el oficial
xAI Grok crawler 🔴 UA falsificado sistemáticamente, "impossible to block" según Cloudflare

2. Fetchers on-demand (disparados por usuario o grounding)

Se disparan cuando un humano pide algo o cuando un LLM hace grounding/web search en vivo. Aquí sí verás hits en logs correlacionados con consultas concretas, a diferencia de AIO/AI Mode.

Servicio Nivel Huella
ChatGPT (browsing + agent fetch) 🟢 UAs ChatGPT-User, ChatGPT Agent + JSON oficial + Web Bot Auth (HTTP Message Signatures) desde ago 2025
Vertex AI Agents 🟢 UA Google-CloudVertexBot
Gemini grounding / URL Context tool 🟠 Sin UA específico documentado. El fetch lo hace la infra Google y se observa como UA escueto Google
Claude (fetch para grounding) 🟡 UA Claude-User. Sin JSON oficial
Perplexity (fetch para grounding) 🟡 UA Perplexity-User. Mismo paquete deslistado por Cloudflare
Amazon (fetch on-demand) 🟢 UA Amzn-User
Mistral (fetch on-demand) 🟢 UA MistralAI-User

3. Clicks humanos desde citas en chatbots

Cómo se ve un click humano que llega desde una cita en un chatbot, tanto en server logs como en tu herramienta de analytics.

Origen Nivel Huella
Perplexity web 🟢 perplexity.ai / referral, Referer consistente
ChatGPT web, citation links (todos los planes) 🟢 utm_source=chatgpt.com desde jun 2025
ChatGPT web, inline links (Plus / Pro / Team) 🟢 Referer preservado, aparece como chatgpt.com / referral
Copilot (copilot.microsoft.com) 🟢 copilot.microsoft.com / referral
Gemini web (gemini.google.com) 🟢 gemini.google.com / referral
Claude web 🟡 Path con fecha claude.ai/referral/YYYY-MM-DD, requiere regex para agrupar
Gemini app iOS 🟡 UA GeminiiOS/x.x.x con GoogleWv/1.0 (WKWebView) identificable en logs. Referer stripped, cae en Direct en GA4. Descubierto por mí en logs (oct 2025).
Gemini, UA Google genérico (resto de superficies) 🟠 Gemini usa UA escueto Google para gran parte de su tráfico, sin documentación oficial. Imposible distinguir origen (app, web, grounding, etc.)
Apps móviles ChatGPT, Claude, Perplexity 🔴 Comportamiento no documentado oficialmente por los proveedores. Reportado consistentemente por la industria, los clicks desde apps móviles strippean Referer y la mayoría no llevan UTM. Estimaciones de 20-40% del tráfico IA mal atribuido a Direct por este motivo
ChatGPT web, inline links (plan Free) 🔴 Referer stripped, cae en Direct
Gemini app Android 🔴 Sin UA propio documentado. Cae bajo Google genérico o Direct

4. Experiencias generativas integradas en SERP

AIO y AI Mode dentro de google.com, Copilot Search dentro de bing.com. Mezcladas con orgánico clásico en GA4 en ambos casos. Bing es bastante más transparente que Google en su panel para webmasters.

Origen Nivel Huella
AI Overviews (Google) 🔴 Clicks e impresiones incluidos en totales de Search Console, pero sin filtro para aislarlos (google / organic en GA4)
AI Mode (Google) 🔴 Clicks e impresiones agregados al "Web" search type de Search Console desde 17 jun 2025, sin filtro dedicado
Copilot Search + Bing AI summaries 🟡 Mezclado con bing / organic en GA4, pero el AI Performance report de Bing Webmaster Tools (feb 2026) sí muestra citations, grounding queries, páginas citadas y mapping query↔página. Solo visibilidad de citation, no clicks al sitio. Pero, en Microsoft Clarity tenemos además share of authority y AI referral traffic.

5. Navegadores agénticos

Browsers Chromium pilotados por LLM. Visibles en GA4 como humanos. UA Chrome estándar, ninguno tiene UA propio dedicado salvo Google-Agent. La única señal fiable cuando ejecutan tareas agénticas es Web Bot Auth, si la firman.

Browser / Agent Nivel Huella
Google-Agent (Gemini Agent + Chrome Auto-Browse) 🟢 UA propio con string compatible; Google-Agent + JSON oficial (user-triggered-agents.json) + Web Bot Auth (identidad agent.bot.goog) desde mar 2026. Heredó de Project Mariner (cerrado 4 may 2026). Único agente con UA propio
ChatGPT Atlas (modo agent) 🟡 Sin UA propio, pero firma con Web Bot Auth cuando opera en modo agent (registrado como signed agent chatgpt-agent en Cloudflare). Navegación humana normal indistinguible
Perplexity Comet 🟠 Sin UA propio. Algunas peticiones del asistente incluyen "Perplexity" en UA. Sin Web Bot Auth documentado
Claude for Chrome (extensión) 🔴 UA Chrome del usuario, indistinguible. Sin Web Bot Auth
Dia (The Browser Company) 🔴 UA Chromium estándar, indistinguible. Sin Web Bot Auth

Conclusiones

Citas con clicks en chatbots desde desktop

Es el tramo más limpio. Perplexity pasa Referer consistente, ChatGPT incluye utm_source=chatgpt.com en las citation links de todos los planes desde junio 2025, Copilot y Gemini web pasan Referer estándar, y Claude requiere agrupar paths por fecha con regex pero se hace. Adobe Analytics lanzó la dimensión "Conversational AI tools" en agosto de 2025, Amplitude también identifica LLMs en sus default channel rules, y GA4 sacó su canal nativo "AI Assistant" el 13 de mayo de 2026. En Plausible, Matomo o cualquier sistema con reglas de canal personalizadas puedes montártelo manualmente.

Citas con clicks en chatbots desde móvil

Android cae en Direct casi sin excepciones e iOS solo deja huella en logs vía GeminiiOS (UA descubierto por mi). Las apps de ChatGPT, Claude y Perplexity strippean Referer y no llevan UTM, con estimaciones de industria del 20-40% del tráfico IA misatribuido a Direct por este motivo, y los canales nativos de las herramientas de analytics no resuelven esto.

Cubren los grandes proveedores con referrer detectable (ChatGPT, Gemini, Claude, en algunos casos Perplexity y Copilot) pero no lo que llega sin referrer ni UTM, que es exactamente donde está el agujero del móvil. Si solo miras a estos canales, el tráfico de las apps móviles te queda fuera.

Citas sin clicks

El último problema, y el más difícil de resolver, son las citaciones sin click, esto es, la marca mencionada en respuestas IA sin que el usuario clique. Más allá del impacto en CTR orgánico, suficientemente documentado, el dato relevante es el click dentro del propio AIO. Pew Research midió un 1% en julio de 2025, lo que significa que aunque tu marca aparezca citada en el AIO, solo un usuario de cada cien clica la fuente y el resto se queda en Google o cierra la pestaña.

Search Console agrega clicks e impresiones de AIO y AI Mode al total sin filtro para aislarlos, y las impresiones entre mayo 2025 y abril 2026 estuvieron infladas por un bug que Google reconoció oficialmente.

Bing va por delante de Google en transparencia ya que el AI Performance report en Bing Webmaster Tools, lanzado en febrero 2026, muestra citations, grounding queries, páginas citadas y desde marzo el mapping query↔página. Lo único que no da son clicks al sitio, solo visibilidad de citation. Fuera de la SERP el problema se repite en los chatbots.

Los prompt trackers rotan unos pocos prompts predefinidos sobre LLMs no deterministas que cambian de respuesta hora a hora. Dan la punta, de la punta, del iceberg. Los de escala masiva como Sistrix o Ahrefs, dan un poquito más. El volumen de menciones que recibe una marca en las conversaciones de millones de usuarios no se puede observar, y no parece que vaya a cambiar a corto plazo porque las APIs de los LLMs no exponen esos datos.

Agentes navegando

Los agentic browsers tipo Atlas, Comet, Claude for Chrome o Dia se ven en GA4 como humanos normales porque, técnicamente, lo son, con UA Chrome estándar, cookies y navegación humana. Aquí demostré que no eran identificados como bots y ejecutaban Google Analytics.

Ninguno tiene un UA dedicado propio, lo cual es un problema para el tráfico agéntico. La excepción es Google, que con Google-Agent, el UA lanzado el 20 de marzo de 2026 para Project Mariner y heredado por Gemini Agent y Chrome Auto-Browse tras el cierre de Mariner el 4 de mayo de 2026, es el único agente navegacional mainstream que se identifica explícitamente en logs. Tiene su propio fichero de IPs (user-triggered-agents.json) y está experimentando con Web Bot Auth, el estándar IETF de firma criptográfica. ChatGPT Atlas también firma con Web Bot Auth cuando entra en modo agent pero sin UA propio, mientras que Comet, Claude for Chrome y Dia son indistinguibles.

Web Bot Auth es hoy la única señal fiable para distinguir un agente legítimo de un spoofer, dado que el UA es trivial de falsificar y la firma criptográfica requiere acceso a la clave privada del agente.

Qué fuente sirve para qué

La medición de visibilidad en LLMs sale de combinar varias fuentes parciales ya que cada fuente cubre una parte distinta del problema:

  • Server logs (cruzados con datos de CDN o WAF): identificación de crawlers, fetchers y agentes con UA propio. Te dice quién entra a leer y con qué frecuencia (bots o users).
  • Herramientas de analytics (Adobe Analytics, GA4, Amplitude, Plausible, Matomo, Piwik PRO o la que uses): clicks humanos desde citas en chatbot web, con sus canales nativos o personalizados. Con esto mides sesiones, conversiones y revenue generado por tráfico IA. Asume que aquí no está todo, un porcentaje considerable es Direct.
  • Search Console: agrega AIO y AI Mode al total pero no los separa. Puedes inferir algún prompt mediante RegEx, no es fiable.
  • Bing Webmaster Tools (AI Performance report): única fuente que muestra citations dentro de Copilot y Bing AI summaries, con grounding queries y páginas citadas. Te da visibilidad de citation, no de los clicks. Aquí te enseño a descargarte toda la data sin ir página a página.
  • Microsoft Clarity (Citations dashboard): grounding queries, cited pages y share of authority dentro de Copilot y experiencias AI de partners de Microsoft, más AI referral traffic medido desde el propio script de Clarity. Como lo que hay en BWT en la parte de citations pero añade la sesión y el share of authority como KPI
  • Prompt trackers: aproximación ínfima de las citations en LLMs. Para mi son el negocio de la certidumbre prefabricada.

 

Natzir Turrado 17 mayo 2026

Compartir

Facebook Linkedin Twitter

Otros artículos

Workflows y Agentes de IA para SEO

La Inteligencia Artificial ha dejado de ser una promesa futurista para convertirse en una fuerza transformadora en el presente y, el SEO, tenía que subirse también a la ola. Problema: nadar por el estado actual de herramientas, workflows y agentes de IA para SEO puede ser complicado, y el hype existente nubla la realidad práctica. […]

Leer más

No es GEO ni AEO es sólo SEO: cómo hacer SEO para la IA

Cada vez que un nuevo concepto o sigla asoma en el mundo del marketing digital, GEO, AEO, LLMO, GAIO, LSO, LEO, etc. el debate gira en torno a si estamos ante una verdadera revolución o si es la misma estrategia de siempre con otro nombre. Mi experiencia es que la optimización para grandes modelos de […]

Leer más