La evolución del Query Augmentation: Del Query Expansion al Agentic Search

Google ha anunciado en Search I/O lo que han definido como "a new era for AI Search". Vamos, que Google entra oficialmente en la era de los Search Agents que operan 24/7 en background, razonando entre fuentes y notificándote cuando algo cambia.

Cuando leí el anuncio pensé en la charla que di en septiembre de 2025 en un evento de SISTRIX (la siguiente imagen es una slide de la misma). Allí ya hablaba de la búsqueda agentic como una nueva forma de expandir queries, un paradigma distinto al Query Fan-Out (aunque se nutra de él), y Google por fin se ha atrevido a sacarlo a producción.

Lo ha empaquetado como Search Agents, en vez del Agentic Search con el que la industria lleva tiempo refiriéndose a esto, pero la dirección técnica era evidente para cualquiera que llevara siguiendo la tecnología de los últimos años.

El Query Fan-Out no era nuevo en 2023, los SEOs llevamos lidiando con esto desde los 2000 y el Agentic Search no es una sorpresa en 2026... vamos, es la culminación de 25 años de evolución del Query Augmentation.

Query augmentation

Este post es la continuación natural de mi artículo sobre búsqueda híbrida. Si aún no lo has leído, te recomiendo empezar por ahí.

1. ¿Qué es el Query Augmentation y por qué existe?

Un buscador es un sistema con varias capas que trabajan en equipo: una parte busca por palabras exactas, otra interpreta significados, y luego hay varios módulos que deciden qué merece estar arriba. Todo eso lo expliqué en el post de búsqueda híbrida.

Query rewriting vector search

Pero antes de que el motor pueda buscar algo, tiene que entender lo que le has pedido. Y aquí está parte de la magia: tu query, tal y como la escribes, casi nunca se usa literalmente. Se reescribe, se expande, se traduce, se generaliza, se especifica. A eso es a lo que se llama Query Augmentation.

La razón es porque el usuario es ambiguo, perezoso e imperfecto. Escribe mal, usa sinónimos, omite contexto, mezcla idiomas. Y el motor necesita transformar esa caja de Pandora en algo que sus índices puedan responder con precisión.

El Query Augmentation es la capa que convierte lo que tú escribes en lo que el motor busca.

Esa capa ha pasado por varias generaciones, cada una corrigiendo las limitaciones de la anterior. Vamos a verlas.

2. La evolución, año a año

2000 - Query Expansion: el corrector ortográfico

Al principio era todo muy literal. Si escribías mal, no encontraba nada. Así que lo primero que metió Google fue corrección ortográfica, stemming/lematización, sinónimos básicos con WordNet y co-ocurrencias. El famoso "¿Querías decir…?".

Hay un ejemplo precioso que Google compartió hace más de una década: una tabla con todas las formas en que la gente escribía mal "Britney Spears". Más de 600 variaciones. Brittany spears, britny, briteny, britney, brytney, brritney… Es divertido verlo ahora, pero ese era el estado del arte, tablas literales con misspellings 😀

Britney misspellings

Y aquí va una curiosidad que sigo usando años después: el footprint del doble tilde (~~) para desactivar el sistema de sinónimos de Google. ¡Y todavía funciona! En los 2000, añadir un caret (^) activaba el matching de sinónimos. Después Google lo hizo behavior por defecto. Pero si quieres desactivarlo, todavía puedes escribir ~~viajes y verás cómo cambia la SERP. Pruébalo.

  • Impacto: encontrabas resultados aunque escribieras mal o usaras otra palabra.
  • Limitación: no entendía nada de la intención. Solo igualaba tokens.

2013 - Hummingbird: el primer salto semántico

Hummingbird es cuando Google empieza a jugar en serio con la semántica. Aquí entra el Knowledge Graph y empieza a usarse contexto conversacional. Ya no solo busca palabras, entiende entidades e intenciones.

Si preguntabas "¿quién ganó ayer?", no te devolvía páginas con esas palabras, te devolvía directamente el resultado del partido del equipo que solías seguir, basado en tu contexto anterior.

  • Impacto: te entendía aunque no usaras las palabras exactas.
  • Limitación: seguía dependiendo de que el concepto estuviera en el Knowledge Graph.

2015 - RankBrain: la entrada del deep learning

RankBrain fue la entrada real de lo neuronal en el ranking. Usando embeddings consigue mapear consultas raras a equivalentes más frecuentes. Si alguien busca "médico del corazón", RankBrain entiende que lo que quiere es un cardiólogo.

Es el momento en que Google empieza a cubrir la long-tail de verdad. Y, técnicamente, es cuando Google se convierte en un sistema híbrido donde junta lo mejor de ambos mundos: la búsqueda léxica (BM25) con una capa densa de significado semántico por encima.

  • Impacto: cobertura real de queries nunca vistas.
  • Limitación: traduce queries raras a frecuentes, pero no entiende contexto fino.

2018 - Neural Matching: los super-sinónimos

Neural Matching, lo que Google llamó "super-sinónimos". Aquí el buscador ya puede conectar conceptos sin compartir ni una palabra.

Ejemplo: "cómo aliviar el estómago revuelto" lo alinea con documentos que hablan de "náuseas", aunque esa palabra no aparezca en tu query. Esto va más allá de la expansión léxica, es alineamiento de intención a nivel neuronal.

  • Impacto: encuentra contenido relevante sin solapamiento de vocabulario.
  • Limitación: no es contextual palabra a palabra. Sigue tratando la query como un blob de intención.

2019 - BERT: contexto palabra a palabra

Con BERT el salto es aún más potente porque el buscador ya entiende el contexto palabra a palabra. Entiende preposiciones, negaciones, el orden de las frases.

Antes Google confundía "viajes a Nueva York desde Madrid" con "viajes desde Nueva York a Madrid". Con BERT deja de equivocarse en esas cosas. La desambiguación sintáctico-semántica se hace dentro del propio modelo.

  • Impacto: matices, negaciones, preposiciones. Menos malentendidos.
  • Limitación: monolingüe en su mayor parte y solo texto.

2021 - MUM: multitarea, multilingüe, multimodal

MUM es un BERT con esteroides: multitarea, multilingüe y multimodal.

Puede usar lo que sabe en un idioma para responder en otro, y combinar texto con imágenes o vídeos. Si preguntas "consejos para subir el Fuji", puede sacar información de guías en japonés o de fotos, aunque tú lo hayas preguntado en español.

Google luego matizó que MUM solo lo usa para featured snippets, Google Lens, topics relacionados de YouTube y poco más. Pero conceptualmente abrió la puerta que el conocimiento ya no esté atado al idioma de la query ni a un documento de texto.

  • Impacto: cobertura más allá de idioma y formato.
  • Limitación: muy costoso, uso restringido a casos específicos.

2023 - Query Fan-Out: query augmentation en esteroides

Y en 2023 empieza el Query Fan-Out. Aquí el buscador ya no se conforma con tu query tal cual, sino que genera múltiples sub-queries en paralelo: equivalentes, especificaciones, generalizaciones, traducciones, clarificaciones.

Es como si lanzara un abanico de preguntas para asegurarse de cubrir todos los ángulos, y luego selecciona las mejores. Lo explicaré con más detalle en la siguiente sección porque la base de lo que Google acaba de anunciar.

2024 - Agentic Search: el siguiente nivel

Aquí el sistema genera queries, mira resultados, evalúa si le valen, reescribe, vuelve a buscar. Es un bucle iterativo, casi como si tuviera un pequeño investigador dentro que sabe cuándo profundizar más o cuándo cambiar de enfoque. Esto le permite resolver preguntas mucho más complejas, paso a paso.

Cuando di mi charla en septiembre de 2025, ya estaba claro que esto venía. Lo que no sabía era que Google le iba a poner de nombre oficial "Search Agents".

3. Query Fan-Out: el retrieval de los chatbots LLM

En la patente es US20230281193A1 de Google: "Generating query variants using a trained generative model" se describe cómo un sistema con un Variant Engine, un Controller Engine y un Generative Model toma tu query y produce un árbol de variantes.

Las variantes son al menos ocho:

Tipo de variante Qué hace Ejemplo sobre "qué es el cortisol"
Equivalencia Misma intención, otra forma "what is cortisol", "definición de cortisol"
Generalización Sube de categoría "qué son las hormonas del estrés", "cómo funciona el sistema endocrino"
Especificación Baja a facetas concretas "cortisol en análisis de sangre", "efectos del cortisol en el sueño"
Follow-up Expansión exploratoria "cómo bajar el cortisol", "relación cortisol y estrés"
Canonicalización Normalización de ruido "que es el cortisol" (sin tildes, normalizada)
Traducción Corpus multi-idioma "what is cortisol", "cortisol hormone definition"
Implicación Reformulación con hechos "cortisol es una hormona", "cortisol e inflamación"
Clarificación Desambiguación "cortisol vs cortisona", "cortisol en biología o psicología"

Cada una de esas variantes se lanza en paralelo. Cada una tiene su propio retrieval (léxico + vectorial, fusionado con RRF, como expliqué aquí). Cada una devuelve sus candidatos. Y luego un controlador dinámico (probablemente entrenado con Reinforcement Learning) decide qué variantes han aportado señal útil, cuáles descartar, y si necesita lanzar más.

Es importante entender que el fan-out no es determinista. Si haces la misma query dos veces, no obtienes exactamente las mismas variantes. Eso es lo que rompe la mayoría de las herramientas de "AI visibility tracking" que se venden por ahí, como ya conté en mi artículo sobre prompt trackers.

Y oye, esto es algo que no puedes replicar. La razón es que Google tiene piezas a las que nosotros no tenemos acceso:

  • Señales internas: scores, clics y answer quality de cada variante. Sin ese feedback el loop se rompe.
  • Controlador con RL: una política que decide cuántas variantes lanzar y cuándo parar, entrenada con recompensas invisibles para nosotros.
  • Multitarea: ocho tipos de variantes y un modelo que sabe cuándo aplicar cada una. Podemos copiar el patrón, no la decisión.
  • Histórico masivo: millones de queries y clics reales etiquetando implícitamente qué funciona. Ese dataset no existe fuera de Google.
  • Selección dinámica de modelo: cambia de modelo según intención, dispositivo o cohorte y nosotros no usaríamos el suyo.
  • Recompensas basadas en answer quality: el sistema para cuando la respuesta es suficientemente buena, no por número de variantes. No tenemos esa métrica.
  • Personalización: historial, ubicación, contexto reciente y, ahora, Gmail/Photos/Calendar vía Personal Intelligence.

Vamos, imposible de replicar desde fuera, por mucho Dunning-Kruger que lo intente:

Query fan out simulator tool

Es como querer montar un F1 con piezas de Lego... puedes imitar la forma, pero nunca la velocidad. Pero tampoco importa. Y aquí está el matiz que se les escapa a los GEO Bros porque la respuesta SEO al fan-out no es simularlo o incorporarlo de facto, es darle crear páginas robustas que cubran léxica y semánticamente tanto la query original como sus expansiones. El proceso que los SEOs llevamos haciendo históricamente. Lo expliqué en detalle en el artículo sobre por qué trocear tu contenido es malo para tu SEO y para la IA.

La genealogía del Fan-Out

El Query Fan-Out no aparece de la nada en 2023. Como comenté en la charla,  es la culminación de años de investigación en cómo generar consultas sintéticas:

  • doc2query / Document Expansion (2019-2020): generar queries sintéticas desde documentos para entrenar al sistema a recuperarlos.
  • Adolphs et al. (2022, ETH/Google): Latent Space Decoding. Decodificar directamente desde el espacio de embeddings. El puente entre doc2query y fan-out.
  • HyDE (2022-2023): Hypothetical Document Embeddings. Generar documentos hipotéticos desde una query y usar sus embeddings para buscar.
  • WO2024064249A1 (2024): formaliza el Synthetic Query Training, generar queries desde docs para entrenar retrievers offline.

Así que el Fan-Out no surge de la nada, es la culminación de años de investigación en cómo generar consultas sintéticas. Lo nuevo es que ahora no se queda en el training y lo hace en vivo, cada vez que preguntamos.

4. Search Agents: lo que Google acaba de anunciar

Vamos a lo que ha pasado esta semana. Liz Reid lo dijo así en el post de Search I/O 2026:

"We're entering the era of Search agents, where you can easily create, customize and manage multiple AI agents for your many tasks, right in Search."

  • Information agents que operan 24/7 en background. Le dejas un brief tipo "avísame cuando salga un piso en Majadahonda con 4 habitaciones por menos de X", y un agente escanea continuamente todo... blogs, news sites, social posts y los datos frescos de finance, shopping y deportes de Google para detectar cambios. Cuando encuentra algo, te manda una notificación con una síntesis y la posibilidad de tomar acción.
  • Esto es el bucle iterativo de la búsqueda agentic, pero ahora persistente en el tiempo. La query se convierte en una suscripción a un problema. 
  • Agentic booking en categorías nuevas. Locales, servicios, experiencias. "Encuéntrame una sala de karaoke privada para seis personas un viernes por la noche que sirva comida tarde". Google trae precios y disponibilidad y te lanza directo a reservar. Y en categorías como reparaciones del hogar, beauty o pet care, Google puede llamar al negocio en tu nombre. Esto último ya lo probé el año pasado cuando tuve acceso al a beta.
  • Generative UI en la respuesta. Google trae a Search por fin la capacidad de Antigravity y de agentic coding de Gemini 3.5 Flash. Digo por fin porque lo anunciaron en noviembre. Ahora la respuesta puede ser una UI generada al vuelo, con visualizaciones, simulaciones, tablas, gráficos. Prompt Tracker gonna hate. Y para tareas continuas como planificar una boda, gestionar una mudanza, Search te construye un dashboard persistente, como una especie de mini-app que vives volviendo a usar.
  • Personal Intelligence en 200 países y 98 idiomas. Conectas Gmail, Photos y pronto Calendar, y AI Mode los usa como contexto y sin suscripción. Las IAs conectadas a tools van a personalizar la respuesta tanto que ningún prompt tracker tendrá sentido.

5. Qué significa esto para tu SEO

Bien, ya sabemos cómo ha evolucionado el Query Augmentation desde "did you mean…" hasta agentes 24/7. Ahora te preguntarás: ¿y yo qué hago con esto? LO DE SIEMPRE. 

1. Posicionarte en Google

Este es un estudio que llevo haciendo desde noviembre del 24' y se cumple siempre. La correlación entre el número de citaciones y estar posicionado en el top-3 de Google es altísima. No solo hay correlación de Spearman, si no también de Pearson, o lo que es lo mismo, que hay correlación lineal y de magnitud.

Correlacion citas ai overviews google top 3 ranking

Correlacion citas ai overviews google top 3 ranking 2

2. Ser accesible

Estar en Google y ser fuente de grounding no basta si el bot no entra. Puedes estar en el top 1, formar parte del grounding interno del modelo, ser citado como fuente, y aun así desaparecer en la respuesta visible. Si el bot no puede entrar a evaluar tu contenido, todo lo anterior se cae.

He observado que una de la causas más frecuentes de ghost citation es por motivos técnicos. A veces no es un problema de marca o de tu contenido. Es un problema de que la IA no puede leerte cuando va a buscarte.

Dos formas habituales de romper este último eslabón es bloqueos del WAF y cuando tu contenido se renderiza con JavaScript y el bot solo ve el shell.

Accesibilidad

3. Trabajar la entidad

Los LLMs no potencian a las marcas por casualidad. Se entrenan con el corpus del conocimiento humano.

La razón es que los modelos de IA trabajan en lo que llaman monosemanticidad. Hay “neuronas” que se activan cuando el modelo detecta un concepto muy concreto, por ejemplo, “dirección de correo electrónico” o “nombres de ciudades.” La idea la explica un estudio reciente de Anthropic y se asemeja de nuevo al viejo concepto SEO semántico de “entidades” y “desambiguación”.

A su vez, los modelos almacenan “hechos” en sus capas internas. Típico ejemplo: Michael Jordan → Basketball. Esa asociación se graba en la red,  específicamente en los multi-layer perceptrons (MLPs).

El SEO lleva toda la vida trabajando entidades... ¡y menciones! ¿Cómo se construye una entidad? Lo resumo aquí:

Construir entidad

  • Mediante owned content: tu contenido tiene que ser claro, valioso, con autoría y datos que cubran el árbol de variantes posibles. Y creo que la autoridad temática se vuelve más importante y más decisiva por funcionamiento del RRF.
  • Mediante earned content: que terceros te citen en contextos de recomendación. Esto es lo que mueve el prior del modelo.
  • Mediante una capa técnica: Explicar claramente lo que haces, ser coherente con las señales y ayudar a nutrir el KG de Google.

Contruir entidad google marca

Siempre digo que las marcas son atajos mentales que nos reducen el tiempo y la molestia de buscar. Los LLM han heredado ese sesgo.

 4. Los Search Agents SOLO cambian el modelo de visita

Si un agente está monitorizando 24/7 para un usuario entonces ya no estás compitiendo por que el usuario haga clic ahora. Estás compitiendo por que el agente te elija como fuente de monitorización fiable y constante. Entiendo que esto premiará la frescura, fiabilidad y machine-readability de tu contenido a lo largo del tiempo, es lo que decidirá si cambiará de fuente o use la misma. Como decía antes, ahora las personas se "suscribirán" a una query.

Natzir Turrado 21 mayo 2026

Compartir

Facebook Linkedin Twitter

Otros artículos

Herramientas para medir visibilidad en IA: Lo que no te cuentan los Prompt Trackers

Las herramientas para medir visibilidad en la IA (prompt trackers) prometen medir algo que es imposible medir con precisión. Para mi son el negocio de la certidumbre prefabricada. Este informe técnico examina por qué medir la visibilidad en IA es técnicamente problemático, qué dice la evidencia disponible y cómo evaluar las herramientas del mercado. Mi […]

Leer más