Para entender por qué existe el mercado de los prompt trackers hay que mirar tres capas distintas que creo que se mezclan en el debate. Primero, la psicología del comprador. Segundo, los incentivos de las organizaciones donde ese comprador trabaja. Y tercero, el modelo formativo que produce profesionales del marketing y del SEO con un lenguaje heredado de un mundo que ya no funciona como funcionaba. Las tres se refuerzan entre sí.
Por eso un mercado donde la señal técnica es débil, como ya documenté con detalle aquí, factura cientos de millones al año con márgenes brutos del 85 al 95% según los datos que recogí en aquel análisis a partir de los pricings públicos de las tools y estimaciones de costes operativos.
El cerebro humano y la incertidumbre
La aversión a la ambigüedad lleva estudiándose en economía y psicología desde la paradoja que formuló Daniel Ellsberg en 1961. Su experimento, basado en apuestas sobre urnas con distinto grado de información sobre su contenido, mostraba que la gente prefiere apostar por opciones cuya probabilidad conoce frente a opciones cuya probabilidad es desconocida, aunque matemáticamente sean equivalentes. Una cosa es la aversión al riesgo (saber que hay un 30% de probabilidades de algo) y otra distinta es la aversión a la ambigüedad (no saber siquiera cuáles son esas probabilidades). El cerebro trata ambas situaciones de manera distinta y prefiere sistemáticamente la primera, según recoge la revisión de Marciano Siniscalchi sobre ambigüedad y aversión a la ambigüedad.
Eso sí, con matices. Heath y Tversky propusieron en 1991 la hipótesis de competencia, que muestra que cuando una persona se siente experta en un dominio, el patrón se invierte y empieza a buscar ambigüedad en lugar de evitarla. Esto importa porque el comprador de martech no se ve como un sujeto neutral metido en una urna abstracta, se ve como experto en lo suyo. La aversión a la ambigüedad actúa en él de forma menos directa de lo que sugeriría Ellsberg. Aun así, en el momento de comprar una tool cuya metodología no entiende del todo, vuelve a estar fuera de su zona de competencia, y el sesgo reaparece.
Un estudio publicado en PMC en 2020 sobre intervenciones para reducir la aversión a la ambigüedad encontró que después de enseñarle a la gente la paradoja y mostrarle por qué su elección era subóptima, la aversión bajaba pero no desaparecía (y además producía un efecto colateral de reducir la aversión al riesgo en otros contextos no relacionados).
Junto a esto opera la ilusión de control que describió Ellen Langer en los años 70, que es esa tendencia a creer que controlamos cosas que en realidad están dominadas por el azar. Una revisión publicada en Analytical Chemistry sobre sesgos en el juicio experto añade que cuando los expertos creen que pueden superar sus sesgos por fuerza de voluntad, el intento puede acabar haciéndolos más fuertes. Lo único que sí parece reducir la ilusión de control es tener perfiles distintos en el equipo que decide, según un estudio experimental de Meissner y Wulf publicado en European Management Journal en 2017.
El efecto farola y la falacia de McNamara
Seguro que conoces esta historia del efecto farola. Un policía encuentra a un borracho buscando algo bajo una farola por la noche. Le pregunta qué busca. Sus llaves. ¿Las perdió ahí? No, las perdí allí, en aquel parque oscuro. ¿Y por qué busca aquí entonces? Porque aquí hay luz.
Columbia Business School publicó un análisis del profesor Oded Netzer sobre por qué, a pesar de inversiones crecientes en marketing analytics, la contribución medida de esa analítica al rendimiento corporativo seguía siendo baja. La explicación que ofrecen los autores es que las empresas miden lo que es fácil de medir y lo que de verdad cuenta suele quedar fuera del foco.

Esto ha evolucionado en nuestro sector como la falacia de McNamara, formalizada por el sociólogo Daniel Yankelovich. Tiene cuatro pasos según el resumen de Sketchplanations.
- Medir lo que es fácil de medir.
- Descartar lo que no se puede medir.
- Asumir que lo que no se puede medir no es importante.
- Concluir que lo que no se puede medir no existe.
McNamara aplicó esa lógica en Vietnam usando el body count como métrica principal. Big Think tiene un artículo divulgativo sobre cómo este patrón aparece hoy en decisiones cotidianas.
Goodhart y los KPIs que dejan de medir
A esto creo que hay que sumarle un tercer mecanismo, la ley de Goodhart, formulada por el economista británico Charles Goodhart en 1975 y popularizada por la antropóloga Marilyn Strathern. Dice que cuando una medida se convierte en objetivo, deja de ser una buena medida. La entrada de Wikipedia sobre la ley recoge la cita exacta de Goodhart, "any observed statistical regularity will tend to collapse once pressure is placed upon it for control purposes".

Existe una anécdota que se cita en muchos libros como ejemplo, la del programa colonial británico en Delhi que ofreció una recompensa por cobras muertas y acabó incentivando que la gente criara cobras para cobrarla. Posiblemente es una anécdota es inventada, nunca lo sabremos.
En marketing pasa lo mismo. Si el equipo se evalúa por número de leads, se generan leads que no convierten. Si el SEO se evalúa por keywords en top 10, se persiguen keywords sin volumen ni intención comercial. Si el email marketing se evalúa por open rate, las líneas de asunto se vuelven clickbait.
KPI Tree tiene una guía sobre Goodhart y el diseño de métricas donde argumenta que el problema se agrava cuando las métricas se aíslan. Una métrica conectada a sus parents y childs en un árbol crea una red de relaciones donde manipular un nodo produce distorsiones visibles en los nodos vecinos. Una métrica aislada no tiene esa protección. La industria de prompt tracking lo sabe, por eso casi todas las tools venden un score único en una gráfica que sube y baja en vez de un sistema con guardrails.
El argumento más fuerte a favor de los prompt trackers
Para ser justos, toca hacer el ejercicio inverso, porque el caso a favor de medir visibilidad en LLMs no es trivial y descartarlo no sería honesto por mi parte. El argumento más sólido tiene tres componentes.
- El primero es la diferencia entre valor direccional y valor absoluto. Aunque un visibility score de 42 no signifique nada en términos absolutos, una caída del 40% mes a mes puede señalar un cambio real en cómo el modelo está representando la marca, sobre todo si la metodología de la herramienta se mantiene constante. Hay un montón de sistemas con mucho azar que se miden todo el rato (meteorología, mercados financieros, encuestas). Que los LLMs no sean deterministas no significa que no se puedan medir. Significa que hay que hacer muchas más repeticiones de las que la mayoría de tools hacen y no confundir señal con ruido en muestras pequeñas. Pero esto a tu prompt tracker favorito no lo sabe o si lo sabe no lo hace bien porque perdería sus márgenes. Felipe Concha, fundador de Bison, ingeniero civil y PhD en IA me dijo lo siguiente a través de LinkedIn (he pedido permiso para hacerlo público), después de leerse mi artículos sobre el prompt tracking:

- El segundo es el uso como sistema de alarma. Hay clientes y consultores que compran trackers sabiendo sus limitaciones, y los usan como tripwire para detectar cambios bruscos. Una tool que detecta que tu marca ha desaparecido del 80% de los prompts donde antes aparecía tiene valor diagnóstico aunque el score absoluto sea ruidoso. Pero hay que hacerlo bien porque si no es muy fácil de manipular.

- El tercero es la mental availability. Si lo que cuenta para el crecimiento de marca es estar presente en la mente del consumidor en el momento de compra, y los LLMs están sustituyendo cada vez más a la búsqueda, entonces estar presente en las respuestas de los LLMs sí afecta a esa disponibilidad mental.
Pero ¿dónde se rompe? Yo lo veo en otros tres puntos.
- El valor direccional solo se sostiene si la metodología se mantiene constante, y las tools cambian modelos, prompts y APIs constantemente. Eso rompe la base sobre la que estás comparando. Yo he trakeado los mismos prompts en 3 tools distintas y los trends no eran consistentes.
- El uso como sistema de alarma solo funciona si el comprador sabe ignorar los scores absolutos y mirar solo cambios bruscos. Pero la mayoría del mercado no compra así, porque estas tools se venden prometiendo justo lo contrario, medición precisa de tu visibilidad y el que puedas hacer algo accionable con esa información.
- ¿Las herramientas actuales miden mental availability o miden algo mucho más estrecho, como presencia en N prompts sintéticos sin contexto de usuario real? Que la mental availability cuenta nadie lo discute. La crítica es a cómo se está midiendo y a cómo se vende lo medido.
El SaaS martech está diseñado para vender certidumbre
MarTech publicó en febrero de 2026 un análisis de por qué las empresas malgastan 2 millones de dólares en herramientas mal compradas. Las causas que identificaron son: compras impulsadas por FOMO, decisiones siladas, y demos diseñadas para que la urgencia supere a la claridad operacional. Una guía sobre la psicología de venta de SaaS describe cómo se usan promociones limitadas, accesos beta y mensajes de "los líderes ya están ahí" para activar el FOMO en compradores corporativos.
Quiero pensar que estos mercados no se sostienen porque el comprador sea irracional. Se sostienen porque el comprador saca algo real de la compra (defensa ante el board, narrativa para el cliente, menos ansiedad) aunque la señal técnica sea débil. Funciona así porque el mercado opera dentro de sus límites. La crítica es que esa utilidad subjetiva tiene un gasto escondido, que es el de la mala asignación de presupuesto.
A esto se suma un incentivo que oigo mucho internamente. En muchas empresas el bonus anual depende de haber lanzado iniciativas de IA, incluida la contratación de tools, para mejorar eficiencia y procesos. El comprador también está presionado desde arriba, y una tool de prompt tracking marca esa casilla rápido.
El funnel como historia que nos contamos
El funnel lineal awareness-consideration-decision tampoco existe en la realidad. McKinsey publicó hace más de una década su consumer decision journey mostrando que el viaje real funciona como un bucle. Los consumidores entran, salen, vuelven, comparan, abandonan y reanudan.
Un análisis reciente de AI Digital recoge las posiciones de BCG y Edelman, que describen el comportamiento de compra como demasiado dinámico para un modelo lineal y la compra como el inicio de una relación, no su final. Salesforce reporta que el 73% de los compradores B2B esperan que el vendedor entienda sus necesidades antes de la primera conversación.
El funnel sobrevive en las organizaciones porque cumple una función política. Es un lenguaje compartido entre departamentos. Es una forma de repartir presupuesto y es una manera de dividir KPIs entre equipos. Cuando desmontas el funnel, desmontas la estructura organizativa que se monta encima, y eso cuesta más que mantener la historia.
La paradoja de la abundancia de datos
Más datos no implica mejores decisiones, y está documentado en la literatura: parálisis por análisis.
Logarithmic Perspectives publicó en febrero de 2026 un análisis donde argumenta que la era de la abundancia de medición ha producido decisiones más lentas y más debate. Una investigación citada por Moosend sobre analysis paralysis muestra que el 78% de las personas se sienten abrumadas por la cantidad de fuentes de datos.
El estudio que llevo citando 14 años en mis clases de CRO es de la mermelada de Iyengar y Lepper, citado en un análisis de CMSWire sobre saturación de datos, que mostró que cuando se ofrecían 24 sabores de mermelada solo el 3% compraba, pero cuando se ofrecían 6 sabores el 30% compraba.

La formación como reproductor del problema
El problema empieza antes del marketing. La educación general sigue funcionando con un modelo bastante taylorista, que nos programa para entornos predecibles donde hay una respuesta correcta. Es otro melón que no voy a abrir aquí. Pero la formación reglada en marketing y comunicación viene del mismo sitio y sigue enseñando ese mismo modelo de mundo predecible. Y a esto se suma que en marketing falta conocimiento técnico de base, lo que deja al profesional sin herramientas para auditar la metodología de las tools que compra.
Mark Ritson lleva años hablando de "tactification" como problema de la disciplina. En una entrevista con Marketing Week junto a Byron Sharp describe la obsesión con la ejecución sin entender lo estratégico. En su aparición en The CMO Show dijo: "you can actually have too much measurement and not enough insight".
Sharp ataca directamente a las métricas pequeñas que no tienen impacto demostrable. En su intervención de 2025 al recoger el Sir Charles McGrath Award dijo que los marketers están obsesionados con medir cosas pequeñas que no tienen casi ningún impacto.
Además, Sharp y Ritson critican el performance marketing en favor de reach y mental availability, y el prompt tracking no es exactamente lo que tienen en el punto de mira, pero estas tools podrían aprender mucho de esto.
El sector SEO viene de 20 años donde el rank tracker era la métrica reina para muchos. Search Engine Journal publicó en noviembre de 2025 un análisis sobre repositioning del SEO donde argumenta que las definiciones tradicionales ya no son suficientes. La inercia aquí es enorme y la razón es que rehacer el reporting es rehacer la formación, los contratos y la identidad profesional. No basta con cambiar un dashboard.
Cómo encajan los prompt trackers en este contexto
Si juntas las piezas, el modelo de negocio del prompt tracker se entiende bastante bien. Una herramienta puede venderse incluso cuando su validez técnica es débil, siempre que cumpla tres condiciones. Que el número sea lo suficientemente estable para que parezca señal. Que la metodología sea lo suficientemente técnica para que el comprador no pueda cuestionarla. Y que la narrativa de venta active el FOMO suficiente para que decir que no parezca arriesgado profesionalmente.
Hay aproximaciones más sofisticadas, que son las que yo hago con mis propios pipelines. El problema es que o falta el conocimiento técnico para construirlas, o las tools que podrían aplicarlas no lo hacen porque les rompería el margen. El resultado es que la mayoría del dinero se mueve en la zona donde la promesa de medición está más alejada de la realidad técnica.
¿Qué cambiaría esta dinámica?
¿Qué pasará con prompt trackers cuando los datos de primera parte se generalicen? Cuando Google extienda Search Console a AI Overviews y AI Mode, el visibility score modelado va a tener que dar otra cosa, ORM, sentimiento de marca, panel de brand marketing. Algo más cercano a un dashboard de gestión de reputación que a un indicador de visibilidad irreal.
Cuando llegó Google Search Console en 2015, las herramientas de tercera parte no desaparecieron, pasaron a tener que justificarse contra el dato real y aportar valor más allá del mismo.
Pero si bien es cierto que estas tools daban datos que correlacionaban con los ingresos. Si estas tools se compran tal cual es, en parte, porque NO hay perfiles técnicos en el proceso de decisión.
Para mejorar la decisión individual de una compra influye la diversidad cognitiva en la sala donde se decide. El estudio de Meissner y Wulf en European Management Journal en 2017 muestra que tener perfiles distintos en el equipo de decisión sí reduce la ilusión de control. Si en la mesa hay alguien que entiende estadística, alguien que entiende el negocio, y alguien que entiende cómo funcionan los LLMs por dentro, la conversación cambia.
El CFO se cita a menudo como el mecanismo de corrección. Posiblemente no va a fulminar el prompt tracking, pero con los presupuestos más apretados desde 2023, va a empezar a pedirle lo mismo que le pide al resto de tools del stack.
Lo que queda
La tool en sí no es el problema. Lo que ha hecho la IA es subir la incertidumbre, y la industria que vive de ofrecer reducción de incertidumbre se ha frotado las manos. Las tools de prompt tracking son la respuesta perfecta a un problema que ya existía antes. El ecosistema está en una fase temprana donde la promesa de medición va por delante de la metodología real, y el dinero fluye hacia donde la promesa es más pomposa. Y ver el muro de LinkedIn plagado de publicaciones pagadas a influencers que cuentan mentiras no ayuda. Si pagas a un influencer, lo callas. Es por ello que yo no tengo contratos con ninguna herramienta. Hasta 8 prompt tackers me han ofrecido dinero por hablar bien de ellos, los he rechazado a todos.
No sólo eso, herramientas como Profound parece ser que pagan hasta 250€ por una review positiva en G2:

Mientras tanto, el trabajo del consultor honesto consiste en no fingir certezas que no tiene, en distinguir entre lo que se puede medir y lo que se está midiendo, y en preguntarse, antes de comprar o recomendar una tool, qué decisión concreta de negocio va a cambiar con ese dato. Si la respuesta es "ninguna", la tool es humo. Si la respuesta es algo concreto, conviene comprobar si el dato que entrega tiene la calidad necesaria para sostener esa decisión. Es analítica básica aplicada a una industria que se está construyendo más rápido de lo que se está entendiendo.