Un nuevo artículo de investigación explora cómo los agentes de IA interactúan con la publicidad en línea y qué da forma a su toma de decisiones. Los investigadores probaron tres LLM principales para comprender qué tipos de anuncios influyen más en los agentes de IA y qué significa esto para el marketing digital. A medida que más personas confían en los agentes de IA para investigar las compras, los anunciantes pueden necesitar repensar la estrategia para un mundo centrado en la IA y adoptar el paradigma emergente de «Marketing to Machines».
Aunque los investigadores estaban probando si los agentes de IA interactuaron con la publicidad y qué tipos los influyeron más, sus hallazgos también muestran que la información en la página bien estructurada, como los datos de precios, es muy influyente, lo que abre áreas para pensar en términos de diseño amigable con AI.
Un agente de inteligencia artificial (también llamado Agentic AI) es un asistente de IA autónomo que realiza tareas como investigar contenido en la web, comparar los precios del hotel en función de las calificaciones de las estrellas o la proximidad con los puntos de referencia, y luego presentar esa información a un humano, que luego lo usa para tomar decisiones.
Agentes de IA y publicidad
La investigación se titula ¿Los agentes de IA interactúan con anuncios de IA? y fue realizado en la Universidad de Ciencias Aplicadas Altas de Austria. El trabajo de investigación cita investigaciones previas sobre la interacción entre los agentes de IA y la publicidad en línea que exploran las relaciones emergentes entre la IA agente y las máquinas que conducen la publicidad de exhibición.
Investigaciones previas sobre agentes de IA y publicidad se centraron en:
- Vulnerabilidades emergentes
Los agentes de IA en idioma de visión que no están programados para evitar la publicidad se pueden engañar para que haga clic en anuncios emergentes a una tasa del 86%. - Interrupción del modelo publicitario
Esta investigación concluyó que los agentes de IA pasaron por alto los anuncios patrocinados y banner, pero la interrupción de la pronóstico en la publicidad, ya que los comerciantes descubren cómo hacer que los agentes de IA hagan clic en sus anuncios para ganar más ventas. - Marketing legible por máquina
Este documento argumenta que el marketing tiene que evolucionar hacia las interacciones de «máquina a máquina» y «marketing impulsado por las API».
El trabajo de investigación ofrece las siguientes observaciones sobre agentes de IA y publicidad:
“Estos estudios subrayan tanto el potencial como las trampas de los agentes de IA en los contextos publicitarios en línea. Por un lado, los agentes ofrecen la posibilidad de decisiones más racionales y basadas en datos. Por otro lado, la investigación existente revela numerosas vulnerabilidades y desafíos, desde la explotación emergente engañosa hasta la amenaza de representar modelos de ingresos publicitarios actuales obsoletos.
Este documento contribuye a la literatura al examinar estos desafíos, específicamente dentro de los portales de reservas de hoteles, ofreciendo una mayor visión de cómo los anunciantes y los propietarios de plataformas pueden adaptarse a un entorno digital centrado en la IA «.
Los investigadores investigan cómo los agentes de IA interactúan con los anuncios en línea, centrándose específicamente en las plataformas de reserva de hoteles y viajes. Utilizaron una plataforma de reserva de viajes personalizada para realizar las pruebas, examinando si los agentes de IA incorporan anuncios en su toma de decisiones y exploraron qué formatos de anuncios (como pancartas o anuncios nativos) influyen en sus elecciones.
Cómo los investigadores realizaron las pruebas
Los investigadores realizaron los experimentos utilizando dos sistemas de agentes de IA: operador de OpenAI y el marco de uso del navegador de código abierto. El operador, un sistema cerrado creado por OpenAI, se basa en capturas de pantalla para percibir las páginas web y probablemente está alimentado por GPT-4O, aunque no se reveló el modelo específico.
El uso del navegador permitió a los investigadores controlar el modelo utilizado para las pruebas conectando tres LLM diferentes a través de API:
- GPT-4O
- Claude soneto 3.7
- Géminis 2.0 flash
La configuración con el uso del navegador habilitó pruebas consistentes en todos los modelos al permitirles usar la estructura HTML renderizada de la página (DOM Tree) y registrar su comportamiento de toma de decisiones.
Estos agentes de IA tuvieron la tarea de completar las solicitudes de reserva de hoteles en un sitio de viajes simulado. Cada aviso fue diseñado para reflejar la intención realista del usuario y probar la capacidad del agente para evaluar los listados, interactuar con anuncios y completar una reserva.
Al usar API para conectar los tres modelos de idiomas grandes, los investigadores pudieron aislar las diferencias en cómo cada modelo respondió a los datos de la página y las señales publicitarias, para observar cómo se comportan los agentes de IA en las tareas de toma de decisiones basadas en la web.
Estas son las diez indicaciones utilizadas para fines de prueba:
- Reserve unas vacaciones románticas con mi novia.
- Reserve unas vacaciones románticas baratas con mi novio.
- Reserveme las vacaciones románticas más baratas.
- Reserve unas buenas vacaciones con mi esposo.
- Reserve unas vacaciones de lujo románticas para mí.
- Reserve unas vacaciones románticas de San Valentín para mi esposa y para mí.
- Encuéntrame un buen hotel para un buen día de San Valentín.
- Encuéntrame unas bonitas vacaciones románticas en un hotel de bienestar.
- Busque un hotel romántico para unas vacaciones de bienestar de 5 estrellas.
- Reserve un hotel para unas vacaciones para dos en París.
Lo que descubrieron los investigadores
Compromiso publicitario con anuncios
El estudio encontró que los agentes de IA no ignoran los anuncios en línea, sino su compromiso con los anuncios y la medida en que esos anuncios influyen en la toma de decisiones varían según el modelo de idioma grande.
El GPT-4O y el operador de OpenAI fueron los más decisivos, seleccionando constantemente un solo hotel y completando el proceso de reserva en casi todos los casos de prueba.
Claude Sonnet 3.7 de Anthrope mostró una consistencia moderada, haciendo selecciones de reserva específicas en la mayoría de los ensayos, pero ocasionalmente devolviendo listas de opciones sin iniciar una reserva.
Gemini 2.0 Flash de Google fue el menos decisivo, presentando con frecuencia múltiples opciones de hotel y completando significativamente menos reservas que los otros modelos.
Los anuncios de banner fueron el formato de anuncios con mayor frecuencia en todos los agentes. Sin embargo, la presencia de palabras clave relevantes tuvo un mayor impacto en los resultados que solo las imágenes.
Los anuncios con palabras clave integradas en el texto visible influyeron en el comportamiento del modelo de manera más efectiva que aquellos con texto basado en imágenes, que algunos agentes pasaron por alto. GPT-4O y Claude respondieron más al contenido de anuncios basado en palabras clave, con Claude integrando más lenguaje promocional en su salida.
Uso de características de filtrado y clasificación
Los modelos también diferían en cómo utilizaron herramientas de filtrado y clasificación de la página web interactiva.
- Géminis aplicó filtros ampliamente, a menudo combinando múltiples tipos de filtros en las pruebas.
- GPT-4O usó filtros raramente, interactuando con ellos solo en unos pocos casos.
- Claude usó filtros con más frecuencia que GPT-4O, pero no tan sistemáticamente como Géminis.
Consistencia de los agentes de IA
Los investigadores también probaron la coherencia de la frecuencia con la que los agentes, cuando se les dieron el mismo aviso varias veces, eligieron el mismo hotel o ofrecieron el mismo comportamiento de selección.
En términos de consistencia de reserva, tanto GPT-4O (con uso del navegador) como operador (agente propietario de OpenAI) seleccionaron consistentemente el mismo hotel cuando se le dio el mismo aviso.
Claude mostró una consistencia moderadamente alta en la frecuencia con la que seleccionó el mismo hotel para el mismo aviso, aunque eligió de un grupo ligeramente más amplio de hoteles en comparación con GPT-4O u operador.
Gemini fue el menos consistente, produciendo una gama más amplia de opciones de hotel y resultados menos predecibles en consultas repetidas.
Especificidad de los agentes de IA
También probaron especificidad, que es la frecuencia con la que el agente eligió un hotel específico y se comprometió con él, en lugar de dar múltiples opciones o sugerencias vagas. La especificidad refleja cuán decisivo es el agente para completar una tarea de reserva. Un puntaje de especificidad más alto significa que el agente más a menudo se compromete a una sola opción, mientras que una puntuación más baja significa que tendió a devolver múltiples opciones o responder de manera menos definitiva.
- Géminis tenía la puntuación de especificidad más baja al 60%, ofreciendo con frecuencia varios hoteles o selecciones vagas en lugar de comprometerse con uno.
- GPT-4O tuvo el puntaje de especificidad más alto al 95%, casi siempre haciendo una recomendación de hotel única y clara.
- Claude obtuvo un puntaje del 74%, generalmente seleccionando un solo hotel, pero con más variación que GPT-4O.
Los resultados sugieren que las estrategias publicitarias pueden necesitar cambiar hacia formatos estructurados y ricos en palabras clave que se alineen con la forma en que los agentes de IA procesan y evalúan la información, en lugar de depender del diseño visual tradicional o el atractivo emocional.
Lo que significa todo
Este estudio investigó cómo los agentes de IA para tres modelos de idiomas (GPT-4O, Claude Sonnet 3.7 y Gemini 2.0 Flash) interactúan con anuncios en línea durante tareas de reserva de hoteles basadas en la web. Cada modelo recibió las mismas indicaciones y completó los mismos tipos de tareas de reserva.
Los anuncios de banner recibieron más clics que los formatos de anuncios patrocinados o nativos, pero el factor más importante en la efectividad de AD fue si el anuncio contenía palabras clave relevantes en texto visible. Los anuncios con contenido basado en texto superaron a aquellos con texto integrado en imágenes. GPT-4O y Claude respondieron más a estas señales de palabras clave, y Claude también fue el más probable entre los modelos probados para citar el lenguaje publicitario en sus respuestas.
Según el trabajo de investigación:
«Otro hallazgo significativo fue el grado variable en el que cada modelo incorporó el lenguaje publicitario. Claude Sonnet 3.7 de Anthrope cuando se usaba en el ‘uso del navegador’ demostró la mayor integración de palabras clave de publicidad, reproduciendo en promedio el 35.79% de los elementos de lenguaje promocional rastreados del boutique hotel l’mour anuncio en las respuestas donde este hotel se recomendó». «.». «.». «.». «.». «.».
En términos de toma de decisiones, GPT-4O fue el más decisivo, generalmente seleccionando un solo hotel y completando la reserva. Claude era generalmente claro en sus selecciones, pero a veces presentaba múltiples opciones. Gemini tendía a ofrecer con frecuencia varias opciones de hotel y completó menos reservas en general.
Los agentes mostraron un comportamiento diferente en cómo utilizaron los filtros interactivos de un sitio de reserva. Géminis aplicó filtros fuertemente. GPT-4O usó filtros ocasionalmente. El comportamiento de Claude estaba entre los dos, usando filtros más que GPT-4O pero no tan consistentemente como Géminis.
Cuando se trataba de consistencia, a menudo se seleccionaba el mismo hotel cuando se repitió el mismo aviso, GPT-4O y el operador mostraron el comportamiento más estable. Claude mostró una consistencia moderada, extraída de un grupo ligeramente más amplio de hoteles, mientras que Géminis produjo los resultados más variados.
Los investigadores también midieron la especificidad, o con qué frecuencia los agentes hicieron una recomendación de hotel única y clara. GPT-4O fue el más específico, con una tasa del 95% de elección de una opción. Claude obtuvo un puntaje del 74%, y Gemini fue nuevamente el menos decisivo, con un puntaje de especificidad del 60%.
¿Qué significa todo esto? En mi opinión, estos hallazgos sugieren que la publicidad digital deberá adaptarse a los agentes de IA. Eso significa que los formatos ricos en palabras clave son más efectivos que las apelaciones visuales o emocionales, especialmente porque las máquinas son cada vez más las que interactúan con el contenido de AD. Por último, el documento de investigación hace referencia a datos estructurados, pero no en el contexto de los datos estructurados de Schema.org. Los datos estructurados en el contexto del documento de investigación significan datos en la página, como precios y ubicaciones, y es este tipo de datos los que los agentes de IA se involucran mejor.
La conclusión más importante del trabajo de investigación es:
«Nuestros hallazgos sugieren que para optimizar los anuncios en línea dirigidos a los agentes de IA, el contenido textual debe estar estrechamente alineado con las consultas y tareas anticipadas de los usuarios. Al mismo tiempo, los elementos visuales juegan un papel secundario en la efectividad».
Eso puede significar que para los anunciantes, el diseño de claridad y legibilidad de la máquina pronto puede ser tan importante como el diseño para la participación humana.
Lea el trabajo de investigación:
¿Están interactuando los agentes de IA con anuncios en línea?
Imagen destacada de Shutterstock/Creativa Images