La visibilidad de la IA solía significar cita. A finales de junio de 2026, empieza a significar transacción

Fecha:

--Advertisement--spot_img

Durante dos años, la cuestión de la visibilidad de la IA ha sido una pregunta: ¿se cita su sitio web? A finales de junio de 2026, la pregunta pasa a ser dos. ¿Se cita su sitio web y, cuando el agente se presenta para reservar la cita en el teléfono de un usuario, puede realmente completar la reserva?

El 12 de mayo de 2026, Google anunció que la navegación automática de Chrome, la función de navegación agente que completa formularios, reserva citas, reserva estacionamiento, programa visitas, renueva licencias y compara compras, llega a los teléfonos Android a fines de junio de 2026. La primera ola llega al Samsung Galaxy S26 y al Google Pixel 10. El resto del año se extiende a relojes, automóviles, gafas y computadoras portátiles. El agente ha estado viviendo en el escritorio en versión preliminar desde enero. A finales de junio, pasa a 200 millones de bolsillos.

El detalle crítico es qué tipo de lanzamiento es este. La navegación automática en Android no se incluye como una aplicación, una extensión del navegador ni una función de suscripción voluntaria. Es parte del propio sistema operativo. El propio marco de Google lo expresa claramente: Android está pasando “de un sistema operativo a un sistema inteligente”. El agente está integrado. Todos los usuarios de Pixel 10 y Galaxy S26 lo obtienen de forma predeterminada. AppFunctions, la API subyacente para la comunicación entre agente y aplicación, llegará a más de 200 millones de dispositivos Android a finales de 2026.

Este no es el lanzamiento de una función. Es la capa de distribución móvil para toda la pila web agente que Google ha enviado durante los últimos seis meses, incluida en el propio sistema operativo. Solo leyendo, el anuncio del 12 de mayo parece una actualización de Gemini. Leer contra la línea de tiempo, cierra la arquitectura.

La integración a nivel de sistema operativo es el diferenciador que remodela lo que está en juego

Cada agente de consumo anterior se enviaba como una aplicación o un sitio web. ChatGPT, Claude, Perplexity y, hasta hoy, Gemini vivían en aplicaciones. Las aplicaciones tienen que competir por la instalación, la retención y el uso diario, dependen de que el usuario recuerde abrirlas y se ubican en el espacio de usuario del teléfono detrás de cualquier otra cosa en la que el usuario tenga que pensar.

La integración a nivel de sistema operativo es una categoría diferente. Cuando el agente se envía con el sistema operativo, no es necesario abrirlo, recordarlo ni ganarle tiempo a otras aplicaciones. Está disponible de forma predeterminada en el momento en que el usuario levanta el teléfono. La disponibilidad predeterminada en cientos de millones de dispositivos no es lo mismo que “la aplicación más popular”. Está más cerca de lo que ha sido la búsqueda predeterminada para los navegadores de escritorio durante dos décadas. Quien posee el valor predeterminado es dueño del tráfico.

Esa disponibilidad predeterminada es importante por dos razones. El primero es el alcance. El agente será probado por una población mucho mayor que la que ha alcanzado cualquier agente que haya optado por participar. El usuario del Pixel 10 no necesita instalar nada para delegar la reserva del corte de pelo. El usuario del Galaxy S26 no tiene que elegir un producto agente. Dicen lo que quieren y el agente a nivel de sistema operativo lo hace.

La segunda razón es la autoridad. Un agente a nivel de sistema operativo tiene permisos a nivel de sistema para navegar por aplicaciones, aceptar notificaciones, leer la pantalla y operar el navegador. Tiene acceso al administrador de contraseñas. Tiene acceso a la información de contacto del usuario a través de Inteligencia Personal. Tiene las credenciales y el contexto para completar las tareas que se le pide que complete. Los agentes a nivel de aplicación solo pueden hacer lo que sus permisos permiten y, en Android, esos permisos históricamente terminan en el límite de la aplicación.

La combinación de disponibilidad predeterminada y autoridad a nivel de sistema es lo que hace que finales de junio de 2026 sean diferentes del lanzamiento de escritorio con navegación automática de enero. Lo que importa es el cambio de escala, no el cambio de características.

A finales de junio de 2026 es cuando la navegación automática de Chrome llega a los teléfonos Android

El anuncio de Google del 12 de mayo llama al cambio «Inteligencia Géminis» y describe a Android como un paso de «un sistema operativo a un sistema de inteligencia». Detrás del lenguaje de marketing, los cambios operativos son concretos. La navegación automática de Chrome gestiona la reserva de citas y de estacionamiento. Autocompletar inteligente se basa en Google Password Manager y Personal Intelligence para completar campos de formulario en la web. La automatización de tareas de varios pasos encadena acciones de aplicaciones en alimentos y viajes compartidos. Rambler convierte texto hablado en mensajes pulidos. Create My Widget genera widgets personalizados para la pantalla de inicio a partir de lenguaje natural.

LEER  Por qué la estrategia híbrida es mejor

La característica más importante de la web es la navegación automática. La navegación automática utiliza las capacidades multimodales de Gemini 3 para leer páginas, identificar lo que contienen, completar formularios, navegar flujos y completar transacciones. Google no publica la ruta técnica exacta. La comprensión basada en la visión, más el acceso DOM y las lecturas del árbol de accesibilidad es la composición inferida, pero la empresa no la ha especificado deliberadamente. Lo que Google ha especificado es el comportamiento. El agente opera el sitio web de la misma manera que lo hace un usuario, excepto que más rápido y sin que el usuario toque nada.

La navegación automática está incluida en Google AI Pro a $19,99 por mes para 20 tareas por día, o AI Ultra a $249,99 por mes para 200 tareas por día. Se detiene para la confirmación explícita del usuario sobre compras y publicaciones en redes sociales. Los primeros casos de uso que cita Google son cotidianos: programar citas, presentar informes de gastos, comparar precios de hoteles, gestionar suscripciones, renovar permisos de conducir, obtener cotizaciones de fontaneros.

Estas son las tareas que generan la mayor parte del tráfico de reservas de empresas locales.

El arco de 6 meses consta de 9 movimientos de Google que se componen de 1 pila

El anuncio de Android de Gemini Intelligence es el décimo movimiento de una serie, no el primero. Cada movimiento cerró una capa diferente de la arquitectura web agente. Juntos, cubren el camino completo desde el descubrimiento hasta la citación, la acción, el comercio y la identidad del agente.

29 de enero de 2026: La navegación automática de Chrome se lanzó en versión preliminar para computadoras de escritorio en EE. UU.

25 de febrero de 2026: AppFunctions para Android, una API estilo protocolo de contexto modelo que permite que las aplicaciones de Android expongan acciones a Gemini de forma nativa, con Uber, DoorDash y OpenTable como socios de lanzamiento.

16 de abril de 2026: La integración de AI Mode Chrome se implementa para los usuarios de inglés de EE. UU., lo que hace que AI Mode sea accesible desde la barra de direcciones de Chrome.

29 de abril de 2026: Google reemplaza el botón «Buscar» en Android a nivel mundial con «Preguntar a Google», poniendo fin a la suposición de que «buscar» significa escribir palabras clave.

Abril de 2026: Google web.dev publica “Creación de sitios web aptos para agentes”, la primera guía de patrones de diseño publicada por un proveedor para una arquitectura web legible por agentes.

Abril de 2026: Gemma 4 y Gemini Nano 4 se envían como inteligencia agente local en el dispositivo, hasta 4 veces más rápido que la generación anterior y un 60 % menos de batería.

Abril de 2026: Se lanza el Protocolo de comercio universal (UCP), desarrollado conjuntamente con Shopify, Etsy, Wayfair y Target, que define cómo los agentes realizan transacciones con los sitios web de los comerciantes.

Abril de 2026: Google Cloud Next incluye la plataforma Gemini Enterprise Agent, el protocolo de agente a agente (A2A) para la comunicación entre agentes entre plataformas y Workspace Studio para la creación de agentes sin código.

12 de mayo de 2026: Gemini Intelligence Android y el lanzamiento de navegación automática en teléfonos a finales de junio, integrado en la capa del sistema operativo.

Finales de junio de 2026: La navegación automática de Chrome está disponible en Android.

La composición es la historia. Project Mariner, el agente de investigación de navegación web de DeepMind que obtuvo una puntuación del 83,5 % en el punto de referencia WebVoyager, se convirtió en la navegación automática de Chrome. La navegación automática necesita una forma de manejar los flujos comerciales. Esa es la UCP. UCP necesita que los agentes se identifiquen en los sistemas comerciales. Ese es A2A. El agente necesita inferencia local para la latencia móvil. Ese es Gemini Nano 4. El agente necesita patrones de diseño para saber cómo es un «flujo de reservas» en millones de sitios web. Esa es la guía amigable para los agentes de web.dev. El agente necesita distribución. Eso es lo que ofrece la integración a nivel de sistema operativo.

Cada pieza, por sí sola, parecía una actualización del producto. Apilados, son la capa operativa de la web agente en la plataforma móvil dominante.

El cambio de transacciones cambia el significado de “visibilidad del agente”

Durante dos años, la visibilidad de la IA ha sido un problema de descubrimiento enmarcado en la elegibilidad para las citas en ChatGPT, Perplexity y AI Overviews de Google. El marco de elegibilidad de recuperación sobre el que Mike King y otros han escrito este año es el marco adecuado para ese problema. La elegibilidad de las citas es anterior al porcentaje de citas, y el porcentaje de citas es anterior a la presencia de la marca en el descubrimiento mediado por IA.

LEER  Las mejores agencias de marketing tecnológico del mundo

A finales de junio de 2026, el marco se amplía. La cita todavía está en juego, pero hay una segunda pregunta encima. Cuando el agente aparece en el sitio web en el teléfono del usuario, ¿puede completar la acción?

Todos los pilares de la arquitectura Machine-First todavía se aplican. La identidad le dice al agente qué negocio representa el sitio web. La estructura le dice al agente qué hay en la página y dónde están las acciones. El contenido le dice al agente lo que realmente dice la página. La interacción le dice al agente cómo completar lo que vino a hacer.

A través de la lente de las citas, la identidad, la estructura y el contenido tuvieron la mayor parte del peso. El cuarto pilar, Interacción, fue al que la mayoría de los equipos prestaron menos atención. A través de la lente de las transacciones, la interacción pasa de ser la menos discutida a ser más cargada. El agente ya no sólo lee su página de reserva. Hace clic en el botón «Martes a las 6:00 p. m.», completa el campo del número de teléfono, acepta el modo de confirmación de la reserva y navega por el proceso de pago de varios pasos. Cada uno de esos movimientos puede fallar de una manera que el agente no pueda recuperarse, en sitios web que funcionan bien para usuarios humanos.

Lo que se divide en los clústeres de exploración automática en 8 modos de falla

Un patrón que no cuesta ninguna conversión bajo el tráfico humano puede costar la reserva completa bajo el tráfico de agentes. Los modos de falla se agrupan en un puñado de categorías.

La representación del lado del cliente bloquea la página. El agente lee la respuesta HTML inicial. Si el formulario de reserva, el widget de calendario o el botón de llamada a la acción se muestran solo después de la hidratación de JavaScript, el agente ve un caparazón vacío. Este es el mismo fallo que oculta el contenido de las citas de búsqueda de IA, aplicado a la superficie transaccional. Los creadores de sitios web visuales modernos que utilizan de forma predeterminada la representación del lado del cliente, incluidos Figma Sites, Bubble, Wix Studio, Plasmic y Lovable en su configuración predeterminada de React + Vite, producen sitios web donde el flujo de reservas es invisible para el agente.

Los muros de cookies bloquean el contenido hasta la interacción. Si su sitio web muestra un banner de cookies que oculta todo el contenido hasta que el usuario hace clic en Aceptar, el agente debe hacer clic en Aceptar primero. Algunos agentes se encargan de esto. Algunos no lo hacen. Algunos hacen clic en Aceptar en un banner cuyos términos el usuario no ha visto, lo cual es un problema aparte. De cualquier manera, el muro de cookies introduce un paso en el que el agente podría fallar.

Los formularios sin las etiquetas adecuadas son ilegibles. A sin un asociado elemento o un aria-label El atributo es un campo que el agente no puede identificar. No sabe si poner ahí el número de teléfono, el correo electrónico o el nombre. Multiplíquelo en un formulario de reserva de cinco campos y la tasa de fracaso aumentará. Los elementos de etiqueta reales combinados con cada entrada son la solución, y son la misma solución que las auditorías de accesibilidad han recomendado durante quince años.

Los botones basados ​​en div fallan en la interacción. A

styled to look like a button is not a button to the agent. The agent reads HTML semantically. If the “Book now” element is not a real o elemento, el agente no sabe que se puede hacer clic en él. La solución es enviar elementos de botones reales.

Las trampas modales impiden que se complete el flujo. Un modal que aparece en medio del flujo con un botón de cerrar oculto detrás de un estado de desplazamiento CSS, o un widget de calendario que se abre en una ventana emergente que el agente no puede descartar, interrumpe la reserva. El agente se queda atrapado en un estado sin camino recuperable a seguir.

CAPTCHA detiene al agente en seco. Un CAPTCHA en el formulario de reserva es una parada difícil. El agente no lo solucionará. El usuario no solicitó que se le probara CAPTCHA en medio de una tarea delegada. La reserva falla. Los CAPTCHA son cada vez más la capa de fricción de último recurso contra el tráfico de bots, y están a punto de comenzar a bloquear también el tráfico legítimo de agentes delegados por los usuarios.

El tiempo de carga dinámica excede la ventana de paciencia del agente. Una página que se carga en ocho segundos debido a paquetes pesados ​​de JavaScript es una página que el agente podría abandonar. El trabajo de elegibilidad de recuperación de Mike King en abril mostró que el tiempo de carga de la página se ha convertido en un límite estricto para la recuperación de la IA, con 499 códigos de estado (“conexión cerrada del cliente”) que aparecen donde el agente se dio por vencido antes de que terminara la página. La navegación automática hereda la misma restricción, agravada por la latencia móvil.

Los muros de inicio de sesión requieren credenciales que el agente quizás no tenga. Google Password Manager ayuda cuando el usuario ha guardado las credenciales. Sin credenciales guardadas, el agente se detiene. Para las reservas de empresas locales, los muros de registro son una capa de fricción común previa a la acción. Se convierten en un duro bloqueador de agentes en el momento en que el usuario no se ha registrado previamente.

La auditoría no ha cambiado en una década, solo la clase visitante

Realicé la auditoría de siete reglas de Google en nohacks.co a principios de este mes. Pasaron seis de siete. La regla cinco, puntero del cursor en elementos interactivos, falló en todos los botones nativos debido a un valor predeterminado de Tailwind v4 que se envía sin previo aviso. Tres líneas de CSS lo arreglaron. La solución tardó más en encontrar que en implementarse.

Esa auditoría se enmarcó en torno a la elegibilidad de las citas de búsqueda de IA. La misma auditoría, en el marco de la navegación automática, es una auditoría de elegibilidad de transacciones. Abra el flujo de reserva en un teléfono en Chrome. Deshabilite JavaScript en las herramientas de desarrollo. Recargar. ¿Puedes ver el formulario, ver los botones, completar la reserva solo con el teclado?

En caso afirmativo, el agente también puede hacerlo.

En caso negativo, el agente no puede y la reserva pasa al siguiente salón de la lista.

La auditoría no es nueva. Los equipos de accesibilidad han estado ejecutando variaciones desde la era WCAG 2.0. Los marcos de elegibilidad de recuperación y elegibilidad de transacciones son nuevas clases de visitantes que se benefician de las mismas correcciones. La guía web.dev que Google publicó en abril hace explícita la convergencia. Cada una de las siete reglas de legibilidad de los agentes de Google se asigna a una recomendación WCAG existente.

La auditoría preexistente, aplicada intencionalmente, cubre ambas clases.

Las reservas van a otra parte en silencio y el sistema operativo elige al ganador

Cuando un usuario de Pixel 10 dice "reserva un corte de pelo el martes a las seis" a finales de junio, la navegación automática de Chrome selecciona el sitio web de un salón. El agente que realiza la selección es el sistema operativo en sí, no una aplicación de terceros que el usuario eligió, y el usuario no seleccionó el selector más de lo que seleccionó qué motor de búsqueda utiliza la barra de direcciones.

Si la reserva se realiza correctamente, el usuario obtiene la confirmación, el salón obtiene la reserva y el sitio web también es el destino predeterminado para la próxima reserva delegada por el agente. Si la reserva falla, el usuario no ve ningún error. El agente vuelve a intentarlo. El agente elige otro salón. La reserva va allí.

El salón cuyo sitio web no pudo realizar la reserva nunca ve al usuario. No hay señal analítica. No hay ningún evento de carrito abandonado. No hay ninguna notificación de "el agente agotó el tiempo de espera en su formulario de reserva" en Google Search Console. El tráfico que no llegó es invisible. Tres meses después, el propietario se da cuenta de que las reservas han disminuido y no puede identificar la causa.

Finales de junio es la fecha límite y el trabajo para estar listo es pequeño. Una auditoría lleva unas horas, las correcciones se ejecutan uno o dos días para la mayoría de los sitios web y la alternativa son meses de pérdida silenciosa antes de que la causa sea siquiera visible.

Más recursos:


Esta publicación se publicó originalmente en No Hacks.


Imagen de portada: Yaaaaayy/Shutterstock

--Advertisement--spot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img

Popular

spot_img

Más como esto
Relacionada

Publicidad web push 2026: tendencias y oportunidades del mercado

Esta publicación fue patrocinada por Roller Ads. Las opiniones...

El problema de la convergencia de la IA

En este momento hay un sabor particular de pánico...

Cómo crear un equipo de marketing de crecimiento con un presupuesto...

Todos los fundadores en etapa inicial con los que...

Google dice que los nombres de dominio con guiones están bien...

John Mueller de Google confirmó recientemente que el uso...