Haga la misma pregunta sobre su marca en cuatro motores de IA diferentes y probablemente obtendrá cuatro respuestas diferentes. Una respuesta es actual y cita su última página. Otro describe un puesto que usted retiró hace 18 meses y no cita nada en absoluto. Un tercero dirige todo el asunto a través del puesto de comparación de un competidor. La misma marca, la misma pregunta, cuatro representaciones, y los espacios entre ellas no son ruido aleatorio que puedas descartar como una peculiaridad del modelo. Son estructurales y, una vez que puedas ver la estructura, puedes planificar en torno a ella.
En “Cuando el límite de datos de entrenamiento se convierte en un factor de clasificación”, expuse que su marca ahora vive en dos sistemas de memoria diferentes a la vez. Una es la memoria paramétrica, el conocimiento incorporado en un modelo durante el entrenamiento y luego congelado hasta la siguiente ejecución del entrenamiento. La otra es la recuperación: el contenido se recupera en el momento en que alguien pregunta. Ese artículo trataba sobre lo que significa la distinción en cuanto al tiempo. Esta es sobre la parte que dejé deliberadamente para su propio tratamiento, que es que los motores no se apoyan en esos dos recuerdos de la misma manera, y esa diferencia es lo que realmente determina dónde aparece su marca y cómo se lee cuando llega allí.
Cada motor tiene una postura de memoria
Permítanme darle un nombre a la cosa, porque nombrarla hace que sea más fácil planificar. Un LLM postura de la memoria es su lean predeterminado: cuando le preguntas algo, ¿busca la recuperación en vivo o responde con lo que ya contiene en sus parámetros? Las plataformas se clasifican en dos campos amplios, y en qué campo se ubica un motor determina casi todo acerca de cómo su contenido llega al usuario a través de esa superficie.
Por un lado están los motores que recuperan casi todas las consultas. La perplejidad es el caso más claro; realiza una búsqueda web en vivo sobre prácticamente todas las preguntas y muestra sus fuentes por diseño y no como una excepción. Las descripciones generales de IA y el modo AI de Google también se basan en la recuperación, pero con un detalle que vale la pena comprender: esas superficies son atendidas por el mismo rastreador que impulsa los resultados orgánicos, basándose en el índice de búsqueda central en lugar de la memoria paramétrica de Gemini. El token que ofrece Google para controlar el entrenamiento de modelos, Google-Extended, no tiene ningún efecto sobre lo que aparece en la Búsqueda o sus funciones de IA. Entonces, en los motores de recuperación constante, su visibilidad es primero una pregunta de recuperación y apenas una pregunta paramétrica.
Del otro lado están los motores que deciden por consulta. ChatGPT, Claude, Microsoft Copilot y la aplicación Gemini toman una decisión sobre cada pregunta: responda desde los parámetros o vaya a buscar. La búsqueda web de Claude se ejecuta como una herramienta que el modelo elige invocar cuando decide que la pregunta lo necesita. Copilot se conecta a la web solo cuando está habilitado y los beneficios inmediatos, y cuando un administrador desactiva la conexión a tierra, recurre por completo a la capacitación interna del modelo. Ese último detalle es el puente hacia “Dejar de tratar la visibilidad de la IA como un solo problema”, donde la recuperación era una de las tres capas que un equipo debía gobernar. Aquí está esa capa desde adentro: en un motor decidido por el modelo, si la recuperación ocurre puede ser una configuración en la consola de administración de alguien, no una propiedad de su contenido.
Y la postura ni siquiera es estable dentro de un solo motor. Un estudio de flujo de clics de ChatGPT encontró que la proporción de sesiones que desencadenaron una búsqueda web oscilaba entre aproximadamente el 15 y el 66% en la ventana del estudio, moviéndose a medida que se actualizaban los modelos subyacentes. La misma pregunta que hizo en marzo podría responderse de memoria y, en abril, acceder a la web en vivo, sin que nada haya cambiado por su parte. La postura es un objetivo en movimiento, y es exactamente por eso que hay que medirla en lugar de asumirla.
La recuperación dejó de ser un solo paso
Incluso cuando un motor se recupera, recuperarlo ya no es una acción limpia, y aquí es donde muchos de los antiguos instintos de optimización se rompen silenciosamente. El modelo de paso único, en el que un sistema incorpora su consulta, toma el puñado superior de páginas coincidentes y las genera, ha dado paso a la recuperación de agentes que planifica y ejecuta muchas subconsultas antes de responder. Una pregunta que el usuario escribe se convierte en un fanático de las preguntas que el sistema hace en su nombre, desde un par hasta docenas. Ya no estás optimizando solo para la pregunta en el cuadro de búsqueda. Estás optimizando las preguntas invisibles que genera el motor para satisfacerlo.
Hay un problema de segundo orden encima, y vale la pena exponerlo claramente incluso si algún día merece su propia pieza. Ser arrastrado al contexto no es lo mismo que ser bien utilizado. La investigación que documentó por primera vez cómo los modelos utilizan el contexto largo de manera desigual tiene ya más de una década, y los modelos actuales han resuelto en gran medida la versión simple, encontrando un hecho enterrado en un documento extenso. Lo que sigue siendo poco fiable es lo más difícil: integrar varias señales dispersas en una imagen coherente. Tu marca nunca es un hecho único. Su representación depende de que el motor recopile sus páginas, sus reseñas y la cobertura de terceros que se encuentran en diferentes lugares del material recuperado y luego los combine correctamente. Ese paso de ensamblaje todavía genera pérdidas, lo que significa que «nos están recuperando» y «nos están representando con precisión» se pueden medir y pueden no estar de acuerdo.
El tiempo se convirtió en una palanca que no solías tener
La memoria paramétrica introduce una variable que simplemente no existía en la era del SEO tradicional: la ventana de entrenamiento. No puede editar lo que un modelo ya contiene en sus parámetros. Publicar una corrección hoy no afecta en nada a la versión de su marca codificada en un modelo que terminó de entrenar el verano pasado. Lo único que cambia la memoria paramétrica es una nueva ejecución de entrenamiento, lo que significa que la pregunta útil no es cómo arreglar lo que el modelo ya cree, sino qué aprenderá el modelo sobre usted la próxima vez que entrene y si encontrará la versión correcta de su historia.
Esto es menos desesperado de lo que parece, por dos razones. En primer lugar, la memoria paramétrica no es una caja negra sobre la que no se tiene influencia. Los modelos aprenden la versión de un hecho que aparece de manera consistente y corroborada en muchas fuentes, por lo que el trabajo es hacer que la versión precisa de su historia sea redundante, la versión que sea difícil pasar por alto cuando los rastreadores llegan. Es un juego largo medido en generaciones de modelos en lugar de ediciones de páginas, pero es un juego que puedes jugar. En segundo lugar, la cadencia de entrenamiento ya no es un lento evento anual. Los principales proveedores ahora ofrecen lanzamientos puntuales frecuentes, cada uno con su propio límite, por lo que la capa paramétrica se actualiza en pasos a los que realmente puede apuntar en lugar de un único horizonte lejano. Algunas de las inconsistencias que los equipos siguen señalando, el mismo motor dando diferentes respuestas en diferentes días, es esto en acción: un día la pregunta se extrajo de los parámetros, al siguiente desencadenó la recuperación y las dos capas no contaban la misma historia.
Un flujo de trabajo para descubrir dónde se encuentra realmente
Puede ejecutar esto a mano hoy en día, sin herramientas especiales, que es más bien el punto. Si comprendes las dos memorias, podrás leer lo que cualquier motor está haciendo con tu marca. Llámalo la auditoría de la postura de la memoria.
- Elija las consultas que paguen. No el nombre de su marca por sí solo, sino las preguntas que realmente hace un comprador donde usted debe aparecer: las preguntas de categoría, las comparaciones, las enmarcadas en problemas. Un puñado, ligado a los ingresos.
- Ejecute cada uno a lo largo de una extensión deliberada. Al menos un motor de recuperación permanente y al menos dos modelos decididos, utilizando siempre la misma redacción, por lo que la única variable es la plataforma.
- Lea la postura, no sólo la respuesta. Las citas son la indicación. Fuentes citadas en vivo significan que la recuperación fue despedida; una respuesta segura y sin fuentes provino de la memoria paramétrica. En los motores decididos por el modelo, haga cada pregunta dos veces, una con una frase sencilla y constante y otra con una señal reciente como «más reciente» o «actual», y observe si la segunda versión activa el motor para recuperarlo. Ese giro es la postura que se revela.
- Clasifica lo que está mal según el recuerdo que lo produjo. Hechos obsoletos sin citación apuntan a un problema paramétrico. Ausente por completo, o representado a través de la página de un competidor en un motor que claramente recuperó, indica un problema de selección de recuperación. En el resultado, los dos pueden parecer casi idénticos. No son el mismo defecto.
- Repara la capa que realmente está rotaporque las correcciones no se transfieren:
- Un problema paramétrico no se puede editar directamente. Usted influye en la siguiente ventana de capacitación implementando contenido consistente, corroborado y rastreable ahora, de modo que la versión correcta de su historia sea la que se aprenda.
- Un problema de recuperación es el trabajo de búsqueda y selección: responda las subpreguntas directamente, estructure sus páginas para una extracción limpia y fortalezca la corroboración entre fuentes de terceros para que su versión sea la que se combine en la respuesta.
- Ponle fecha y repite. La postura no es estable, por lo que una auditoría única es una instantánea, no un hallazgo. Póngalo en una cadencia, al menos trimestralmente.
Lo que deja la pregunta que vale la pena considerar
La mayoría de los equipos que optimizan la visibilidad de la IA trabajan duro en un sistema de memoria y tratan el otro como si no existiera, generalmente sin haber decidido nunca cuál eligieron. La disciplina que esto requiere es pequeña de describir e incómoda de practicar: para cada motor que te importa, conoce su postura, conoce qué recuerdo lleva tu marca allí y sabe si esa es la capa que habrías elegido a propósito.
Eso es la cuestión de la capa de memoriay la mayoría de los equipos aún no pueden responderla, que es en sí mismo el diagnóstico. También expone por qué una puntuación única de visibilidad de la IA es un error de categoría. Un número que colapsa la posición paramétrica y la posición de recuperación en una sola cifra es el promedio de dos cosas que se mueven de forma independiente, recompensan trabajos diferentes y fallan de diferentes maneras. No puedes gestionar lo que has aplanado. La alfabetización que importa ahora es la capacidad de mantener separadas las dos capas en tu cabeza y preguntar, cada vez, cuál estás mirando realmente.
Si ha ejecutado una versión de esto en su propia marca, me gustaría saber qué encontró, especialmente cuando una plataforma lo sorprendió. Deje un comentario o comuníquese con nosotros.
Y si quieres un argumento más extenso sobre por qué la visibilidad, la confianza y la legibilidad de las máquinas se están convirtiendo en el mismo problema, ese es el tema de mi libro. La capa de máquina.
Más recursos:
Esta publicación se publicó originalmente en Duane Forrester Decodes.
Imagen de portada: Summit Art Creations/Shutterstock


