La ciencia de lo que realmente recompensa la IA

Mejore sus habilidades con los conocimientos expertos semanales de Growth Memo. ¡Suscríbete gratis!

En «La ciencia de cómo presta atención la IA», analicé 1,2 millones de respuestas de ChatGPT para comprender exactamente cómo lee una página la IA. En “La ciencia de cómo la IA elige sus fuentes”, analicé 98.000 filas de citas para comprender qué páginas llegan al grupo de lectura.

Esta es la Parte 3.

Donde te lo dijo la Parte 1 dónde En una página mira AI, y la Parte 2 te lo dijo. cual páginas que la IA considera habitualmente, esta te lo dice qué En realidad, la IA recompensa el contenido que lee.

Los datos aclaran:

La mayoría de los consejos de redacción de SEO con IA no se mantienen a escala. No existe una fórmula universal para “escribir así para ser citado”: las señales que aumentan las tasas de citación de una industria pueden perjudicar activamente a otra.
Los tipos de entidades que predicen las citas no son los objetivos. FECHA y NÚMERO son positivos universales. PRICE suprime las citas en cinco de seis verticales, y las entidades verificadas por KG son una señal negativa.
La única señal de escritura que se mantiene en las siete verticales: Lenguaje declarativo en su introducción, +14 % de incremento agregado.
La estructura del encabezado es binaria. Comprométete con el número correcto para tu vertical o no uses ninguno. Tres o cuatro títulos son peores que cero en cada vertical.
Predomina el contenido corporativo. Reddit no lo hace. El comportamiento de las citas de la IA no refleja lo que sucedió con la búsqueda orgánica en 2023-2024.

1. Señales de escritura específicas influyen en las citas, mientras que otras la perjudican

Si bien “La ciencia de cómo presta atención la IA” cubre partes de la página y tipos de escritura que influyen en la visibilidad de ChatGPT, quería entender qué señales a nivel de escritura (recuento de palabras, estructura, estilo de lenguaje) predicen tasas más altas de citas de IA en todas las verticales.

Acercarse

Comparé las páginas más citadas (más de tres citas rápidas únicas) con las poco citadas en siete métricas de escritura: recuento de palabras, lenguaje definitivo, cobertura, elementos de la lista, densidad de entidades nombradas y señales de introducción específicas.
Analicé las primeras 1000 palabras para determinar el recuento de elementos de la lista, la densidad de entidades nombradas, la densidad de tokens de lenguaje definitivo de introducción y el recuento de números de introducción.

Resultados: En todos los sectores verticales, la redacción definitiva y la inclusión de entidades relevantes son importantes. Pero la mayoría de las señales son planas.

Crédito de la imagen: Kevin Indig

Lo que mostraron los patrones de la industria

Al dividir los datos por vertical, de repente vemos preferencias:

Número total de palabras fue más fuerte en CRM/SaaS (1,59x).
Las finanzas fueron una anomalía con el recuento de palabras: Las páginas más cortas ganan (0,86 veces el número de palabras).
Frases definitivas en los primeros 1.000 caracteres fueron positivos para la mayoría de los verticales.
La educación es una señal vacía. El estilo de escritura no explica casi nada sobre la probabilidad de citación allí.

Principales conclusiones

1. No existe una fórmula universal para “escribir así para que te citen”. Por ejemplo, las señales que aumentan las tasas de citación de CRM/SaaS perjudican activamente a Finanzas. En su lugar, haga coincidir el formato del contenido con las normas verticales.

2. La única regla universal: abrir con una declaración declarativa directa. No es una pregunta, ni una contextualización, ni un preámbulo. La forma es “(X) es (Y)” o “(X) hace (Z)”. Esta es la única instrucción de escritura que se cumple independientemente de la vertical, el tipo de contenido o la longitud.

LEER Consejos de Google sobre Canonicals: distinguen entre mayúsculas y minúsculas

3. Los LLM “penalizan” la cobertura en su introducción. «Esto puede ayudar a los equipos a comprender» funciona peor que «Los equipos que hacen X ven Y». Elimine los calificadores de su párrafo inicial antes de cualquier otra optimización.

2. Los tipos de entidades que predicen las citas no son los objetivos

La mayoría de los consejos de OEA se centran en entidades nombradas como categoría: incluya marcas, nombres de herramientas y números más conocidos. El análisis de tipo de entidad transversal que aparece a continuación cuenta una historia más específica (y más útil).

Acercarse

Ejecutó la API de lenguaje natural de Google en los primeros 1000 caracteres (alrededor de 200 a 250 palabras) de cada URL única.
Incremento calculado por tipo de entidad: % de páginas muy citadas con ese tipo/% de páginas poco citadas.
Se analizaron 5000 páginas en siete verticales.

* Una nota rápida sobre terminología: Google NLP clasifica los productos de software, aplicaciones y herramientas SaaS como CONSUMER_GOOD, una etiqueta heredada de cuando se creó la API para la venta minorista física. A lo largo de este análisis, CONSUMER_GOOD significa entidades de software/producto.

Resultados: FECHA y NÚMERO son las señales positivas más universales. Curiosamente, el PRECIO es el negativo universal más fuerte.

Lo que mostraron los patrones de la industria

FECHA es la señal positiva más universal, con la excepción de Finanzas (0,65x).
NÚMERO es el segundo más universal. Los recuentos, métricas y estadísticas específicos de la introducción predicen consistentemente tasas de citas más altas. Finanzas (0,98x) y Product Analytics (1,10x) marcan el suelo y el techo de ese rango.
PRECIO es el negativo universal más fuerte. Las páginas que se abren con precios indican una intención comercial. Las finanzas son la única excepción con 1,16x, probablemente porque el precio aquí significa porcentajes de tarifas y comparaciones de tasas, que son los datos de referencia reales que buscan las consultas financieras.
CONSUMIDOR_BUENO (entidades de software/producto) es mixta. En el sector sanitario, las entidades de productos señalan marcas y herramientas establecidas. En Crypto, nombrar protocolos y productos específicos es fundamental para responder consultas técnicas.
NÚMERO DE TELÉFONO es una señal positiva en Salud (1,41x) y Educación (1,40x). En ambos casos, es casi seguro que se trata de un proxy de marcas/instituciones/proveedores establecidos con presencia física real, no una señal literal para agregar números de teléfono a sus páginas.

La inversión del Knowledge Graph merece su propia nota aquí:

Los datos mostraron que las páginas más citadas promedian 1,42 KG de entidades verificadas frente a 1,75 para las páginas poco citadas (incremento: 0,81x).
Las páginas creadas en torno a entidades conocidas y verificadas por KG (marcas importantes, instituciones, personajes famosos) tienden a tener una cobertura genérica, que ChatGPT no prefiere.
Las páginas muy citadas están repletas de entidades específicas y de nicho: una metodología particular, una estadística precisa, una comparación con nombre. Muchas de esas entidades de nicho no tienen ninguna entrada en KG. Esa especificidad es lo que busca la IA.

Principales conclusiones

1. Agregue la fecha de publicación a sus páginas y trate de utilizar al menos un número específico en su contenido. Esa combinación es lo más parecido a una señal de citación de IA universal que produjo este conjunto de datos. Pero Finanzas llega allí a través de datos de precios y especificidad de ubicación.

2. Evite abrir con precios en verticales no financieras. Las introducciones con precios dominantes se correlacionan con tasas de citas más bajas.

3. La presencia de KG y la autoridad de la marca no se traducen en una ventaja en las citas de IA. Buscar entradas de Wikipedia, paneles de marca o verificación de KG es la palanca equivocada. Las entidades específicas de nicho (incluso aquellas sin entradas de KG) superan a las famosas.

3. Estructura de encabezados: Comprométete con uno o no te molestes

Sabemos que los títulos son importantes para las citas de los dos análisis anteriores. A continuación, quería comprender si el recuento de encabezados predice las tasas de citas y si la estructura óptima varía según la vertical.

LEER Agentes y flujos de trabajo de IA para auditoría (Parte 2)

Acercarse

Contó el total de encabezados por página (H1+H2+H3) en todas las URL citadas.
Páginas agrupadas en 7 grupos de encabezados: 0, 1-2, 3-4, 5-9, 10-19, 20-49, 50+.
Tasa de citas altas calculada (% de URL muy citadas) por segmento y por vertical.

Resultados: Incluir más títulos en su contenido no es siempre mejor. El punto óptimo depende de la vertical y del tipo de contenido. Un hallazgo es válido en todas partes: curiosamente, 3 o 4 títulos son peores que cero.

Lo que mostraron los patrones de la industria

CRM/SaaS es el único vertical donde se confirma el aumento de títulos de 20+: 12,7% de tasa de alta citación en 20-49 títulos frente a una base del 5,9%. La categoría 50+ alcanza el 18,2%. Las páginas de referencia largas y estructuradas y las guías de comparación con una sección por herramienta superan a todo lo demás aquí.
Cuidado de la salud se invierte más bruscamente. La tasa de cotización alta cae del 15,1% en cero rúbricas al 2,5% en 20-49 rúbricas. Una página con 30 H2 sobre temas de telesalud indica una intención de optimización, no una autoridad clínica.
Finanzas alcanza su punto máximo entre 10 y 19 títulos (tasa de alta citación del 29,4%). Estructurado pero no exhaustivo: tablas de tasas de pensamiento, desgloses regulatorios y páginas de comparación de asesores con una profundidad de encabezado moderada.
Cripto alcanza su punto máximo entre cinco y nueve títulos (tasa de alta citación del 34,7%). La documentación técnica en esta vertical tiende hacia una prosa densa con una estructura de navegación moderada. La sobreestructuración rompe la profundidad técnica.
Educación es plano en todos los recuentos de encabezados, lo que es consistente con el hallazgo de señales de escritura. La estructura de los títulos no explica casi nada sobre la probabilidad de citación en el contenido educativo.
La zona muerta de rumbo tres o cuatro se mantiene en todas las verticales sin excepción. La estructura parcial confunde la navegación de la IA sin proporcionar el beneficio completo de una jerarquía comprometida.

Principales conclusiones

1. El hallazgo del encabezado 20+ de la Parte 1 es un hallazgo de CRM/SaaS, no universal. Aplicarlo a la atención médica, la educación o las finanzas podría suprimir activamente las tasas de citación en esas verticales.

2. El principio que se aplica en todas partes: Comprométete con la estructura o no la uses. El término medio te cuesta en todos los verticales. Una página completamente estructurada con la profundidad de título adecuada supera a una página semiestructurada en todos los verticales.

3. Utilice el rango de rumbo óptimo para su vertical. Cripto: 5-9. Finanzas y Educación: 10-19. CRM/SaaS: 20+ (con H3). Sanidad: 0 o 5-9 como máximo. Las páginas de referencia de CRM largas con más de 50 secciones son el único caso en el que la máxima profundidad del encabezado vale la pena.

4. UGC no domina

El “efecto Reddit” reformuló la búsqueda orgánica entre 2024 y 2025. Quería entender si ChatGPT cita contenido generado por usuarios (Reddit, foros, reseñas) en proporciones significativas o si domina el contenido corporativo/editorial.

La suposición común de la industria (que la IA también cita preferentemente las voces de la comunidad) no es lo que encontramos en los datos.

Acercarse

Clasificó estas URL citadas como (1) UGC: Reddit, Quora, Stack Overflow, subdominios del foro, Medium, Substack, Product Hunt, Tumblr o (2) prefijos de comunidad/foro o corporativo/editorial por dominio.
Cuota de citas calculada por categoría y por vertical.
Conjunto de datos: 98.217 citas en 7 verticales.

LEER Cómo funciona el sistema de recomendación de YouTube en 2025

Resultados: El contenido corporativo representa el 94,7% de todas las citas. UGC es casi invisible.

Lo que mostraron los patrones de la industria

Finanzas es la vertical más bloqueada corporativamente con un UGC del 0,5%. El contenido de YMYL (Your Money, Your Life) parece suprimir sistemáticamente las citas a la opinión de la comunidad.
Cuidado de la salud se sitúa en el 1,8% UGC por la misma razón estructural. El contenido clínico, de telesalud y de HIPAA se basa casi exclusivamente en fuentes institucionales.
Cripto tiene la mayor penetración de UGC en el conjunto de datos con un 9,2%. El contenido generado por la comunidad (hilos técnicos de Reddit, tutoriales de Medium, publicaciones en foros de desarrolladores) responde a una proporción significativa de las consultas analizadas. En un nicho técnico en rápida evolución donde la documentación oficial constantemente se retrasa, las publicaciones de la comunidad llenan el vacío.
Análisis de productos y tecnología de recursos humanos Siéntese en 6,9% y 5,8% UGC. Ambas son verticales donde los hilos de comparación de Reddit y las comunidades de reseñas de productos brindan una señal genuina junto con el contenido corporativo.

Principales conclusiones

1. El «efecto Reddit» en SEO no se ha traducido proporcionalmente en las citas de IA. En la mayoría de las verticales, reddit.com capta entre el 2% y el 5% del total de citas. Este hallazgo está en línea con otras investigaciones de la industria, incluido este informe de Profound.

2. Para finanzas y atención médica: UGC tiene un valor de citación de IA casi nulo. Invierta en contenido corporativo estructurado y autorizado con fuentes claras. La participación de la comunidad puede ser importante por otras razones, pero no contribuye significativamente al porcentaje de citas de IA en estas verticales.

3. Para criptografía, análisis de productos y tecnología de recursos humanos: la presencia en la comunidad tiene un valor de citación medible. Los hilos comparativos detallados de Reddit, las publicaciones técnicas en Medium y las respuestas estructuradas del foro de desarrolladores pueden complementar el alcance del contenido corporativo.

Qué significa esto para la estrategia de visibilidad del LLM

En las tres partes de este estudio, el hallazgo constante es que las citas mediante IA no son principalmente un problema de calidad de la escritura.

La parte 2 demostró que es un problema de arquitectura de contenido: las páginas delgadas de un solo propósito están estructuralmente bloqueadas independientemente de qué tan bien estén escritas. Esta pieza muestra que la misma lógica se aplica dentro del contenido mismo.

La tabla de señales de escritura agregadas es el gráfico más importante de este análisis. No porque le muestre qué hacer, sino porque muestra cuánto de lo que le dice la industria AI SEO/GEO/AEO no sobrevive al escrutinio transversal. Recuento de palabras, densidad de listas, recuentos de entidades nombradas… todo plano o negativo en conjunto. Las señales que funcionan son verticales específicas y más pequeñas de lo que implica el consenso de nuestra industria.

La meta-lección de este análisis es que los hallazgos son específicos verticales (y probablemente temáticos), lo que no es diferente en SEO.

Esta parte concluye la ciencia de la IA, por ahora. Porque el ecosistema de IA cambia constantemente.

Metodología

Analizamos ~98.000 filas de citas de ChatGPT extraídas de aproximadamente 1,2 millones de respuestas de ChatGPT de Gauge.

Debido a que la IA se comporta de manera diferente según el tema, aislamos los datos en siete verticales distintas y verificadas para garantizar que los hallazgos no estuvieran sesgados por una industria específica.

Verticales analizados:

SaaS B2B
Finanzas
Cuidado de la salud
Educación
Cripto
tecnología de recursos humanos
Análisis de productos

Imagen destacada: CoreDESIGN/Shutterstock; Paulo Bobita/Diario del motor de búsqueda

La ciencia de lo que realmente recompensa la IA

1. Señales de escritura específicas influyen en las citas, mientras que otras la perjudican

Acercarse

Lo que mostraron los patrones de la industria

Principales conclusiones

2. Los tipos de entidades que predicen las citas no son los objetivos

Acercarse

Lo que mostraron los patrones de la industria

Principales conclusiones

3. Estructura de encabezados: Comprométete con uno o no te molestes

Acercarse

Lo que mostraron los patrones de la industria

Principales conclusiones

4. UGC no domina

Acercarse

Lo que mostraron los patrones de la industria

Principales conclusiones

Qué significa esto para la estrategia de visibilidad del LLM

Metodología

DEJA UNA RESPUESTA Cancelar respuesta

Más como estoRelacionada

Sobre nosotras

Categorías

Lo último

Selecciones del editor

Más como esto
Relacionada