Mejore sus habilidades con los conocimientos expertos semanales de Growth Memo. ¡Suscríbete gratis!
Durante años, los SEO han operado con una suposición simple: cuanto más terreno cubra su contenido, más probabilidades habrá de que aparezca en las respuestas generadas por IA. De hecho, cada “mejor práctica” en el contenido SEO clásico te empuja hacia más: más subtemas, más secciones, más palabras. Cree la «guía definitiva».
Un análisis de 815.000 pares de páginas de consulta en 16.851 consultas y 353.799 páginas dice lo contrario:
- La cobertura en abanico es casi irrelevante para las tasas de citación.
- En realidad, dos señales predicen si ChatGPT cita su página.
- Seis cambios concretos en su biblioteca de contenidos existente le ayudarán.
1. El estudio
AirOps ejecutó 16,851 consultas a través de ChatGPT tres veces cada una a través de la interfaz de usuario, capturando cada subconsulta distribuida, cada URL buscada, cada cita realizada y cada página eliminada. Oshen Davidson construyó el oleoducto. Analicé los datos.
Cada consulta genera un promedio de dos consultas distribuidas. ChatGPT recupera aproximadamente 10 URL por subbúsqueda, las lee y luego selecciona cuáles citar. Calificamos qué tan bien los subtítulos H2-H4 de cada página coincidían con esas consultas distribuidas utilizando similitud de coseno en incrustaciones bge-base-en-v1.5. Esa puntuación es lo que llamamos cobertura de despliegue: la proporción de subtemas que aborda una página con un umbral de similitud de 0,80. (El umbral de similitud de 0,80 se utilizó para decidir si un subtítulo cuenta como coincidencia con una consulta distribuida. Piense en ello como una barra de relevancia).
La pregunta: ¿Se citan más las páginas con mayor cobertura de distribución?
Encontrará aún más información en el informe AirOps coescrito.
2. La densidad apenas mueve la aguja
En 815.484 filas, la relación entre la cobertura distribuida y las citas es débil.
Cubrir el 100% de los subtemas agrega 4,6 puntos porcentuales a cubrir ninguno. Esa brecha se reduce aún más cuando controlas la coincidencia de la consulta (qué tan bien coincide el mejor encabezado de la página con la consulta original). Entre páginas con fuerte coincidencia de consulta (>= 0,80 similitud de coseno):
La cobertura moderada (26-50%) supera a la cobertura exhaustiva. Las páginas que cubren todo obtienen puntuaciones más bajas que las páginas que cubren una cuarta parte de los subtemas. La estrategia de la “guía definitiva” produce peores resultados que un artículo centrado que cubra bien dos o tres ángulos relacionados.
3. Qué predice realmente la citación
Estas dos señales dominan: rango de recuperación y coincidencia de consultas.
1. Rango de recuperación es el predictor más fuerte por un amplio margen. Una página en la posición 0 en los resultados de búsqueda web de ChatGPT (la primera URL devuelta por su herramienta de búsqueda) tiene una tasa de citas del 58%. En la posición 10, esa cifra cae al 14%. Ejecutamos cada mensaje tres veces consecutivas para este análisis, y las páginas citadas en las tres ejecuciones tienen una clasificación de recuperación media de 2,5. Páginas nunca citadas: rango medio 13.

2. Consulta de coincidencia (similitud de coseno entre la consulta y el mejor encabezado de la página) es la señal de contenido más fuerte. Las páginas con una coincidencia de encabezado de 0,90+ tienen una tasa de citación del 41% en comparación con la tasa del 30% para las páginas por debajo de 0,50. Incluso entre las páginas mejor clasificadas (posición 0-2), una mayor coincidencia de consultas añade 19 puntos porcentuales.
Cobertura de distribución, recuento de palabras, recuento de encabezados, autoridad de dominio: todo secundario. Algunas son planas. Algunos están inversamente correlacionados.
4. La excepción de Wikipedia
Un tipo de sitio rompe el patrón. Wikipedia tiene la peor clasificación de recuperación en el conjunto de datos (mediana 24) y la puntuación de coincidencia de consultas más baja (0,576). Todavía logra la tasa de citación más alta: 59%.
Las páginas de Wikipedia tienen un promedio de 4.383 palabras, 31 listas y 6,6 tablas. Son enciclopédicos en el sentido literal. ChatGPT cita Wikipedia desde lo más profundo de los resultados de búsqueda, donde se ignoran todos los demás tipos de sitios.
Esta es la densidad que funciona como una señal, pero a una escala que ningún editor puede replicar. El contenido de Wikipedia es exhaustivo, ricamente estructurado y entrelazado entre millones de temas. Una publicación de blog corporativo de 3000 palabras con 15 subtítulos no es lo mismo.
5. La realidad bimodal
El 58% de las páginas recuperadas por ChatGPT en este conjunto de datos nunca se citan. El 25% siempre se cita cuando aparecen. Sólo el 17% se sitúa en el punto medio.
Los grupos siempre citados y nunca citados parecen casi idénticos en la mayoría de las métricas de contenido: recuentos de palabras similares (~2200), recuentos de encabezados similares (~20), puntuaciones de legibilidad similares (~12 grado FK), autoridad de dominio similar (~54). Las señales en la página que podemos medir no separan a los ganadores de los perdedores.
Lo que los separa es el rango de recuperación. Las páginas siempre citadas se ubican cerca de la cima cuando aparecen. Las páginas nunca citadas se ubican en la mitad inferior. El sistema de recuperación, cualesquiera que sean las señales que utilice internamente, es el guardián. Todo lo demás es un desempate.
6. Qué significa esto para su contenido
La sabiduría convencional sobre redacción de contenido SEO dice que cubra más subtemas, agregue más secciones y genere densidad. Los datos dicen que el enfoque convencional produce páginas «mixtas», el 17% en el medio que a veces es citado y otras veces ignorado.
Las páginas mixtas tienen el mayor número de palabras, la mayor cantidad de títulos y la mayor autoridad de dominio en el conjunto de datos. Son las “guías definitivas”. También son los que tienen el desempeño menos confiable en ChatGPT.
Las páginas que ganan consistentemente están enfocadas. Ellos:
- Haga coincidir la consulta directamente en sus encabezados,
- Tienden a ser más breves (el punto ideal para las citas es de 500 a 2000 palabras) y
- Tener suficiente estructura (7-20 subtítulos) para organizar el contenido sin diluirlo.
Cree la página que sea la mejor respuesta a una pregunta. No es la página que responde adecuadamente a 20.
Imagen de portada: Tero Vesalainen/Shutterstock; Paulo Bobita/Diario del motor de búsqueda


