John Mueller de Google respondió una pregunta sobre las URL duplicadas que aparecen después de un cambio en la estructura del sitio. Su respuesta ofrece claridad sobre cómo Google maneja el contenido duplicado y qué influye realmente en las decisiones de indexación y clasificación.
Preocupación por las URL duplicadas y el impacto en la clasificación
El propietario de un sitio había cambiado la estructura de URL de sus páginas web y luego descubrió que todavía se podía acceder a versiones anteriores de esas URL y aparecían en Google Search Console.
A la persona que hizo la pregunta en Reddit le preocupaba que solicitar volver a rastrear las URL más antiguas pudiera confundir a Google o provocar problemas de clasificación.
Ellos preguntaron:
“Cambié de tema hace un tiempo e hice un rediseño y en algún momento… cambié todas las URL de mis recetas quitando la parte /recipe/ de site.com/recipe/actualrecipe, por lo que ahora es solo site.com/actualrecipe, pero hay URL que aún funcionan cuando vuelves a colocar /recipe/ en la URL.
Fui a GSC y me entró el pánico porque muchas de mis recetas no estaban indexadas debido a un error 5xx (creo que fue cuando mi sitio estuvo inactivo durante unos días).
Ahora ya solicité que se volvieran a rastrear algunos de ellos, pero me di cuenta de que tal vez Google los estaba ignorando por una razón, como si no quisiera los duplicados.
¿Mis solicitudes de rastreo de URL /recipe/ van a confundir a Google, quien podría penalizar mi clasificación por los duplicados?
La pregunta refleja una preocupación razonable de que las URL y el contenido duplicados puedan afectar negativamente las clasificaciones, especialmente cuando el error aparece a través de los informes de indexación de la consola de búsqueda.
Google puede manejar URL duplicadas
John Mueller de Google respondió a la pregunta explicando que varias URL que apuntan al mismo contenido no provocan una penalización ni pérdida de visibilidad de búsqueda. También señaló que este tipo de duplicación es común en la web, lo que implica que los sistemas de Google tienen experiencia en el manejo de este tipo de problemas.
Él explicó:
“Está bien, pero te lo estás poniendo más difícil (Google elegirá uno para conservarlo, pero es posible que tengas preferencias).
No hay penalización ni degradación de clasificación si tiene varias URL que dirigen al mismo contenido; casi todos los sitios tienen variaciones. Gran parte del SEO técnico consiste básicamente en susurrar en los motores de búsqueda, ser coherente con las sugerencias y monitorear para asegurarse de que sean captadas «.
A lo que Mueller se refiere es a la capacidad de Google de canonicalizar una única URL como la que es representativa de varias URL similares. Como dijo Mueller, múltiples URL para esencialmente el mismo contenido es un problema frecuente en la web.
La documentación de Google enumera cinco razones por las que ocurre contenido duplicado:
- “Variantes regionales: por ejemplo, un contenido para EE. UU. y el Reino Unido, accesible desde diferentes URL, pero esencialmente el mismo contenido en el mismo idioma.
- Variantes de dispositivo: por ejemplo, una página con una versión móvil y otra de escritorio.
- Variantes de protocolo: por ejemplo, las versiones HTTP y HTTPS de un sitio.
- Funciones del sitio: por ejemplo, los resultados de las funciones de clasificación y filtrado de una página de categoría.
- Variantes accidentales: por ejemplo, la versión de demostración del sitio se deja accidentalmente accesible a los rastreadores”.
El punto es que el contenido duplicado es algo que sucede a menudo en la web y es algo que Google puede manejar.
Señales técnicas de SEO
Mueller dijo que Google elegirá una URL para conservarla, pero añadió que el propietario del sitio podría tener preferencias. Eso significa que Google canonicalizará los duplicados por sí solo, pero el propietario del sitio o el SEO aún pueden indicar qué URL es la mejor opción (la canónica) para clasificar en los resultados de búsqueda.
Ahí es donde entra en juego el SEO técnico. Los enlaces internos, las redirecciones, el uso adecuado de rel=»canonical», la coherencia del mapa del sitio y la coherencia en las redirecciones 301 funcionan como sugerencias que ayudan a Google a identificar la versión que realmente desea indexar.
El verdadero problema son las señales mixtas
El comentario de Mueller sobre ponérselo más difícil a usted mismo fue que el propietario del sitio/SEO dedica tiempo a solicitar que se vuelvan a rastrear las URL y señala que Google lo resolverá por sí solo. Pero luego también hizo referencia a las preferencias, lo que aludía a todas las señales que mencioné anteriormente, en particular la rel=”canonical”.
El SEO técnico a menudo se trata de reforzar las preferencias
La descripción que hace Mueller del SEO técnico como “susurro de los motores de búsqueda” es útil porque capta cuánto del SEO implica reforzar sus preferencias sobre qué URL se rastrean, qué contenido se elige para clasificar e indicar qué páginas de un sitio web son las más importantes. Google aún puede elegir una versión canónica por sí solo, pero las señales consistentes aumentan las posibilidades de que elija la versión que desea el propietario del sitio.
Eso lo convierte en un buen ejemplo de lo que se trata el SEO: facilitar a Google el rastreo, la indexación y la comprensión del contenido. Esa es realmente la esencia del SEO. Se trata de ser claro y coherente en el contenido, las URL, los enlaces internos, la navegación general del sitio e incluso en mostrar el HTML más limpio, incluido el HTML semántico (lo que facilita a Google anotar una página web).
El HTML semántico se puede utilizar para identificar claramente el contenido principal de una página web. Puede ayudar directamente a Google a centrarse en lo que se llama contenido central, que probablemente se utiliza para la anotación central de Google. La anotación central es un resumen del tema principal de la página web.
La documentación de canonicalización de Google explica:
«Cuando Google indexa una página, determina el contenido principal (o pieza central) de cada página. Si Google encuentra varias páginas que parecen ser iguales o el contenido principal es muy similar, elige la página que, basándose en los factores (o señales) recopilados por el proceso de indexación, es objetivamente la más completa y útil para los usuarios de búsqueda, y la marca como canónica. La página canónica se rastreará con mayor regularidad; los duplicados se rastrean con menos frecuencia para reducir la carga de rastreo en los sitios».
SEO técnico y ser coherente
Volviendo atrás para tener una vista a nivel de bosque, las URL duplicadas en realidad se deben a que un sitio web no es coherente. No suele considerarse que la coherencia tenga que ver con el SEO, pero en realidad sí lo tiene, a nivel general. Cada vez que creaba un nuevo sitio web, siempre tenía un plan sobre cómo hacerlo consistente, desde las URL hasta los temas, y también cómo poder expandirlo de manera consistente a medida que el sitio web crece para cubrir más temas, para incorporarlo.
Comidas para llevar
- Varias URL para el mismo contenido no causan penalización ni descenso de clasificación.
- Google normalmente elegirá una versión para conservar
- Los propietarios de sitios pueden influir en esa elección a través de señales técnicas consistentes.
- El verdadero problema son las señales contradictorias, no el contenido duplicado en sí.
- El SEO técnico a menudo se reduce a reforzar preferencias claras y monitorear si Google las recoge.
- La visión del SEO a nivel de bosque puede considerarse coherente
Imagen destacada de Shutterstock/Andrey_Kuzmin


