Google señala silenciosamente que NotebookLM ignora Robots.txt

Fecha:

--Advertisement--spot_img

Google ha actualizado silenciosamente su lista de recuperadores activados por el usuario con nueva documentación para Google NotebookLM. La importancia de este cambio aparentemente menor es que está claro que Google NotebookLM no obedecerá al archivo robots.txt.

Cuaderno de GoogleLM

NotebookLM es una herramienta de investigación y redacción de inteligencia artificial que permite a los usuarios agregar la URL de una página web, que procesará el contenido y luego les permitirá hacer una variedad de preguntas y generar resúmenes basados ​​en el contenido.

La herramienta de Google puede crear automáticamente un mapa mental interactivo que organiza temas de un sitio web y extrae conclusiones de él.

Los captadores activados por el usuario ignoran Robots.txt

Los captadores activados por el usuario de Google son agentes web activados por los usuarios y, de forma predeterminada, ignoran el protocolo robots.txt.

Según la documentación de captadores activados por el usuario de Google:

«Debido a que la búsqueda fue solicitada por un usuario, estos buscadores generalmente ignoran las reglas de robots.txt».

Google-NotebookLM ignora Robots.txt

El propósito de robots.txt es brindar a los editores control sobre los robots que indexan páginas web. Pero agentes como el buscador Google-NotebookLM no indexan contenido web, sino que actúan en nombre de los usuarios que interactúan con el contenido del sitio web a través de NotebookLM de Google.

Cómo bloquear NotebookLM

Google utiliza el Google-NotebookLM agente de usuario al extraer el contenido del sitio web. Por lo tanto, es posible que los editores que deseen impedir que los usuarios accedan a su contenido puedan crear reglas que bloqueen automáticamente a ese agente de usuario. Por ejemplo, una solución sencilla para los editores de WordPress es utilizar Wordfence para crear una regla personalizada para bloquear a todos los visitantes del sitio web que utilizan el agente de usuario Google-NotebookLM.

LEER  Estadísticas de marketing de IA Todo líder empresarial debe conocer en 2025

Otra forma de hacerlo es con .htaccess usando la siguiente regla:


RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} Google-NotebookLM (NC)
RewriteRule .* - (F,L)
--Advertisement--spot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img

Popular

spot_img

Más como esto
Relacionada

Google Analytics lanza planificador de escenarios y proyecciones

Google Analytics lanzó Scenario Planner y Projections, dos nuevas...

Queda la mitad del tráfico. La industria del SEO envió ideas...

Antes del lanzamiento de AI Overviews en mayo de...

Cómo los datos propios y cero pueden impulsar su estrategia de...

Actualmente se produce una paradoja interesante en el ámbito...

Google comienza a implementar la actualización de spam de marzo de...

Google comenzó a implementar hoy la actualización de spam...