Google señala silenciosamente que NotebookLM ignora Robots.txt

Fecha:

--Advertisement--spot_img

Google ha actualizado silenciosamente su lista de recuperadores activados por el usuario con nueva documentación para Google NotebookLM. La importancia de este cambio aparentemente menor es que está claro que Google NotebookLM no obedecerá al archivo robots.txt.

Cuaderno de GoogleLM

NotebookLM es una herramienta de investigación y redacción de inteligencia artificial que permite a los usuarios agregar la URL de una página web, que procesará el contenido y luego les permitirá hacer una variedad de preguntas y generar resúmenes basados ​​en el contenido.

La herramienta de Google puede crear automáticamente un mapa mental interactivo que organiza temas de un sitio web y extrae conclusiones de él.

Los captadores activados por el usuario ignoran Robots.txt

Los captadores activados por el usuario de Google son agentes web activados por los usuarios y, de forma predeterminada, ignoran el protocolo robots.txt.

Según la documentación de captadores activados por el usuario de Google:

«Debido a que la búsqueda fue solicitada por un usuario, estos buscadores generalmente ignoran las reglas de robots.txt».

Google-NotebookLM ignora Robots.txt

El propósito de robots.txt es brindar a los editores control sobre los robots que indexan páginas web. Pero agentes como el buscador Google-NotebookLM no indexan contenido web, sino que actúan en nombre de los usuarios que interactúan con el contenido del sitio web a través de NotebookLM de Google.

Cómo bloquear NotebookLM

Google utiliza el Google-NotebookLM agente de usuario al extraer el contenido del sitio web. Por lo tanto, es posible que los editores que deseen impedir que los usuarios accedan a su contenido puedan crear reglas que bloqueen automáticamente a ese agente de usuario. Por ejemplo, una solución sencilla para los editores de WordPress es utilizar Wordfence para crear una regla personalizada para bloquear a todos los visitantes del sitio web que utilizan el agente de usuario Google-NotebookLM.

LEER  Cómo automatizar la agrupación de palabras clave de SEO por intención de búsqueda con Python

Otra forma de hacerlo es con .htaccess usando la siguiente regla:


RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} Google-NotebookLM (NC)
RewriteRule .* - (F,L)
--Advertisement--spot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img

Popular

spot_img

Más como esto
Relacionada

El impacto que la IA está teniendo en el ecosistema del...

No soy alguien que haya bebido mucho AI Kool...

ChatGPT consigue compras y lo que impulsa las citas de IA

Bienvenido al Pulse de la semana: las actualizaciones afectan...

El Alpha no es un seguimiento de LLM

Adobe acaba de pagar 1.900 millones de dólares por...

Cómo rediseñar los flujos de trabajo de contenido SEO

Es oficialmente el fin de la búsqueda orgánica tal...