Google recientemente presentó una nueva patente para una forma de proporcionar resultados de búsqueda basados en el historial de navegación y correo electrónico de un usuario. La patente describe una nueva forma de buscar dentro del contexto de un motor de búsqueda, dentro de una interfaz de correo electrónico y a través de un asistente basado en la voz (mencionado en la patente como un sistema de diálogo basado en la voz).
Un problema que muchas personas tienen es que pueden recordar lo que vieron, pero no pueden recordar dónde lo vieron o cómo lo encontraron. La nueva patente, titulada Generación de respuestas de consulta de la historia de un usuario, resuelve ese problema ayudando a las personas a encontrar información que han visto previamente dentro de una página web o un correo electrónico al permitirles pedir lo que están buscando usando el lenguaje cotidiano como «¿Cuál fue ese artículo que leí la semana pasada sobre el ajedrez?»
El problema que resuelve la invención es que los motores de búsqueda tradicionales no permiten a los usuarios buscar fácilmente su propio historial de navegación o correo electrónico utilizando lenguaje natural. La invención funciona tomando la pregunta hablada o mecanografiada de un usuario, reconociendo que la pregunta está pidiendo contenido previamente visto y luego recuperando los resultados de búsqueda del historial personal del usuario (como el historial o correos electrónicos de su navegador). Para lograr esto, utiliza filtros como fecha, tema o dispositivo utilizado.
Lo novedoso de la invención es la capacidad del sistema para comprender consultas de lenguaje natural vagas o difusas y coincidirlas con las interacciones pasadas específicas de un usuario, incluida la muestra de la versión de una página tal como se veía cuando el usuario originalmente lo vio (una versión en caché de la página web).
Clasificación de consulta (intención) y filtrado
Clasificación de consultas
El sistema primero determina si la intención de la consulta hablada o escrita del usuario es recuperar información previamente accedida. Este proceso se llama clasificación de consultas e implica analizar la redacción de la consulta para detectar la intención. El sistema compara partes de la consulta con patrones conocidos asociados con las preguntas de búsqueda de la historia y utiliza técnicas como análisis semántico y umbrales de similitud para identificar si la intención del usuario es buscar algo que haya visto antes, incluso cuando la redacción es vago o conversacional.
El umbral de similitud es una parte interesante de la invención porque compara lo que el usuario dice o escribe con frases conocidas de búsqueda de la historia para ver si son similares. No está buscando un partido exacto, sino un partido cerrado.
Filtración
La siguiente parte es filtrarse, y ocurre después de que el sistema ha identificado la intención de búsqueda de historial. Luego aplica filtros como el tema, el tiempo o el dispositivo para limitar la búsqueda al contenido del historial personal del usuario que coincida con esos criterios.
El filtro de tiempo es una forma de limitar la búsqueda dentro de un marco de tiempo específico que se menciona o implica en la consulta de búsqueda. Esto ayuda al sistema a reducir los resultados de búsqueda a lo que el usuario está tratando de encontrar. Entonces, si un usuario habla frases como «la semana pasada» o «hace unos días», entonces sabe restringir la consulta a esos marcos de tiempo respectivos.
Una calidad interesante del filtro de tiempo es que se aplica con un nivel de confusión, lo que significa que no es exacto. Entonces, cuando una persona le pide al asistente de voz que encuentre algo de la semana pasada, no hará una búsqueda literal de los últimos siete días, pero lo expandirá a un período de tiempo más largo.
La patente describe la calidad difusa del filtro de tiempo:
«Por ejemplo, la colección del historial del navegador … puede incluir una lista de páginas web a las que el usuario accedió. El motor de búsqueda … puede obtener documentos del índice … basado en los filtros de la consulta formateada.
Por ejemplo, si la consulta formateada … incluye un filtro de fecha (por ejemplo, «la semana pasada») y un filtro de temas (por ejemplo, «historia de ajedrez»), el motor de búsqueda … puede recuperar solo documentos de la colección … que satisfacen estos filtros, es decir, documentos a los que el usuario accedió en la semana anterior que se relacionan con una «historia de ajedrez».
En este ejemplo, el motor de búsqueda … puede aplicar rangos de tiempo difuso al filtro «la semana pasada» para tener en cuenta las inexactitudes en la memoria humana. En particular, mientras que la «semana pasada» se refiere literalmente a los siete días calendario de la semana anterior, el motor de búsqueda … puede buscar documentos en una gama más amplia, por ejemplo, en cualquier momento de las últimas dos semanas «.
Una vez que se clasifica una consulta como solicitando algo que se vio anteriormente, el sistema identifica detalles en la fraseo del usuario que son indicativos de tema, fecha o hora, fuente, dispositivo, remitente o ubicación y los usa como filtros para buscar el historial personal del usuario.
Cada filtro ayuda a reducir el alcance de la búsqueda para que coincida con lo que el usuario está tratando de recordar: por ejemplo, un filtro de temas («receta de pavo») se dirige al tema del contenido; Un filtro de tiempo («la semana pasada») restringe los resultados a cuando se accedió; Un filtro de origen («Whitehouse.gov») limita la búsqueda a sitios web específicos; Un filtro de dispositivo (por ejemplo, «en mi teléfono») restringe aún más los resultados de búsqueda de un determinado dispositivo; Un filtro de remitente («de la abuela») ayuda a localizar correos electrónicos o contenido compartido; y un filtro de ubicación (por ejemplo, «en el trabajo») restringe los resultados a los accedidos en un lugar físico en particular.
Al combinar estos filtros sensibles al contexto, el sistema imita la forma en que las personas recuerdan naturalmente el contenido para ayudar a los usuarios a recuperar exactamente lo que están buscando, incluso cuando su consulta es vaga o incompleta.
Alcance de la búsqueda: lo que se busca
La siguiente parte de la patente se trata de descubrir el alcance de lo que se buscará, lo que se limita a fuentes predefinidas, como el historial de navegadores, versiones en caché de páginas web o correos electrónicos. Entonces, en lugar de buscar en toda la web, el sistema se centra solo en el historial personal del usuario, lo que hace que los resultados sean más relevantes para lo que el usuario está tratando de recordar.
Versiones en caché del contenido previamente visto
Otra característica interesante descrita en la patente es el almacenamiento en caché de la página web. El almacenamiento en caché se refiere a guardar una copia de una página web tal como apareció cuando el usuario la vio originalmente. Esto permite al sistema mostrar al usuario esa versión específica de la página en los resultados de búsqueda, en lugar de la versión actual, que puede haber cambiado o eliminado.
La versión en caché actúa como una instantánea en el tiempo, lo que facilita el usuario reconocer o recordar el contenido que está buscando. Esto es especialmente útil cuando el usuario no recuerda detalles precisos como el nombre de la página o dónde la encontró, pero lo reconocería si lo volvieran a ver. Al mostrar la versión que el usuario realmente vio, el sistema hace que la experiencia de búsqueda sea más alineada con la forma en que las personas recuerdan las cosas.
Aplicaciones potenciales de la invención de patentes
El sistema descrito en la patente se puede aplicar en varios contextos del mundo real donde los usuarios pueden querer recuperar el contenido que han visto anteriormente:
Motores de búsqueda
La patente se refiere varias veces al uso de esta técnica en el contexto de un motor de búsqueda que recupera los resultados no de la web pública, sino del historial personal del usuario, como páginas web y correos electrónicos visitados previamente. Si bien el sistema está diseñado para buscar solo contenido al que el usuario ha accedido previamente, la patente señala que algunas implementaciones también pueden incluir documentos adicionales relevantes para la consulta, incluso si el usuario no los ha visto antes.
Clientes de correo electrónico
El sistema trata los correos electrónicos de acceso previamente como parte del historial de búsqueda. Por ejemplo, puede devolver un correo electrónico antiguo como «Las albóndigas de pavo de la abuela» basadas en consultas vagas de lenguaje natural.
Asistentes de voz
La patente incluye ejemplos de «una búsqueda basada en la voz» donde los usuarios hablan consultas de conversación como «Estoy buscando una receta de pavo que leí en mi teléfono». El sistema maneja el reconocimiento de voz e interpreta la intención de recuperar los resultados relevantes de la historia personal.
Lea la patente completa aquí:
Generando respuestas de consulta del historial de un usuario
Imagen destacada de Shutterstock/Jhvephoto