miércoles, 28 de septiembre de 2011

NOTICIAS DE INTERES


Un sistema inteligente de recuperación y difusión de información
Mercurio es un servicio personalizado de noticias, basado en técnicas de análisis del contenido textual (categorización de textos) [Sebastiani, 99] y de recuperación de información [Baeza-Yates and Ribeiro-Neto, 99]), así como en modelado de usuario [Gervás et al., 99], que selecciona la información relevante para cada usuario. Gracias a Mercurio, cualquier usuario podrá recibir, a través del correo electrónico, un mensaje diario con las noticias que el sistema detecta como relevantes según sus intereses, previamente definidos en el momento de registrarse en el sistema.
Un usuario se registra en el sistema proporcionando una dirección de correo electrónico, un login y un password. A continuación, construye un perfil o modelo de usuario a partir de sus preferencias: días de la semana en los que quiere recibir noticias, número máximo de noticias por mensaje, desactivación temporal del servicio y delimitación de los intereses del usuario. Estos intereses se pueden definir conforme a las secciones del periódico ABC, a un conjunto de categorías presentado como sistema alternativo de clasificación (que se corresponden con las categorías de primer nivel de Yahoo España) y a los términos elegidos por el propio usuario.
Hay que recordar que también incorpora un sistema de búsqueda que permite al usuario llevar a cabo búsquedas básicas sobre las noticias del día, ya que el usuario puede estar interesado en una información concreta, pero no incluida en su perfil. El usuario podrá modificar su modelo, sabiendo que el sistema se ejecuta cada día, una sola vez, y a primera hora de la mañana, en el momento en que las noticias están disponibles.
El mensaje recibido por el usuario contiene: su nombre, la fecha y, de cada noticia, el título, su relevancia (en porcentaje), un resumen y un enlace a la noticia completa en el periódico digital. Al final del mensaje se muestran los intereses que tiene especificados en su perfil, en función de las secciones, categorías y términos elegidos.
Desde un punto de vista técnico, es relevante señalar que la representación de la información se obtiene gracias a la aplicación a cada texto del modelo del espacio vectorial [Salton, 89]. La representación de las categorías se realiza con el texto asociado a las páginas web de las categorías de primer nivel de Yahoo España. Los términos se representan también mediante el modelo del espacio vectorial.
Para realizar la selección se categorizan automáticamente las noticias respecto al sistema alternativo de clasificación y se seleccionan las noticias más relevantes con respecto a los términos elegidos por el usuario. Además, las noticias se procesan para confirmar que pertenecen a algunas de las secciones elegidas por el usuario. Finalmente, los resultados que se obtienen se integran para obtener un valor final de relevancia.

No hay comentarios:

Publicar un comentario