Sistema de recomendación web basado en la actividad de los usuarios de la Universidad Nacional de Colombia

En este trabajo se presenta un modelo de un sistema de recomendación híbrido web basado en minería de contenido y de uso, para mejorar la experiencia de navegación del usuario; se utiliza como fuente la información anonimizada de los log de navegación obtenidos de la comunidad de la Universidad Naci...

Full description

Autores:
Dussán Sarria, Miguel Darío
Tipo de recurso:
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/11530
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/11530
http://bdigital.unal.edu.co/8964/
Palabra clave:
0 Generalidades / Computer science, information and general works
Minería web
Sistemas de recomendación
Métodos de agrupamiento
Mineríía de texto / Web mining
Recommender systems
Clustering methods
Text mining
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En este trabajo se presenta un modelo de un sistema de recomendación híbrido web basado en minería de contenido y de uso, para mejorar la experiencia de navegación del usuario; se utiliza como fuente la información anonimizada de los log de navegación obtenidos de la comunidad de la Universidad Nacional de Colombia. El sistema, basado en la agrupación de documentos y sesiones web, y la extracción de reglas de asociación de sesiones web, consta de dos etapas: la etapa fuera de línea, que extrae y procesa los documentos y las sesiones web del registro de navegación para generar los patrones de agrupamiento y reglas de asociación necesarios para sus componentes, el recomendador de contenido y el de uso web; y la etapa en línea, que utiliza los recomendadores construidos en la fase anterior para generar recomendaciones para el usuario. Se utiliza la representación de documentos y sesiones web en un espacio vectorial t f - idf, que son agrupados utilizando el algoritmo Bisecting K-Means; para los grupos de sesiones se generan reglas de asociación usando el algoritmo Apriori. La validación del modelo se hizo de forma supervisada, seleccionando un grupo de sesiones web como consulta al sistema, y realizando una encuesta a un grupo de usuarios sobre las recomendaciones generadas. / Abstract. This work presents a model of an hybrid web recommendation system based on content and usage mining, in order to improve the user navigation experience; as information source, the anonymized navigation log from the academic community of Universidad Nacional de Colombia is employed. The system, based on document and web session clustering, and association rules extraction from web sessions, is composed of two stages: in the offline stage, the documents and web sessions are extracted from the navigation log and processed; and the online stage, that uses the identified patterns in the last stage to generate recommendations to the user. In order to validate the proposed model, a supervised approach is adopted, selecting web sessions as the input to the system, and executing a survey to a group of users about the generated recommendations