Análisis de la combinación de modelos de filtrado de información

El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una perso...

Full description

Autores:
Monroy Vecino, Olga Lucía
Tipo de recurso:
Fecha de publicación:
2003
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/3331
Acceso en línea:
http://hdl.handle.net/20.500.12749/3331
Palabra clave:
Information retrieval
Selective dissemination of information
Information storage systems
Information retrieval systems
Search strategies
Systems engineering
Computer science
Investigations
Analysis
Information overload
Content-based filtering (Cognitive)
Collaborative filtering (Social)
Recuperación de información
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Estrategias de búsqueda
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Sobrecarga de información
Filtrado de basado en contenido (Cognitivo)
Filtrado colaborativo (Social)
EachMovie
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_9443cf96771c840816b67ea0cc12e9d8
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/3331
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Análisis de la combinación de modelos de filtrado de información
dc.title.translated.eng.fl_str_mv Analysis of the combination of information filtering models
title Análisis de la combinación de modelos de filtrado de información
spellingShingle Análisis de la combinación de modelos de filtrado de información
Information retrieval
Selective dissemination of information
Information storage systems
Information retrieval systems
Search strategies
Systems engineering
Computer science
Investigations
Analysis
Information overload
Content-based filtering (Cognitive)
Collaborative filtering (Social)
Recuperación de información
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Estrategias de búsqueda
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Sobrecarga de información
Filtrado de basado en contenido (Cognitivo)
Filtrado colaborativo (Social)
EachMovie
title_short Análisis de la combinación de modelos de filtrado de información
title_full Análisis de la combinación de modelos de filtrado de información
title_fullStr Análisis de la combinación de modelos de filtrado de información
title_full_unstemmed Análisis de la combinación de modelos de filtrado de información
title_sort Análisis de la combinación de modelos de filtrado de información
dc.creator.fl_str_mv Monroy Vecino, Olga Lucía
dc.contributor.advisor.spa.fl_str_mv Pérez Alcázar, José de Jesús
dc.contributor.author.spa.fl_str_mv Monroy Vecino, Olga Lucía
dc.contributor.cvlac.*.fl_str_mv https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038
dc.contributor.corporatename.spa.fl_str_mv Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM)
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Investigación Tecnologías de Información - GTI
Grupo de Investigaciones Clínicas
dc.subject.keywords.eng.fl_str_mv Information retrieval
Selective dissemination of information
Information storage systems
Information retrieval systems
Search strategies
Systems engineering
Computer science
Investigations
Analysis
Information overload
Content-based filtering (Cognitive)
Collaborative filtering (Social)
topic Information retrieval
Selective dissemination of information
Information storage systems
Information retrieval systems
Search strategies
Systems engineering
Computer science
Investigations
Analysis
Information overload
Content-based filtering (Cognitive)
Collaborative filtering (Social)
Recuperación de información
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Estrategias de búsqueda
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Sobrecarga de información
Filtrado de basado en contenido (Cognitivo)
Filtrado colaborativo (Social)
EachMovie
dc.subject.lemb.spa.fl_str_mv Recuperación de información
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Estrategias de búsqueda
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
dc.subject.proposal.none.fl_str_mv Sobrecarga de información
Filtrado de basado en contenido (Cognitivo)
Filtrado colaborativo (Social)
EachMovie
description El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos.
publishDate 2003
dc.date.issued.none.fl_str_mv 2003-06-03
dc.date.accessioned.none.fl_str_mv 2020-06-26T21:32:20Z
dc.date.available.none.fl_str_mv 2020-06-26T21:32:20Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.local.spa.fl_str_mv Tesis
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/3331
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
url http://hdl.handle.net/20.500.12749/3331
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Monroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM
Armtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995.
Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999.
Balabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997.
Basu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988.
Baudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999.
Belkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992.
Bradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000
Breese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998.
Bueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001.
Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999.
Compaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001
Compendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002
Cotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000.
Cotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000.
Delgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988.
Delgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001.
Fisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.html
Gokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999.
Goldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992.
Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999
Herlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999
-------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000.
Jirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdf
Lieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995
Maes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994.
Melville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001.
Papadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997.
Pazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996.
Polcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000.
Porter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/
Resnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997.
Sánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mx
Sarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000
-------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001
Sarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998.
Soboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999.
Van Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdf
Van Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979.
Vel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997
Wang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9
Wise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995
Zazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 2.5 Colombia
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Bucaramanga (Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Maestría en Ciencias Computacionales
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/3331/1/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/3331/2/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpg
bitstream.checksum.fl_str_mv 9cdedee1c3a29cc94deeaa7302cde227
b3b25e520a5901f2bf5c9537c0273d5e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814277729947746304
spelling Pérez Alcázar, José de Jesús38f31005-c259-48e5-845c-ac95c39cc2b9Monroy Vecino, Olga Lucíacd365a2d-d33c-434e-8928-4c34973d0d64https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM)Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T21:32:20Z2020-06-26T21:32:20Z2003-06-03http://hdl.handle.net/20.500.12749/3331instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEl tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos.Instituto Tecnológico de Estudios Superiores de Monterrey ITESMINTRODUCCIÓN 10 1. CONCEPTOS GENERALES 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Efectividad y Eficiencia. 15 1.1.2 Relevancia. 16 1.1.3 Modelos de recuperación de Información. 17 1.1.3.1 Vista lógica o representación de los documentos. 17 1.1.3.2 Evolución de los sistemas de recuperación de información. 18 1.1.3.3 Taxonomía. 19 1.1.3.4 Descripción de un modelo de Recuperación de Información. 22 1.1.3.5 Modelos Teóricos alternativos. 24 1.1.3.6 Modelos Algebraicos alternativos. 25 1.1.3.7 Modelos Probabilísticos alternativos. 27 1.2 FILTRADO DE INFORMACIÓN 29 1.3 SISTEMAS DE RECOMENDACIÓN 31 1.4 DSI. DISEMINACIÓN SELECTIVA DE INFORMACIÓN 33 2. MODELOS DE FILTRADO 35 2.1 FILTRADO BASADO EN CONTENIDO 35 2.2 FILTRADO COLABORATIVO 40 2.2.1 Algoritmos de Filtrado Colaborativo basados en Memoria. 43 pág. 2.2.2 Algoritmos de Filtrado Colaborativo basados en Modelo. 45 2.2.2.1 Redes Bayesianas. 45 2.2.2.2 Agrupamiento o Clustering. 45 2.2.2.3 Aproximación basada en reglas. 46 3. INTEGRACIÓN DE FILTRADO COLABORATIVO Y POR CONTENIDO 47 3.1 VISIÓN GENERAL DE LA INTEGRACIÓN DE FILTRADO 47 COLABORATIVO Y POR CONTENIDO 3.2 UNA ALTERNATIVA DE INTEGRACIÓN. 50 3.2.1 Integración modelo colaborativo y basado en contenido 51 orientado por objetivos. 3.2.1.1 Arquitectura del Modelo. 52 3.2.1.2 Funcionalidad. 53 3.2.2 Uso de información social y basada en contenido para hacer 54 recomendaciones. Recomendación como un problema de clasificación. 3.2.3 Filtrado de información Colaborativo Basado en Contenido, 56 con el uso de agentes cooperativos. 3.3 EJEMPLOS DE SISTEMAS BASADOS EN CONTENIDO, 57 COLABORATIVOS O HÍBRIDOS 4. IMPLEMENTACION DE MODELOS DE INTEGRACION 59 4.1 HERRAMIENTAS UTILIZADAS 59 4.1.1 Base de datos de EachMovie. 59 4.1.2 Java y Oracle. 59 4.2 MÉTRICAS 60 4.3 PROPUESTAS DE INTEGRACIÓN DE MODELOS DE FILTRADO 63 4.3.1 Algoritmo de Filtrado Colaborativo. 63 4.3.2 Algoritmo de Filtrado por Contenido. 63 4.3.3 Modelo híbrido de Recomendación de Información: Filtrado 66 Colaborativo Mejorado por Contenido. 4.3.3.1 Descripción del Sistema. 67 4.3.3.2 Resultados obtenidos. 70 4.3.4 Modelo Combinado para Recomendación de información, usando 72 Filtrado basado en Contenido y Colaborativo. 4.3.4.1 Descripción del sistema. 72 4.3.4.2 Resultados obtenidos. 74 4.3.5 Combinación de Filtrado Basado en Contenido y Colaborativo 76 manteniendo los dos modelos separados. 5. ANÁLISIS DE RESULTADOS 78 6. CONCLUSIONES 85 7. TRABAJO FUTURO 87 8. REFERENCIAS BIBLIOGRÁFICAS 89 BIBLIOGRAFÍA 93 ANEXO A. ALGORITMOSMaestríaThe topic of information overload has been widely discussed in the information management and retrieval literature, but it still remains an unsolved problem. The information for each user comes from many different sources and represents more data than a normal person can handle. Newer applications employ technologies such as automatic collaborative filtering or document rendering and evaluation, using various automated methods, to assist users in their information reception and analysis tasks. It starts from the basic concepts of Information Retrieval as a prelude to the task of Filtering Information and systems that allow, in addition to responding to a query from a user, recommending a set of items that may also be of interest to you, which is what known as Recommendation Systems. The models used for information filtering: Content-Based Filtering (Cognitive) and Collaborative Filtering (Social), are studied separately and later integrated into the proposals that seek to minimize the weaknesses of each model. A recommendation system based on filtering by pure content, recommends items similar to those that the user has given a high rating in the past, on the other hand, a recommendation system with pure collaborative filtering identifies users with similar tastes, to recommend to the user the items they liked. A hybrid system can incorporate the advantages of both systems and minimize the disadvantages that each model presents in its pure form. As a preamble to the integration proposals, some application examples of known recommender systems are briefly described, such as Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher among others, which are systems based on content filtering, collaborative or hybrid. For the test of each of the studied models, the EachMovie Database was used, which is a compilation of movie information, made by the Compaq Research Center, which ran the recommendation service for 18 months, to experiment with the collaborative filtering system. During this time, 72,916 users gave 2,811,983 ratings (numerical ratings) for 1,628 different films (films and videos). This data set is available so that it can be used by researchers in the collaborative filtering area to test their algorithms.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaAnálisis de la combinación de modelos de filtrado de informaciónAnalysis of the combination of information filtering modelsMagíster en Ciencias ComputacionalesBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Ciencias Computacionalesinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMInformation retrievalSelective dissemination of informationInformation storage systemsInformation retrieval systemsSearch strategiesSystems engineeringComputer scienceInvestigationsAnalysisInformation overloadContent-based filtering (Cognitive)Collaborative filtering (Social)Recuperación de informaciónDiseminación selectiva de la informaciónSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónEstrategias de búsquedaIngeniería de sistemasCiencias computacionalesInvestigacionesAnálisisSobrecarga de informaciónFiltrado de basado en contenido (Cognitivo)Filtrado colaborativo (Social)EachMovieMonroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESMArmtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995.Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999.Balabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997.Basu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988.Baudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999.Belkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992.Bradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000Breese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998.Bueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001.Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999.Compaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001Compendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002Cotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000.Cotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000.Delgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988.Delgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001.Fisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.htmlGokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999.Goldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992.Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999Herlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999-------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000.Jirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdfLieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995Maes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994.Melville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001.Papadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997.Pazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996.Polcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000.Porter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/Resnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997.Sánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mxSarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000-------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001Sarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998.Soboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999.Van Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdfVan Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979.Vel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997Wang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9Wise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995Zazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002ORIGINAL2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf2003_Tesis_Olga_Lucia_Monroy_Vecino.pdfTesisapplication/pdf764983https://repository.unab.edu.co/bitstream/20.500.12749/3331/1/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf9cdedee1c3a29cc94deeaa7302cde227MD51open accessTHUMBNAIL2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpg2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpgIM Thumbnailimage/jpeg4362https://repository.unab.edu.co/bitstream/20.500.12749/3331/2/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpgb3b25e520a5901f2bf5c9537c0273d5eMD52open access20.500.12749/3331oai:repository.unab.edu.co:20.500.12749/33312024-01-20 09:52:33.639open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co