Análisis de la combinación de modelos de filtrado de información
El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una perso...
- Autores:
-
Monroy Vecino, Olga Lucía
- Tipo de recurso:
- Fecha de publicación:
- 2003
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/3331
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/3331
- Palabra clave:
- Information retrieval
Selective dissemination of information
Information storage systems
Information retrieval systems
Search strategies
Systems engineering
Computer science
Investigations
Analysis
Information overload
Content-based filtering (Cognitive)
Collaborative filtering (Social)
Recuperación de información
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Estrategias de búsqueda
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Sobrecarga de información
Filtrado de basado en contenido (Cognitivo)
Filtrado colaborativo (Social)
EachMovie
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_9443cf96771c840816b67ea0cc12e9d8 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/3331 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Análisis de la combinación de modelos de filtrado de información |
dc.title.translated.eng.fl_str_mv |
Analysis of the combination of information filtering models |
title |
Análisis de la combinación de modelos de filtrado de información |
spellingShingle |
Análisis de la combinación de modelos de filtrado de información Information retrieval Selective dissemination of information Information storage systems Information retrieval systems Search strategies Systems engineering Computer science Investigations Analysis Information overload Content-based filtering (Cognitive) Collaborative filtering (Social) Recuperación de información Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Estrategias de búsqueda Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis Sobrecarga de información Filtrado de basado en contenido (Cognitivo) Filtrado colaborativo (Social) EachMovie |
title_short |
Análisis de la combinación de modelos de filtrado de información |
title_full |
Análisis de la combinación de modelos de filtrado de información |
title_fullStr |
Análisis de la combinación de modelos de filtrado de información |
title_full_unstemmed |
Análisis de la combinación de modelos de filtrado de información |
title_sort |
Análisis de la combinación de modelos de filtrado de información |
dc.creator.fl_str_mv |
Monroy Vecino, Olga Lucía |
dc.contributor.advisor.spa.fl_str_mv |
Pérez Alcázar, José de Jesús |
dc.contributor.author.spa.fl_str_mv |
Monroy Vecino, Olga Lucía |
dc.contributor.cvlac.*.fl_str_mv |
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038 |
dc.contributor.corporatename.spa.fl_str_mv |
Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM) |
dc.contributor.researchgroup.spa.fl_str_mv |
Grupo de Investigación Tecnologías de Información - GTI Grupo de Investigaciones Clínicas |
dc.subject.keywords.eng.fl_str_mv |
Information retrieval Selective dissemination of information Information storage systems Information retrieval systems Search strategies Systems engineering Computer science Investigations Analysis Information overload Content-based filtering (Cognitive) Collaborative filtering (Social) |
topic |
Information retrieval Selective dissemination of information Information storage systems Information retrieval systems Search strategies Systems engineering Computer science Investigations Analysis Information overload Content-based filtering (Cognitive) Collaborative filtering (Social) Recuperación de información Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Estrategias de búsqueda Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis Sobrecarga de información Filtrado de basado en contenido (Cognitivo) Filtrado colaborativo (Social) EachMovie |
dc.subject.lemb.spa.fl_str_mv |
Recuperación de información Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Estrategias de búsqueda Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis |
dc.subject.proposal.none.fl_str_mv |
Sobrecarga de información Filtrado de basado en contenido (Cognitivo) Filtrado colaborativo (Social) EachMovie |
description |
El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos. |
publishDate |
2003 |
dc.date.issued.none.fl_str_mv |
2003-06-03 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T21:32:20Z |
dc.date.available.none.fl_str_mv |
2020-06-26T21:32:20Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.local.spa.fl_str_mv |
Tesis |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/3331 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/3331 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Monroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM Armtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995. Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999. Balabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997. Basu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988. Baudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999. Belkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992. Bradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000 Breese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998. Bueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001. Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999. Compaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001 Compendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002 Cotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000. Cotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000. Delgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988. Delgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001. Fisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.html Gokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999. Goldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992. Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999 Herlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999 -------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000. Jirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdf Lieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995 Maes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994. Melville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001. Papadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997. Pazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996. Polcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000. Porter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/ Resnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997. Sánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mx Sarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000 -------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001 Sarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998. Soboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999. Van Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdf Van Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979. Vel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997 Wang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9 Wise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995 Zazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Maestría en Ciencias Computacionales |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/3331/1/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3331/2/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpg |
bitstream.checksum.fl_str_mv |
9cdedee1c3a29cc94deeaa7302cde227 b3b25e520a5901f2bf5c9537c0273d5e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277729947746304 |
spelling |
Pérez Alcázar, José de Jesús38f31005-c259-48e5-845c-ac95c39cc2b9Monroy Vecino, Olga Lucíacd365a2d-d33c-434e-8928-4c34973d0d64https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000274038Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM)Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T21:32:20Z2020-06-26T21:32:20Z2003-06-03http://hdl.handle.net/20.500.12749/3331instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEl tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información. Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura. Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos. Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos.Instituto Tecnológico de Estudios Superiores de Monterrey ITESMINTRODUCCIÓN 10 1. CONCEPTOS GENERALES 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Efectividad y Eficiencia. 15 1.1.2 Relevancia. 16 1.1.3 Modelos de recuperación de Información. 17 1.1.3.1 Vista lógica o representación de los documentos. 17 1.1.3.2 Evolución de los sistemas de recuperación de información. 18 1.1.3.3 Taxonomía. 19 1.1.3.4 Descripción de un modelo de Recuperación de Información. 22 1.1.3.5 Modelos Teóricos alternativos. 24 1.1.3.6 Modelos Algebraicos alternativos. 25 1.1.3.7 Modelos Probabilísticos alternativos. 27 1.2 FILTRADO DE INFORMACIÓN 29 1.3 SISTEMAS DE RECOMENDACIÓN 31 1.4 DSI. DISEMINACIÓN SELECTIVA DE INFORMACIÓN 33 2. MODELOS DE FILTRADO 35 2.1 FILTRADO BASADO EN CONTENIDO 35 2.2 FILTRADO COLABORATIVO 40 2.2.1 Algoritmos de Filtrado Colaborativo basados en Memoria. 43 pág. 2.2.2 Algoritmos de Filtrado Colaborativo basados en Modelo. 45 2.2.2.1 Redes Bayesianas. 45 2.2.2.2 Agrupamiento o Clustering. 45 2.2.2.3 Aproximación basada en reglas. 46 3. INTEGRACIÓN DE FILTRADO COLABORATIVO Y POR CONTENIDO 47 3.1 VISIÓN GENERAL DE LA INTEGRACIÓN DE FILTRADO 47 COLABORATIVO Y POR CONTENIDO 3.2 UNA ALTERNATIVA DE INTEGRACIÓN. 50 3.2.1 Integración modelo colaborativo y basado en contenido 51 orientado por objetivos. 3.2.1.1 Arquitectura del Modelo. 52 3.2.1.2 Funcionalidad. 53 3.2.2 Uso de información social y basada en contenido para hacer 54 recomendaciones. Recomendación como un problema de clasificación. 3.2.3 Filtrado de información Colaborativo Basado en Contenido, 56 con el uso de agentes cooperativos. 3.3 EJEMPLOS DE SISTEMAS BASADOS EN CONTENIDO, 57 COLABORATIVOS O HÍBRIDOS 4. IMPLEMENTACION DE MODELOS DE INTEGRACION 59 4.1 HERRAMIENTAS UTILIZADAS 59 4.1.1 Base de datos de EachMovie. 59 4.1.2 Java y Oracle. 59 4.2 MÉTRICAS 60 4.3 PROPUESTAS DE INTEGRACIÓN DE MODELOS DE FILTRADO 63 4.3.1 Algoritmo de Filtrado Colaborativo. 63 4.3.2 Algoritmo de Filtrado por Contenido. 63 4.3.3 Modelo híbrido de Recomendación de Información: Filtrado 66 Colaborativo Mejorado por Contenido. 4.3.3.1 Descripción del Sistema. 67 4.3.3.2 Resultados obtenidos. 70 4.3.4 Modelo Combinado para Recomendación de información, usando 72 Filtrado basado en Contenido y Colaborativo. 4.3.4.1 Descripción del sistema. 72 4.3.4.2 Resultados obtenidos. 74 4.3.5 Combinación de Filtrado Basado en Contenido y Colaborativo 76 manteniendo los dos modelos separados. 5. ANÁLISIS DE RESULTADOS 78 6. CONCLUSIONES 85 7. TRABAJO FUTURO 87 8. REFERENCIAS BIBLIOGRÁFICAS 89 BIBLIOGRAFÍA 93 ANEXO A. ALGORITMOSMaestríaThe topic of information overload has been widely discussed in the information management and retrieval literature, but it still remains an unsolved problem. The information for each user comes from many different sources and represents more data than a normal person can handle. Newer applications employ technologies such as automatic collaborative filtering or document rendering and evaluation, using various automated methods, to assist users in their information reception and analysis tasks. It starts from the basic concepts of Information Retrieval as a prelude to the task of Filtering Information and systems that allow, in addition to responding to a query from a user, recommending a set of items that may also be of interest to you, which is what known as Recommendation Systems. The models used for information filtering: Content-Based Filtering (Cognitive) and Collaborative Filtering (Social), are studied separately and later integrated into the proposals that seek to minimize the weaknesses of each model. A recommendation system based on filtering by pure content, recommends items similar to those that the user has given a high rating in the past, on the other hand, a recommendation system with pure collaborative filtering identifies users with similar tastes, to recommend to the user the items they liked. A hybrid system can incorporate the advantages of both systems and minimize the disadvantages that each model presents in its pure form. As a preamble to the integration proposals, some application examples of known recommender systems are briefly described, such as Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher among others, which are systems based on content filtering, collaborative or hybrid. For the test of each of the studied models, the EachMovie Database was used, which is a compilation of movie information, made by the Compaq Research Center, which ran the recommendation service for 18 months, to experiment with the collaborative filtering system. During this time, 72,916 users gave 2,811,983 ratings (numerical ratings) for 1,628 different films (films and videos). This data set is available so that it can be used by researchers in the collaborative filtering area to test their algorithms.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaAnálisis de la combinación de modelos de filtrado de informaciónAnalysis of the combination of information filtering modelsMagíster en Ciencias ComputacionalesBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Ciencias Computacionalesinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMInformation retrievalSelective dissemination of informationInformation storage systemsInformation retrieval systemsSearch strategiesSystems engineeringComputer scienceInvestigationsAnalysisInformation overloadContent-based filtering (Cognitive)Collaborative filtering (Social)Recuperación de informaciónDiseminación selectiva de la informaciónSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónEstrategias de búsquedaIngeniería de sistemasCiencias computacionalesInvestigacionesAnálisisSobrecarga de informaciónFiltrado de basado en contenido (Cognitivo)Filtrado colaborativo (Social)EachMovieMonroy Vecino, Olga Lucía (2003). Análisis de la combinación de modelos de filtrado de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESMArmtrong, R., Freitag, D., Joachims, T., and Mitchell, T. WebWatcher: A learning apprentice for the world wide web”. http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-6/web-agent/www/project-home.html 1995.Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Capítulos 1 al 5. Hatlow, England. Addison Wesley. 1999.Balabanovic, M. and Shoham Y. Fab: Content-Based, Collaborative Recommendation. Communicatios of the ACM, 40(3):66-72. March 1997.Basu, C., Hirsh, H., and Cohen, W. Recommendation as Classification: Using Social and Content-Based Information in Recommendation. http://citeseer.nj.nec.com/basu98recommendation.html 1988.Baudisch, P. Joining Collaborative and Content-based filtering. German National Research Center for Information Technolgy GMD. Darmstadt, Germany. http://www.darmstadt.gmd.de/~baudisch/Publications 1999.Belkin, N.J. and Croft, W. B. Information Filtering and Information Retrieval: Two Sides of the Same Coin. Communicatios of the ACM, 35(12):29-38. December 1992.Bradley, K., Rafter, R., and Smyth, B. Case-Based User Profiling for Content Personalisation. http://kermit.ucm.ie/casper/ah2000bradley.ps 2000Breese, J., Heckerman, D., and Kadie, C. Empirical Analysis of Predictive Alforithms for Collaborative Filtering. In Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. Madison, 1998.Bueno, D., Conejo, R., and David, A. METIOREW: An Objective Oriented Content Based and Collaborative Recommending System. http://wwwis.win.tue.nl/ah2001/papers/METIOREW.pdf 2001.Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., and Sartin, M. Combinig Content-Based and Collaborative Filters in an Online Newspaper. http://citeseer.nj.nec.com/claypool99combining.html 1999.Compaq Systems Research Center. EachMovie Collaborative Filtering data set. http://www.research.compaq.com/SCR/eachmovie/ 1.997 – 2001Compendio Tesis y otros Trabajos de Grado. Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC). Bogotá, Colombia. 2002Cotter, P. y Smyth, B. PTV: Intelligent personalized tv guides. http://www.cs.ucd.ie/students/pcotter/default.htm In Twelfth Conference on Innovative Applications of Artificial Intelligence, 2000.Cotter, P. y Smyth, B. PTV, Personalised Services for Digital TV http://www.ptvplus.com/ptv/home.jsp 2000.Delgado, J., Ishii, N., and Ura, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. http://citeseer.nj.nec.com/delgado98intelligent.html 1988.Delgado, J. e Ishii, N. Multi-Agent Learning in Recommender Systems for Informaction Filtering on the Internet. http://www.informatik.uni-trier.de/~ley/db/indices/a-tree/i/Ishii:Naohiro.html 2001.Fisher, D., Hildrum, K., Hong, J., Newman, M., Thomas, M. and Vuduc, R. SWAMI: a framework for collaborative filtering algorithm development and evaluation. http://guir.cs.berkeley.edu/projects/swami/swami-paper/paper.htmlGokhale, Anuja. Improvements to Collaborative Filtering Algorithms. Worcester Polytechnic Institute. http://www.cs.wpi.edu/~claypool/ms/cf-improve/cf-improve.ps 1999.Goldberg, D., Nichols, D., Oki, B. M., and Terry, D. Using Collaborative Filtering to weave an Information Tapestry. Communicatios of the ACM, 35(12):61-70. December 1992.Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. And Riedl, J. Movielens: Helping you find the right movies. http://www.movielens.umn.edu/ 1999Herlocker, J., Konstan, J., Borchers, A. and Riedl, J. An algorithmic framework for performing collaborative filtering. In SIGIR’99: Proceedings of the 22nd Anual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999-------- Explaining Collaborative Filtering Recommendations. http://cs.oregonstate.edu/~herlock/papers/explanations_cscw2000.pdf 2000.Jirón, M. y Olivares, L. DSI Escolar: Un timón para no naufragar en internet. http://www.bibliotecarios.cl/conferencia/documentos/jiron.pdfLieberman, H. Letizia: An Agent that Assists Web Browsing. http://lieber.www.media.mit.edu/people/lieber/Lieberary/Letizia/Letizia-AAAI/Letizia.ps 1995Maes, P.Agents that Reduce Work and Information Overload. Communication of the ACM, 37 (7):30-40. July 1994.Melville, P., Mooney, R., Nagarajan, R. Content-Boosted Collaborative Filtering. In Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, 2001.Papadimitriou, C., Ragharan, P., Tamaki, H. and Vempala, S. Latente Semantic Indexing: A probabilistic Analysis. http://citeseer.nj.nec.com/papadimitriou98latent.html 1.997.Pazzani, M., Muramatzu, J., and Billsus, D. Syskill & Webert: Identifying interesting web sites. http://www.ics.uci.edu/~pazzani/Publications/aaai-webert.pdf 1996.Polcicová, G. and Návrat, P. Combining Content-based and Collaborative Filtering. Slovak University of Technology, Department of Computer Science and Engineering, Bratislava, Slovakia. http://www.dcs.elf.stuba.sk 2000.Porter, M. The Porter Stemming Algorithm. http://www.tartarus.org/~martin/PorterStemmer/Resnick, P., Varian, H.R., and Guest Editors. Recommender Systems. Communicatios of the ACM, 40(3):56-58. March 1997.Sánchez Pereira, A. La Diseminación Selectiva de Información a través de Internet. Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México. http://dgbiblio.unam.mxSarwar, B., Karypis, G., Konstant, J., and Riedl, J. Analysis of Recommendation Algorithms for E-Commerce. In Proceedings of the ACM EC’00 Conference. Minneapolis, MN. 2000-------- Item-based Collaborative Filtering Recommendation Algorithms. In WWW10 Conference. May, 2001Sarwar, B., Konstan, J., Borchers, A., Herlocker, J., Miller, B. y Riedl, J.. Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System. http://www.cs.umn.edu/Research/GroupLens/papers/pdf/filterbot-CSCW98.pdf Copyrigth ACM 1998.Soboroff, I. y Nicholas, C. Combining content and collaboration in text filtering. http://citeseer.nj.nec.com/soboroff99combining.html 1.999.Van Metern, R. and Van Someren, M. Using Content-Based Filtering for Recommendation. http://www.ics.forth.gr/~potamias/mlnia/paper_6.pdfVan Rijsbergen, C. J. Information Retrieval. Computing Science. Computing Science University of Glasgow. http://www.dcs.gla.ac.uk/Keith/Chapter.1/ch.1.html 1979.Vel, O., and Nesbitt, S. A Collaborative filtering Agent System for Dynamic Virtual Communities on the web. http://citeseer.nj.nec.com/de-collaborative.html 1997Wang, P. Java. Con programación orientada a objetos y aplicaciones en la WWW. International Thomson Editores. 2000. Pág. 2-9Wise, J., Thomas, J., Pennock, K., Lantip, D., Pottier, M., Schur, A., and Crow, V. Visualizing the non-visual: spatial analysis and interaccion with information from text documents. Pacific Northwest Lab, Richland, WA. 1.995Zazo Rodríguez, A, Figuerola, P., Alonso, J., y Gómez, R. Recuperación de información utilizando el modelo vectorial. Participación en el taller CLEF-2001. Informe Técnico. http://tejo.usal.es/inftec/2002/DPTOIA-IT-2002-006.pdf 2002ORIGINAL2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf2003_Tesis_Olga_Lucia_Monroy_Vecino.pdfTesisapplication/pdf764983https://repository.unab.edu.co/bitstream/20.500.12749/3331/1/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf9cdedee1c3a29cc94deeaa7302cde227MD51open accessTHUMBNAIL2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpg2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpgIM Thumbnailimage/jpeg4362https://repository.unab.edu.co/bitstream/20.500.12749/3331/2/2003_Tesis_Olga_Lucia_Monroy_Vecino.pdf.jpgb3b25e520a5901f2bf5c9537c0273d5eMD52open access20.500.12749/3331oai:repository.unab.edu.co:20.500.12749/33312024-01-20 09:52:33.639open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |