Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
Web Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. E...
- Autores:
-
Fuentes Mejía, Oscar Fernando
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2001
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/26645
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/26645
- Palabra clave:
- Application of techniques
Behavior patterns
Web usage mining
Search
Data mining
Computer programs
Software architecture
HTML (Document markup language)
Ingeniería de sistemas
Innovaciones tecnológicas
Bases de datos
Programas para computador
Arquitectura de software
HTML (Lenguaje de marcado)
Aplicación de técnicas
Patrones de comportamiento
Búsqueda
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_7d0d117c756aead6333ee4aafc6088d6 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/26645 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
dc.title.translated.spa.fl_str_mv |
Application of web usage mining techniques to search for behavioral patterns |
title |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
spellingShingle |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento Application of techniques Behavior patterns Web usage mining Search Data mining Computer programs Software architecture HTML (Document markup language) Ingeniería de sistemas Innovaciones tecnológicas Bases de datos Programas para computador Arquitectura de software HTML (Lenguaje de marcado) Aplicación de técnicas Patrones de comportamiento Búsqueda |
title_short |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
title_full |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
title_fullStr |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
title_full_unstemmed |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
title_sort |
Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento |
dc.creator.fl_str_mv |
Fuentes Mejía, Oscar Fernando |
dc.contributor.advisor.none.fl_str_mv |
García D., Juan Carlos |
dc.contributor.author.none.fl_str_mv |
Fuentes Mejía, Oscar Fernando |
dc.subject.keywords.spa.fl_str_mv |
Application of techniques Behavior patterns Web usage mining Search Data mining Computer programs Software architecture HTML (Document markup language) |
topic |
Application of techniques Behavior patterns Web usage mining Search Data mining Computer programs Software architecture HTML (Document markup language) Ingeniería de sistemas Innovaciones tecnológicas Bases de datos Programas para computador Arquitectura de software HTML (Lenguaje de marcado) Aplicación de técnicas Patrones de comportamiento Búsqueda |
dc.subject.lemb.spa.fl_str_mv |
Ingeniería de sistemas Innovaciones tecnológicas Bases de datos Programas para computador Arquitectura de software HTML (Lenguaje de marcado) |
dc.subject.proposal.spa.fl_str_mv |
Aplicación de técnicas Patrones de comportamiento Búsqueda |
description |
Web Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial. |
publishDate |
2001 |
dc.date.issued.none.fl_str_mv |
2001 |
dc.date.accessioned.none.fl_str_mv |
2024-09-19T20:07:01Z |
dc.date.available.none.fl_str_mv |
2024-09-19T20:07:01Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.local.spa.fl_str_mv |
Trabajo de Grado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.hasversion.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/26645 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.unab.edu.co |
url |
http://hdl.handle.net/20.500.12749/26645 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB repourl:https://repository.unab.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Agrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14. Anand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74. Anand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461. Büchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61. Büchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a. Büchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b. Chen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996. Cooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence. Cooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1). Etzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996. Ling, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79. Mulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35. Spiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999. Spiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999. Srikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17. Zaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29. |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) Atribución-NoComercial-SinDerivadas 2.5 Colombia http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spatial.spa.fl_str_mv |
Bucaramanga (Santander, Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería de Sistemas |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/26645/1/2001_Fuentes_Mejia_Oscar.pdf https://repository.unab.edu.co/bitstream/20.500.12749/26645/2/license.txt https://repository.unab.edu.co/bitstream/20.500.12749/26645/3/2001_Fuentes_Mejia_Oscar.pdf.jpg |
bitstream.checksum.fl_str_mv |
42128b37fcac80edb3314f7aa411f94a 3755c0cfdb77e29f2b9125d7a45dd316 11973b903975eceab47c5ace04b47041 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277345720139776 |
spelling |
García D., Juan Carlos684b7956-47dd-4905-a767-54eb684550eeFuentes Mejía, Oscar Fernando3c84ce43-ccc8-4d26-83bb-e2d8e72cc952Bucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-09-19T20:07:01Z2024-09-19T20:07:01Z2001http://hdl.handle.net/20.500.12749/26645instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coWeb Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial.INTRODUCCIÓN 1. CARACTERISTICAS DEL WORLD WIDE WEB 2 1.1. CLASIFICACION DE FUENTES 2 1.2 EL CLIENTE 3 1.3 PROXY Y GATEWAYS 5 1.4 EL SERVIDOR 5 1.5 APLICACIÓN SOBRE WWW 6 2. REVISION Y PROYECTOS EXISTENTES 8 2.1 DIMENSIÓN DE LOS PROYECTOS DE WUM 8 2.2 DOCUMENTACIÓN SOBRE PROYECTOS EXISTENTES 9 2.3 CARACTERÍSTICAS DE USO 11 3. WEB USAGE MINING 13 3.1 WEB DATA 13 3.1.1 Contenido 13 3.1.2 Estructura 14 3.1.3 Uso 14 3,1.4 Perfil de Usuario 14 4. TÉCNICAS 15 4.1 EXTRACCIÓN DE DATOS 15 4.2 PREPROCESAMIENTO 16 4.2.1 Preprocesamiento de Uso 16 4.2.2 Preprocesamiento de Contenido 20 4.2.3 Preprocesamiento de Estructura 21 4.3 DESCUBRIMIENTO DE PATRONES 21 4.4 ANÁLISIS ESTADÍSTICO 22 5. ALGORITMOS 23 5.1 TECNICAS 23 5.2 REGLAS DE ASOCIACIÓN 23 5.3 CLUSTERING 24 5.4 PATRONES SECUENCIALES 25 5.5 DEPENDENCIA DE MODELAMIENTO 26 5.6 ANÁLISIS DE MODELOS 27 6. SOFTWARE EXISTENTE EN EL MERCADO 29 6.1 CLASIFICACION DEL SOFTWARE 29 6.2 WUM 29 6.3 WEBTRENDS 32 6.3.1 Resultados de WebTrends 34 7. VENTAJAS DE UNA APLICACION DE WUM 35 7.1 PERSONALIZACIÓN 35 7.2 MEJORAS DEL SISTEMA 35 7.3 INTELIGENCIA DE NEGOCIOS 36 7.4 CARACTERÍSTICAS DE USO 36 8. HERRAMIENTA PROTOTIPO DESARROLLADA 38 8.1 EL ALGORITMO 38 8.2 DESCUBRIR ITEMSETS GRANDES 41 8.3 ALGORITMO APRIORI 42 8.4 DESCRIPCIÓN DE LA HERRAMIENTA 44 8.4.1 Funcionamiento de la Herramienta 46 8.4.2 Resultados parciales de la herramienta 48 8.4.3 Corrida de una caso de prueba 51 8.4.4 Archivo de entrada 52 8.4.5 Parte del Resultado del Log de la UNAB sin depurar el archivo principal. 55 8.4.6 Resultado final de la herramienta 55 8.5 INTERPRETACIÓN DE LAS REGLAS 60 8.6 EL PROGRAMA APRIORI 62 8.6.1 Opciones de ejecución del programa Apriori 62 8.7 INTERFASE DEL. PROGRAMA APRIORI UNAB 64 9. CONCLUSIONES 65 10. RECOMENDACIONES 67 BIBLIOGRAFÍA 68 ANEXOS 71PregradoWeb Usage Mining is the application of data mining techniques to discover usage patterns from a website, to understand and improve the service needs in your applications. The VWWUM is made up of three phases, preprocessing, model discovery and model analysis. Each of these phases will be described in detail in this document. Giving a potential application to data mining within the web, since the application of this practice has shown a rapid increase and interest within the research communities. In this document you will find a detailed taxonomy of work in this area, including research efforts for commercial use.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamientoApplication of web usage mining techniques to search for behavioral patternsIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPApplication of techniquesBehavior patternsWeb usage miningSearchData miningComputer programsSoftware architectureHTML (Document markup language)Ingeniería de sistemasInnovaciones tecnológicasBases de datosProgramas para computadorArquitectura de softwareHTML (Lenguaje de marcado)Aplicación de técnicasPatrones de comportamientoBúsquedaAgrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14.Anand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74.Anand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461.Büchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61.Büchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a.Büchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b.Chen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996.Cooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence.Cooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1).Etzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996.Ling, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79.Mulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35.Spiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999.Spiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999.Srikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17.Zaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29.ORIGINAL2001_Fuentes_Mejia_Oscar.pdf2001_Fuentes_Mejia_Oscar.pdfTesisapplication/pdf52371128https://repository.unab.edu.co/bitstream/20.500.12749/26645/1/2001_Fuentes_Mejia_Oscar.pdf42128b37fcac80edb3314f7aa411f94aMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/26645/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2001_Fuentes_Mejia_Oscar.pdf.jpg2001_Fuentes_Mejia_Oscar.pdf.jpgIM Thumbnailimage/jpeg7928https://repository.unab.edu.co/bitstream/20.500.12749/26645/3/2001_Fuentes_Mejia_Oscar.pdf.jpg11973b903975eceab47c5ace04b47041MD53open access20.500.12749/26645oai:repository.unab.edu.co:20.500.12749/266452024-10-16 14:34:53.865open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg== |