Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento

Web Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. E...

Full description

Autores:
Fuentes Mejía, Oscar Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2001
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/26645
Acceso en línea:
http://hdl.handle.net/20.500.12749/26645
Palabra clave:
Application of techniques
Behavior patterns
Web usage mining
Search
Data mining
Computer programs
Software architecture
HTML (Document markup language)
Ingeniería de sistemas
Innovaciones tecnológicas
Bases de datos
Programas para computador
Arquitectura de software
HTML (Lenguaje de marcado)
Aplicación de técnicas
Patrones de comportamiento
Búsqueda
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_7d0d117c756aead6333ee4aafc6088d6
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/26645
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
dc.title.translated.spa.fl_str_mv Application of web usage mining techniques to search for behavioral patterns
title Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
spellingShingle Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
Application of techniques
Behavior patterns
Web usage mining
Search
Data mining
Computer programs
Software architecture
HTML (Document markup language)
Ingeniería de sistemas
Innovaciones tecnológicas
Bases de datos
Programas para computador
Arquitectura de software
HTML (Lenguaje de marcado)
Aplicación de técnicas
Patrones de comportamiento
Búsqueda
title_short Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
title_full Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
title_fullStr Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
title_full_unstemmed Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
title_sort Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamiento
dc.creator.fl_str_mv Fuentes Mejía, Oscar Fernando
dc.contributor.advisor.none.fl_str_mv García D., Juan Carlos
dc.contributor.author.none.fl_str_mv Fuentes Mejía, Oscar Fernando
dc.subject.keywords.spa.fl_str_mv Application of techniques
Behavior patterns
Web usage mining
Search
Data mining
Computer programs
Software architecture
HTML (Document markup language)
topic Application of techniques
Behavior patterns
Web usage mining
Search
Data mining
Computer programs
Software architecture
HTML (Document markup language)
Ingeniería de sistemas
Innovaciones tecnológicas
Bases de datos
Programas para computador
Arquitectura de software
HTML (Lenguaje de marcado)
Aplicación de técnicas
Patrones de comportamiento
Búsqueda
dc.subject.lemb.spa.fl_str_mv Ingeniería de sistemas
Innovaciones tecnológicas
Bases de datos
Programas para computador
Arquitectura de software
HTML (Lenguaje de marcado)
dc.subject.proposal.spa.fl_str_mv Aplicación de técnicas
Patrones de comportamiento
Búsqueda
description Web Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial.
publishDate 2001
dc.date.issued.none.fl_str_mv 2001
dc.date.accessioned.none.fl_str_mv 2024-09-19T20:07:01Z
dc.date.available.none.fl_str_mv 2024-09-19T20:07:01Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/26645
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/26645
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Agrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14.
Anand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74.
Anand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461.
Büchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61.
Büchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a.
Büchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b.
Chen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996.
Cooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence.
Cooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1).
Etzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996.
Ling, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79.
Mulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35.
Spiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999.
Spiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999.
Srikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17.
Zaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Bucaramanga (Santander, Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Ingeniería de Sistemas
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/26645/1/2001_Fuentes_Mejia_Oscar.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/26645/2/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/26645/3/2001_Fuentes_Mejia_Oscar.pdf.jpg
bitstream.checksum.fl_str_mv 42128b37fcac80edb3314f7aa411f94a
3755c0cfdb77e29f2b9125d7a45dd316
11973b903975eceab47c5ace04b47041
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1812205483926224896
spelling García D., Juan Carlos684b7956-47dd-4905-a767-54eb684550eeFuentes Mejía, Oscar Fernando3c84ce43-ccc8-4d26-83bb-e2d8e72cc952Bucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-09-19T20:07:01Z2024-09-19T20:07:01Z2001http://hdl.handle.net/20.500.12749/26645instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coWeb Usage Mining es la aplicación de técnicas de minería de datos para descubrir patrones de uso desde un sítio web, para entender y mejorar las necesidades de servicio en sus aplicaciones. La VWWUM esta constituida por tres fases, preprocesamiento, descubrimiento de modelos y análisis de modelos. En este documento se describirán en detalle cada una de estas fases. Dando una aplicación potencial, a la minería de datos dentro de la web, pues ha mostrado un rápido incremento e interés dentro de la comunidades investigativas la aplicación de esta practica. En este documento se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial.INTRODUCCIÓN 1. CARACTERISTICAS DEL WORLD WIDE WEB 2 1.1. CLASIFICACION DE FUENTES 2 1.2 EL CLIENTE 3 1.3 PROXY Y GATEWAYS 5 1.4 EL SERVIDOR 5 1.5 APLICACIÓN SOBRE WWW 6 2. REVISION Y PROYECTOS EXISTENTES 8 2.1 DIMENSIÓN DE LOS PROYECTOS DE WUM 8 2.2 DOCUMENTACIÓN SOBRE PROYECTOS EXISTENTES 9 2.3 CARACTERÍSTICAS DE USO 11 3. WEB USAGE MINING 13 3.1 WEB DATA 13 3.1.1 Contenido 13 3.1.2 Estructura 14 3.1.3 Uso 14 3,1.4 Perfil de Usuario 14 4. TÉCNICAS 15 4.1 EXTRACCIÓN DE DATOS 15 4.2 PREPROCESAMIENTO 16 4.2.1 Preprocesamiento de Uso 16 4.2.2 Preprocesamiento de Contenido 20 4.2.3 Preprocesamiento de Estructura 21 4.3 DESCUBRIMIENTO DE PATRONES 21 4.4 ANÁLISIS ESTADÍSTICO 22 5. ALGORITMOS 23 5.1 TECNICAS 23 5.2 REGLAS DE ASOCIACIÓN 23 5.3 CLUSTERING 24 5.4 PATRONES SECUENCIALES 25 5.5 DEPENDENCIA DE MODELAMIENTO 26 5.6 ANÁLISIS DE MODELOS 27 6. SOFTWARE EXISTENTE EN EL MERCADO 29 6.1 CLASIFICACION DEL SOFTWARE 29 6.2 WUM 29 6.3 WEBTRENDS 32 6.3.1 Resultados de WebTrends 34 7. VENTAJAS DE UNA APLICACION DE WUM 35 7.1 PERSONALIZACIÓN 35 7.2 MEJORAS DEL SISTEMA 35 7.3 INTELIGENCIA DE NEGOCIOS 36 7.4 CARACTERÍSTICAS DE USO 36 8. HERRAMIENTA PROTOTIPO DESARROLLADA 38 8.1 EL ALGORITMO 38 8.2 DESCUBRIR ITEMSETS GRANDES 41 8.3 ALGORITMO APRIORI 42 8.4 DESCRIPCIÓN DE LA HERRAMIENTA 44 8.4.1 Funcionamiento de la Herramienta 46 8.4.2 Resultados parciales de la herramienta 48 8.4.3 Corrida de una caso de prueba 51 8.4.4 Archivo de entrada 52 8.4.5 Parte del Resultado del Log de la UNAB sin depurar el archivo principal. 55 8.4.6 Resultado final de la herramienta 55 8.5 INTERPRETACIÓN DE LAS REGLAS 60 8.6 EL PROGRAMA APRIORI 62 8.6.1 Opciones de ejecución del programa Apriori 62 8.7 INTERFASE DEL. PROGRAMA APRIORI UNAB 64 9. CONCLUSIONES 65 10. RECOMENDACIONES 67 BIBLIOGRAFÍA 68 ANEXOS 71PregradoWeb Usage Mining is the application of data mining techniques to discover usage patterns from a website, to understand and improve the service needs in your applications. The VWWUM is made up of three phases, preprocessing, model discovery and model analysis. Each of these phases will be described in detail in this document. Giving a potential application to data mining within the web, since the application of this practice has shown a rapid increase and interest within the research communities. In this document you will find a detailed taxonomy of work in this area, including research efforts for commercial use.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Aplicación de técnicas de web usage mining para la búsqueda de patrones de comportamientoApplication of web usage mining techniques to search for behavioral patternsIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaIngeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPApplication of techniquesBehavior patternsWeb usage miningSearchData miningComputer programsSoftware architectureHTML (Document markup language)Ingeniería de sistemasInnovaciones tecnológicasBases de datosProgramas para computadorArquitectura de softwareHTML (Lenguaje de marcado)Aplicación de técnicasPatrones de comportamientoBúsquedaAgrawal, R. & Srikant, R, (1995) Mining Sequential Patterns, Proc. Int’! Conf. on Data Engineering, pp. 3-14.Anand, 8.5., Scotney, B,W,, Tan, M,G., McClean, S.1, Bell, D.A., Hughes, J.,G, & Magill, I1.C. (1997) Designing a Kernel for Data Mining, /EEE Expert, 12(2):65-74.Anand, S. S., A, R. Patrick, J. G. Hughes and D,. A, Bell. 1998. A Data Mining Methodology for Cross-Sales, Knowledge-based Systems Journal 10; 449-461.Büchner, A.G. & Mulvenna, M.D,. (1998) Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining, 4CM SIGMOD Record, 21(4):54-61.Büchner, A.G,, Mulvenna, M,D., Anand, S.S, & Hughes, J.G. An Internet-cnabled Knowledge Discovery Process, Proc. 9% rt’) Database Conf., forthcoming, 1999a.Büchner, A,G., Baumgarten, M., Mulvenna, M.D., Anand, S.S. & Hughes, J,G. Navigation Pattern Discovery from Internet Data, submitted to 4CM Workshop on Web Usage Analysis and User Profiling (WebKDD’99), 1999b.Chen, M,S,, Park, J.8. & Yu, P,S, Data Mining for Traversal Patterns in a Web Environment, Proc. 16" Tntl’l Conf, on Distributed Computing Systems, pp. 385-392, 1996.Cooley, R., Mobasher, R. & Srivastava, J. (1997) Web Mining: Information and Pattern Discovery on the World Wide Web, Proc, 9% IEEE Int’! Conf. on Tools with Artificial Intelligence.Cooley, R., Mobasher, R. & Srivastava, J. (1999) Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, 1(1).Etzioni, O, The World-Wide Web: Quagmire or Gold Mine?, Comm. of the ACM, 39(11):65- 68, 1996.Ling, C.X. & Li, C, (1998) Data Mining for Direct Marketing: Problems and Solutions, Proc. 4" rut] Conf. on Knowledge Discovery and Data Mining, pp. 73-79.Mulvenna, M,D., Norwood, M.T. & Büchner, A,G. (1998) Data-driven Marketing, Electronic Markets: The Int’! Journal of Electronic Commerce and Business Media, 8(3):32-35.Spiliopoulou, M. The laborious way from data mining to web mining, Jnt’'! Journal of Computing Systems, Science de Engineering, March 1999.Spiliopoulou, M., Faulstich, L.C. & Winkler, K. A Data Miner analyzing the Navigational Behaviour of Web Users, Proc, 4C41'99 Workshop on Machine Learning in User Modelling, forthecoming, 1999.Srikant, R, & Agrawal, R, (1996) Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5°’ Int'! Conf on Extending Database Technology, pp. 3-17.Zaïane, O.R, Xin, M, & Han, J. (1998) Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs, Prac. Advances in Digital Libraries Conſ. pp. 19-29.ORIGINAL2001_Fuentes_Mejia_Oscar.pdf2001_Fuentes_Mejia_Oscar.pdfTesisapplication/pdf52371128https://repository.unab.edu.co/bitstream/20.500.12749/26645/1/2001_Fuentes_Mejia_Oscar.pdf42128b37fcac80edb3314f7aa411f94aMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/26645/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2001_Fuentes_Mejia_Oscar.pdf.jpg2001_Fuentes_Mejia_Oscar.pdf.jpgIM Thumbnailimage/jpeg7928https://repository.unab.edu.co/bitstream/20.500.12749/26645/3/2001_Fuentes_Mejia_Oscar.pdf.jpg11973b903975eceab47c5ace04b47041MD53open access20.500.12749/26645oai:repository.unab.edu.co:20.500.12749/266452024-09-19 22:01:08.044open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==