Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales

Recientemente las aplicaciones de CRM (customer relationship management) y los planes de lealtad se han masi ficado, permitiendo a las empresas obtener mayor información de sus clientes y monitorear sus transacciones. Está información además de mostrar cómo está el cliente actualmente, puede permiti...

Full description

Autores:
Jiménez Quintero, Paula Andrea
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2016
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/3849
Acceso en línea:
http://hdl.handle.net/11634/3849
Palabra clave:
Predictive models
Segmentation
Textual data
Modelos lineales (Estadística)
Comportamiento del consumidor -- Métodos estadísticos
Probabilidades
Modelos predictivos
Segmentación
Datos textuales
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANTTOMAS2_e39b8414290d76b9eaf1d5cf46c02eda
oai_identifier_str oai:repository.usta.edu.co:11634/3849
network_acronym_str SANTTOMAS2
network_name_str Repositorio Institucional USTA
repository_id_str
dc.title.spa.fl_str_mv Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
title Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
spellingShingle Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
Predictive models
Segmentation
Textual data
Modelos lineales (Estadística)
Comportamiento del consumidor -- Métodos estadísticos
Probabilidades
Modelos predictivos
Segmentación
Datos textuales
title_short Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
title_full Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
title_fullStr Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
title_full_unstemmed Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
title_sort Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales
dc.creator.fl_str_mv Jiménez Quintero, Paula Andrea
dc.contributor.advisor.none.fl_str_mv Cruz Castro, Daniel Leonardo
dc.contributor.author.none.fl_str_mv Jiménez Quintero, Paula Andrea
dc.subject.keyword.none.fl_str_mv Predictive models
Segmentation
Textual data
topic Predictive models
Segmentation
Textual data
Modelos lineales (Estadística)
Comportamiento del consumidor -- Métodos estadísticos
Probabilidades
Modelos predictivos
Segmentación
Datos textuales
dc.subject.lemb.none.fl_str_mv Modelos lineales (Estadística)
Comportamiento del consumidor -- Métodos estadísticos
Probabilidades
dc.subject.proposal.spa.fl_str_mv Modelos predictivos
Segmentación
Datos textuales
description Recientemente las aplicaciones de CRM (customer relationship management) y los planes de lealtad se han masi ficado, permitiendo a las empresas obtener mayor información de sus clientes y monitorear sus transacciones. Está información además de mostrar cómo está el cliente actualmente, puede permitir conocerlo a profundidad y con ello poder por ejemplo marcar a los clientes m as valiosos, segmentar la población para crear productos llamativos, predecir algunos comportamientos futuros como la deserción, establecer la próxima mejor oferta, defi nir las oportunidades de venta cruzada y el perfi l del cliente más propenso en una determinada campa~na comercial. En este articulo se presenta el tema de la comparación de modelos predictivos de la posibilidad de compra para un individuo en las campañas comerciales y su caracterización mediante análisis de datos textuales. Se aplicaron métodos predictivos de Redes Neuronales, Maquinas de Soporte Vectorial, Regresión Logística binomial, modelo Bayesiano y Árboles de Clasi ficación. Se realiza la selección del mejor modelo mediante validación cruzada, su acuraccy, precisión y el área bajo la curva ROC. Adicionalmente, se realizó un análisis de datos textuales para relacionar las opiniones de los clientes y su posibilidad de compra.
publishDate 2016
dc.date.issued.none.fl_str_mv 2016-07-16
dc.date.accessioned.none.fl_str_mv 2017-06-29T14:42:32Z
dc.date.available.none.fl_str_mv 2017-06-29T14:42:32Z
dc.type.none.fl_str_mv bachelor thesis
dc.type.local.spa.fl_str_mv Tesis de pregrado
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.none.fl_str_mv Jiménez, P. (2016). Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales. (Trabajo de pregrado). Universidad Santo Tomás. Bogotá, Colombia
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/3849
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Jiménez, P. (2016). Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales. (Trabajo de pregrado). Universidad Santo Tomás. Bogotá, Colombia
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/3849
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv Baath, R. (2014), ‘Peter norvig’s spell checker in two lines of base r’. *http://www.sumsar.net/blog/2014/12/peter-norvigs-spell-checker-in-two-lines-of-r/
Bécue, M., Lebart, L. & Rajadell, N. (1992), ‘El análisis estadístico de datos textuales, la lectura según los escolares de enseñanza primaria.’, Anuario de Psicología . Facultad de Psicología U.B (55), 7–22.
Betancourt, G. (2005.), ‘Las máquinas de soporte vectorial (svms)’, Scientia Et Technica pp. 67–72.
Estadística Aplicada. Universidad de Salamanca., G. (2006), ‘Regresión y correlación. introducción a la estadística.’. *http://biplot.usal.es/problemas/libro/index.html
Fagerland, M., Hosmer, D. & Bofin, A. (2008), ‘Multinomial goodness-of-fit tests for logistic regression models.’, Statist Med. 27, 38–53.
Flórez, A., Gutiérrez, A. & Zea, J. (2015), ‘Estimación por muestreo del índice de Gini para las localidades de Bogotá D.C. usando funciones en r’, Comunicaciones en Estadística 8(1), 59–79.
García, J. (2006), ‘Efectos de la colinealidad en el modelado de la regresión y su solución’, Cultura Científica y Tecnológica 16, 23–34.
Hosmer, DW, J. & Lemeshow, S. (1980), ‘Goodness-of-fit tests for the multiple logistic regression model.’, Communications in Statistics -Theory and Methods 9, 1043–1069.
Lebart, L., Salem, A. & Bécue, M. (2000), Análisis Estadístico de Textos, Vol. 2, ilustrada ed, Colección Educación. Serie Instrumentos.
Norvig, P. (2007), ‘How to write a spelling corrector’. *http://norvig.com/spell-correct.html
Pardo, C. E., Ortíz, J. E. & Cruz, D. L. (2012), Análisis de datos textuales con dtmvic, in ‘XXII Simposio Internacional de Estadística, Bucaramanga.’
Vélez, M., Egurrola, J. & Barragán, F. (2012), ‘Uso de la puntuación de propensión (propensity score) en estudios no experimentales’.
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Bogotá
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Pregrado Estadística
dc.publisher.faculty.spa.fl_str_mv Facultad de Estadística
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/3849/5/2016PaulaJimenez.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/3849/6/cartadefacultad.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/3849/7/cartaderechosdeautor.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/3849/1/2016PaulaJimenez.pdf
https://repository.usta.edu.co/bitstream/11634/3849/3/cartadefacultad.pdf
https://repository.usta.edu.co/bitstream/11634/3849/4/cartaderechosdeautor.pdf
https://repository.usta.edu.co/bitstream/11634/3849/2/license.txt
bitstream.checksum.fl_str_mv 5824f16e9452d232bb097e7f1cee671b
bfd07904094c8b62dbcdd07a997f3eab
f6a3c23f464a79f66fe499c8a781d6d5
45dc098b5cc11f5a05e750bd533c281c
4918436c959a4de018d635ea8bc0b5ce
d5c03c56970058bfd9c603ff7cedec78
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv noreply@usta.edu.co
_version_ 1782026086350061568
spelling Cruz Castro, Daniel LeonardoJiménez Quintero, Paula Andrea2017-06-29T14:42:32Z2017-06-29T14:42:32Z2016-07-16Jiménez, P. (2016). Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textuales. (Trabajo de pregrado). Universidad Santo Tomás. Bogotá, Colombiahttp://hdl.handle.net/11634/3849reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coRecientemente las aplicaciones de CRM (customer relationship management) y los planes de lealtad se han masi ficado, permitiendo a las empresas obtener mayor información de sus clientes y monitorear sus transacciones. Está información además de mostrar cómo está el cliente actualmente, puede permitir conocerlo a profundidad y con ello poder por ejemplo marcar a los clientes m as valiosos, segmentar la población para crear productos llamativos, predecir algunos comportamientos futuros como la deserción, establecer la próxima mejor oferta, defi nir las oportunidades de venta cruzada y el perfi l del cliente más propenso en una determinada campa~na comercial. En este articulo se presenta el tema de la comparación de modelos predictivos de la posibilidad de compra para un individuo en las campañas comerciales y su caracterización mediante análisis de datos textuales. Se aplicaron métodos predictivos de Redes Neuronales, Maquinas de Soporte Vectorial, Regresión Logística binomial, modelo Bayesiano y Árboles de Clasi ficación. Se realiza la selección del mejor modelo mediante validación cruzada, su acuraccy, precisión y el área bajo la curva ROC. Adicionalmente, se realizó un análisis de datos textuales para relacionar las opiniones de los clientes y su posibilidad de compra.Recently CRM (customer relationship management) applications and loyalty schemes have become massive, allowing companies to get more information about their customers and monitor their transactions. It is information in addition to showing how is the current customer, you can allow to know in depth and thus can for example mark the most valuable customers, segment the population to create eye-catching products, predict some future behaviors such as desertion, set the next best deal , de ning cross-selling opportunities and customer pro le more prone in a given marketing year. In this article the issue of comparison of predictive models of the possibility of purchase for an individual in commercial campaigns and their characterization is presented by analysis of textual data. predictive methods Neural Networks, Support Vector Machines, Binomial Logistic Regression, Bayesian Model and Classi cation Trees were applied. selecting the best model by cross-validation, your acuraccy, accuracy and area under the ROC curve is performed. In addition, a textual data analysis was performed to relate the opinions of customers and their ability to purchase.Profesional en estadísticahttp://unidadinvestigacion.usta.edu.coPregradoapplication/pdfspaUniversidad Santo TomásPregrado EstadísticaFacultad de EstadísticaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Comparación de modelos predictivos para propensión de compra y su caracterización mediante análisis de datos textualesbachelor thesisTesis de pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisPredictive modelsSegmentationTextual dataModelos lineales (Estadística)Comportamiento del consumidor -- Métodos estadísticosProbabilidadesModelos predictivosSegmentaciónDatos textualesCRAI-USTA BogotáBaath, R. (2014), ‘Peter norvig’s spell checker in two lines of base r’. *http://www.sumsar.net/blog/2014/12/peter-norvigs-spell-checker-in-two-lines-of-r/Bécue, M., Lebart, L. & Rajadell, N. (1992), ‘El análisis estadístico de datos textuales, la lectura según los escolares de enseñanza primaria.’, Anuario de Psicología . Facultad de Psicología U.B (55), 7–22.Betancourt, G. (2005.), ‘Las máquinas de soporte vectorial (svms)’, Scientia Et Technica pp. 67–72.Estadística Aplicada. Universidad de Salamanca., G. (2006), ‘Regresión y correlación. introducción a la estadística.’. *http://biplot.usal.es/problemas/libro/index.htmlFagerland, M., Hosmer, D. & Bofin, A. (2008), ‘Multinomial goodness-of-fit tests for logistic regression models.’, Statist Med. 27, 38–53.Flórez, A., Gutiérrez, A. & Zea, J. (2015), ‘Estimación por muestreo del índice de Gini para las localidades de Bogotá D.C. usando funciones en r’, Comunicaciones en Estadística 8(1), 59–79.García, J. (2006), ‘Efectos de la colinealidad en el modelado de la regresión y su solución’, Cultura Científica y Tecnológica 16, 23–34.Hosmer, DW, J. & Lemeshow, S. (1980), ‘Goodness-of-fit tests for the multiple logistic regression model.’, Communications in Statistics -Theory and Methods 9, 1043–1069.Lebart, L., Salem, A. & Bécue, M. (2000), Análisis Estadístico de Textos, Vol. 2, ilustrada ed, Colección Educación. Serie Instrumentos.Norvig, P. (2007), ‘How to write a spelling corrector’. *http://norvig.com/spell-correct.htmlPardo, C. E., Ortíz, J. E. & Cruz, D. L. (2012), Análisis de datos textuales con dtmvic, in ‘XXII Simposio Internacional de Estadística, Bucaramanga.’Vélez, M., Egurrola, J. & Barragán, F. (2012), ‘Uso de la puntuación de propensión (propensity score) en estudios no experimentales’.THUMBNAIL2016PaulaJimenez.pdf.jpg2016PaulaJimenez.pdf.jpgIM Thumbnailimage/jpeg7998https://repository.usta.edu.co/bitstream/11634/3849/5/2016PaulaJimenez.pdf.jpg5824f16e9452d232bb097e7f1cee671bMD55open accesscartadefacultad.pdf.jpgcartadefacultad.pdf.jpgIM Thumbnailimage/jpeg6470https://repository.usta.edu.co/bitstream/11634/3849/6/cartadefacultad.pdf.jpgbfd07904094c8b62dbcdd07a997f3eabMD56open accesscartaderechosdeautor.pdf.jpgcartaderechosdeautor.pdf.jpgIM Thumbnailimage/jpeg7600https://repository.usta.edu.co/bitstream/11634/3849/7/cartaderechosdeautor.pdf.jpgf6a3c23f464a79f66fe499c8a781d6d5MD57open accessORIGINAL2016PaulaJimenez.pdf2016PaulaJimenez.pdfapplication/pdf1218070https://repository.usta.edu.co/bitstream/11634/3849/1/2016PaulaJimenez.pdf45dc098b5cc11f5a05e750bd533c281cMD51open accesscartadefacultad.pdfcartadefacultad.pdfapplication/pdf254426https://repository.usta.edu.co/bitstream/11634/3849/3/cartadefacultad.pdf4918436c959a4de018d635ea8bc0b5ceMD53metadata only accesscartaderechosdeautor.pdfcartaderechosdeautor.pdfapplication/pdf342037https://repository.usta.edu.co/bitstream/11634/3849/4/cartaderechosdeautor.pdfd5c03c56970058bfd9c603ff7cedec78MD54metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repository.usta.edu.co/bitstream/11634/3849/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52open access11634/3849oai:repository.usta.edu.co:11634/38492023-07-19 20:05:34.509open accessRepositorio Universidad Santo Tomásnoreply@usta.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=