Modelo de predicción del precio de la vivienda en el Valle de San Nicolás

RESUMEN : A través del presente documento se busca explorar las mejores técnicas de aprendizaje supervisado para predicción de precios de vivienda para un conjunto de datos de 2.481 registros extraídos del portal fincaraiz.com. Inicialmente se tratarán algunos aspectos como el planteamiento del prob...

Full description

Autores:
Soto Hincapié, Robin Andrés
David Rodríguez, Estefanía
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/24674
Acceso en línea:
http://hdl.handle.net/10495/24674
Palabra clave:
Aprendizaje automático (inteligencia artificial)
Machine learning
Redes neurales (computadores)
Neural networks (Computer science)
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Regresión
Árboles de decisión
Gradiente descendente
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UDEA2_778eaa3ff16bc0634cdf8173e80083f6
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/24674
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
title Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
spellingShingle Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
Aprendizaje automático (inteligencia artificial)
Machine learning
Redes neurales (computadores)
Neural networks (Computer science)
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Regresión
Árboles de decisión
Gradiente descendente
title_short Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
title_full Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
title_fullStr Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
title_full_unstemmed Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
title_sort Modelo de predicción del precio de la vivienda en el Valle de San Nicolás
dc.creator.fl_str_mv Soto Hincapié, Robin Andrés
David Rodríguez, Estefanía
dc.contributor.advisor.none.fl_str_mv Arias Londoño, Julián David
dc.contributor.author.none.fl_str_mv Soto Hincapié, Robin Andrés
David Rodríguez, Estefanía
dc.subject.lemb.none.fl_str_mv Aprendizaje automático (inteligencia artificial)
Machine learning
Redes neurales (computadores)
Neural networks (Computer science)
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
topic Aprendizaje automático (inteligencia artificial)
Machine learning
Redes neurales (computadores)
Neural networks (Computer science)
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Regresión
Árboles de decisión
Gradiente descendente
dc.subject.proposal.spa.fl_str_mv Regresión
Árboles de decisión
Gradiente descendente
description RESUMEN : A través del presente documento se busca explorar las mejores técnicas de aprendizaje supervisado para predicción de precios de vivienda para un conjunto de datos de 2.481 registros extraídos del portal fincaraiz.com. Inicialmente se tratarán algunos aspectos como el planteamiento del problema y los objetivos, luego se hará un recorrido a través de las distintas técnicas de aprendizaje supervisado usadas en la actualidad, haciendo énfasis en aspectos clave como la selección de hiperparámetros o la idoneidad de los modelos a la hora de abordar el problema de predicción de precios. Posterior a esto se realizará una revisión del conjunto de datos con el cual se pretende realizar el proceso de modelado, partiendo de las características básicas del dataset y luego ahondando en algunos hallazgos logrados a partir del análisis descriptivo. Una vez se tenga conocimientos sobre el dataset, se procederá a explicar el diseño de las pruebas y las distintas iteraciones realizadas, con el objetivo de que los lectores puedan replicar el proceso experimental 1. Finalmente se hará una explicación de los resultados obtenidos y las implicaciones del uso de modelos basados en técnicas de ensamble y redes neuronales, en contraste con otras técnicas estadísticas como la Regresión Lineal Múltiple y la Regresión Ridge.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-12-09T13:34:23Z
dc.date.available.none.fl_str_mv 2021-12-09T13:34:23Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/draft
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/24674
url http://hdl.handle.net/10495/24674
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.accessrights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.extent.spa.fl_str_mv 77
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.place.spa.fl_str_mv Medellín
institution Universidad de Antioquia
bitstream.url.fl_str_mv http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/7/DavidEstefania_2021_PrecioViviendaOriente.pdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/10/license_rdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/11/license.txt
bitstream.checksum.fl_str_mv 2029af85656438cf2c6c4359add074ba
b88b088d9957e670ce3b3fbe2eedbc13
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Antioquia
repository.mail.fl_str_mv andres.perez@udea.edu.co
_version_ 1812173113804193792
spelling Arias Londoño, Julián DavidSoto Hincapié, Robin AndrésDavid Rodríguez, Estefanía2021-12-09T13:34:23Z2021-12-09T13:34:23Z2021http://hdl.handle.net/10495/24674RESUMEN : A través del presente documento se busca explorar las mejores técnicas de aprendizaje supervisado para predicción de precios de vivienda para un conjunto de datos de 2.481 registros extraídos del portal fincaraiz.com. Inicialmente se tratarán algunos aspectos como el planteamiento del problema y los objetivos, luego se hará un recorrido a través de las distintas técnicas de aprendizaje supervisado usadas en la actualidad, haciendo énfasis en aspectos clave como la selección de hiperparámetros o la idoneidad de los modelos a la hora de abordar el problema de predicción de precios. Posterior a esto se realizará una revisión del conjunto de datos con el cual se pretende realizar el proceso de modelado, partiendo de las características básicas del dataset y luego ahondando en algunos hallazgos logrados a partir del análisis descriptivo. Una vez se tenga conocimientos sobre el dataset, se procederá a explicar el diseño de las pruebas y las distintas iteraciones realizadas, con el objetivo de que los lectores puedan replicar el proceso experimental 1. Finalmente se hará una explicación de los resultados obtenidos y las implicaciones del uso de modelos basados en técnicas de ensamble y redes neuronales, en contraste con otras técnicas estadísticas como la Regresión Lineal Múltiple y la Regresión Ridge.ABSTRACT : This document seeks to explore the best supervised learning techniques for house price prediction for a dataset of 2,481 records extracted from the fincaraiz.com portal. Initially, some aspects such as the statement of the problem and the objectives will be treated, then it will be explained the different supervised learning techniques used today, emphasizing key aspects such as the selection of hyperparameters or models suitability when it comes to address the problem of price prediction. After this, a review of the data used for the modeling process will be carried out, starting from the basic characteristics of the dataset and then delving into some findings obtained from the descriptive analysis. Once the dataset is known, we will proceed to explain the design of the tests and the different iterations carried out, with the aim that the readers can replicate the experimental process 2. Finally, an explanation will be made of the results obtained and the implications of the use of models based on assembly techniques and neural networks, in contrast to other statistical techniques such as Multiple Linear Regression and Ridge Regression.77application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/otherhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/Modelo de predicción del precio de la vivienda en el Valle de San NicolásMedellínAprendizaje automático (inteligencia artificial)Machine learningRedes neurales (computadores)Neural networks (Computer science)Aprendizaje supervisado (aprendizaje automático)Supervised learning (Machine learning)RegresiónÁrboles de decisiónGradiente descendenteEspecialista en Analítica y Ciencia de DatosEspecializaciónFacultad de Ingeniería. Especialización en Analítica y Ciencia de DatosUniversidad de AntioquiaORIGINALDavidEstefania_2021_PrecioViviendaOriente.pdfDavidEstefania_2021_PrecioViviendaOriente.pdfTrabajo de grado de especializaciónapplication/pdf1561819http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/7/DavidEstefania_2021_PrecioViviendaOriente.pdf2029af85656438cf2c6c4359add074baMD57CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/10/license_rdfb88b088d9957e670ce3b3fbe2eedbc13MD510LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://bibliotecadigital.udea.edu.co/bitstream/10495/24674/11/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51110495/24674oai:bibliotecadigital.udea.edu.co:10495/246742021-12-09 08:35:09.327Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=