Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering

El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimi...

Full description

Autores:
Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
Tipo de recurso:
Fecha de publicación:
2023
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/11536
Acceso en línea:
http://hdl.handle.net/10584/11536
Palabra clave:
Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
Rights
License
Universidad del Norte
id REPOUNORT2_7fce5b36c0ddaee823fb371c024d05f4
oai_identifier_str oai:manglar.uninorte.edu.co:10584/11536
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
dc.title.en_US.fl_str_mv Design of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniques
title Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
spellingShingle Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
title_short Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
title_full Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
title_fullStr Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
title_full_unstemmed Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
title_sort Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
dc.creator.fl_str_mv Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
dc.contributor.advisor.none.fl_str_mv PeñaBaena Niebles, Rita Patricia
dc.contributor.author.none.fl_str_mv Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
dc.subject.es_ES.fl_str_mv Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
topic Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
dc.subject.en_US.fl_str_mv CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
description El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-05-31T21:36:05Z
dc.date.available.none.fl_str_mv 2023-05-31T21:36:05Z
dc.date.issued.none.fl_str_mv 2023-05-30
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/11536
url http://hdl.handle.net/10584/11536
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2023
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/11536/1/Imagen%20proyecto%20final%201.pdf
https://manglar.uninorte.edu.co/bitstream/10584/11536/2/Imagen%20proyecto%20final%201.png
https://manglar.uninorte.edu.co/bitstream/10584/11536/3/Final%20project%20image%201.pdf
https://manglar.uninorte.edu.co/bitstream/10584/11536/4/Final%20project%20image%201.png
https://manglar.uninorte.edu.co/bitstream/10584/11536/5/license.txt
bitstream.checksum.fl_str_mv bad026fd19bbee626e43316fc203f896
53f3964871c45ba6f9c1436df277cb9e
539eae70e106d5a45376d4f83f4becdf
002e519dbb648c253221d2205f8e4d65
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1812183094402220032
spelling PeñaBaena Niebles, Rita PatriciaSalguedo Carrillo, Diana CarolinaAponte Pereira, AngieGarcía Varela, Humberto de Jesus2023-05-31T21:36:05Z2023-05-31T21:36:05Z2023-05-30http://hdl.handle.net/10584/11536El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python.The real estate market has a great relevance in the country's economy. However, this sector is affected by the constant development of the market, its sensitivity to trends and various economic, social and environmental factors, among others, which end up having an impact on the appraisal of homes. Likewise, the subjectivity of the parties involved when assigning a price and the lack of speed in these processes generate distrust among market participants, uncertainty and thus investment risks. Therefore, this project aims to design a real estate price prediction model and an interface that facilitates its replicability, scalability and use in order to meet the needs of the stakeholders in this sector in the city of Barranquilla. To achieve this, the CRISD-DM methodology was implemented, which establishes a framework for the correct understanding of the problem, the efficiency in the analysis and application of the models. In addition, for the paper development, different regression techniques were evaluated to a set of different configurations to identify the combination that best fits the data and generates the most robust model. These configurations were formed by adjusting the response variable, taking it as the price per total area or per square meter, classifying the data by type of housing and the clusters obtained according to this classification by means of the K-Prototypes method. As for the regression algorithms, Artificial Neural Networks, Support Vector Regression, XGBoost and Random Forest techniques were used. The final model was elaborated by choosing the best combination for each type of housing, i.e., an ensemble model. It obtained the best results in terms of performance, such as a RMSE with a result of 130 million, being at least 10% better than the traditional method (144 million). Finally, this model was deployed in web page format by means of Flask and Python.spaBarranquilla, Universidad del Norte, 2023Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Avaluó de inmueblesCRISP-DMAlgoritmos de machine learningClusterizaciónCRISP-DMReal estate appraisalMachine learning algorithmClusteringDiseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clusteringDesign of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniquesarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALImagen proyecto final 1.pdfImagen proyecto final 1.pdfapplication/pdf448215https://manglar.uninorte.edu.co/bitstream/10584/11536/1/Imagen%20proyecto%20final%201.pdfbad026fd19bbee626e43316fc203f896MD51Imagen proyecto final 1.pngImagen proyecto final 1.pngimage/png404565https://manglar.uninorte.edu.co/bitstream/10584/11536/2/Imagen%20proyecto%20final%201.png53f3964871c45ba6f9c1436df277cb9eMD52Final project image 1.pdfFinal project image 1.pdfapplication/pdf431209https://manglar.uninorte.edu.co/bitstream/10584/11536/3/Final%20project%20image%201.pdf539eae70e106d5a45376d4f83f4becdfMD53Final project image 1.pngFinal project image 1.pngimage/png389322https://manglar.uninorte.edu.co/bitstream/10584/11536/4/Final%20project%20image%201.png002e519dbb648c253221d2205f8e4d65MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/11536/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5510584/11536oai:manglar.uninorte.edu.co:10584/115362023-05-31 16:36:05.805Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=