Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimi...
- Autores:
-
Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
- Tipo de recurso:
- Fecha de publicación:
- 2023
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/11536
- Acceso en línea:
- http://hdl.handle.net/10584/11536
- Palabra clave:
- Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_7fce5b36c0ddaee823fb371c024d05f4 |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/11536 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
dc.title.en_US.fl_str_mv |
Design of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniques |
title |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
spellingShingle |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering Avaluó de inmuebles CRISP-DM Algoritmos de machine learning Clusterización CRISP-DM Real estate appraisal Machine learning algorithm Clustering |
title_short |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
title_full |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
title_fullStr |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
title_full_unstemmed |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
title_sort |
Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering |
dc.creator.fl_str_mv |
Salguedo Carrillo, Diana Carolina Aponte Pereira, Angie García Varela, Humberto de Jesus |
dc.contributor.advisor.none.fl_str_mv |
PeñaBaena Niebles, Rita Patricia |
dc.contributor.author.none.fl_str_mv |
Salguedo Carrillo, Diana Carolina Aponte Pereira, Angie García Varela, Humberto de Jesus |
dc.subject.es_ES.fl_str_mv |
Avaluó de inmuebles CRISP-DM Algoritmos de machine learning Clusterización |
topic |
Avaluó de inmuebles CRISP-DM Algoritmos de machine learning Clusterización CRISP-DM Real estate appraisal Machine learning algorithm Clustering |
dc.subject.en_US.fl_str_mv |
CRISP-DM Real estate appraisal Machine learning algorithm Clustering |
description |
El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python. |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2023-05-31T21:36:05Z |
dc.date.available.none.fl_str_mv |
2023-05-31T21:36:05Z |
dc.date.issued.none.fl_str_mv |
2023-05-30 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/11536 |
url |
http://hdl.handle.net/10584/11536 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2023 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
https://manglar.uninorte.edu.co/bitstream/10584/11536/1/Imagen%20proyecto%20final%201.pdf https://manglar.uninorte.edu.co/bitstream/10584/11536/2/Imagen%20proyecto%20final%201.png https://manglar.uninorte.edu.co/bitstream/10584/11536/3/Final%20project%20image%201.pdf https://manglar.uninorte.edu.co/bitstream/10584/11536/4/Final%20project%20image%201.png https://manglar.uninorte.edu.co/bitstream/10584/11536/5/license.txt |
bitstream.checksum.fl_str_mv |
bad026fd19bbee626e43316fc203f896 53f3964871c45ba6f9c1436df277cb9e 539eae70e106d5a45376d4f83f4becdf 002e519dbb648c253221d2205f8e4d65 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1812183094402220032 |
spelling |
PeñaBaena Niebles, Rita PatriciaSalguedo Carrillo, Diana CarolinaAponte Pereira, AngieGarcía Varela, Humberto de Jesus2023-05-31T21:36:05Z2023-05-31T21:36:05Z2023-05-30http://hdl.handle.net/10584/11536El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python.The real estate market has a great relevance in the country's economy. However, this sector is affected by the constant development of the market, its sensitivity to trends and various economic, social and environmental factors, among others, which end up having an impact on the appraisal of homes. Likewise, the subjectivity of the parties involved when assigning a price and the lack of speed in these processes generate distrust among market participants, uncertainty and thus investment risks. Therefore, this project aims to design a real estate price prediction model and an interface that facilitates its replicability, scalability and use in order to meet the needs of the stakeholders in this sector in the city of Barranquilla. To achieve this, the CRISD-DM methodology was implemented, which establishes a framework for the correct understanding of the problem, the efficiency in the analysis and application of the models. In addition, for the paper development, different regression techniques were evaluated to a set of different configurations to identify the combination that best fits the data and generates the most robust model. These configurations were formed by adjusting the response variable, taking it as the price per total area or per square meter, classifying the data by type of housing and the clusters obtained according to this classification by means of the K-Prototypes method. As for the regression algorithms, Artificial Neural Networks, Support Vector Regression, XGBoost and Random Forest techniques were used. The final model was elaborated by choosing the best combination for each type of housing, i.e., an ensemble model. It obtained the best results in terms of performance, such as a RMSE with a result of 130 million, being at least 10% better than the traditional method (144 million). Finally, this model was deployed in web page format by means of Flask and Python.spaBarranquilla, Universidad del Norte, 2023Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Avaluó de inmueblesCRISP-DMAlgoritmos de machine learningClusterizaciónCRISP-DMReal estate appraisalMachine learning algorithmClusteringDiseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clusteringDesign of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniquesarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALImagen proyecto final 1.pdfImagen proyecto final 1.pdfapplication/pdf448215https://manglar.uninorte.edu.co/bitstream/10584/11536/1/Imagen%20proyecto%20final%201.pdfbad026fd19bbee626e43316fc203f896MD51Imagen proyecto final 1.pngImagen proyecto final 1.pngimage/png404565https://manglar.uninorte.edu.co/bitstream/10584/11536/2/Imagen%20proyecto%20final%201.png53f3964871c45ba6f9c1436df277cb9eMD52Final project image 1.pdfFinal project image 1.pdfapplication/pdf431209https://manglar.uninorte.edu.co/bitstream/10584/11536/3/Final%20project%20image%201.pdf539eae70e106d5a45376d4f83f4becdfMD53Final project image 1.pngFinal project image 1.pngimage/png389322https://manglar.uninorte.edu.co/bitstream/10584/11536/4/Final%20project%20image%201.png002e519dbb648c253221d2205f8e4d65MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/11536/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5510584/11536oai:manglar.uninorte.edu.co:10584/115362023-05-31 16:36:05.805Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |