Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering

El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimi...

Full description

Autores:
Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
Tipo de recurso:
Fecha de publicación:
2023
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/11536
Acceso en línea:
http://hdl.handle.net/10584/11536
Palabra clave:
Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
Rights
License
Universidad del Norte
Description
Summary:El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python.