Diseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimi...
- Autores:
-
Salguedo Carrillo, Diana Carolina
Aponte Pereira, Angie
García Varela, Humberto de Jesus
- Tipo de recurso:
- Fecha de publicación:
- 2023
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/11536
- Acceso en línea:
- http://hdl.handle.net/10584/11536
- Palabra clave:
- Avaluó de inmuebles
CRISP-DM
Algoritmos de machine learning
Clusterización
CRISP-DM
Real estate appraisal
Machine learning algorithm
Clustering
- Rights
- License
- Universidad del Norte
Summary: | El mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python. |
---|