Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla

TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the...

Full description

Autores:
Álvarez, Ricardo
López, Alejandro
Piñeres, Augusto
Selman, Isabella
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/11251
Acceso en línea:
http://hdl.handle.net/10584/11251
Palabra clave:
Crispdm
Modelo de predicción
Avalúo
Barranquilla
Price prediction
Real estate appraisal
Rights
License
Universidad del Norte
id REPOUNORT2_b1a438d3f7e1b14f682f4a9007870e8e
oai_identifier_str oai:manglar.uninorte.edu.co:10584/11251
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
dc.title.en_US.fl_str_mv Model design for price prediction and real estate appraisal in the city of Barranquilla
title Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
spellingShingle Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
Crispdm
Modelo de predicción
Avalúo
Barranquilla
Price prediction
Real estate appraisal
title_short Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
title_full Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
title_fullStr Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
title_full_unstemmed Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
title_sort Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
dc.creator.fl_str_mv Álvarez, Ricardo
López, Alejandro
Piñeres, Augusto
Selman, Isabella
dc.contributor.advisor.none.fl_str_mv Peñabaena, Rita
dc.contributor.author.none.fl_str_mv Álvarez, Ricardo
López, Alejandro
Piñeres, Augusto
Selman, Isabella
dc.subject.es_ES.fl_str_mv Crispdm
Modelo de predicción
Avalúo
Barranquilla
Price prediction
Real estate appraisal
topic Crispdm
Modelo de predicción
Avalúo
Barranquilla
Price prediction
Real estate appraisal
description TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the task of analyzing and interpreting the market behavior and tendencies to be able to penetrate its walls by providing satisfaction to its clients, both real estate sellers and buyers. The main objective of this project is to apply analytics methods to a database provided by TruData with the purpose of designing a robust model that allows the prediction of a real estate market price with a minimal error indicator. The methodology applied was a six-phase CRISP DM to correctly analyze the market context and the data supplied with the goal of correctly modeling the data entered. This process presented many challenges as it required an exhaustive investigation about the types of data analytics models to define which were the ones that fit the data best, considering the investigation done about successful cases of data modeling in other businesses and industries. Based on the results of this process, the models chosen to analyze the data were: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. After obtaining the results thrown by each of the chosen modules, a comparison of their performance was done, considering their RSME and MAPE. RMSE is interpreted as the deviation of the result obtained and it’s presented in the same unit as the response variable (COP). MAPE represents the average of the absolute error in percentage form. Both indicate a better result as they get smaller in quantity. The model with the best result was the one developed with Random Forest methodology, having a approximate RMSE of 84.000.000 COP. This model will allow the prediction of a property value with the manual entry of each property's independent variables.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-12-09T14:13:26Z
dc.date.available.none.fl_str_mv 2022-12-09T14:13:26Z
dc.date.issued.none.fl_str_mv 2022-12-01
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/11251
url http://hdl.handle.net/10584/11251
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2022
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/11251/3/license.txt
https://manglar.uninorte.edu.co/bitstream/10584/11251/1/Crispdm%20espa%c3%b1ol.png
https://manglar.uninorte.edu.co/bitstream/10584/11251/2/Crispdm%20ingles.png
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
bda2fd52eabf83cf9064742532119a9b
42f05763b562e177d9e770d4605a7972
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1808401267597246464
spelling Peñabaena, RitaÁlvarez, RicardoLópez, AlejandroPiñeres, AugustoSelman, Isabella2022-12-09T14:13:26Z2022-12-09T14:13:26Z2022-12-01http://hdl.handle.net/10584/11251TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the task of analyzing and interpreting the market behavior and tendencies to be able to penetrate its walls by providing satisfaction to its clients, both real estate sellers and buyers. The main objective of this project is to apply analytics methods to a database provided by TruData with the purpose of designing a robust model that allows the prediction of a real estate market price with a minimal error indicator. The methodology applied was a six-phase CRISP DM to correctly analyze the market context and the data supplied with the goal of correctly modeling the data entered. This process presented many challenges as it required an exhaustive investigation about the types of data analytics models to define which were the ones that fit the data best, considering the investigation done about successful cases of data modeling in other businesses and industries. Based on the results of this process, the models chosen to analyze the data were: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. After obtaining the results thrown by each of the chosen modules, a comparison of their performance was done, considering their RSME and MAPE. RMSE is interpreted as the deviation of the result obtained and it’s presented in the same unit as the response variable (COP). MAPE represents the average of the absolute error in percentage form. Both indicate a better result as they get smaller in quantity. The model with the best result was the one developed with Random Forest methodology, having a approximate RMSE of 84.000.000 COP. This model will allow the prediction of a property value with the manual entry of each property's independent variables.La empresa TruData se encarga de prestar el servicio de analítica de datos e inteligencia de negocios para distintas empresas de Colombia. Recientemente, adquirió un cliente nuevo que se dedica a la compra y venta rápida de propiedades inmobiliarias del país, y desean empezar operaciones en Barranquilla. A la empresa se le encargó la tarea de analizar las tendencias y el comportamiento del mercado actual en la ciudad para lograr penetrarlo brindando satisfacción a sus clientes. El objetivo de este proyecto es aplicar métodos de analítica a una base de datos suministrada por TruData con el fin de diseñar un modelo que permita predecir el valor de un inmueble con un indicador de error mínimo. Para lograr esto, se decide optar por utilizar CRISP DM, una metodología que consiste en seguir una serie de pasos para analizar correctamente una base de datos. Este proceso implicó muchos retos dado que se llevó a cabo una investigación exhaustiva sobre los tipos de modelos de análisis de datos con el fin de definir cuáles serían los mejores para comparar, teniendo en cuenta la investigación realizada sobre casos de éxito de modelación de datos. Con base en los resultados de este proceso se optó por analizar los datos mediante los modelos: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. Al obtener los resultados de cada uno de los modelos, se realizó una comparativa de su rendimiento según su RMSE y MAPE. El RMSE se interpreta como la desviación de los datos y se arroja en la misma unidad de la variable respuesta (COP). El MAPE interpreta la media del error absoluto en porcentaje y, al igual que el RMSE, indica un mejor resultado cuando es más bajo. El modelo con mejor resultado fue el desarrollado mediante la metodología Random Forest, con un RMSE aproximado de 84.000.000 COP. Este modelo permitirá predecir un precio de venta de un inmueble con el ingreso manual de las variables independientes de la respectiva propiedad.spaBarranquilla, Universidad del Norte, 2022Universidad del Nortehttp://purl.org/coar/access_right/c_abf2CrispdmModelo de predicciónAvalúoBarranquillaPrice predictionReal estate appraisalDiseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de BarranquillaModel design for price prediction and real estate appraisal in the city of Barranquillaarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/11251/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALCrispdm español.pngCrispdm español.pngMetodología CRISP-DMimage/png128113https://manglar.uninorte.edu.co/bitstream/10584/11251/1/Crispdm%20espa%c3%b1ol.pngbda2fd52eabf83cf9064742532119a9bMD51Crispdm ingles.pngCrispdm ingles.pngCRISP-DM 6 PHASESimage/png124315https://manglar.uninorte.edu.co/bitstream/10584/11251/2/Crispdm%20ingles.png42f05763b562e177d9e770d4605a7972MD5210584/11251oai:manglar.uninorte.edu.co:10584/112512022-12-09 09:13:26.59Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=