Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla
TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the...
- Autores:
-
Álvarez, Ricardo
López, Alejandro
Piñeres, Augusto
Selman, Isabella
- Tipo de recurso:
- Fecha de publicación:
- 2022
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/11251
- Acceso en línea:
- http://hdl.handle.net/10584/11251
- Palabra clave:
- Crispdm
Modelo de predicción
Avalúo
Barranquilla
Price prediction
Real estate appraisal
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_b1a438d3f7e1b14f682f4a9007870e8e |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/11251 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
dc.title.en_US.fl_str_mv |
Model design for price prediction and real estate appraisal in the city of Barranquilla |
title |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
spellingShingle |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla Crispdm Modelo de predicción Avalúo Barranquilla Price prediction Real estate appraisal |
title_short |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
title_full |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
title_fullStr |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
title_full_unstemmed |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
title_sort |
Diseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de Barranquilla |
dc.creator.fl_str_mv |
Álvarez, Ricardo López, Alejandro Piñeres, Augusto Selman, Isabella |
dc.contributor.advisor.none.fl_str_mv |
Peñabaena, Rita |
dc.contributor.author.none.fl_str_mv |
Álvarez, Ricardo López, Alejandro Piñeres, Augusto Selman, Isabella |
dc.subject.es_ES.fl_str_mv |
Crispdm Modelo de predicción Avalúo Barranquilla Price prediction Real estate appraisal |
topic |
Crispdm Modelo de predicción Avalúo Barranquilla Price prediction Real estate appraisal |
description |
TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the task of analyzing and interpreting the market behavior and tendencies to be able to penetrate its walls by providing satisfaction to its clients, both real estate sellers and buyers. The main objective of this project is to apply analytics methods to a database provided by TruData with the purpose of designing a robust model that allows the prediction of a real estate market price with a minimal error indicator. The methodology applied was a six-phase CRISP DM to correctly analyze the market context and the data supplied with the goal of correctly modeling the data entered. This process presented many challenges as it required an exhaustive investigation about the types of data analytics models to define which were the ones that fit the data best, considering the investigation done about successful cases of data modeling in other businesses and industries. Based on the results of this process, the models chosen to analyze the data were: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. After obtaining the results thrown by each of the chosen modules, a comparison of their performance was done, considering their RSME and MAPE. RMSE is interpreted as the deviation of the result obtained and it’s presented in the same unit as the response variable (COP). MAPE represents the average of the absolute error in percentage form. Both indicate a better result as they get smaller in quantity. The model with the best result was the one developed with Random Forest methodology, having a approximate RMSE of 84.000.000 COP. This model will allow the prediction of a property value with the manual entry of each property's independent variables. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-12-09T14:13:26Z |
dc.date.available.none.fl_str_mv |
2022-12-09T14:13:26Z |
dc.date.issued.none.fl_str_mv |
2022-12-01 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/11251 |
url |
http://hdl.handle.net/10584/11251 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2022 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
https://manglar.uninorte.edu.co/bitstream/10584/11251/3/license.txt https://manglar.uninorte.edu.co/bitstream/10584/11251/1/Crispdm%20espa%c3%b1ol.png https://manglar.uninorte.edu.co/bitstream/10584/11251/2/Crispdm%20ingles.png |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 bda2fd52eabf83cf9064742532119a9b 42f05763b562e177d9e770d4605a7972 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1818112210456543232 |
spelling |
Peñabaena, RitaÁlvarez, RicardoLópez, AlejandroPiñeres, AugustoSelman, Isabella2022-12-09T14:13:26Z2022-12-09T14:13:26Z2022-12-01http://hdl.handle.net/10584/11251TruData is a company that provides a data analytics and business intelligence service to various companies in diverse industries in Colombia. They acquired a new costumer whose business is buying and selling real estate properties at a fair price in a short period of time. The company was given the task of analyzing and interpreting the market behavior and tendencies to be able to penetrate its walls by providing satisfaction to its clients, both real estate sellers and buyers. The main objective of this project is to apply analytics methods to a database provided by TruData with the purpose of designing a robust model that allows the prediction of a real estate market price with a minimal error indicator. The methodology applied was a six-phase CRISP DM to correctly analyze the market context and the data supplied with the goal of correctly modeling the data entered. This process presented many challenges as it required an exhaustive investigation about the types of data analytics models to define which were the ones that fit the data best, considering the investigation done about successful cases of data modeling in other businesses and industries. Based on the results of this process, the models chosen to analyze the data were: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. After obtaining the results thrown by each of the chosen modules, a comparison of their performance was done, considering their RSME and MAPE. RMSE is interpreted as the deviation of the result obtained and it’s presented in the same unit as the response variable (COP). MAPE represents the average of the absolute error in percentage form. Both indicate a better result as they get smaller in quantity. The model with the best result was the one developed with Random Forest methodology, having a approximate RMSE of 84.000.000 COP. This model will allow the prediction of a property value with the manual entry of each property's independent variables.La empresa TruData se encarga de prestar el servicio de analítica de datos e inteligencia de negocios para distintas empresas de Colombia. Recientemente, adquirió un cliente nuevo que se dedica a la compra y venta rápida de propiedades inmobiliarias del país, y desean empezar operaciones en Barranquilla. A la empresa se le encargó la tarea de analizar las tendencias y el comportamiento del mercado actual en la ciudad para lograr penetrarlo brindando satisfacción a sus clientes. El objetivo de este proyecto es aplicar métodos de analítica a una base de datos suministrada por TruData con el fin de diseñar un modelo que permita predecir el valor de un inmueble con un indicador de error mínimo. Para lograr esto, se decide optar por utilizar CRISP DM, una metodología que consiste en seguir una serie de pasos para analizar correctamente una base de datos. Este proceso implicó muchos retos dado que se llevó a cabo una investigación exhaustiva sobre los tipos de modelos de análisis de datos con el fin de definir cuáles serían los mejores para comparar, teniendo en cuenta la investigación realizada sobre casos de éxito de modelación de datos. Con base en los resultados de este proceso se optó por analizar los datos mediante los modelos: GLM BOOST, Random Forest, Regresión Lineal Múltiple, XGBOOST y RIDGE Regression. Al obtener los resultados de cada uno de los modelos, se realizó una comparativa de su rendimiento según su RMSE y MAPE. El RMSE se interpreta como la desviación de los datos y se arroja en la misma unidad de la variable respuesta (COP). El MAPE interpreta la media del error absoluto en porcentaje y, al igual que el RMSE, indica un mejor resultado cuando es más bajo. El modelo con mejor resultado fue el desarrollado mediante la metodología Random Forest, con un RMSE aproximado de 84.000.000 COP. Este modelo permitirá predecir un precio de venta de un inmueble con el ingreso manual de las variables independientes de la respectiva propiedad.spaBarranquilla, Universidad del Norte, 2022Universidad del Nortehttp://purl.org/coar/access_right/c_abf2CrispdmModelo de predicciónAvalúoBarranquillaPrice predictionReal estate appraisalDiseño de modelo para predicción de precio y avalúo de inmuebles en la ciudad de BarranquillaModel design for price prediction and real estate appraisal in the city of Barranquillaarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/11251/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALCrispdm español.pngCrispdm español.pngMetodología CRISP-DMimage/png128113https://manglar.uninorte.edu.co/bitstream/10584/11251/1/Crispdm%20espa%c3%b1ol.pngbda2fd52eabf83cf9064742532119a9bMD51Crispdm ingles.pngCrispdm ingles.pngCRISP-DM 6 PHASESimage/png124315https://manglar.uninorte.edu.co/bitstream/10584/11251/2/Crispdm%20ingles.png42f05763b562e177d9e770d4605a7972MD5210584/11251oai:manglar.uninorte.edu.co:10584/112512022-12-09 09:13:26.59Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |