Comparación entre árboles de regresión CART y regresión Lineal

Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los...

Full description

Autores:
Díaz Sepúlveda, Juan Felipe
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/11894
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/11894
http://bdigital.unal.edu.co/9474/
Palabra clave:
51 Matemáticas / Mathematics
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y regresión
CART
Simulation
Prediction error
Linear Regression
CART: Classification and Regression
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_3c364ce61ed98431f77999b0ab7dfe19
oai_identifier_str oai:repositorio.unal.edu.co:unal/11894
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Correa Morales, Juan Carlos (Thesis advisor)5ce5bfe7-ef62-414b-a49c-747c8fecaff1-1Díaz Sepúlveda, Juan Felipea882e47c-13e8-4bc2-b1c6-0b36e239e2923002019-06-25T00:33:08Z2019-06-25T00:33:08Z2013https://repositorio.unal.edu.co/handle/unal/11894http://bdigital.unal.edu.co/9474/Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grandeAbstract Linear regression is the statistical method most used to predict values of continuous variables because of its easy interpretation, but in many situations to apply the model assumptions are not met and some users tend to force leading to erroneous conclusions. CART regression trees are an alternative regression requires no assumptions about the data to be analyzed and a method of easy interpretation of the results. In this paper we compare the predictive level from both CART and linear regression through simulation. In general, it was found that when adjusting the correct linear regression model to the data, the linear regression prediction error is always less than the CART prediction error. We also found that when adjusted erroneously linear regression model to the data, CART prediction error is smaller than the linear regression prediction error only when it has a sufficiently large amount of dataMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaDíaz Sepúlveda, Juan Felipe (2013) Comparación entre árboles de regresión CART y regresión Lineal. Maestría thesis, Universidad Nacional de Colombia, Medellín.51 Matemáticas / MathematicsSimulaciónError de predicciónRegresión LinealÁrboles de clasificación y regresiónCARTSimulationPrediction errorLinear RegressionCART: Classification and RegressionComparación entre árboles de regresión CART y regresión LinealTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL71269839.2013.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf4515647https://repositorio.unal.edu.co/bitstream/unal/11894/1/71269839.2013.pdfcd2aff4eb89f59b5488d63b4617d1336MD51THUMBNAIL71269839.2013.pdf.jpg71269839.2013.pdf.jpgGenerated Thumbnailimage/jpeg3821https://repositorio.unal.edu.co/bitstream/unal/11894/2/71269839.2013.pdf.jpge1849b2d5fc516d1b6302fb65298809eMD52unal/11894oai:repositorio.unal.edu.co:unal/118942023-09-20 23:06:07.961Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Comparación entre árboles de regresión CART y regresión Lineal
title Comparación entre árboles de regresión CART y regresión Lineal
spellingShingle Comparación entre árboles de regresión CART y regresión Lineal
51 Matemáticas / Mathematics
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y regresión
CART
Simulation
Prediction error
Linear Regression
CART: Classification and Regression
title_short Comparación entre árboles de regresión CART y regresión Lineal
title_full Comparación entre árboles de regresión CART y regresión Lineal
title_fullStr Comparación entre árboles de regresión CART y regresión Lineal
title_full_unstemmed Comparación entre árboles de regresión CART y regresión Lineal
title_sort Comparación entre árboles de regresión CART y regresión Lineal
dc.creator.fl_str_mv Díaz Sepúlveda, Juan Felipe
dc.contributor.advisor.spa.fl_str_mv Correa Morales, Juan Carlos (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Díaz Sepúlveda, Juan Felipe
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
topic 51 Matemáticas / Mathematics
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y regresión
CART
Simulation
Prediction error
Linear Regression
CART: Classification and Regression
dc.subject.proposal.spa.fl_str_mv Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y regresión
CART
Simulation
Prediction error
Linear Regression
CART: Classification and Regression
description Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande
publishDate 2013
dc.date.issued.spa.fl_str_mv 2013
dc.date.accessioned.spa.fl_str_mv 2019-06-25T00:33:08Z
dc.date.available.spa.fl_str_mv 2019-06-25T00:33:08Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/11894
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/9474/
url https://repositorio.unal.edu.co/handle/unal/11894
http://bdigital.unal.edu.co/9474/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística
Escuela de Estadística
dc.relation.references.spa.fl_str_mv Díaz Sepúlveda, Juan Felipe (2013) Comparación entre árboles de regresión CART y regresión Lineal. Maestría thesis, Universidad Nacional de Colombia, Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/11894/1/71269839.2013.pdf
https://repositorio.unal.edu.co/bitstream/unal/11894/2/71269839.2013.pdf.jpg
bitstream.checksum.fl_str_mv cd2aff4eb89f59b5488d63b4617d1336
e1849b2d5fc516d1b6302fb65298809e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089872046030848