Comparación entre árboles de regresión CART y regresión lineal

Linear regression is the most widely used method in statistics to predict values of continuous variables due to its easy interpretation, but in many situations the suppositions to apply the model are not met and some users tend to force them leading them to erroneous conclusions. CART regression tre...

Full description

Autores:
Díaz Sepúlveda, Juan Felipe
Correa, Juan Carlos
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Santo Tomás
Repositorio:
Universidad Santo Tomás
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/39582
Acceso en línea:
https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101
http://hdl.handle.net/11634/39582
Palabra clave:
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y Regresión CART
Rights
License
http://purl.org/coar/access_right/c_abf2
id SantoToma2_ce73a1f3729f5cd16c38b46782cf7259
oai_identifier_str oai:repository.usta.edu.co:11634/39582
network_acronym_str SantoToma2
network_name_str Universidad Santo Tomás
repository_id_str
spelling Díaz Sepúlveda, Juan FelipeCorrea, Juan Carlos2022-01-18T16:06:49Z2022-01-18T16:06:49Z2013-12-09https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/110110.15332/s2027-3355.2013.0002.05http://hdl.handle.net/11634/39582Linear regression is the most widely used method in statistics to predict values of continuous variables due to its easy interpretation, but in many situations the suppositions to apply the model are not met and some users tend to force them leading them to erroneous conclusions. CART regression trees is a regression alternative that does not require suppositions on the data to be analyzed and is a method of easy interpretation of results. This work compares predictive levels of linear regression with CART through simulation. In general, it was found that when the correct linear regression model is adjusted to the data, the prediction error of linear regression is always lower than that of CART. It was also found that when linear regression model is erroneously adjusted to the data, the prediction error of CART is lower than that of linear regression only when it has a sufficiently large amount of data.La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la Regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande.application/pdftext/plainapplication/octet-streamspaUniversidad Santo Tomáshttps://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/1336https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/3632https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/5254Comunicaciones en Estadística; Vol. 6 Núm. 2 (2013); 175-195Comunicaciones en Estadística; Vol. 6 No. 2 (2013); 175-1952339-30762027-3355Comparación entre árboles de regresión CART y regresión linealComparison between CART regression trees and linear regressioninfo:eu-repo/semantics/articlehttp://purl.org/coar/version/c_970fb48d4fbd8a85http://purl.org/coar/resource_type/c_2df8fbb1SimulaciónError de predicciónRegresión LinealÁrboles de clasificación y Regresión CARThttp://purl.org/coar/access_right/c_abf211634/39582oai:repository.usta.edu.co:11634/395822023-07-14 16:09:23.03metadata only accessRepositorio Universidad Santo Tomásnoreply@usta.edu.co
dc.title.spa.fl_str_mv Comparación entre árboles de regresión CART y regresión lineal
dc.title.alternative.eng.fl_str_mv Comparison between CART regression trees and linear regression
title Comparación entre árboles de regresión CART y regresión lineal
spellingShingle Comparación entre árboles de regresión CART y regresión lineal
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y Regresión CART
title_short Comparación entre árboles de regresión CART y regresión lineal
title_full Comparación entre árboles de regresión CART y regresión lineal
title_fullStr Comparación entre árboles de regresión CART y regresión lineal
title_full_unstemmed Comparación entre árboles de regresión CART y regresión lineal
title_sort Comparación entre árboles de regresión CART y regresión lineal
dc.creator.fl_str_mv Díaz Sepúlveda, Juan Felipe
Correa, Juan Carlos
dc.contributor.author.none.fl_str_mv Díaz Sepúlveda, Juan Felipe
Correa, Juan Carlos
dc.subject.proposal.spa.fl_str_mv Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y Regresión CART
topic Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y Regresión CART
description Linear regression is the most widely used method in statistics to predict values of continuous variables due to its easy interpretation, but in many situations the suppositions to apply the model are not met and some users tend to force them leading them to erroneous conclusions. CART regression trees is a regression alternative that does not require suppositions on the data to be analyzed and is a method of easy interpretation of results. This work compares predictive levels of linear regression with CART through simulation. In general, it was found that when the correct linear regression model is adjusted to the data, the prediction error of linear regression is always lower than that of CART. It was also found that when linear regression model is erroneously adjusted to the data, the prediction error of CART is lower than that of linear regression only when it has a sufficiently large amount of data.
publishDate 2013
dc.date.issued.none.fl_str_mv 2013-12-09
dc.date.accessioned.none.fl_str_mv 2022-01-18T16:06:49Z
dc.date.available.none.fl_str_mv 2022-01-18T16:06:49Z
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/article
dc.identifier.none.fl_str_mv https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101
10.15332/s2027-3355.2013.0002.05
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/39582
url https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101
http://hdl.handle.net/11634/39582
identifier_str_mv 10.15332/s2027-3355.2013.0002.05
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/1336
https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/3632
https://revistas.usantotomas.edu.co/index.php/estadistica/article/view/1101/5254
dc.relation.citationissue.spa.fl_str_mv Comunicaciones en Estadística; Vol. 6 Núm. 2 (2013); 175-195
dc.relation.citationissue.eng.fl_str_mv Comunicaciones en Estadística; Vol. 6 No. 2 (2013); 175-195
dc.relation.citationissue.none.fl_str_mv 2339-3076
2027-3355
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
text/plain
application/octet-stream
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
institution Universidad Santo Tomás
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv noreply@usta.edu.co
_version_ 1800786374862831617