Comparación entre árboles de regresión CART y regresión Lineal

Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los...

Full description

Autores:
Díaz Sepúlveda, Juan Felipe
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/11894
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/11894
http://bdigital.unal.edu.co/9474/
Palabra clave:
51 Matemáticas / Mathematics
Simulación
Error de predicción
Regresión Lineal
Árboles de clasificación y regresión
CART
Simulation
Prediction error
Linear Regression
CART: Classification and Regression
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande