Comparación de árboles de regresión y clasificación y regresión logística

El problema de la clasificación de individuos u objetos en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir éste propósito. En este trabajo se presenta la comparación, mediante simulación Monte Carlo, de dos técnicas es...

Full description

Autores:
Serna Pineda, Sandra Carolina
Tipo de recurso:
Fecha de publicación:
2009
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/2421
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/2421
http://bdigital.unal.edu.co/671/
Palabra clave:
33 Economía / Economics
58 Plantas / Plants
Árboles de clasificación y regresión
Regresión logística
Análisis de regresión logística
Regresion
Método de Montecarlo
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:El problema de la clasificación de individuos u objetos en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir éste propósito. En este trabajo se presenta la comparación, mediante simulación Monte Carlo, de dos técnicas estadísticas de clasificicación: Árboles de Regresión y Clasificación (CART) y Regresión Logística. El comportamiento de las técnicas fue medido con la Tasa de Mala Clasificación (TMC). En general, la Regresión Logística presentó una Tasa de Mala Clasificación más baja que los Árboles de Clasificación. Se presenta una aplicación a la Encuesta de Innovación y Desarrollo Tecnológico, utilizando las técnicas estudiadas, para contribuir a un mejor conocimiento del sistema nacional de innovación en Colombia. / Abstract. The classification problem of individuals or objects in known groups or populations is of great interest in statistics, for this reason it has been developed several techniques for achieving this purpose. This works presents the comparison between two classificaction techinques: Classification and Regression Trees, and Logistic Regression, by using Monte Carlo simulation. The behavior of both techniques was measured with the misclassification rate (MCR). Generally, logistic regression presented lower Misclassification rates than classification and regression trees. We present an application to the Innovation and Technologic Survey, with the mentioned techniques, to contribute to a better understanding of the national system of innovation in Colombia. The data bases were provided by the ``Descubrimiento de Conocimiento sobre la Innovación en Colombia'' project.