Comparación entre métodos para clasificación usando algunas distribuciones multivariadas

El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo prev...

Full description

Autores:
Cortés Vélez, Catalina Inés
Tipo de recurso:
Fecha de publicación:
2014
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/75216
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/75216
http://bdigital.unal.edu.co/39733/
Palabra clave:
51 Matemáticas / Mathematics
Clasificación
Máquinas de soporte vectorial
Regresión logística
Análisis discriminante lineal
Tasa de clasificación errónea
Classification
Support vector machines
Logistic regression
Linear dis-criminant analysis
False discovery rate
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo previo Salazar, Vélez y Salazar comparan vía simulación la eficiencia de las máquinas de soporte vectorial y la Regresión Logística, para datos que necesiten la clasificación en dos grupos y que posean una distribución univariada. En este trabajo se compara la eficiencia de Regresión Logística, Máquinas de Soporte Vectorial, Análisis Discriminante y Clasificador Fuzzy, para clasificar un grupo de datos en dos categorías mutuamente excluyentes, en el escenario de datos multivariados provenientes de poblaciones con distribución normal multivariada, normal asimétrica y t multivariada. Dicha eficiencia o desempeño se medirá con la tasa de clasificación errónea.