Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?

La clasificación de individuos es un problema muy común en el trabajo estadístico aplicado. Si X es un conjunto de datos de una población en la que sus elementos pertenecen a g clases, el objetivo de los métodos de clasificación es determinar a cuál de ellas pertenecerá una nueva observación. Cuando...

Full description

Autores:
Salazar, Diego Alejandro
Vélez, Jorge Iván
Salazar, Juan Carlos
Tipo de recurso:
Article of journal
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/41040
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/41040
http://bdigital.unal.edu.co/31137/
Palabra clave:
clasificación
genética
máquinas de soporte vectorial
regresión logística
simulación
Classification
Genetics
Logistic regression
Simulation
Support vector machines
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:La clasificación de individuos es un problema muy común en el trabajo estadístico aplicado. Si X es un conjunto de datos de una población en la que sus elementos pertenecen a g clases, el objetivo de los métodos de clasificación es determinar a cuál de ellas pertenecerá una nueva observación. Cuando g = 2, uno de los métodos más utilizados es la regresión logística. Recientemente, las Máquinas de Soporte Vectorial se han convertido en una alternativa importante. En este trabajo se exponen los principios básicos de ambos métodos y se da respuesta a la pregunta de cuál es más recomendable para discriminar, vía simulación. Finalmente, se presenta una aplicación con datos provenientes de un experimento con microarreglos.