Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?

La clasificación de individuos es un problema muy común en el trabajo estadístico aplicado. Si X es un conjunto de datos de una población en la que sus elementos pertenecen a g clases, el objetivo de los métodos de clasificación es determinar a cuál de ellas pertenecerá una nueva observación. Cuando...

Full description

Autores:
Salazar, Diego Alejandro
Vélez, Jorge Iván
Salazar, Juan Carlos
Tipo de recurso:
Article of journal
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/41040
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/41040
http://bdigital.unal.edu.co/31137/
Palabra clave:
clasificación
genética
máquinas de soporte vectorial
regresión logística
simulación
Classification
Genetics
Logistic regression
Simulation
Support vector machines
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_cbe1a57a6c57af165fb3b6b8e9745e3b
oai_identifier_str oai:repositorio.unal.edu.co:unal/41040
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Salazar, Diego Alejandrocfe17245-7ad1-4980-be5f-885b82e1aa51300Vélez, Jorge Iván27ceb407-d2b0-40f8-a9da-fcb3bc1b3db6300Salazar, Juan Carlosc8d2539b-f0c5-475c-8f49-719df10293b73002019-06-28T09:47:16Z2019-06-28T09:47:16Z2012https://repositorio.unal.edu.co/handle/unal/41040http://bdigital.unal.edu.co/31137/La clasificación de individuos es un problema muy común en el trabajo estadístico aplicado. Si X es un conjunto de datos de una población en la que sus elementos pertenecen a g clases, el objetivo de los métodos de clasificación es determinar a cuál de ellas pertenecerá una nueva observación. Cuando g = 2, uno de los métodos más utilizados es la regresión logística. Recientemente, las Máquinas de Soporte Vectorial se han convertido en una alternativa importante. En este trabajo se exponen los principios básicos de ambos métodos y se da respuesta a la pregunta de cuál es más recomendable para discriminar, vía simulación. Finalmente, se presenta una aplicación con datos provenientes de un experimento con microarreglos.The classification of individuals is a common problem in applied statistics. If X is a data set corresponding to a sample from an specific population in which observations belong to g different categories, the goal of classification methods is to determine to which of them a new observation will belong to. When g = 2, logistic regression (LR) is one of the most widely used classification methods. More recently, Support Vector Machines (SVM) has become an important alternative. In this paper, the fundamentals of LR and SVM are described, and the question of which one is better to discriminate is addressed using statistical simulation. An application with real data from a microarray experiment is presented as illustration.application/pdfspaUniversidad Nacional de Colombiahttp://revistas.unal.edu.co/index.php/estad/article/view/30268Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de EstadísticaRevista Colombiana de EstadísticaRevista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 0120-1751Salazar, Diego Alejandro and Vélez, Jorge Iván and Salazar, Juan Carlos (2012) Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar? Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 0120-1751 .Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?Artículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTclasificacióngenéticamáquinas de soporte vectorialregresión logísticasimulaciónClassificationGeneticsLogistic regressionSimulationSupport vector machinesORIGINAL30268-109321-1-PB.pdfapplication/pdf850488https://repositorio.unal.edu.co/bitstream/unal/41040/1/30268-109321-1-PB.pdfd508af430ba1b616c51ec869c884afa7MD5130268-142433-1-PB.htmltext/html11365https://repositorio.unal.edu.co/bitstream/unal/41040/2/30268-142433-1-PB.html605a5027f5063a6fde1a52b6d3ec04e4MD52THUMBNAIL30268-109321-1-PB.pdf.jpg30268-109321-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg5393https://repositorio.unal.edu.co/bitstream/unal/41040/3/30268-109321-1-PB.pdf.jpgce7abcf1486a8af0f2c16da14b8adbb3MD53unal/41040oai:repositorio.unal.edu.co:unal/410402023-01-31 23:06:04.135Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
title Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
spellingShingle Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
clasificación
genética
máquinas de soporte vectorial
regresión logística
simulación
Classification
Genetics
Logistic regression
Simulation
Support vector machines
title_short Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
title_full Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
title_fullStr Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
title_full_unstemmed Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
title_sort Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar?
dc.creator.fl_str_mv Salazar, Diego Alejandro
Vélez, Jorge Iván
Salazar, Juan Carlos
dc.contributor.author.spa.fl_str_mv Salazar, Diego Alejandro
Vélez, Jorge Iván
Salazar, Juan Carlos
dc.subject.proposal.spa.fl_str_mv clasificación
genética
máquinas de soporte vectorial
regresión logística
simulación
Classification
Genetics
Logistic regression
Simulation
Support vector machines
topic clasificación
genética
máquinas de soporte vectorial
regresión logística
simulación
Classification
Genetics
Logistic regression
Simulation
Support vector machines
description La clasificación de individuos es un problema muy común en el trabajo estadístico aplicado. Si X es un conjunto de datos de una población en la que sus elementos pertenecen a g clases, el objetivo de los métodos de clasificación es determinar a cuál de ellas pertenecerá una nueva observación. Cuando g = 2, uno de los métodos más utilizados es la regresión logística. Recientemente, las Máquinas de Soporte Vectorial se han convertido en una alternativa importante. En este trabajo se exponen los principios básicos de ambos métodos y se da respuesta a la pregunta de cuál es más recomendable para discriminar, vía simulación. Finalmente, se presenta una aplicación con datos provenientes de un experimento con microarreglos.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-28T09:47:16Z
dc.date.available.spa.fl_str_mv 2019-06-28T09:47:16Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/41040
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/31137/
url https://repositorio.unal.edu.co/handle/unal/41040
http://bdigital.unal.edu.co/31137/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/estad/article/view/30268
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Estadística
Revista Colombiana de Estadística
dc.relation.ispartofseries.none.fl_str_mv Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 0120-1751
dc.relation.references.spa.fl_str_mv Salazar, Diego Alejandro and Vélez, Jorge Iván and Salazar, Juan Carlos (2012) Comparación entre svm y regresión logística: ¿cuál es más recomendable para discriminar? Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 Revista Colombiana de Estadística; Vol. 35, núm. 2 (2012): Número especial en Bioestadística; 223-237 0120-1751 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/41040/1/30268-109321-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/41040/2/30268-142433-1-PB.html
https://repositorio.unal.edu.co/bitstream/unal/41040/3/30268-109321-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv d508af430ba1b616c51ec869c884afa7
605a5027f5063a6fde1a52b6d3ec04e4
ce7abcf1486a8af0f2c16da14b8adbb3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089888207732736