Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?

La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a c...

Full description

Autores:
Salazar Blandón, Diego Alejandro
Tipo de recurso:
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/9648
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/9648
http://bdigital.unal.edu.co/6594/
Palabra clave:
51 Matemáticas / Mathematics
Máquinas de Soporte Vectorial
Regresión logística
Clasificación
Simulación estadística
Genética /Support Vector Machines
Logistic Regression
Classification
Statistical simulation
Genetics.
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_9509119d5b38c8860ba3404598a24b62
oai_identifier_str oai:repositorio.unal.edu.co:unal/9648
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Salazar Uribe, Juan Carlos (Thesis advisor)ae985abc-20f2-4341-84ae-929b0ed3733e-1Salazar Blandón, Diego Alejandro8656a6cf-eac7-46c6-b72f-1b94d9c1ac3c3002019-06-24T21:04:05Z2019-06-24T21:04:05Z2012https://repositorio.unal.edu.co/handle/unal/9648http://bdigital.unal.edu.co/6594/La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a cuál de esas dos clases pertenecerá una nueva observación. Uno de los métodos más utilizados es la regresión logística (RL); su validez y desempeño han sido ampliamente demostrados en la literatura. Recientemente, las Máquinas de Soporte Vectorial (SVM), un método alterno basado en procesos algorítmicos, proporciona un enfoque diferente a la solución de este problema. En este trabajo se exponen los principios básicos de RL y SVM y se comparan, vía simulación, para dar respuesta a la pregunta de cuál es más recomendable para discriminar cuando la población puede clasificarse en dos categorías. Finalmente se presentan dos aplicaciones con datos provenientes de micro arreglos en los que se midieron los niveles de expresión de genes en pacientes con diabetes y enfermedad de Alzheimer./ Abstract. The classification of individuals or objects is a common problem in applied statistics. For instance, if X is a data set corresponding to a sample from an specific population in which all its observations belong to one of two categories, the goal of classification methods is to decide to which class a new observation will be in. One of the most and widely used classification methods is logistic regression (LR); its properties and performance have been extensively studied in the literature. Recently, Support Vector Machine (SVM), an alternative method based on highly structured algorithms, has provided a new solution to the classification problem. In this work, the fundamentals of LR and SVM are described. Also, using statistical simulation, we address the question of which of them is better to discriminate when the population can be classified in two categories. Finally, two applications with real data from microarray experiments in diabetes and Alzheimer’s disease are presented as illustration.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaSalazar Blandón, Diego Alejandro (2012) Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.51 Matemáticas / MathematicsMáquinas de Soporte VectorialRegresión logísticaClasificaciónSimulación estadísticaGenética /Support Vector MachinesLogistic RegressionClassificationStatistical simulationGenetics.Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL15373359.2012.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf1692126https://repositorio.unal.edu.co/bitstream/unal/9648/1/15373359.2012.pdf0753d85c05ccff0c201065308537bcbdMD51THUMBNAIL15373359.2012.pdf.jpg15373359.2012.pdf.jpgGenerated Thumbnailimage/jpeg3938https://repositorio.unal.edu.co/bitstream/unal/9648/2/15373359.2012.pdf.jpg95686d472d1de8adf8a5b631fcadb5ddMD52unal/9648oai:repositorio.unal.edu.co:unal/96482023-03-15 11:49:49.008Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
title Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
spellingShingle Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
51 Matemáticas / Mathematics
Máquinas de Soporte Vectorial
Regresión logística
Clasificación
Simulación estadística
Genética /Support Vector Machines
Logistic Regression
Classification
Statistical simulation
Genetics.
title_short Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
title_full Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
title_fullStr Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
title_full_unstemmed Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
title_sort Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
dc.creator.fl_str_mv Salazar Blandón, Diego Alejandro
dc.contributor.advisor.spa.fl_str_mv Salazar Uribe, Juan Carlos (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Salazar Blandón, Diego Alejandro
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
topic 51 Matemáticas / Mathematics
Máquinas de Soporte Vectorial
Regresión logística
Clasificación
Simulación estadística
Genética /Support Vector Machines
Logistic Regression
Classification
Statistical simulation
Genetics.
dc.subject.proposal.spa.fl_str_mv Máquinas de Soporte Vectorial
Regresión logística
Clasificación
Simulación estadística
Genética /Support Vector Machines
Logistic Regression
Classification
Statistical simulation
Genetics.
description La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a cuál de esas dos clases pertenecerá una nueva observación. Uno de los métodos más utilizados es la regresión logística (RL); su validez y desempeño han sido ampliamente demostrados en la literatura. Recientemente, las Máquinas de Soporte Vectorial (SVM), un método alterno basado en procesos algorítmicos, proporciona un enfoque diferente a la solución de este problema. En este trabajo se exponen los principios básicos de RL y SVM y se comparan, vía simulación, para dar respuesta a la pregunta de cuál es más recomendable para discriminar cuando la población puede clasificarse en dos categorías. Finalmente se presentan dos aplicaciones con datos provenientes de micro arreglos en los que se midieron los niveles de expresión de genes en pacientes con diabetes y enfermedad de Alzheimer./ Abstract. The classification of individuals or objects is a common problem in applied statistics. For instance, if X is a data set corresponding to a sample from an specific population in which all its observations belong to one of two categories, the goal of classification methods is to decide to which class a new observation will be in. One of the most and widely used classification methods is logistic regression (LR); its properties and performance have been extensively studied in the literature. Recently, Support Vector Machine (SVM), an alternative method based on highly structured algorithms, has provided a new solution to the classification problem. In this work, the fundamentals of LR and SVM are described. Also, using statistical simulation, we address the question of which of them is better to discriminate when the population can be classified in two categories. Finally, two applications with real data from microarray experiments in diabetes and Alzheimer’s disease are presented as illustration.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-24T21:04:05Z
dc.date.available.spa.fl_str_mv 2019-06-24T21:04:05Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/9648
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/6594/
url https://repositorio.unal.edu.co/handle/unal/9648
http://bdigital.unal.edu.co/6594/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística
Escuela de Estadística
dc.relation.references.spa.fl_str_mv Salazar Blandón, Diego Alejandro (2012) Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/9648/1/15373359.2012.pdf
https://repositorio.unal.edu.co/bitstream/unal/9648/2/15373359.2012.pdf.jpg
bitstream.checksum.fl_str_mv 0753d85c05ccff0c201065308537bcbd
95686d472d1de8adf8a5b631fcadb5dd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814090259363790848