Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?
La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a c...
- Autores:
-
Salazar Blandón, Diego Alejandro
- Tipo de recurso:
- Fecha de publicación:
- 2012
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/9648
- Palabra clave:
- 51 Matemáticas / Mathematics
Máquinas de Soporte Vectorial
Regresión logística
Clasificación
Simulación estadística
Genética /Support Vector Machines
Logistic Regression
Classification
Statistical simulation
Genetics.
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_9509119d5b38c8860ba3404598a24b62 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/9648 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Salazar Uribe, Juan Carlos (Thesis advisor)ae985abc-20f2-4341-84ae-929b0ed3733e-1Salazar Blandón, Diego Alejandro8656a6cf-eac7-46c6-b72f-1b94d9c1ac3c3002019-06-24T21:04:05Z2019-06-24T21:04:05Z2012https://repositorio.unal.edu.co/handle/unal/9648http://bdigital.unal.edu.co/6594/La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a cuál de esas dos clases pertenecerá una nueva observación. Uno de los métodos más utilizados es la regresión logística (RL); su validez y desempeño han sido ampliamente demostrados en la literatura. Recientemente, las Máquinas de Soporte Vectorial (SVM), un método alterno basado en procesos algorítmicos, proporciona un enfoque diferente a la solución de este problema. En este trabajo se exponen los principios básicos de RL y SVM y se comparan, vía simulación, para dar respuesta a la pregunta de cuál es más recomendable para discriminar cuando la población puede clasificarse en dos categorías. Finalmente se presentan dos aplicaciones con datos provenientes de micro arreglos en los que se midieron los niveles de expresión de genes en pacientes con diabetes y enfermedad de Alzheimer./ Abstract. The classification of individuals or objects is a common problem in applied statistics. For instance, if X is a data set corresponding to a sample from an specific population in which all its observations belong to one of two categories, the goal of classification methods is to decide to which class a new observation will be in. One of the most and widely used classification methods is logistic regression (LR); its properties and performance have been extensively studied in the literature. Recently, Support Vector Machine (SVM), an alternative method based on highly structured algorithms, has provided a new solution to the classification problem. In this work, the fundamentals of LR and SVM are described. Also, using statistical simulation, we address the question of which of them is better to discriminate when the population can be classified in two categories. Finally, two applications with real data from microarray experiments in diabetes and Alzheimer’s disease are presented as illustration.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaSalazar Blandón, Diego Alejandro (2012) Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.51 Matemáticas / MathematicsMáquinas de Soporte VectorialRegresión logísticaClasificaciónSimulación estadísticaGenética /Support Vector MachinesLogistic RegressionClassificationStatistical simulationGenetics.Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL15373359.2012.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf1692126https://repositorio.unal.edu.co/bitstream/unal/9648/1/15373359.2012.pdf0753d85c05ccff0c201065308537bcbdMD51THUMBNAIL15373359.2012.pdf.jpg15373359.2012.pdf.jpgGenerated Thumbnailimage/jpeg3938https://repositorio.unal.edu.co/bitstream/unal/9648/2/15373359.2012.pdf.jpg95686d472d1de8adf8a5b631fcadb5ddMD52unal/9648oai:repositorio.unal.edu.co:unal/96482023-03-15 11:49:49.008Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |
dc.title.spa.fl_str_mv |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
title |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
spellingShingle |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? 51 Matemáticas / Mathematics Máquinas de Soporte Vectorial Regresión logística Clasificación Simulación estadística Genética /Support Vector Machines Logistic Regression Classification Statistical simulation Genetics. |
title_short |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
title_full |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
title_fullStr |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
title_full_unstemmed |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
title_sort |
Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? |
dc.creator.fl_str_mv |
Salazar Blandón, Diego Alejandro |
dc.contributor.advisor.spa.fl_str_mv |
Salazar Uribe, Juan Carlos (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Salazar Blandón, Diego Alejandro |
dc.subject.ddc.spa.fl_str_mv |
51 Matemáticas / Mathematics |
topic |
51 Matemáticas / Mathematics Máquinas de Soporte Vectorial Regresión logística Clasificación Simulación estadística Genética /Support Vector Machines Logistic Regression Classification Statistical simulation Genetics. |
dc.subject.proposal.spa.fl_str_mv |
Máquinas de Soporte Vectorial Regresión logística Clasificación Simulación estadística Genética /Support Vector Machines Logistic Regression Classification Statistical simulation Genetics. |
description |
La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a cuál de esas dos clases pertenecerá una nueva observación. Uno de los métodos más utilizados es la regresión logística (RL); su validez y desempeño han sido ampliamente demostrados en la literatura. Recientemente, las Máquinas de Soporte Vectorial (SVM), un método alterno basado en procesos algorítmicos, proporciona un enfoque diferente a la solución de este problema. En este trabajo se exponen los principios básicos de RL y SVM y se comparan, vía simulación, para dar respuesta a la pregunta de cuál es más recomendable para discriminar cuando la población puede clasificarse en dos categorías. Finalmente se presentan dos aplicaciones con datos provenientes de micro arreglos en los que se midieron los niveles de expresión de genes en pacientes con diabetes y enfermedad de Alzheimer./ Abstract. The classification of individuals or objects is a common problem in applied statistics. For instance, if X is a data set corresponding to a sample from an specific population in which all its observations belong to one of two categories, the goal of classification methods is to decide to which class a new observation will be in. One of the most and widely used classification methods is logistic regression (LR); its properties and performance have been extensively studied in the literature. Recently, Support Vector Machine (SVM), an alternative method based on highly structured algorithms, has provided a new solution to the classification problem. In this work, the fundamentals of LR and SVM are described. Also, using statistical simulation, we address the question of which of them is better to discriminate when the population can be classified in two categories. Finally, two applications with real data from microarray experiments in diabetes and Alzheimer’s disease are presented as illustration. |
publishDate |
2012 |
dc.date.issued.spa.fl_str_mv |
2012 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T21:04:05Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T21:04:05Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/9648 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/6594/ |
url |
https://repositorio.unal.edu.co/handle/unal/9648 http://bdigital.unal.edu.co/6594/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística Escuela de Estadística |
dc.relation.references.spa.fl_str_mv |
Salazar Blandón, Diego Alejandro (2012) Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? Maestría thesis, Universidad Nacional de Colombia, Sede Medellín. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/9648/1/15373359.2012.pdf https://repositorio.unal.edu.co/bitstream/unal/9648/2/15373359.2012.pdf.jpg |
bitstream.checksum.fl_str_mv |
0753d85c05ccff0c201065308537bcbd 95686d472d1de8adf8a5b631fcadb5dd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090259363790848 |