Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.

Mediante este trabajo se automatizó el proceso de anotación de secuencias proteicas, a través del uso de técnicas de aprendizaje de máquina supervisado y kernels de secuencias conocidos también como string kernels, para ello se implementan tres tipos de kernel, en conjunto con una metodología para l...

Full description

Autores:
Cardona Escobar, Andrés Felipe
Pineda Iral, Juan Camilo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2015
Institución:
Instituto Tecnológico Metropolitano
Repositorio:
Repositorio ITM
Idioma:
spa
OAI Identifier:
oai:repositorio.itm.edu.co:20.500.12622/110
Acceso en línea:
http://hdl.handle.net/20.500.12622/110
Palabra clave:
Máquinas de soporte vectorial
Aprendizaje automático
kernel (Informática)
Reconocimiento de patrones
Algoritmos heurísticos
Métodos heurísticos
Genetic algorithms
Mathematical models
Simulation methods
Digital control systems
ALGORITMOS GENÉTICOS
MODELOS MATEMÁTICOS
MÉTODOS DE SIMULACIÓN
SISTEMAS DE CONTROL DIGITAL
Rights
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id RepoITM2_21a7e29b51b36601f74f8aa6a1bffbad
oai_identifier_str oai:repositorio.itm.edu.co:20.500.12622/110
network_acronym_str RepoITM2
network_name_str Repositorio ITM
repository_id_str
spelling Jaramillo Garzón, Jorge AlbertoCardona Escobar, Andrés FelipePineda Iral, Juan Camilo2019-02-28T19:59:42Z2018-08-13T21:48:59Z2019-02-28T19:59:42Z2018-08-13T21:48:59Z2015http://hdl.handle.net/20.500.12622/110instname:Instituto Tecnológico Metropolitanoreponame:Repositorio Institucional Instituto Tecnológico Metropolitanorepourl:https://repositorio.itm.edu.co/Mediante este trabajo se automatizó el proceso de anotación de secuencias proteicas, a través del uso de técnicas de aprendizaje de máquina supervisado y kernels de secuencias conocidos también como string kernels, para ello se implementan tres tipos de kernel, en conjunto con una metodología para la clasificación supervisada de secuencias proteicas, que incluye máquinas de vectores de soporte (SVM) para resolver 14 problemas de clasificación que hacen referencia a funciones moleculares de plantas terrestres (Embryophyta). La metodología implementada utiliza algoritmos meta-heurísticos bio-inspirados para encontrar los parámetros óptimos de la SVM, a través de una validación cruzada de 10 particiones. Con el propósito de resolver el problema del desbalance de clases, se asignan pesos a las mismas y luego se introducen como hiperparámetros al clasificador, esto con el fin de evitar métodos de muestreo usados para adicionar o quitar muestras. Los resultados obtenidos fueron comparados con el kernel de base radial (RBF) bajo la misma metodología. La media geométrica entre la sensibilidad y la especificidad fue utilizada como medida de desempeño global, los resultados obtenidos muestran que el desempeño de los kernels de secuencias fue mejor en la mayoría de los problemas, mostrando que este tipo de kernels, son una herramienta adecuada para el problema tratado.Ingeniero MecatrónicopregradoRecurso electrónicoapplication/pdfspaInstituto Tecnológico MetropolitanoFacultad de IngenieríasIngeniería MecatrónicaInstituto Tecnológico Metropolitanohttp://creativecommons.org/licenses/by-nc-nd/4.0/Acceso abiertoAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://purl.org/coar/access_right/c_abf2Máquinas de soporte vectorialAprendizaje automáticokernel (Informática)Reconocimiento de patronesAlgoritmos heurísticosMétodos heurísticosGenetic algorithmsMathematical modelsSimulation methodsDigital control systemsALGORITMOS GENÉTICOSMODELOS MATEMÁTICOSMÉTODOS DE SIMULACIÓNSISTEMAS DE CONTROL DIGITALMetodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.A methodology for the prediction of Embryophyta protein functions using string kernels.Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisLICENSElicense.txttext/plain0https://repositorio.itm.edu.co/bitstream/20.500.12622/110/1/license.txtd41d8cd98f00b204e9800998ecf8427eMD51ORIGINALCardonaEscobarAndresFelipe2017.pdfTesisapplication/pdf2272716https://repositorio.itm.edu.co/bitstream/20.500.12622/110/2/CardonaEscobarAndresFelipe2017.pdfd99dd9bcfa799aec574cc7102b175fb9MD52THUMBNAILCardonaEscobarAndresFelipe2017.pdf.jpgCardonaEscobarAndresFelipe2017.pdf.jpgGenerated Thumbnailimage/jpeg4171https://repositorio.itm.edu.co/bitstream/20.500.12622/110/3/CardonaEscobarAndresFelipe2017.pdf.jpg401d28872e92dffca82121e87491260aMD5320.500.12622/110oai:repositorio.itm.edu.co:20.500.12622/1102021-03-23 09:50:30.832Repositorio Instituto Tecnológico Metropolitano ITMrepositorio@itm.edu.co
dc.title.spa.fl_str_mv Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
dc.title.translated.eng.fl_str_mv A methodology for the prediction of Embryophyta protein functions using string kernels.
title Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
spellingShingle Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
Máquinas de soporte vectorial
Aprendizaje automático
kernel (Informática)
Reconocimiento de patrones
Algoritmos heurísticos
Métodos heurísticos
Genetic algorithms
Mathematical models
Simulation methods
Digital control systems
ALGORITMOS GENÉTICOS
MODELOS MATEMÁTICOS
MÉTODOS DE SIMULACIÓN
SISTEMAS DE CONTROL DIGITAL
title_short Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
title_full Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
title_fullStr Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
title_full_unstemmed Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
title_sort Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias.
dc.creator.fl_str_mv Cardona Escobar, Andrés Felipe
Pineda Iral, Juan Camilo
dc.contributor.advisor.none.fl_str_mv Jaramillo Garzón, Jorge Alberto
dc.contributor.author.none.fl_str_mv Cardona Escobar, Andrés Felipe
Pineda Iral, Juan Camilo
dc.subject.spa.fl_str_mv Máquinas de soporte vectorial
Aprendizaje automático
kernel (Informática)
Reconocimiento de patrones
Algoritmos heurísticos
Métodos heurísticos
topic Máquinas de soporte vectorial
Aprendizaje automático
kernel (Informática)
Reconocimiento de patrones
Algoritmos heurísticos
Métodos heurísticos
Genetic algorithms
Mathematical models
Simulation methods
Digital control systems
ALGORITMOS GENÉTICOS
MODELOS MATEMÁTICOS
MÉTODOS DE SIMULACIÓN
SISTEMAS DE CONTROL DIGITAL
dc.subject.keywords.eng.fl_str_mv Genetic algorithms
Mathematical models
Simulation methods
Digital control systems
dc.subject.lemb.spa.fl_str_mv ALGORITMOS GENÉTICOS
MODELOS MATEMÁTICOS
MÉTODOS DE SIMULACIÓN
SISTEMAS DE CONTROL DIGITAL
description Mediante este trabajo se automatizó el proceso de anotación de secuencias proteicas, a través del uso de técnicas de aprendizaje de máquina supervisado y kernels de secuencias conocidos también como string kernels, para ello se implementan tres tipos de kernel, en conjunto con una metodología para la clasificación supervisada de secuencias proteicas, que incluye máquinas de vectores de soporte (SVM) para resolver 14 problemas de clasificación que hacen referencia a funciones moleculares de plantas terrestres (Embryophyta). La metodología implementada utiliza algoritmos meta-heurísticos bio-inspirados para encontrar los parámetros óptimos de la SVM, a través de una validación cruzada de 10 particiones. Con el propósito de resolver el problema del desbalance de clases, se asignan pesos a las mismas y luego se introducen como hiperparámetros al clasificador, esto con el fin de evitar métodos de muestreo usados para adicionar o quitar muestras. Los resultados obtenidos fueron comparados con el kernel de base radial (RBF) bajo la misma metodología. La media geométrica entre la sensibilidad y la especificidad fue utilizada como medida de desempeño global, los resultados obtenidos muestran que el desempeño de los kernels de secuencias fue mejor en la mayoría de los problemas, mostrando que este tipo de kernels, son una herramienta adecuada para el problema tratado.
publishDate 2015
dc.date.issued.none.fl_str_mv 2015
dc.date.accessioned.none.fl_str_mv 2018-08-13T21:48:59Z
2019-02-28T19:59:42Z
dc.date.available.none.fl_str_mv 2018-08-13T21:48:59Z
2019-02-28T19:59:42Z
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12622/110
dc.identifier.instname.spa.fl_str_mv instname:Instituto Tecnológico Metropolitano
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Instituto Tecnológico Metropolitano
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.itm.edu.co/
url http://hdl.handle.net/20.500.12622/110
identifier_str_mv instname:Instituto Tecnológico Metropolitano
reponame:Repositorio Institucional Instituto Tecnológico Metropolitano
repourl:https://repositorio.itm.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.local.spa.fl_str_mv Acceso abierto
dc.rights.creativecommons.*.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
Acceso abierto
Attribution-NonCommercial-NoDerivatives 4.0 International
http://purl.org/coar/access_right/c_abf2
dc.format.medium.spa.fl_str_mv Recurso electrónico
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Instituto Tecnológico Metropolitano
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingenierías
dc.publisher.program.spa.fl_str_mv Ingeniería Mecatrónica
dc.publisher.grantor.spa.fl_str_mv Instituto Tecnológico Metropolitano
institution Instituto Tecnológico Metropolitano
bitstream.url.fl_str_mv https://repositorio.itm.edu.co/bitstream/20.500.12622/110/1/license.txt
https://repositorio.itm.edu.co/bitstream/20.500.12622/110/2/CardonaEscobarAndresFelipe2017.pdf
https://repositorio.itm.edu.co/bitstream/20.500.12622/110/3/CardonaEscobarAndresFelipe2017.pdf.jpg
bitstream.checksum.fl_str_mv d41d8cd98f00b204e9800998ecf8427e
d99dd9bcfa799aec574cc7102b175fb9
401d28872e92dffca82121e87491260a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Instituto Tecnológico Metropolitano ITM
repository.mail.fl_str_mv repositorio@itm.edu.co
_version_ 1808408177274781696