Método computacional para la identificación de proteínas secretadas por vía no clásica

Este trabajo propuso un método computacional innovador para la clasificación de proteínas secretadas por vía no clásica. De forma específica se presenta una aproximación novedosa tanto en la comprensión y uso de los métodos basados en aprendizaje de máquina como en la solución a un problema complejo...

Full description

Autores:
Restrepo Montoya, Daniel
Tipo de recurso:
Fecha de publicación:
2010
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/70339
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/70339
http://bdigital.unal.edu.co/2584/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Bioinformática
Aprendizaje de máquina
Bacterias
Gram-Positiva
Clasificadores
Métodos de Kernel
Bioinformatics
Machine Learning
Gram-Positive bacteria
Classifiers
Kernel methods
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Este trabajo propuso un método computacional innovador para la clasificación de proteínas secretadas por vía no clásica. De forma específica se presenta una aproximación novedosa tanto en la comprensión y uso de los métodos basados en aprendizaje de máquina como en la solución a un problema complejo previamente reportado por la comunidad científica. La nueva metodología denominada SIG+SVM fue validada con datos evaluados experimentalmente superando las aproximaciones previamente reportadas para la clasificación de proteínas que cumplen con esta condición. Así mismo, se proponen transformaciones innovadoras a partir de procesos eficaces, reportando excelentes resultados, lo cual se ve reflejado de manera directa en el área de las ciencias de la vida a nivel mundial, abriendo un espacio único para el Departamento de Ingeniería de Sistemas. / Abstract. This work proposed novel computational method for classifying Gram-positive proteins that are secreted via the nonclassical secretory pathway, denoted as SIG+SVM: secretion independent Gram-positive supported vector machine. SIG+SVM implements novel approaches, both in the use and understanding of Kernel methods as well as for the solution of a biological problem. It is composed by 4 Kernel-based classifiers (frequencies, dipeptides, physicochemical factors and PSSM), each of which is based on different vectorial representations obtained by applying different amino acid sequence transformations to the input data. The method performed better than previously reported approaches proposed for classifying nonclassically secreted proteins when being tested with an experimentally validated protein dataset.