Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas

Este trabajo presenta una metodología de solución al problema de clasificación de residuos catalíticos en sitios activos de enzimas. Esta metodología está basada en el aprendizaje de máquina específicamente en las máquinas de soporte vectorial (MSV); que junto a las funciones kernel permite clasific...

Full description

Autores:
Hernández González, Nelson
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/20209
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/20209
http://bdigital.unal.edu.co/10683/
Palabra clave:
0 Generalidades / Computer science, information and general works
57 Ciencias de la vida; Biología / Life sciences; biology
66 Ingeniería química y Tecnologías relacionadas/ Chemical engineering
Máquinas de soporte vectorial
Funciones kernel
Sitios catalíticos
Support Vector Machine
Kernel functions
Catalytic sites
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_f85bf8ca43039c480058a55a28b05baa
oai_identifier_str oai:repositorio.unal.edu.co:unal/20209
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Niño V., Luis FernandoHernández González, Nelson57c8ed48-c1d0-4cbe-ac0b-22e4a6f7d0463002019-06-25T18:25:22Z2019-06-25T18:25:22Z2013https://repositorio.unal.edu.co/handle/unal/20209http://bdigital.unal.edu.co/10683/Este trabajo presenta una metodología de solución al problema de clasificación de residuos catalíticos en sitios activos de enzimas. Esta metodología está basada en el aprendizaje de máquina específicamente en las máquinas de soporte vectorial (MSV); que junto a las funciones kernel permite clasificar residuos en enzimas a partir de su secuencia. El conjunto de datos utilizados fue Catalytic Site Atlas (CSA). En la metodología planteada, en primer lugar encontramos la información biológica de los residuos integrada con la representación en secuencia de la enzima que lo contiene; esto por medio de las funciones kernel gaussiano y string, respectivamente. Posteriormente; el algoritmo jerárquico AGNES (Agglomerative Nesting) es aplicado para obtener un número de grupos inicial para el algoritmo de agrupación k-medias; obteniendo como resultado cinco grupos de enzimas. Por último, para cada grupo se desarrolló un sistema basado en MSV. La estimación del error de generalización después de validación cruzada es usada como criterio de desempeño del modelo.Abstract. This project presents a methodology to solve the problem of classification of catalytic residues in enzyme active sites. This methodology is based on machine learning and more specifically support vector machine (SVM); which together with the kernel functions allows classifying residues in enzyme with their own sequence. The dataset used during this study was Catalytic Site Atlas (CSA). In the proposed methodology, first it is found the biologic information of the residues integrated with the sequence representation of the enzyme that contains the residue. This is done by means of the Gaussian and string kernel functions, respectively. Afterwards, the hierarchical clustering algorithm AGNES (Agglomerative Nesting) is applied in order to get a number of groups to initialize the k-means clustering algorithm, obtaining as result five groups of enzymes. Finally, for each one of the clusters, it was developed a sorting system based on SVM. The estimation of generalization error using cross validation is used as criteria of model performance.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialHernández González, Nelson (2013) Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas. Maestría thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works57 Ciencias de la vida; Biología / Life sciences; biology66 Ingeniería química y Tecnologías relacionadas/ Chemical engineeringMáquinas de soporte vectorialFunciones kernelSitios catalíticosSupport Vector MachineKernel functionsCatalytic sitesMétodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimasTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299799.2013.pdfapplication/pdf1545441https://repositorio.unal.edu.co/bitstream/unal/20209/1/299799.2013.pdfde45bfd290d5e8250d22211c4baf0227MD51THUMBNAIL299799.2013.pdf.jpg299799.2013.pdf.jpgGenerated Thumbnailimage/jpeg4206https://repositorio.unal.edu.co/bitstream/unal/20209/2/299799.2013.pdf.jpg98b72f5fd3b13c10ba40409e48a914eaMD52unal/20209oai:repositorio.unal.edu.co:unal/202092023-09-25 23:05:38.01Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
title Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
spellingShingle Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
0 Generalidades / Computer science, information and general works
57 Ciencias de la vida; Biología / Life sciences; biology
66 Ingeniería química y Tecnologías relacionadas/ Chemical engineering
Máquinas de soporte vectorial
Funciones kernel
Sitios catalíticos
Support Vector Machine
Kernel functions
Catalytic sites
title_short Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
title_full Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
title_fullStr Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
title_full_unstemmed Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
title_sort Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas
dc.creator.fl_str_mv Hernández González, Nelson
dc.contributor.author.spa.fl_str_mv Hernández González, Nelson
dc.contributor.spa.fl_str_mv Niño V., Luis Fernando
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
57 Ciencias de la vida; Biología / Life sciences; biology
66 Ingeniería química y Tecnologías relacionadas/ Chemical engineering
topic 0 Generalidades / Computer science, information and general works
57 Ciencias de la vida; Biología / Life sciences; biology
66 Ingeniería química y Tecnologías relacionadas/ Chemical engineering
Máquinas de soporte vectorial
Funciones kernel
Sitios catalíticos
Support Vector Machine
Kernel functions
Catalytic sites
dc.subject.proposal.spa.fl_str_mv Máquinas de soporte vectorial
Funciones kernel
Sitios catalíticos
Support Vector Machine
Kernel functions
Catalytic sites
description Este trabajo presenta una metodología de solución al problema de clasificación de residuos catalíticos en sitios activos de enzimas. Esta metodología está basada en el aprendizaje de máquina específicamente en las máquinas de soporte vectorial (MSV); que junto a las funciones kernel permite clasificar residuos en enzimas a partir de su secuencia. El conjunto de datos utilizados fue Catalytic Site Atlas (CSA). En la metodología planteada, en primer lugar encontramos la información biológica de los residuos integrada con la representación en secuencia de la enzima que lo contiene; esto por medio de las funciones kernel gaussiano y string, respectivamente. Posteriormente; el algoritmo jerárquico AGNES (Agglomerative Nesting) es aplicado para obtener un número de grupos inicial para el algoritmo de agrupación k-medias; obteniendo como resultado cinco grupos de enzimas. Por último, para cada grupo se desarrolló un sistema basado en MSV. La estimación del error de generalización después de validación cruzada es usada como criterio de desempeño del modelo.
publishDate 2013
dc.date.issued.spa.fl_str_mv 2013
dc.date.accessioned.spa.fl_str_mv 2019-06-25T18:25:22Z
dc.date.available.spa.fl_str_mv 2019-06-25T18:25:22Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/20209
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/10683/
url https://repositorio.unal.edu.co/handle/unal/20209
http://bdigital.unal.edu.co/10683/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
Departamento de Ingeniería de Sistemas e Industrial
dc.relation.references.spa.fl_str_mv Hernández González, Nelson (2013) Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/20209/1/299799.2013.pdf
https://repositorio.unal.edu.co/bitstream/unal/20209/2/299799.2013.pdf.jpg
bitstream.checksum.fl_str_mv de45bfd290d5e8250d22211c4baf0227
98b72f5fd3b13c10ba40409e48a914ea
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886137573146624