Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial

Título en ingles: Protein secondary structure prediction    using  support vector machines Abstract : Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from...

Full description

Autores:
Delgado, Darío José
Arguello Fuentes, Henry
Torres, Rodrigo Gonzalo
Tipo de recurso:
Article of journal
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/43015
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/43015
http://bdigital.unal.edu.co/33113/
http://bdigital.unal.edu.co/33113/3/
Palabra clave:
coding methodology
support vector machines
prediction of protein secondary structure
máquinas de soporte vectorial
metodología de codificación
predicción de la estructura secundaria de proteínas
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_32779fbac8148e444d2853bba0187b84
oai_identifier_str oai:repositorio.unal.edu.co:unal/43015
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
title Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
spellingShingle Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
coding methodology
support vector machines
prediction of protein secondary structure
máquinas de soporte vectorial
metodología de codificación
predicción de la estructura secundaria de proteínas
title_short Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
title_full Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
title_fullStr Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
title_full_unstemmed Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
title_sort Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial
dc.creator.fl_str_mv Delgado, Darío José
Arguello Fuentes, Henry
Torres, Rodrigo Gonzalo
dc.contributor.author.spa.fl_str_mv Delgado, Darío José
Arguello Fuentes, Henry
Torres, Rodrigo Gonzalo
dc.subject.proposal.spa.fl_str_mv coding methodology
support vector machines
prediction of protein secondary structure
máquinas de soporte vectorial
metodología de codificación
predicción de la estructura secundaria de proteínas
topic coding methodology
support vector machines
prediction of protein secondary structure
máquinas de soporte vectorial
metodología de codificación
predicción de la estructura secundaria de proteínas
description Título en ingles: Protein secondary structure prediction    using  support vector machines Abstract : Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers. Key words: coding methodology; support vector machines; prediction of protein secondary structure. Resumen: Entre los métodos computacionales utilizados para la predicción de la estructura secundaria de proteínas, se destaca el uso de máquinas de soporte vectorial. Este trabajo de investigación presenta la predicción de la estructura secundaria de proteínas desde su secuencia primaria de aminoácidos usando Máquinas de Soporte Vectorial. Como entradas, en la metodología propuesta, se utilizan características de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el aminoácido en la posición central adopte una determinada estructura secundaria. Para la extracción de características se utiliza un método de codificación de secuencias en el que cada símbolo en la estructura primaria se relaciona con cada símbolo en la estructura secundaria. El uso de este método de codificación permite reducir la dimensionalidad de los datos de miles de características a sólo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisión. Además, se logra reducir los costos computacionales en la construcción de los clasificadores debido a que este trabajo modela el problema de multi-clasificación como un grupo de clasificadores binarios. Palabras clave: máquinas de soporte vectorial; metodología de codificación; predicción de la estructura secundaria de proteínas.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-28T11:27:00Z
dc.date.available.spa.fl_str_mv 2019-06-28T11:27:00Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/43015
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/33113/
http://bdigital.unal.edu.co/33113/3/
url https://repositorio.unal.edu.co/handle/unal/43015
http://bdigital.unal.edu.co/33113/
http://bdigital.unal.edu.co/33113/3/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/biotecnologia/article/view/32885
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Biotecnología
Revista Colombiana de Biotecnología
dc.relation.ispartofseries.none.fl_str_mv Revista Colombiana de Biotecnología; Vol. 14, núm. 1 (2012); 233-244 1909-8758 0123-3475
dc.relation.references.spa.fl_str_mv Delgado, Darío José and Arguello Fuentes, Henry and Torres, Rodrigo Gonzalo (2012) Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial. Revista Colombiana de Biotecnología; Vol. 14, núm. 1 (2012); 233-244 1909-8758 0123-3475 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/msword
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/43015/1/32885-121906-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/43015/2/32885-121845-1-PB.docx
https://repositorio.unal.edu.co/bitstream/unal/43015/3/32885-121906-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv 7777da87d0dc5bad2dd0e69f391d13fe
f40a91afc0c72bf8e5deb40251cfc3d5
cadecbb67206c38258fb5cfa9234138b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886499527950336
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Delgado, Darío José331eb25c-a868-4784-9636-f9f10ea87d48300Arguello Fuentes, Henry900ac240-45af-4faa-b0db-153fb5ee5a82300Torres, Rodrigo Gonzalo50f3a274-5e72-498e-8a6a-fb17163d13443002019-06-28T11:27:00Z2019-06-28T11:27:00Z2012https://repositorio.unal.edu.co/handle/unal/43015http://bdigital.unal.edu.co/33113/http://bdigital.unal.edu.co/33113/3/Título en ingles: Protein secondary structure prediction    using  support vector machines Abstract : Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers. Key words: coding methodology; support vector machines; prediction of protein secondary structure. Resumen: Entre los métodos computacionales utilizados para la predicción de la estructura secundaria de proteínas, se destaca el uso de máquinas de soporte vectorial. Este trabajo de investigación presenta la predicción de la estructura secundaria de proteínas desde su secuencia primaria de aminoácidos usando Máquinas de Soporte Vectorial. Como entradas, en la metodología propuesta, se utilizan características de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el aminoácido en la posición central adopte una determinada estructura secundaria. Para la extracción de características se utiliza un método de codificación de secuencias en el que cada símbolo en la estructura primaria se relaciona con cada símbolo en la estructura secundaria. El uso de este método de codificación permite reducir la dimensionalidad de los datos de miles de características a sólo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisión. Además, se logra reducir los costos computacionales en la construcción de los clasificadores debido a que este trabajo modela el problema de multi-clasificación como un grupo de clasificadores binarios. Palabras clave: máquinas de soporte vectorial; metodología de codificación; predicción de la estructura secundaria de proteínas.application/mswordspaUniversidad Nacional de Colombiahttp://revistas.unal.edu.co/index.php/biotecnologia/article/view/32885Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de BiotecnologíaRevista Colombiana de BiotecnologíaRevista Colombiana de Biotecnología; Vol. 14, núm. 1 (2012); 233-244 1909-8758 0123-3475Delgado, Darío José and Arguello Fuentes, Henry and Torres, Rodrigo Gonzalo (2012) Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorial. Revista Colombiana de Biotecnología; Vol. 14, núm. 1 (2012); 233-244 1909-8758 0123-3475 .Predicción de la estructura secundaria de proteínas usando máquinas de soporte vectorialArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTcoding methodologysupport vector machinesprediction of protein secondary structuremáquinas de soporte vectorialmetodología de codificaciónpredicción de la estructura secundaria de proteínasORIGINAL32885-121906-1-PB.pdfapplication/pdf2906248https://repositorio.unal.edu.co/bitstream/unal/43015/1/32885-121906-1-PB.pdf7777da87d0dc5bad2dd0e69f391d13feMD5132885-121845-1-PB.docxapplication/vnd.openxmlformats-officedocument.wordprocessingml.document3153095https://repositorio.unal.edu.co/bitstream/unal/43015/2/32885-121845-1-PB.docxf40a91afc0c72bf8e5deb40251cfc3d5MD52THUMBNAIL32885-121906-1-PB.pdf.jpg32885-121906-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg7035https://repositorio.unal.edu.co/bitstream/unal/43015/3/32885-121906-1-PB.pdf.jpgcadecbb67206c38258fb5cfa9234138bMD53unal/43015oai:repositorio.unal.edu.co:unal/430152023-02-10 23:03:55.516Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co