Identificación de sitios en proteínas usando métodos de aprendizaje de máquina

Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para re...

Full description

Autores:
Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
Tipo de recurso:
Article of journal
Fecha de publicación:
2003
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/28726
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/28726
http://bdigital.unal.edu.co/18774/
Palabra clave:
bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_0dddec1a5f5d7de6e77f900f38c959af
oai_identifier_str oai:repositorio.unal.edu.co:unal/28726
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
title Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
spellingShingle Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
title_short Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
title_full Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
title_fullStr Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
title_full_unstemmed Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
title_sort Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
dc.creator.fl_str_mv Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
dc.contributor.author.spa.fl_str_mv Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
dc.subject.proposal.spa.fl_str_mv bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
topic bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
description Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas.
publishDate 2003
dc.date.issued.spa.fl_str_mv 2003
dc.date.accessioned.spa.fl_str_mv 2019-06-26T10:23:02Z
dc.date.available.spa.fl_str_mv 2019-06-26T10:23:02Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/28726
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/18774/
url https://repositorio.unal.edu.co/handle/unal/28726
http://bdigital.unal.edu.co/18774/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/ingeinv/article/view/14696
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e Investigación
Ingeniería e Investigación
dc.relation.ispartofseries.none.fl_str_mv Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609
dc.relation.references.spa.fl_str_mv Bobadilla Molina, Jaime Leonardo and Niño, Fernando and Mojica, Tobías (2003) Identificación de sitios en proteínas usando métodos de aprendizaje de máquina. Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia - Facultad de Ingeniería
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/28726/1/14696-44125-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/28726/2/14696-44125-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv c978ed2dbbb5c1875bbfa9a0d736f7df
f52c3ae108cb5588d1272aa1a95d3484
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089914375995392
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Bobadilla Molina, Jaime Leonardod22fa21e-3218-40d1-958a-cfb845870d3e300Niño, Fernandoed36b329-2f8b-4fb2-8753-eeb30c69b669300Mojica, Tobíasaf5e8972-64aa-4fd6-85c0-536a07e0cf423002019-06-26T10:23:02Z2019-06-26T10:23:02Z2003https://repositorio.unal.edu.co/handle/unal/28726http://bdigital.unal.edu.co/18774/Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas.The increasing amount of protein three-dimensional (3D) structures determined by x-ray and NMR technologies as well as structures predicted by computational methods results in the need for automated methods to provide inital annotations. We have developed a new method for recognizing sites in three-dimensional protein structures. Our method is based on a previosly reported algorithm for creating descriptions of protein microenviroments using physical and chemical properties at multiple levels of detail. The recognition method takes three inputs: 1. A set of control nonsites that share some structural or functional role. 2. A set of control nonsites that lack this role. 3. A single query site. A support vector machine classifier is built using feature vectors where each component represents a property in a given volume. Validation against an independent test set shows that this recognition approach has high sensitivity and specificity. We also describe the results of scanning four calcium binding proteins (with the calcium removed) using a three dimensional grid of probe points at 1.25 angstrom spacing. The system finds the sites in the proteins giving points at or near the blinding sites. Our results show that property based descriptions along with support vector machines can be used for recognizing protein sites in unannotated structures.application/pdfspaUniversidad Nacional de Colombia - Facultad de Ingenieríahttp://revistas.unal.edu.co/index.php/ingeinv/article/view/14696Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e InvestigaciónIngeniería e InvestigaciónIngeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609Bobadilla Molina, Jaime Leonardo and Niño, Fernando and Mojica, Tobías (2003) Identificación de sitios en proteínas usando métodos de aprendizaje de máquina. Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609 .Identificación de sitios en proteínas usando métodos de aprendizaje de máquinaArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTbioinformaticsmachine learningsupport vector machinesprotein tertiary structurebioinfomáticadogma central de la Biologíaaprendizaje de máquinaestructura terciaria de proteínasmáquinas con vectores de soporteORIGINAL14696-44125-1-PB.pdfapplication/pdf1534703https://repositorio.unal.edu.co/bitstream/unal/28726/1/14696-44125-1-PB.pdfc978ed2dbbb5c1875bbfa9a0d736f7dfMD51THUMBNAIL14696-44125-1-PB.pdf.jpg14696-44125-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg6036https://repositorio.unal.edu.co/bitstream/unal/28726/2/14696-44125-1-PB.pdf.jpgf52c3ae108cb5588d1272aa1a95d3484MD52unal/28726oai:repositorio.unal.edu.co:unal/287262022-11-18 23:02:32.24Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co