Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para re...
- Autores:
-
Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2003
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/28726
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/28726
http://bdigital.unal.edu.co/18774/
- Palabra clave:
- bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_0dddec1a5f5d7de6e77f900f38c959af |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/28726 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
title |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
spellingShingle |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina bioinformatics machine learning support vector machines protein tertiary structure bioinfomática dogma central de la Biología aprendizaje de máquina estructura terciaria de proteínas máquinas con vectores de soporte |
title_short |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
title_full |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
title_fullStr |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
title_full_unstemmed |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
title_sort |
Identificación de sitios en proteínas usando métodos de aprendizaje de máquina |
dc.creator.fl_str_mv |
Bobadilla Molina, Jaime Leonardo Niño, Fernando Mojica, Tobías |
dc.contributor.author.spa.fl_str_mv |
Bobadilla Molina, Jaime Leonardo Niño, Fernando Mojica, Tobías |
dc.subject.proposal.spa.fl_str_mv |
bioinformatics machine learning support vector machines protein tertiary structure bioinfomática dogma central de la Biología aprendizaje de máquina estructura terciaria de proteínas máquinas con vectores de soporte |
topic |
bioinformatics machine learning support vector machines protein tertiary structure bioinfomática dogma central de la Biología aprendizaje de máquina estructura terciaria de proteínas máquinas con vectores de soporte |
description |
Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas. |
publishDate |
2003 |
dc.date.issued.spa.fl_str_mv |
2003 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-26T10:23:02Z |
dc.date.available.spa.fl_str_mv |
2019-06-26T10:23:02Z |
dc.type.spa.fl_str_mv |
Artículo de revista |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/ART |
format |
http://purl.org/coar/resource_type/c_6501 |
status_str |
publishedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/28726 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/18774/ |
url |
https://repositorio.unal.edu.co/handle/unal/28726 http://bdigital.unal.edu.co/18774/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.spa.fl_str_mv |
http://revistas.unal.edu.co/index.php/ingeinv/article/view/14696 |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e Investigación Ingeniería e Investigación |
dc.relation.ispartofseries.none.fl_str_mv |
Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609 |
dc.relation.references.spa.fl_str_mv |
Bobadilla Molina, Jaime Leonardo and Niño, Fernando and Mojica, Tobías (2003) Identificación de sitios en proteínas usando métodos de aprendizaje de máquina. Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609 . |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Universidad Nacional de Colombia - Facultad de Ingeniería |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/28726/1/14696-44125-1-PB.pdf https://repositorio.unal.edu.co/bitstream/unal/28726/2/14696-44125-1-PB.pdf.jpg |
bitstream.checksum.fl_str_mv |
c978ed2dbbb5c1875bbfa9a0d736f7df f52c3ae108cb5588d1272aa1a95d3484 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089914375995392 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Bobadilla Molina, Jaime Leonardod22fa21e-3218-40d1-958a-cfb845870d3e300Niño, Fernandoed36b329-2f8b-4fb2-8753-eeb30c69b669300Mojica, Tobíasaf5e8972-64aa-4fd6-85c0-536a07e0cf423002019-06-26T10:23:02Z2019-06-26T10:23:02Z2003https://repositorio.unal.edu.co/handle/unal/28726http://bdigital.unal.edu.co/18774/Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas.The increasing amount of protein three-dimensional (3D) structures determined by x-ray and NMR technologies as well as structures predicted by computational methods results in the need for automated methods to provide inital annotations. We have developed a new method for recognizing sites in three-dimensional protein structures. Our method is based on a previosly reported algorithm for creating descriptions of protein microenviroments using physical and chemical properties at multiple levels of detail. The recognition method takes three inputs: 1. A set of control nonsites that share some structural or functional role. 2. A set of control nonsites that lack this role. 3. A single query site. A support vector machine classifier is built using feature vectors where each component represents a property in a given volume. Validation against an independent test set shows that this recognition approach has high sensitivity and specificity. We also describe the results of scanning four calcium binding proteins (with the calcium removed) using a three dimensional grid of probe points at 1.25 angstrom spacing. The system finds the sites in the proteins giving points at or near the blinding sites. Our results show that property based descriptions along with support vector machines can be used for recognizing protein sites in unannotated structures.application/pdfspaUniversidad Nacional de Colombia - Facultad de Ingenieríahttp://revistas.unal.edu.co/index.php/ingeinv/article/view/14696Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e InvestigaciónIngeniería e InvestigaciónIngeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609Bobadilla Molina, Jaime Leonardo and Niño, Fernando and Mojica, Tobías (2003) Identificación de sitios en proteínas usando métodos de aprendizaje de máquina. Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 Ingeniería e Investigación; Vol. 23, núm. 3 (2003): (53); 5-11 2248-8723 0120-5609 .Identificación de sitios en proteínas usando métodos de aprendizaje de máquinaArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTbioinformaticsmachine learningsupport vector machinesprotein tertiary structurebioinfomáticadogma central de la Biologíaaprendizaje de máquinaestructura terciaria de proteínasmáquinas con vectores de soporteORIGINAL14696-44125-1-PB.pdfapplication/pdf1534703https://repositorio.unal.edu.co/bitstream/unal/28726/1/14696-44125-1-PB.pdfc978ed2dbbb5c1875bbfa9a0d736f7dfMD51THUMBNAIL14696-44125-1-PB.pdf.jpg14696-44125-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg6036https://repositorio.unal.edu.co/bitstream/unal/28726/2/14696-44125-1-PB.pdf.jpgf52c3ae108cb5588d1272aa1a95d3484MD52unal/28726oai:repositorio.unal.edu.co:unal/287262022-11-18 23:02:32.24Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |