Identificación de sitios en proteínas usando métodos de aprendizaje de máquina

Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para re...

Full description

Autores:
Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
Tipo de recurso:
Article of journal
Fecha de publicación:
2003
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/28726
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/28726
http://bdigital.unal.edu.co/18774/
Palabra clave:
bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas.