Identificación de sitios en proteínas usando métodos de aprendizaje de máquina
Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para re...
- Autores:
-
Bobadilla Molina, Jaime Leonardo
Niño, Fernando
Mojica, Tobías
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2003
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/28726
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/28726
http://bdigital.unal.edu.co/18774/
- Palabra clave:
- bioinformatics
machine learning
support vector machines
protein tertiary structure
bioinfomática
dogma central de la Biología
aprendizaje de máquina
estructura terciaria de proteínas
máquinas con vectores de soporte
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Con el crecimiento de las bases de datos de estructuras tridimensionales determinadas por rayos-x NMR (resonancia magnética nuclear) y de estructuras predichas por computador, se deriva la necesidad de sistemas automáticos que provean anotaciones iniciales. Se ha desarrollado un nuevo método para reconocer sitios en estructura terciaria de proteinas. El método propuesto se basa en un algoritmo previamente reportado para crear descripciones de microambientes en proteínas usando propiedades físicas y químicas con varios niveles de detalle. El método de reconocimiento toma tres entradas: 1.Un conjunto de sitios que comparte un rol funcional o estructural. 2.Un conjunto de no sitios que no tienen este rol. 3. Un sitio del cual se ignora si tiene la característica buscada o no. Se construyo un clasificador con máquina con vectores de soporte usan vectores de características en que cada componente representa una propiedad en un volumen dado. La validación contra un conjunto de prueba independiente muestra que este enfoque tiene alta sensibilidad y especificidad. También se describen los resultados de escanear cuatro proteínas con sitios de unión a calcio (con el calcio removido) usando una rejilla tridimensional de puntos de prueba separada a 1.25 ámstroms. El sistema encuentra los sitios en las proteínas ubicando puntos en los sitios de unión o cerca de estos. Los resultados muestran que puedan usarse descripciones de propiedades junto con máquinas de soporte para reconocer sitios en proteínas no anotadas. |
---|