Un modelo multi-objetivo ab-initio para la predicción de plegamiento de proteínas a un nivel de conformaciones atómicas

La tesis se enfoca en el problema de la predicción de estructuras de proteínas, uno de los problemas más importantes abordados por la bioinformática y la biología molecular. El problema básico consiste en la predicción de la estructura tridimensional de una proteína dada su secuencia de amino-ácidos...

Full description

Autores:
Becerra Romero, David Camilo
Tipo de recurso:
Fecha de publicación:
2010
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/70338
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/70338
http://bdigital.unal.edu.co/2583/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Plegamiento de proteínas
Métodos ab-initio
Optimización multi-objetivo
Computación distribuida
Algoritmos evolutivos
Protein folding
Ab-initio methods
Multi-objective optimization
Distributed computing
Evolutionary algorithms
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:La tesis se enfoca en el problema de la predicción de estructuras de proteínas, uno de los problemas más importantes abordados por la bioinformática y la biología molecular. El problema básico consiste en la predicción de la estructura tridimensional de una proteína dada su secuencia de amino-ácidos. De forma particular, en éste trabajo se presenta una aproximación ab-initio, multi-objetivo y paralela para la predicción de estructuras de proteínas a un nivel atómico. El modelo propuesto incorporó diferentes herramientas de software combinadas con otras herramientas desarrolladas por nosotros. Algunos experimentos se llevaron a cabo sobre un conjunto de cinco diferentes proteínas (1ROP, 1PLW, 1UTG, 1CRT y 1ZDD) para validar el modelo, obteniendo resultados prometedores. Las características más importantes del marco experimental son: i) Se escogió una representación trigonométrica para representar y computar los ángulos de torsión del backbone y la cadena lateral de una proteína; ii) La función de potenciales de energía The Chemistry at HARvard Macromolecular Mechanics (CHARMm) es utilizada para evaluar en términos energéticos la estructura de las conformaciones de proteínas; iii) El algoritmo genético multi-objetivo (NSGA-II) es utilizado para evolucionar las conformaciones de proteínas dirigidas por una función de puntajes de interacciones atómicas; iv) Un modelo de islas del algoritmo evolutivo fue desarrollado para acelerar el proceso de computo y mejorar la efectividad del algoritmo. / Abstract. This thesis focuses on the protein structure prediction problem, one of the most important problems tackled by bioinformatics and molecular biology. The basic problem consists of predicting the three-dimensional structure of a protein from its amino-acid sequence. Specifically, in this work a parallel multi-objective ab-initio approach at an atomic conformation level for protein structure prediction is proposed. The proposed model incorporated several existing software tools combined with others developed by us. Experiments were carried out over a set of different proteins (1ROP, 1PLW, 1UTG, 1CRT and 1ZDD) to validate the model obtaining very promising results. The most important features of the experimental framework are: i) A trigonometric representation was chosen to represent and compute the backbone and side-chain torsion angles of a protein; ii) The Chemistry at HARvard Macromolecular Mechanics (CHARMm) function was used in order to evaluate the structure of protein conformations; iii) The multi-objective genetic algorithm (NSGA-II) was used to evolve protein conformations directed by an atom-interaction scoring function; iv) An island model of the evolutionary algorithm was developed to speed up the process and to improve the effectiveness of the algorithm.