Búsqueda de regiones informativas en genomas virales

En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral ac...

Full description

Autores:
Moreno Gallego, Jaime Leonardo
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/13727
Acceso en línea:
http://hdl.handle.net/1992/13727
Palabra clave:
Virus
Virología
Genomas virales
Biología computacional
Biología
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGs