Búsqueda de regiones informativas en genomas virales
En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral ac...
- Autores:
-
Moreno Gallego, Jaime Leonardo
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/13727
- Acceso en línea:
- http://hdl.handle.net/1992/13727
- Palabra clave:
- Virus
Virología
Genomas virales
Biología computacional
Biología
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
Summary: | En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGs |
---|