Búsqueda de regiones informativas en genomas virales

En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral ac...

Full description

Autores:
Moreno Gallego, Jaime Leonardo
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/13727
Acceso en línea:
http://hdl.handle.net/1992/13727
Palabra clave:
Virus
Virología
Genomas virales
Biología computacional
Biología
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
id UNIANDES2_8ec3ed798fe88bb81a57458f9cc6e8b9
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/13727
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Búsqueda de regiones informativas en genomas virales
title Búsqueda de regiones informativas en genomas virales
spellingShingle Búsqueda de regiones informativas en genomas virales
Virus
Virología
Genomas virales
Biología computacional
Biología
title_short Búsqueda de regiones informativas en genomas virales
title_full Búsqueda de regiones informativas en genomas virales
title_fullStr Búsqueda de regiones informativas en genomas virales
title_full_unstemmed Búsqueda de regiones informativas en genomas virales
title_sort Búsqueda de regiones informativas en genomas virales
dc.creator.fl_str_mv Moreno Gallego, Jaime Leonardo
dc.contributor.advisor.none.fl_str_mv Reyes Muñoz, Alejandro
Restrepo Restrepo, Silvia
Anzola Lagos, Juan Manuel
dc.contributor.author.none.fl_str_mv Moreno Gallego, Jaime Leonardo
dc.subject.keyword.es_CO.fl_str_mv Virus
Virología
Genomas virales
Biología computacional
topic Virus
Virología
Genomas virales
Biología computacional
Biología
dc.subject.themes.none.fl_str_mv Biología
description En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGs
publishDate 2016
dc.date.issued.none.fl_str_mv 2016
dc.date.accessioned.none.fl_str_mv 2018-09-28T10:51:25Z
dc.date.available.none.fl_str_mv 2018-09-28T10:51:25Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/13727
dc.identifier.pdf.none.fl_str_mv u729130.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/13727
identifier_str_mv u729130.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 39 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Maestría en Biología Computacional
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ciencias
dc.publisher.department.es_CO.fl_str_mv Departamento de Biología
publisher.none.fl_str_mv Universidad de los Andes
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/917047d8-c125-41a4-b040-ffe9faec4bfd/download
https://repositorio.uniandes.edu.co/bitstreams/c9a76908-d406-4c81-8f61-f18f2ccca76f/download
https://repositorio.uniandes.edu.co/bitstreams/a56966f1-a99a-437a-87a2-e08a8e68db53/download
bitstream.checksum.fl_str_mv ccd008343b16d7167ab5f8d92a1f53cf
738f1388ba4f5c549325108dac64e091
92f067495b824d5853d5b70d629420bc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133981086285824
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Reyes Muñoz, Alejandro9e4d3f3f-d194-4692-aa8b-4497c83504ba400Restrepo Restrepo, Silviavirtual::11523-1Anzola Lagos, Juan Manuelvirtual::11524-1Moreno Gallego, Jaime Leonardoebd4f9a0-ebde-4233-b56b-321f19827ef25002018-09-28T10:51:25Z2018-09-28T10:51:25Z2016http://hdl.handle.net/1992/13727u729130.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGsUnknown governs viral world while all strategies for their characterization are based on sequence comparison against public databases; a vicious cycle for the scientific community working in viral metagenomics. Moreover, there is no formal method that describes how metagenomic sequences might be attached to the taxonomy established by the International Comitee on Taxonomy of Viruses. This work shows the construction process of ViPhOGs (Virus and Phages Orthologs Groups) and the use of Random Forest machine learning technique as a strategy to resolve the taxonomy of virus. All viral genomes from NIH public databases were downloaded and semi-automatically cleaned. A final set of 13,999 genomes, 442,007 proteins and 31,150 ViPhOGs was obtained. Viral classification at order, family and genus levels was convincingly resolved (classification scores higher than 97%) finding characteristic ViPhOGs for several taxonomic labels. Those ViPhOGs might be used as signature regions for the taxonomic assignment of metagenomic sequencesMagíster en Biología ComputacionalMaestría39 hojasapplication/pdfspaUniversidad de los AndesMaestría en Biología ComputacionalFacultad de CienciasDepartamento de Biologíainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaBúsqueda de regiones informativas en genomas viralesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMVirusVirologíaGenomas viralesBiología computacionalBiologíaPublicationhttps://scholar.google.es/citations?user=7_dVIeAAAAAJvirtual::11523-10000-0001-9016-1040virtual::11523-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000468800virtual::11523-1d7d594d1-aae9-471e-be1d-fc6bbcabef5cvirtual::11523-1f8061409-101d-40c1-b5ce-7c26cc887f95virtual::11524-1d7d594d1-aae9-471e-be1d-fc6bbcabef5cvirtual::11523-1f8061409-101d-40c1-b5ce-7c26cc887f95virtual::11524-1TEXTu729130.pdf.txtu729130.pdf.txtExtracted texttext/plain74570https://repositorio.uniandes.edu.co/bitstreams/917047d8-c125-41a4-b040-ffe9faec4bfd/downloadccd008343b16d7167ab5f8d92a1f53cfMD54ORIGINALu729130.pdfapplication/pdf3934720https://repositorio.uniandes.edu.co/bitstreams/c9a76908-d406-4c81-8f61-f18f2ccca76f/download738f1388ba4f5c549325108dac64e091MD51THUMBNAILu729130.pdf.jpgu729130.pdf.jpgIM Thumbnailimage/jpeg4327https://repositorio.uniandes.edu.co/bitstreams/a56966f1-a99a-437a-87a2-e08a8e68db53/download92f067495b824d5853d5b70d629420bcMD551992/13727oai:repositorio.uniandes.edu.co:1992/137272024-03-13 14:27:20.444http://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co