Búsqueda de regiones informativas en genomas virales
En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral ac...
- Autores:
-
Moreno Gallego, Jaime Leonardo
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/13727
- Acceso en línea:
- http://hdl.handle.net/1992/13727
- Palabra clave:
- Virus
Virología
Genomas virales
Biología computacional
Biología
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
id |
UNIANDES2_8ec3ed798fe88bb81a57458f9cc6e8b9 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/13727 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.es_CO.fl_str_mv |
Búsqueda de regiones informativas en genomas virales |
title |
Búsqueda de regiones informativas en genomas virales |
spellingShingle |
Búsqueda de regiones informativas en genomas virales Virus Virología Genomas virales Biología computacional Biología |
title_short |
Búsqueda de regiones informativas en genomas virales |
title_full |
Búsqueda de regiones informativas en genomas virales |
title_fullStr |
Búsqueda de regiones informativas en genomas virales |
title_full_unstemmed |
Búsqueda de regiones informativas en genomas virales |
title_sort |
Búsqueda de regiones informativas en genomas virales |
dc.creator.fl_str_mv |
Moreno Gallego, Jaime Leonardo |
dc.contributor.advisor.none.fl_str_mv |
Reyes Muñoz, Alejandro Restrepo Restrepo, Silvia Anzola Lagos, Juan Manuel |
dc.contributor.author.none.fl_str_mv |
Moreno Gallego, Jaime Leonardo |
dc.subject.keyword.es_CO.fl_str_mv |
Virus Virología Genomas virales Biología computacional |
topic |
Virus Virología Genomas virales Biología computacional Biología |
dc.subject.themes.none.fl_str_mv |
Biología |
description |
En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGs |
publishDate |
2016 |
dc.date.issued.none.fl_str_mv |
2016 |
dc.date.accessioned.none.fl_str_mv |
2018-09-28T10:51:25Z |
dc.date.available.none.fl_str_mv |
2018-09-28T10:51:25Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/13727 |
dc.identifier.pdf.none.fl_str_mv |
u729130.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/13727 |
identifier_str_mv |
u729130.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
39 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Maestría en Biología Computacional |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ciencias |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Biología |
publisher.none.fl_str_mv |
Universidad de los Andes |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/917047d8-c125-41a4-b040-ffe9faec4bfd/download https://repositorio.uniandes.edu.co/bitstreams/c9a76908-d406-4c81-8f61-f18f2ccca76f/download https://repositorio.uniandes.edu.co/bitstreams/a56966f1-a99a-437a-87a2-e08a8e68db53/download |
bitstream.checksum.fl_str_mv |
ccd008343b16d7167ab5f8d92a1f53cf 738f1388ba4f5c549325108dac64e091 92f067495b824d5853d5b70d629420bc |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133981086285824 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Reyes Muñoz, Alejandro9e4d3f3f-d194-4692-aa8b-4497c83504ba400Restrepo Restrepo, Silviavirtual::11523-1Anzola Lagos, Juan Manuelvirtual::11524-1Moreno Gallego, Jaime Leonardoebd4f9a0-ebde-4233-b56b-321f19827ef25002018-09-28T10:51:25Z2018-09-28T10:51:25Z2016http://hdl.handle.net/1992/13727u729130.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el mundo de los viromas domina lo desconocido y para su caracterización no se conocen muchos esfuerzos diferentes a la comparación de secuencias contra bases de datos públicas. Mas aún, a la fecha no se conoce un proceso formal de cómo asignar secuencias metagenómicas en la clasificación viral actual propuesta por la Comisión Internacional de Taxonomía Viral. Este estudio muestra el proceso de construcción de los ViPhOGs (Grupos de Ortólogos de Virus y Fagos) y el uso de un algoritmo de aprendizaje tipo Random Forest para resolver el problema de clasificación taxonómica viral dada la presencia característica de ViPhOGs en un conjunto de virus de acuerdo a su afiliación taxonómica. Para esto todos los genomas de virus almacenados en las bases de datos públicas del NCBI fueron descargados, analizando un total de 13,999 genomas, 442,007 proteínas y estableciendo un conjunto de 31,150 ViPhOGsUnknown governs viral world while all strategies for their characterization are based on sequence comparison against public databases; a vicious cycle for the scientific community working in viral metagenomics. Moreover, there is no formal method that describes how metagenomic sequences might be attached to the taxonomy established by the International Comitee on Taxonomy of Viruses. This work shows the construction process of ViPhOGs (Virus and Phages Orthologs Groups) and the use of Random Forest machine learning technique as a strategy to resolve the taxonomy of virus. All viral genomes from NIH public databases were downloaded and semi-automatically cleaned. A final set of 13,999 genomes, 442,007 proteins and 31,150 ViPhOGs was obtained. Viral classification at order, family and genus levels was convincingly resolved (classification scores higher than 97%) finding characteristic ViPhOGs for several taxonomic labels. Those ViPhOGs might be used as signature regions for the taxonomic assignment of metagenomic sequencesMagíster en Biología ComputacionalMaestría39 hojasapplication/pdfspaUniversidad de los AndesMaestría en Biología ComputacionalFacultad de CienciasDepartamento de Biologíainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaBúsqueda de regiones informativas en genomas viralesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMVirusVirologíaGenomas viralesBiología computacionalBiologíaPublicationhttps://scholar.google.es/citations?user=7_dVIeAAAAAJvirtual::11523-10000-0001-9016-1040virtual::11523-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000468800virtual::11523-1d7d594d1-aae9-471e-be1d-fc6bbcabef5cvirtual::11523-1f8061409-101d-40c1-b5ce-7c26cc887f95virtual::11524-1d7d594d1-aae9-471e-be1d-fc6bbcabef5cvirtual::11523-1f8061409-101d-40c1-b5ce-7c26cc887f95virtual::11524-1TEXTu729130.pdf.txtu729130.pdf.txtExtracted texttext/plain74570https://repositorio.uniandes.edu.co/bitstreams/917047d8-c125-41a4-b040-ffe9faec4bfd/downloadccd008343b16d7167ab5f8d92a1f53cfMD54ORIGINALu729130.pdfapplication/pdf3934720https://repositorio.uniandes.edu.co/bitstreams/c9a76908-d406-4c81-8f61-f18f2ccca76f/download738f1388ba4f5c549325108dac64e091MD51THUMBNAILu729130.pdf.jpgu729130.pdf.jpgIM Thumbnailimage/jpeg4327https://repositorio.uniandes.edu.co/bitstreams/a56966f1-a99a-437a-87a2-e08a8e68db53/download92f067495b824d5853d5b70d629420bcMD551992/13727oai:repositorio.uniandes.edu.co:1992/137272024-03-13 14:27:20.444http://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |