Visualizing taxonomic reports from biological sequence alignments

En el proceso de identificación y clasificación de secuencias, el alineamiento de secuencias cumple una función muy importante. Este proceso consiste en comparar secuencias desconocidas con bases de datos biológicos que están en continuo crecimiento. Estas comparaciones producen grandes cantidades d...

Full description

Autores:
Vanegas Hernández, Meili
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/34744
Acceso en línea:
http://hdl.handle.net/1992/34744
Palabra clave:
Biología - Procesamiento electrónico de datos - Investigaciones
Biología computacional - Investigaciones
Bioinformática - Investigaciones
Análisis de datos - Investigaciones
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_8192cee3d0ced164d1e93b90f4391b16
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/34744
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Visualizing taxonomic reports from biological sequence alignments
title Visualizing taxonomic reports from biological sequence alignments
spellingShingle Visualizing taxonomic reports from biological sequence alignments
Biología - Procesamiento electrónico de datos - Investigaciones
Biología computacional - Investigaciones
Bioinformática - Investigaciones
Análisis de datos - Investigaciones
Ingeniería
title_short Visualizing taxonomic reports from biological sequence alignments
title_full Visualizing taxonomic reports from biological sequence alignments
title_fullStr Visualizing taxonomic reports from biological sequence alignments
title_full_unstemmed Visualizing taxonomic reports from biological sequence alignments
title_sort Visualizing taxonomic reports from biological sequence alignments
dc.creator.fl_str_mv Vanegas Hernández, Meili
dc.contributor.advisor.none.fl_str_mv Guerra Gómez, John Alexis
Hernández Peñaloza, José Tiberio
dc.contributor.author.none.fl_str_mv Vanegas Hernández, Meili
dc.contributor.jury.none.fl_str_mv Reyes Muñoz, Alejandro
Duitama Castellanos, Jorge Alexander
dc.subject.keyword.es_CO.fl_str_mv Biología - Procesamiento electrónico de datos - Investigaciones
Biología computacional - Investigaciones
Bioinformática - Investigaciones
Análisis de datos - Investigaciones
topic Biología - Procesamiento electrónico de datos - Investigaciones
Biología computacional - Investigaciones
Bioinformática - Investigaciones
Análisis de datos - Investigaciones
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description En el proceso de identificación y clasificación de secuencias, el alineamiento de secuencias cumple una función muy importante. Este proceso consiste en comparar secuencias desconocidas con bases de datos biológicos que están en continuo crecimiento. Estas comparaciones producen grandes cantidades de resultados y extraer información útil de dichos resultados es costoso sin una herramienta que permita resumirlos. La falta de herramientas de análisis de resultados lleva a la clasificación errónea de secuencias. Este proyecto es el resultado de una colaboración cercana con bioinformáticos y una evaluación del estado del arte. Como resultado, se presentan seis tareas comúnmente realizadas por los expertos en el área, con las cuales se buscan principalmente resumir y comparar resultados de alineamientos: para regiones de interés (AT1), reportes taxonómicos (AT2) y descripción de secuencias (AT3). AT1 es el más desarrollado por el estado del arte. Asimismo, AT2 tiene gran cobertura, sin embargo, todavía existen muchas oportunidades de mejora...
publishDate 2018
dc.date.issued.none.fl_str_mv 2018
dc.date.accessioned.none.fl_str_mv 2020-06-10T09:19:13Z
dc.date.available.none.fl_str_mv 2020-06-10T09:19:13Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/34744
dc.identifier.pdf.none.fl_str_mv u808479.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/34744
identifier_str_mv u808479.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv viii, 36 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Uniandes
dc.publisher.program.es_CO.fl_str_mv Maestría en Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/6077cedd-9826-4789-8499-94f63a599993/download
https://repositorio.uniandes.edu.co/bitstreams/0a3d34f1-880e-49f8-885f-f5f5ab1d0453/download
https://repositorio.uniandes.edu.co/bitstreams/bc8e8e4d-b8ca-4445-a174-7bb370a430fa/download
bitstream.checksum.fl_str_mv 609f856280bbb3d796de0be96d34758c
d0cb238606a2ba40420bcc4795c21c4c
2a0fd063e7d91b2a054e3ce7a99f11ee
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133800398815232
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Guerra Gómez, John Alexisvirtual::588-1Hernández Peñaloza, José Tiberiovirtual::589-1Vanegas Hernández, Meili2076fd27-1833-40d2-9b38-4096fa17abdb500Reyes Muñoz, AlejandroDuitama Castellanos, Jorge Alexander2020-06-10T09:19:13Z2020-06-10T09:19:13Z2018http://hdl.handle.net/1992/34744u808479.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el proceso de identificación y clasificación de secuencias, el alineamiento de secuencias cumple una función muy importante. Este proceso consiste en comparar secuencias desconocidas con bases de datos biológicos que están en continuo crecimiento. Estas comparaciones producen grandes cantidades de resultados y extraer información útil de dichos resultados es costoso sin una herramienta que permita resumirlos. La falta de herramientas de análisis de resultados lleva a la clasificación errónea de secuencias. Este proyecto es el resultado de una colaboración cercana con bioinformáticos y una evaluación del estado del arte. Como resultado, se presentan seis tareas comúnmente realizadas por los expertos en el área, con las cuales se buscan principalmente resumir y comparar resultados de alineamientos: para regiones de interés (AT1), reportes taxonómicos (AT2) y descripción de secuencias (AT3). AT1 es el más desarrollado por el estado del arte. Asimismo, AT2 tiene gran cobertura, sin embargo, todavía existen muchas oportunidades de mejora...Biological sequence comparison is a crucial step towards the process of identifying and cataloging new sequences. To achieve this, computational biologists must compare a new sequence to the permanently-growing biological databases. This comparison produces a myriad of results, from where extracting useful information is highly cost-intensive given the lack of tools providing an overview of the results. Moreover, it is possible to mistakenly catalog new sequences due to poor comparison analysis. This project is the outcome of a close collaboration with domain experts and a thorough study of the state of the art. As a result, six analysis tasks commonly performed by bioinformaticians were identified. Each task consists either in summarizing (for single sequence results) or comparing (for multiple sequence results): regions of interest (AT1), taxonomic reports (AT2), and sequences- descriptions (AT3). On the state of the art, AT1 is very well covered, AT2 still has space for improvement and AT3 has been mostly unattended...Magíster en Ingeniería de Sistemas y ComputaciónMaestríaviii, 36 hojasapplication/pdfengUniandesMaestría en Ingeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaVisualizing taxonomic reports from biological sequence alignmentsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMBiología - Procesamiento electrónico de datos - InvestigacionesBiología computacional - InvestigacionesBioinformática - InvestigacionesAnálisis de datos - InvestigacionesIngenieríaPublicationhttps://scholar.google.es/citations?user=-gUUc7oAAAAJvirtual::589-10000-0002-5035-4363virtual::589-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000246689virtual::589-126b87ca4-c283-4bc1-a992-d67be00dbf65virtual::588-1ad318216-13a5-4de4-9d7f-e3ab42397d84virtual::589-126b87ca4-c283-4bc1-a992-d67be00dbf65virtual::588-1ad318216-13a5-4de4-9d7f-e3ab42397d84virtual::589-1ORIGINALu808479.pdfapplication/pdf2663272https://repositorio.uniandes.edu.co/bitstreams/6077cedd-9826-4789-8499-94f63a599993/download609f856280bbb3d796de0be96d34758cMD51TEXTu808479.pdf.txtu808479.pdf.txtExtracted texttext/plain60143https://repositorio.uniandes.edu.co/bitstreams/0a3d34f1-880e-49f8-885f-f5f5ab1d0453/downloadd0cb238606a2ba40420bcc4795c21c4cMD54THUMBNAILu808479.pdf.jpgu808479.pdf.jpgIM Thumbnailimage/jpeg5156https://repositorio.uniandes.edu.co/bitstreams/bc8e8e4d-b8ca-4445-a174-7bb370a430fa/download2a0fd063e7d91b2a054e3ce7a99f11eeMD551992/34744oai:repositorio.uniandes.edu.co:1992/347442024-03-13 11:45:25.536http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co