Haplotipado molecular de individuos : construcción y análisis de algoritmos

A excepción de las células sexuales, las células humanas son diploides. En otras palabras, contienen 22 pares de cromosomas homólogos y un par de cromosomas sexuales. Cada una de las dos copias de cada cromosoma es heredada de uno de los padres. Para caracterizar completamente el genoma de un indivi...

Full description

Autores:
Chavarro Espejo, Christian Gustavo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/44480
Acceso en línea:
http://hdl.handle.net/1992/44480
Palabra clave:
Bioinformática
Genética humana
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_a356a70e941d8dab1cede843f5ab0183
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/44480
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Haplotipado molecular de individuos : construcción y análisis de algoritmos
title Haplotipado molecular de individuos : construcción y análisis de algoritmos
spellingShingle Haplotipado molecular de individuos : construcción y análisis de algoritmos
Bioinformática
Genética humana
Ingeniería
title_short Haplotipado molecular de individuos : construcción y análisis de algoritmos
title_full Haplotipado molecular de individuos : construcción y análisis de algoritmos
title_fullStr Haplotipado molecular de individuos : construcción y análisis de algoritmos
title_full_unstemmed Haplotipado molecular de individuos : construcción y análisis de algoritmos
title_sort Haplotipado molecular de individuos : construcción y análisis de algoritmos
dc.creator.fl_str_mv Chavarro Espejo, Christian Gustavo
dc.contributor.advisor.none.fl_str_mv Duitama Castellanos, Jorge Alexander
dc.contributor.author.none.fl_str_mv Chavarro Espejo, Christian Gustavo
dc.subject.armarc.es_CO.fl_str_mv Bioinformática
Genética humana
topic Bioinformática
Genética humana
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description A excepción de las células sexuales, las células humanas son diploides. En otras palabras, contienen 22 pares de cromosomas homólogos y un par de cromosomas sexuales. Cada una de las dos copias de cada cromosoma es heredada de uno de los padres. Para caracterizar completamente el genoma de un individuo, es esencial la reconstrucción de las dos copias distintas de cada cromosoma, llamadas haplotipos. El ensamblaje de haplotipos es el proceso de asignar cada uno de los diferentes alelos de las variantes cubiertas por las lecturas de secuenciación mapeadas a un haplotipo del genoma de un individuo. Para este proyecto, se implementaron en la herramienta de genómica NGSEP tres algoritmos que aproximan los haplotipos mediante diferentes heurísticas. Dos de estos algoritmos ya habían sido publicado en otras investigaciones, HapChat y GenHap; mientras que el tercero fue desarrollado en el marco de este trabajo. Con el objetivo de probar estos algoritmos implementados, se utilizaron datos reales de humanos y simulaciones de datos provenientes de la bacteria Escherichia coli. Partiendo de estos datos y de implementaciones de algoritmos realizadas, se realizaron comparaciones de calidad entre los algoritmos que intentan solucionar este problema.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-09-03T14:53:45Z
dc.date.available.none.fl_str_mv 2020-09-03T14:53:45Z
dc.date.issued.none.fl_str_mv 2020
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/44480
dc.identifier.pdf.none.fl_str_mv u830588.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/44480
identifier_str_mv u830588.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 42 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/23d4d9cb-d5d7-4f63-af9a-c3665cfbcf9d/download
https://repositorio.uniandes.edu.co/bitstreams/8c92295f-0da6-4195-93f9-89670a2b261d/download
https://repositorio.uniandes.edu.co/bitstreams/adc4b0ba-0051-4ef5-92e4-589baddff33a/download
bitstream.checksum.fl_str_mv b9c8d99f42057b20360b982f11e97edd
489eb2fdfd0d0e1db864759a4cdd3f77
84dcacf12ef882e275841cafc5c5b46a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133868577226752
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Duitama Castellanos, Jorge Alexander579ff412-de79-4c40-a3c9-02c47a5ad340400Chavarro Espejo, Christian Gustavo002d5b9e-9c25-4a6b-a3de-2f71b2bb59d65002020-09-03T14:53:45Z2020-09-03T14:53:45Z2020http://hdl.handle.net/1992/44480u830588.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/A excepción de las células sexuales, las células humanas son diploides. En otras palabras, contienen 22 pares de cromosomas homólogos y un par de cromosomas sexuales. Cada una de las dos copias de cada cromosoma es heredada de uno de los padres. Para caracterizar completamente el genoma de un individuo, es esencial la reconstrucción de las dos copias distintas de cada cromosoma, llamadas haplotipos. El ensamblaje de haplotipos es el proceso de asignar cada uno de los diferentes alelos de las variantes cubiertas por las lecturas de secuenciación mapeadas a un haplotipo del genoma de un individuo. Para este proyecto, se implementaron en la herramienta de genómica NGSEP tres algoritmos que aproximan los haplotipos mediante diferentes heurísticas. Dos de estos algoritmos ya habían sido publicado en otras investigaciones, HapChat y GenHap; mientras que el tercero fue desarrollado en el marco de este trabajo. Con el objetivo de probar estos algoritmos implementados, se utilizaron datos reales de humanos y simulaciones de datos provenientes de la bacteria Escherichia coli. Partiendo de estos datos y de implementaciones de algoritmos realizadas, se realizaron comparaciones de calidad entre los algoritmos que intentan solucionar este problema.Except for sex cells, human cells are diploid. In other words, they contain 22 pairs of homologous chromosomes and one pair of sex chromosomes. Each of the two copies of each chromosome is inherited from one of the parents. To fully characterize the genome of an individual, the reconstruction of the two distinct copies of each chromosome, called haplotypes, is essential. Haplotype assembly it is the process of assigning each of the different alleles of the variants covered by sequencing reads mapped to a haplotype of the genome of an individual. For this project, three algorithms that approximate haplotypes through different heuristics are implemented in the NGSEP genomics tool. Two of these algorithms and we have been published in other research, HapChat and GenHap; while the third was developed in the framework of this work. In order to test these implemented algorithms, real human data and simulations of data from the Escherichia coli bacteria were used. Based on this data and algorithm implementations, quality comparisons are made between the algorithms that attempt to solve this problem.Ingeniero de Sistemas y ComputaciónPregrado42 hojasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaHaplotipado molecular de individuos : construcción y análisis de algoritmosTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPBioinformáticaGenética humanaIngenieríaPublicationTEXTu830588.pdf.txtu830588.pdf.txtExtracted texttext/plain81204https://repositorio.uniandes.edu.co/bitstreams/23d4d9cb-d5d7-4f63-af9a-c3665cfbcf9d/downloadb9c8d99f42057b20360b982f11e97eddMD54ORIGINALu830588.pdfapplication/pdf1246057https://repositorio.uniandes.edu.co/bitstreams/8c92295f-0da6-4195-93f9-89670a2b261d/download489eb2fdfd0d0e1db864759a4cdd3f77MD51THUMBNAILu830588.pdf.jpgu830588.pdf.jpgIM Thumbnailimage/jpeg7598https://repositorio.uniandes.edu.co/bitstreams/adc4b0ba-0051-4ef5-92e4-589baddff33a/download84dcacf12ef882e275841cafc5c5b46aMD551992/44480oai:repositorio.uniandes.edu.co:1992/444802023-10-10 16:16:15.318http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co