Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep

Synteny blocks are sets of similar regions between genomes or within the same genome. The identification of these blocks allows for genomic evolution studies. Recent work in comparative genomics demonstrates an interest in having synteny blocks identification tools that are easy to use and to integr...

Full description

Autores:
Ángel Villadiego, Ricardo Andrés
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/51497
Acceso en línea:
http://hdl.handle.net/1992/51497
Palabra clave:
Interfaces gráficas con el usuario (Sistemas para computador)
Ingeniería de software
Arquitectura de software
Algoritmos (Computadores)
Genómica
Biología computacional
Código genético
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_25af75d1d0260e653d39b6eeba716a17
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/51497
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
title Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
spellingShingle Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
Interfaces gráficas con el usuario (Sistemas para computador)
Ingeniería de software
Arquitectura de software
Algoritmos (Computadores)
Genómica
Biología computacional
Código genético
Ingeniería
title_short Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
title_full Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
title_fullStr Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
title_full_unstemmed Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
title_sort Implementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsep
dc.creator.fl_str_mv Ángel Villadiego, Ricardo Andrés
dc.contributor.advisor.none.fl_str_mv Duitama Castellanos, Jorge Alexander
dc.contributor.author.none.fl_str_mv Ángel Villadiego, Ricardo Andrés
dc.subject.armarc.none.fl_str_mv Interfaces gráficas con el usuario (Sistemas para computador)
Ingeniería de software
Arquitectura de software
Algoritmos (Computadores)
Genómica
Biología computacional
Código genético
topic Interfaces gráficas con el usuario (Sistemas para computador)
Ingeniería de software
Arquitectura de software
Algoritmos (Computadores)
Genómica
Biología computacional
Código genético
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Synteny blocks are sets of similar regions between genomes or within the same genome. The identification of these blocks allows for genomic evolution studies. Recent work in comparative genomics demonstrates an interest in having synteny blocks identification tools that are easy to use and to integrate into existing workflows. Despite the fact that there are currently various tools for identifying synteny blocks, their integration into workflows is difficult. Taking this into account, this functionality was implemented in the NGSEP software. For this, different tools currently used in the identification of synteny blocks were explored and the HalSynteny algorithm was selected and implemented in NGSEP. This algorithm consists of constructing a directed acyclic graph based on the alignments and, based on these, find the synteny blocks using as parameters the distance between the alignments and the total length of the aligned regions that make up a synthesis block. The execution times of both tools were compared and a sensitivity and specificity analysis was performed. The implementation in NGSEP has a much shorter execution time and achieves higher sensitivity in tests compared to HalSynteny. Both tools maintain a similar specificity between them when they are at their maximum sensitivity.
publishDate 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-08-10T18:27:46Z
dc.date.available.none.fl_str_mv 2021-08-10T18:27:46Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/51497
dc.identifier.pdf.none.fl_str_mv 23648.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/51497
identifier_str_mv 23648.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 13 hojas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/9cd90c1e-3f84-48d4-a872-c557982a017a/download
https://repositorio.uniandes.edu.co/bitstreams/89b19f89-a969-47f3-a8bf-8c153184de3a/download
https://repositorio.uniandes.edu.co/bitstreams/e441e977-0846-4156-90a6-388519f3af8a/download
bitstream.checksum.fl_str_mv 5afa2bbb50dc3b15d35125003641c9c0
4a8fee5242d282fd1984cbe4869a5d4a
b3e641b0658ae43a003dfdf6e707e92d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133946661535744
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Duitama Castellanos, Jorge Alexandervirtual::9360-1Ángel Villadiego, Ricardo Andrés6c242521-9379-483c-9440-6ab29b8f14565002021-08-10T18:27:46Z2021-08-10T18:27:46Z2020http://hdl.handle.net/1992/5149723648.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Synteny blocks are sets of similar regions between genomes or within the same genome. The identification of these blocks allows for genomic evolution studies. Recent work in comparative genomics demonstrates an interest in having synteny blocks identification tools that are easy to use and to integrate into existing workflows. Despite the fact that there are currently various tools for identifying synteny blocks, their integration into workflows is difficult. Taking this into account, this functionality was implemented in the NGSEP software. For this, different tools currently used in the identification of synteny blocks were explored and the HalSynteny algorithm was selected and implemented in NGSEP. This algorithm consists of constructing a directed acyclic graph based on the alignments and, based on these, find the synteny blocks using as parameters the distance between the alignments and the total length of the aligned regions that make up a synthesis block. The execution times of both tools were compared and a sensitivity and specificity analysis was performed. The implementation in NGSEP has a much shorter execution time and achieves higher sensitivity in tests compared to HalSynteny. Both tools maintain a similar specificity between them when they are at their maximum sensitivity.Los bloques de sintenia son conjuntos de regiones similares entre genomas o dentro de un mismo genoma. La identificación de estos bloques permite realizar estudios de evolución genómica. Los trabajos recientes en genómica comparativa demuestran un interés por tener herramientas de identificación de bloques de sintenia que sean fáciles de usar e integrar a flujos de trabajos. A pesar de que actualmente existen diversas herramientas para su identificación de bloques de sintenia, su integración a flujos de trabajo resulta difícil. Teniendo en cuenta esta situación, se implementó esta funcionalidad en el software NGSEP. Para ello se exploraron distintas herramientas usadas actualmente en la identificación de bloques de sintenia y se seleccionó e implementó el algoritmo de HalSynteny en NGSEP. Este algoritmo consiste en construir un grafo acíclico dirigido en base a los alineamientos y a partir de estos encontrar los bloques de sintenia utilizando como parámetros la distancia entre los alineamientos y la longitud total de regiones alineadas que componen un bloque de sintenia. Se compararon los tiempos de ejecución de ambas herramientas y se realizó un análisis de sensibilidad y especificidad. La implementación en NGSEP tiene un tiempo de ejecución mucho menor y alcanza una mayor sensibilidad en las pruebas realizadas en comparación con HalSynteny. Ambas herramientas mantienen una especificidad similar entre ellas cuando se encuentran en su máxima sensibilidad.Ingeniero de Sistemas y ComputaciónPregrado13 hojasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónImplementación de un algoritmo de identificación de bloques de sintenia a partir de alineamientos en ngsepTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPInterfaces gráficas con el usuario (Sistemas para computador)Ingeniería de softwareArquitectura de softwareAlgoritmos (Computadores)GenómicaBiología computacionalCódigo genéticoIngeniería201423057Publication07e4ae59-26ee-4988-9701-129fa965d270virtual::9360-107e4ae59-26ee-4988-9701-129fa965d270virtual::9360-1THUMBNAIL23648.pdf.jpg23648.pdf.jpgIM Thumbnailimage/jpeg8170https://repositorio.uniandes.edu.co/bitstreams/9cd90c1e-3f84-48d4-a872-c557982a017a/download5afa2bbb50dc3b15d35125003641c9c0MD55ORIGINAL23648.pdfapplication/pdf441426https://repositorio.uniandes.edu.co/bitstreams/89b19f89-a969-47f3-a8bf-8c153184de3a/download4a8fee5242d282fd1984cbe4869a5d4aMD51TEXT23648.pdf.txt23648.pdf.txtExtracted texttext/plain29649https://repositorio.uniandes.edu.co/bitstreams/e441e977-0846-4156-90a6-388519f3af8a/downloadb3e641b0658ae43a003dfdf6e707e92dMD541992/51497oai:repositorio.uniandes.edu.co:1992/514972024-03-13 13:54:57.458http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co