Prediction of transposable elements

Transposable Elements (TEs) play a fundamental role on the DNA sequences in eukariotic genomes. Their nature imply they form repetitive regions, which control the structure, rearrangement and regulatory functions inside our genome. With the new sequencing techniques and the lack of bioinformatic sof...

Full description

Autores:
Jiménez Gacha, Stephannie
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/45395
Acceso en línea:
http://hdl.handle.net/1992/45395
Palabra clave:
Transposones
Genómica
Bioinformática
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_eb727a9d515f635e502e222dfb822036
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/45395
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Duitama Castellanos, Jorge Alexander579ff412-de79-4c40-a3c9-02c47a5ad340400Jiménez Gacha, Stephannie40c04b95-f057-4259-b4cb-8967121a93a95002020-09-03T15:58:13Z2020-09-03T15:58:13Z2019http://hdl.handle.net/1992/45395u827442.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Transposable Elements (TEs) play a fundamental role on the DNA sequences in eukariotic genomes. Their nature imply they form repetitive regions, which control the structure, rearrangement and regulatory functions inside our genome. With the new sequencing techniques and the lack of bioinformatic software that is capable of predicting TEs, arise the problem of detecting these sequences. Using an approach based on kmer search on an FM-Index we were able to indentify type I retrotransposons. Finally, we measured the effectivity of our proposed method in the Saccharomyces genome database obtaining 68.19% of precision, 58.82% of recall and 63.15% of F-measure. A further evaluation is needed using other genomes that vary their composition of repetitive elements to determine the performance of the proposed method."Los elementos transponibles (TE) desempeñan un papel fundamental en las secuencias de ADN en los genomas eucarióticos. Su naturaleza implica que forman regiones repetitivas, que controlan la estructura, la reorganización y las funciones reguladoras dentro de nuestro genoma. Con las nuevas técnicas de secuenciación y la falta de software bioinformático capaz de predecir los TE, surge el problema de la detección de estas secuencias. Usando un enfoque basado en la búsqueda kmer en un índice FM, pudimos identificar retrotransposones tipo I. Finalmente, medimos la efectividad de nuestro método propuesto en la base de datos del genoma de Saccharomyces obteniendo 68.19% de precisión, 58.82% de recordación y 63.15% de F-medida. Se necesita una evaluación adicional utilizando otros genomas que varían su composición de elementos repetitivos para determinar el rendimiento del método propuesto."--Tomado del Formato de Documento de Grado.Ingeniero de Sistemas y ComputaciónPregrado7 hojasapplication/pdfengUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaPrediction of transposable elementsTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPTransposonesGenómicaBioinformáticaIngenieríaPublicationTHUMBNAILu827442.pdf.jpgu827442.pdf.jpgIM Thumbnailimage/jpeg22366https://repositorio.uniandes.edu.co/bitstreams/b7a68797-8ada-455e-9c81-14eda24b1402/download3d497ccdf15b7de320d40bcf7380b28bMD55TEXTu827442.pdf.txtu827442.pdf.txtExtracted texttext/plain30857https://repositorio.uniandes.edu.co/bitstreams/c7bde143-5364-4a41-b840-c14a7ba17a2e/download356ff255da182e2ec4dbeb6d57267e44MD54ORIGINALu827442.pdfapplication/pdf319636https://repositorio.uniandes.edu.co/bitstreams/fdd3a7b8-0bf8-48f1-8167-735b718a2473/download217a7ce69760e6da8fdcfa467c6409f5MD511992/45395oai:repositorio.uniandes.edu.co:1992/453952023-10-10 15:56:43.51http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co
dc.title.es_CO.fl_str_mv Prediction of transposable elements
title Prediction of transposable elements
spellingShingle Prediction of transposable elements
Transposones
Genómica
Bioinformática
Ingeniería
title_short Prediction of transposable elements
title_full Prediction of transposable elements
title_fullStr Prediction of transposable elements
title_full_unstemmed Prediction of transposable elements
title_sort Prediction of transposable elements
dc.creator.fl_str_mv Jiménez Gacha, Stephannie
dc.contributor.advisor.none.fl_str_mv Duitama Castellanos, Jorge Alexander
dc.contributor.author.none.fl_str_mv Jiménez Gacha, Stephannie
dc.subject.armarc.es_CO.fl_str_mv Transposones
Genómica
Bioinformática
topic Transposones
Genómica
Bioinformática
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Transposable Elements (TEs) play a fundamental role on the DNA sequences in eukariotic genomes. Their nature imply they form repetitive regions, which control the structure, rearrangement and regulatory functions inside our genome. With the new sequencing techniques and the lack of bioinformatic software that is capable of predicting TEs, arise the problem of detecting these sequences. Using an approach based on kmer search on an FM-Index we were able to indentify type I retrotransposons. Finally, we measured the effectivity of our proposed method in the Saccharomyces genome database obtaining 68.19% of precision, 58.82% of recall and 63.15% of F-measure. A further evaluation is needed using other genomes that vary their composition of repetitive elements to determine the performance of the proposed method.
publishDate 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2020-09-03T15:58:13Z
dc.date.available.none.fl_str_mv 2020-09-03T15:58:13Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/45395
dc.identifier.pdf.none.fl_str_mv u827442.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/45395
identifier_str_mv u827442.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 7 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/b7a68797-8ada-455e-9c81-14eda24b1402/download
https://repositorio.uniandes.edu.co/bitstreams/c7bde143-5364-4a41-b840-c14a7ba17a2e/download
https://repositorio.uniandes.edu.co/bitstreams/fdd3a7b8-0bf8-48f1-8167-735b718a2473/download
bitstream.checksum.fl_str_mv 3d497ccdf15b7de320d40bcf7380b28b
356ff255da182e2ec4dbeb6d57267e44
217a7ce69760e6da8fdcfa467c6409f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133846722805760