Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.

La secuenciación de exomas humanos alrededor del mundo ha permitido establecer patrones de variación genética a escala global útiles para brindar una interpretación clínica de variantes. Sin embargo, las bases de datos públicas disponibles, actualmente no reflejan adecuadamente las frecuencias aléli...

Full description

Autores:
Redondo Aguilar, Allison Daian
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/11370
Acceso en línea:
http://hdl.handle.net/20.500.12495/11370
Palabra clave:
Frecuencia-alélica
Variante
SNV
Indel
570
Allele-frequency
Variant
SNV
Indel
Rights
openAccess
License
Atribución-NoComercial-CompartirIgual 4.0 Internacional
id UNBOSQUE2_10af3b908b91ee4395e19fb4485ce612
oai_identifier_str oai:repositorio.unbosque.edu.co:20.500.12495/11370
network_acronym_str UNBOSQUE2
network_name_str Repositorio U. El Bosque
repository_id_str
dc.title.spa.fl_str_mv Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
dc.title.translated.spa.fl_str_mv Analysis of genetic variation in exome samples associated with pathologies in Colombian patients of IPS Biotecgen S.A.S.
title Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
spellingShingle Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
Frecuencia-alélica
Variante
SNV
Indel
570
Allele-frequency
Variant
SNV
Indel
title_short Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
title_full Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
title_fullStr Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
title_full_unstemmed Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
title_sort Análisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.
dc.creator.fl_str_mv Redondo Aguilar, Allison Daian
dc.contributor.advisor.none.fl_str_mv Mahecha López, Daniel Hernán
dc.contributor.author.none.fl_str_mv Redondo Aguilar, Allison Daian
dc.subject.spa.fl_str_mv Frecuencia-alélica
Variante
SNV
Indel
topic Frecuencia-alélica
Variante
SNV
Indel
570
Allele-frequency
Variant
SNV
Indel
dc.subject.ddc.none.fl_str_mv 570
dc.subject.keywords.spa.fl_str_mv Allele-frequency
Variant
SNV
Indel
description La secuenciación de exomas humanos alrededor del mundo ha permitido establecer patrones de variación genética a escala global útiles para brindar una interpretación clínica de variantes. Sin embargo, las bases de datos públicas disponibles, actualmente no reflejan adecuadamente las frecuencias alélicas de poblaciones como la colombiana lo cual se convierte en una limitante importante a la hora de brindar una interpretación clínica de variantes apropiada al contexto específico de diagnóstico genético del país. Por este motivo, se propuso la identificación, la determinación de las frecuencias alélicas y el posterior análisis de variantes de 632 muestras de WES de Biotecgen S.A.S. mediante un flujo de trabajo de control de calidad, alineamiento y llamado de variantes. Se identificaron 1 881 670 SNVs bialélicos y 260 006 Indels . El conjunto presentó una mayor proporción de variantes raras (MAF<0,01). El 88% de las variantes fueron SNVs. Los Indel estuvieron mayormente representados (63%) por deleciones con un tamaño menor a 6 bases. En la clasificación por consecuencia funcional la mayor proporción estuvo representada por missense (55.4%), seguida de sinónimas (43.7%) y nonsense (0.9%). La mayor proporción de loci se encontró en equilibrio de Hardy-Weinberg (p>0.05). Finalmente, las frecuencias alélicas integradas a VarSeq se encuentran actualmente disponibles para los analistas de datos ómicos de Biotecgen S.A.S. proporcionando información relevante para la interpretación clínica de variantes y siendo potencialmente valiosas para futuros estudios de ascendencia genética y estructura poblacional en la cohorte de pacientes colombianos de Biotecgen S.A.S.
publishDate 2022
dc.date.issued.none.fl_str_mv 2022
dc.date.accessioned.none.fl_str_mv 2023-10-10T18:15:03Z
dc.date.available.none.fl_str_mv 2023-10-10T18:15:03Z
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12495/11370
dc.identifier.instname.spa.fl_str_mv instname:Universidad El Bosque
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad El Bosque
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.unbosque.edu.co
url http://hdl.handle.net/20.500.12495/11370
identifier_str_mv instname:Universidad El Bosque
reponame:Repositorio Institucional Universidad El Bosque
repourl:https://repositorio.unbosque.edu.co
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.local.spa.fl_str_mv Acceso abierto
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
http://creativecommons.org/licenses/by-nc-sa/4.0/
Acceso abierto
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Biología
dc.publisher.grantor.spa.fl_str_mv Universidad El Bosque
dc.publisher.faculty.spa.fl_str_mv Facultad de Ciencias
institution Universidad El Bosque
bitstream.url.fl_str_mv https://repositorio.unbosque.edu.co/bitstreams/89c87c2c-71f7-49de-9762-9c871cec2eca/download
https://repositorio.unbosque.edu.co/bitstreams/bff993c5-a058-4d3c-adc8-da09625acf4a/download
https://repositorio.unbosque.edu.co/bitstreams/176baa7e-4e96-4fc0-9b1f-cea7e590a361/download
https://repositorio.unbosque.edu.co/bitstreams/c58fc0dc-5548-443e-9e0e-086ae5017766/download
https://repositorio.unbosque.edu.co/bitstreams/71c5ece1-fe84-4d0c-ad6c-ba584a246dd9/download
https://repositorio.unbosque.edu.co/bitstreams/4b4510df-c005-4569-8cdc-c10daae07055/download
https://repositorio.unbosque.edu.co/bitstreams/581494ad-e9b8-4548-96a5-39fcf68edde9/download
bitstream.checksum.fl_str_mv 64c25a0d8d3013f3fdb337383891b1e6
934f4ca17e109e0a05eaeaba504d7ce4
9f99674430b2f5bda4c892280659d512
17cc15b951e7cc6b3728a574117320f9
235cae2ad411d5cd1f5aa2807fcb5c51
513074c70ecc3775e5254e58b938803c
3b334a5ed8e2c7be5b0f5a8d4d5f167e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad El Bosque
repository.mail.fl_str_mv bibliotecas@biteca.com
_version_ 1814100804101996544
spelling Mahecha López, Daniel HernánRedondo Aguilar, Allison Daian2023-10-10T18:15:03Z2023-10-10T18:15:03Z2022http://hdl.handle.net/20.500.12495/11370instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coLa secuenciación de exomas humanos alrededor del mundo ha permitido establecer patrones de variación genética a escala global útiles para brindar una interpretación clínica de variantes. Sin embargo, las bases de datos públicas disponibles, actualmente no reflejan adecuadamente las frecuencias alélicas de poblaciones como la colombiana lo cual se convierte en una limitante importante a la hora de brindar una interpretación clínica de variantes apropiada al contexto específico de diagnóstico genético del país. Por este motivo, se propuso la identificación, la determinación de las frecuencias alélicas y el posterior análisis de variantes de 632 muestras de WES de Biotecgen S.A.S. mediante un flujo de trabajo de control de calidad, alineamiento y llamado de variantes. Se identificaron 1 881 670 SNVs bialélicos y 260 006 Indels . El conjunto presentó una mayor proporción de variantes raras (MAF<0,01). El 88% de las variantes fueron SNVs. Los Indel estuvieron mayormente representados (63%) por deleciones con un tamaño menor a 6 bases. En la clasificación por consecuencia funcional la mayor proporción estuvo representada por missense (55.4%), seguida de sinónimas (43.7%) y nonsense (0.9%). La mayor proporción de loci se encontró en equilibrio de Hardy-Weinberg (p>0.05). Finalmente, las frecuencias alélicas integradas a VarSeq se encuentran actualmente disponibles para los analistas de datos ómicos de Biotecgen S.A.S. proporcionando información relevante para la interpretación clínica de variantes y siendo potencialmente valiosas para futuros estudios de ascendencia genética y estructura poblacional en la cohorte de pacientes colombianos de Biotecgen S.A.S.Biotecgen S.A.S.BiólogoPregradoThe sequencing of human exomes around the world has made it possible to establish patterns of genetic variation at a global level that are useful to provide a clinical interpretation of variants. However, the public databases currently available do not adequately reflect the allele frequencies of populations such as the Colombian population, which becomes an important limitation when it comes to providing a clinical interpretation of variants appropriate to the specific context of genetic diagnosis in the country. For this reason, we proposed the identification, determination of allele frequencies and subsequent variant analysis of 632 WES samples from Biotecgen S.A.S. through a workflow of quality control, alignment and variant calling. A total of 1 881 670 biallelic SNVs and 260 006 Indel were identified. The set presented a higher proportion of rare variants (MAF< 0,01). In the classification by functional consequence the highest proportion was represented by missense (55.4%), followed by sinónimas (43.7%) and nonsense (0.9%). Eighty-five percent of the variants were SNVs. Indels were mostly represented (63%) by deletions smaller than 6 bases in size and the highest proportion of loci was found in Hardy-Weinberg equilibrium (p>0.05). Finally, allele frequencies integrated to VarSeq are currently available to Biotecgen S.A.S. omics data analysts providing relevant information for the clinical interpretation of variants and being potentially valuable for future studies of genetic ancestry and Colombian population structure.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Frecuencia-alélicaVarianteSNVIndel570Allele-frequencyVariantSNVIndelAnálisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.Analysis of genetic variation in exome samples associated with pathologies in Colombian patients of IPS Biotecgen S.A.S.BiologíaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdfANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdfAnálisis de la variación genética en muestras de exomas asociadas a patologías en pacientes colombianos de la IPS Biotecgen S.A.S.application/pdf5890799https://repositorio.unbosque.edu.co/bitstreams/89c87c2c-71f7-49de-9762-9c871cec2eca/download64c25a0d8d3013f3fdb337383891b1e6MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/bff993c5-a058-4d3c-adc8-da09625acf4a/download934f4ca17e109e0a05eaeaba504d7ce4MD53Carta de Autorizacion.pdfCarta de Autorizacion.pdfapplication/pdf849319https://repositorio.unbosque.edu.co/bitstreams/176baa7e-4e96-4fc0-9b1f-cea7e590a361/download9f99674430b2f5bda4c892280659d512MD55LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/c58fc0dc-5548-443e-9e0e-086ae5017766/download17cc15b951e7cc6b3728a574117320f9MD54THUMBNAILPortada.jpgPortada.jpgPortadaimage/jpeg41139https://repositorio.unbosque.edu.co/bitstreams/71c5ece1-fe84-4d0c-ad6c-ba584a246dd9/download235cae2ad411d5cd1f5aa2807fcb5c51MD56ANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdf.jpgANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdf.jpgIM Thumbnailimage/jpeg4368https://repositorio.unbosque.edu.co/bitstreams/4b4510df-c005-4569-8cdc-c10daae07055/download513074c70ecc3775e5254e58b938803cMD57TEXTANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdf.txtANÁLISIS DE LA VARIACIÓN GENÉTICA EN MUESTRAS DE EXOMAS ASOCIADAS A PATOLOGÍAS EN PACIENTES COLOMBIANOS DE LA IPS BIOTECGEN S.A.S..docx_removed.pdf.txtExtracted texttext/plain101702https://repositorio.unbosque.edu.co/bitstreams/581494ad-e9b8-4548-96a5-39fcf68edde9/download3b334a5ed8e2c7be5b0f5a8d4d5f167eMD5820.500.12495/11370oai:repositorio.unbosque.edu.co:20.500.12495/113702024-02-07 08:00:43.677http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo=