Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos
59 páginas
- Autores:
-
Varela Tabares, Daniela
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad EIA .
- Repositorio:
- Repositorio EIA .
- Idioma:
- spa
- OAI Identifier:
- oai:repository.eia.edu.co:11190/2461
- Acceso en línea:
- https://repository.eia.edu.co/handle/11190/2461
- Palabra clave:
- Flujo de trabajo
Computación en la nube
Variantes oncogénicas
Pipeline
Cloud computing
Oncogenic variant
- Rights
- openAccess
- License
- Derechos Reservados - Universidad EIA, 2019
id |
REIA2_83b3e16993765cc40dd1560799ec7d7d |
---|---|
oai_identifier_str |
oai:repository.eia.edu.co:11190/2461 |
network_acronym_str |
REIA2 |
network_name_str |
Repositorio EIA . |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
title |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
spellingShingle |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos Flujo de trabajo Computación en la nube Variantes oncogénicas Pipeline Cloud computing Oncogenic variant |
title_short |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
title_full |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
title_fullStr |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
title_full_unstemmed |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
title_sort |
Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos |
dc.creator.fl_str_mv |
Varela Tabares, Daniela |
dc.contributor.advisor.spa.fl_str_mv |
Flórez Zapata, Nathalia María Vanessa Arango Ossa, Juan Esteban |
dc.contributor.author.spa.fl_str_mv |
Varela Tabares, Daniela |
dc.subject.proposal.spa.fl_str_mv |
Flujo de trabajo Computación en la nube Variantes oncogénicas |
topic |
Flujo de trabajo Computación en la nube Variantes oncogénicas Pipeline Cloud computing Oncogenic variant |
dc.subject.proposal.eng.fl_str_mv |
Pipeline Cloud computing Oncogenic variant |
description |
59 páginas |
publishDate |
2019 |
dc.date.issued.spa.fl_str_mv |
2019 |
dc.date.accessioned.spa.fl_str_mv |
2020-08-13T22:40:01Z |
dc.date.available.spa.fl_str_mv |
2020-08-13T22:40:01Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
publishedVersion |
dc.identifier.uri.spa.fl_str_mv |
https://repository.eia.edu.co/handle/11190/2461 |
dc.identifier.bibliographiccitation.spa.fl_str_mv |
Varela Tabares, D. (2019). Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos. (Trabajo de grado). Universidad EIA, Envigado-Antioquia. Recuperado de: http://repository.eia.edu.co/handle/11190/2461 |
url |
https://repository.eia.edu.co/handle/11190/2461 |
identifier_str_mv |
Varela Tabares, D. (2019). Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos. (Trabajo de grado). Universidad EIA, Envigado-Antioquia. Recuperado de: http://repository.eia.edu.co/handle/11190/2461 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.rights.spa.fl_str_mv |
Derechos Reservados - Universidad EIA, 2019 |
dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.creativecommons.spa.fl_str_mv |
Atribución-NoComercial |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Derechos Reservados - Universidad EIA, 2019 https://creativecommons.org/licenses/by-nc/4.0/ Atribución-NoComercial http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Universidad EIA |
dc.publisher.department.spa.fl_str_mv |
Biomédica, Mecatrónica y Mecánica |
dc.publisher.editor.spa.fl_str_mv |
Envigado (Antioquia, Colombia). Universidad EIA, 2019 |
dc.publisher.program.spa.fl_str_mv |
Ingeniería Biomédica |
dc.source.spa.fl_str_mv |
Repositorio Institucional Universidad EIA |
institution |
Universidad EIA . |
bitstream.url.fl_str_mv |
https://repository.eia.edu.co/bitstreams/83a3ef4a-af5c-4982-90e0-b6bdfb97109b/download https://repository.eia.edu.co/bitstreams/db4c7ffc-b465-448e-9c89-641bc3d91436/download https://repository.eia.edu.co/bitstreams/1704c58d-ef00-470a-b1b0-b8578e272215/download https://repository.eia.edu.co/bitstreams/db58f410-8219-4efb-8ba2-727689c407ac/download |
bitstream.checksum.fl_str_mv |
cef8b89f04d91732160a35f5a6e6f78d fd684f8be4629056c4efa72ee9a14eeb da9276a8e06ed571bb7fc7c7186cd8fe 0c1e0a4a4a65f02d7a45f313c4fef7b6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad EIA |
repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
_version_ |
1814100913416044544 |
spelling |
Flórez Zapata, Nathalia María Vanessab1136049920298ff87614b9280624902-1Arango Ossa, Juan Esteband9971c934d10926aa1b1272c03ff793f-1Varela Tabares, Daniela197cfa6233c66bef4e06b8e2d7597711-12020-08-13T22:40:01Z2020-08-13T22:40:01Z2019https://repository.eia.edu.co/handle/11190/2461Varela Tabares, D. (2019). Diseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicos. (Trabajo de grado). Universidad EIA, Envigado-Antioquia. Recuperado de: http://repository.eia.edu.co/handle/11190/246159 páginasLa secuenciación de alto rendimiento (NGS, por sus siglas en inglés) revolucionó el campo de la genómica al reducir los costos y aumentar la velocidad del proceso drásticamente. Como consecuencia, la cantidad de secuencias de ADN ha aumentado exponencialmente, y cada día se desarrollan nuevas herramientas y aplicaciones para su procesamiento. Esto ha incrementado la demanda de infraestructura de cómputo y almacenamiento, que permita analizar tal volumen de información. El verdadero valor de estos datos se materializa cuando arrojan información médica relevante en escalas de tiempo aceptables, para su aplicación en el diagnóstico y tratamiento de enfermedades asociadas a alteraciones del genoma, como el cáncer. Sin embargo, la posibilidad de acceder a una infraestructura propia de computación de alto rendimiento, para lograr la transformación de los datos, se ve limitada por sus costos. Es aquí donde la computación en la nube se presenta como una opción atractiva, particularmente por su modelo de facturación bajo demanda, en el que se paga únicamente por los recursos usados. En este trabajo se expone el proceso para lograr la implementación de un flujo de trabajo bioinformático en la nube para la detección de variantes oncogénicas, desde la selección del proveedor del servicio de computación hasta la validación de las variantes genéticas encontradas. Incluyendo múltiples etapas de levantamiento de requerimientos, codificación, diseño y documentación, como se realiza en las metodologías ágiles para el diseño de software, cuyos principios fueron adoptados para el desarrollo. Para la infraestructura de computación en la nube, se escogió Amazon Web Services, un proveedor del servicio. Luego se diseñó el flujo, definiendo entradas, procesos intermedios, salidas y herramientas a utilizar en cada paso; y se seleccionaron los archivos de entrada de una base de datos pública. Los diferentes pasos se conectan a través de Isabl, un marco de trabajo para el manejo de datos NGS, que administra los metadatos y gestiona las tareas, desplegado en la nube utilizando el servicio ECS para la orquestación de contenedores. Adicional a este, se utilizó EC2 para el procesamiento y EFS para el almacenamiento, entre otros servicios. La implementación fue realizada con éxito, se validaron las variantes genéticas encontradas respecto a estudios relacionados y se reportan gráficamente los resultados, lo que facilita la interpretación de estos y le genera un valor adicional al proyecto. Se analizaron los costos asociados al proceso y se comparó con el servicio ofrecido por un centro de computación de alto rendimiento colombiano, mostrando la viabilidad de la computación en la nube para este tipo de desarrollos a corto plazo y pequeña escala.PregradoIngeniero(a) Biomédico(a)application/pdfspaUniversidad EIABiomédica, Mecatrónica y MecánicaEnvigado (Antioquia, Colombia). Universidad EIA, 2019Ingeniería BiomédicaDerechos Reservados - Universidad EIA, 2019https://creativecommons.org/licenses/by-nc/4.0/El autor de la obra, actuando en nombre propio, hace entrega del ejemplar respectivo y de sus anexos en formato digital o electrónico y autoriza a la ESCUELA DE INGENIERIA DE ANTIOQUIA, para que en los términos establecidos en la Ley 23 de 1982, Ley 44 de 1993, Decisión andina 351 de 1993, Decreto 460 de 1995, y demás normas generales sobre la materia, utilice y use por cualquier medio conocido o por conocer, los derechos patrimoniales de reproducción, comunicación pública, transformación y distribución de la obra objeto del presente documento. PARÁGRAFO: La presente autorización se hace extensiva no sólo a las dependencias y derechos de uso sobre la obra en formato o soporte material, sino también para formato virtual, electrónico, digital, y en red, internet, extranet, intranet, etc., y en general en cualquier formato conocido o por conocer. EL AUTOR, manifiesta que la obra objeto de la presente autorización es original y la realiza sin violar o usurpar derechos de autor de terceros, por lo tanto la obra es de exclusiva autoría y tiene la titularidad sobre la misma. PARÁGRAFO: En caso de presentarse cualquier reclamación o acción por parte de un tercero en cuanto a los derechos de autor sobre la obra en cuestión, EL AUTOR, asumirá toda la responsabilidad, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos la ESCUELA DE INGENIERÍA DE ANTIOQUIA actúa como un tercero de buena fe.info:eu-repo/semantics/openAccessAtribución-NoComercialhttp://purl.org/coar/access_right/c_abf2Repositorio Institucional Universidad EIADiseño e implementación de un flujo de trabajo bioinformático en la nube para la identificación de variantes oncogénicas a partir de datos genómicosTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionTexthttps://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_970fb48d4fbd8a85Flujo de trabajoComputación en la nubeVariantes oncogénicasPipelineCloud computingOncogenic variantBIOM/0317PublicationTHUMBNAILVarelaDaniela_2019_DiseñoImplementacionFlujo.pdf.jpgVarelaDaniela_2019_DiseñoImplementacionFlujo.pdf.jpgGenerated Thumbnailimage/jpeg9045https://repository.eia.edu.co/bitstreams/83a3ef4a-af5c-4982-90e0-b6bdfb97109b/downloadcef8b89f04d91732160a35f5a6e6f78dMD54ORIGINALVarelaDaniela_2019_DiseñoImplementacionFlujo.pdfVarelaDaniela_2019_DiseñoImplementacionFlujo.pdfTrabajo de gradoapplication/pdf1635076https://repository.eia.edu.co/bitstreams/db4c7ffc-b465-448e-9c89-641bc3d91436/downloadfd684f8be4629056c4efa72ee9a14eebMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82515https://repository.eia.edu.co/bitstreams/1704c58d-ef00-470a-b1b0-b8578e272215/downloadda9276a8e06ed571bb7fc7c7186cd8feMD52TEXTVarelaDaniela_2019_DiseñoImplementacionFlujo.pdf.txtVarelaDaniela_2019_DiseñoImplementacionFlujo.pdf.txtExtracted texttext/plain130377https://repository.eia.edu.co/bitstreams/db58f410-8219-4efb-8ba2-727689c407ac/download0c1e0a4a4a65f02d7a45f313c4fef7b6MD5311190/2461oai:repository.eia.edu.co:11190/24612023-07-25 17:16:57.565https://creativecommons.org/licenses/by-nc/4.0/Derechos Reservados - Universidad EIA, 2019open.accesshttps://repository.eia.edu.coRepositorio Institucional Universidad EIAbdigital@metabiblioteca.comICAgICAgICAgICAgICAgICAgICAgICAgPGNlbnRlcj5BVklTTyBERSBQUklWQUNJREFEPC9jZW50ZXI+CgpMYSBFc2N1ZWxhIGRlIEluZ2VuaWVyw61hIGRlIEFudGlvcXVpYSBhIHRyYXbDqXMgZGUgZXN0ZSBhdmlzbywgaW5mb3JtYSBhIGxvcyB0aXR1bGFyZXMgZGUgZGF0b3MgcGVyc29uYWxlcyBxdWUgc2UgZW5jdWVudHJlbiBlbiBzdXMgYmFzZXMgZGUgZGF0b3MgcXVlIGxhcyBwb2zDrXRpY2FzIGRlIHRyYXRhbWllbnRvIGRlIGRhdG9zIHBlcnNvbmFsZXMgbGEgRUlBIHNvbjoKCkFsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHNlIGxlIHJlc3BldGFyw6FuIHN1cyBkZXJlY2hvcyBhIGNvbm9jZXIgw61udGVncmFtZW50ZSB5IGRlIGZvcm1hIGdyYXR1aXRhIHN1cyBkYXRvcyBwZXJzb25hbGVzLCBhc8OtIGNvbW8gYSBhY3R1YWxpemFybG9zIHkgcmVjdGlmaWNhcmxvcyBmcmVudGUgYSBsYSBFSUEgbyBsb3MgZW5jYXJnYWRvcyBkZWwgdHJhdGFtaWVudG8uCgpBbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwZXJzb25hbGVzIGVuIHRyYXRhbWllbnRvLCBwb2Ryw6EgY29ub2NlciBlbCB1c28gcXVlIHNlIGxlIGhhIGRhZG8gYSBzdXMgZGF0b3MgcGVyc29uYWxlcywgcHJldmlhIHNvbGljaXR1ZC4KCkVsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHBvZHLDoSBzb2xpY2l0YXIgcHJ1ZWJhIGRlIGxhIGF1dG9yaXphY2nDs24gb3RvcmdhZGEgYSBsYSBFSUEuIHNhbHZvIGN1YW5kbyBleHByZXNhbWVudGUgc2UgZXhjZXB0w7plIGNvbW8gcmVxdWlzaXRvIHBhcmEgZWwgdHJhdGFtaWVudG8sIGRlIGNvbmZvcm1pZGFkIGNvbiBsYSBsZXkuCgpFbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwdWVkZSByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24geSBzb2xpY2l0YXIgbGEgc3VwcmVzacOzbiBkZWwgZGF0byBjdWFuZG8gZW4gZWwgdHJhdGFtaWVudG8gbm8gc2UgcmVzcGV0ZW4gbG9zIHByaW5jaXBpb3MsIGRlcmVjaG9zIHkgZ2FyYW50w61hcyBjb25zdGl0dWNpb25hbGVzIHkgbGVnYWxlcy4gTGEgcmV2b2NhdG9yaWEgeSBzdXByZXNpw7NuIHByb2NlZGVyw6EgY3VhbmRvIGxhIFN1cGVyaW50ZW5kZW5jaWEgZGUgSW5kdXN0cmlhIHkgQ29tZXJjaW8gKFNJQykgaGF5YSBkZXRlcm1pbmFkbyBxdWUgZW4gZWwgdHJhdGFtaWVudG8sIGxhIEVTQ1VFTEEgREUgSU5HRU5JRVLDjUEgREUgQU5USU9RVUlBIGhhIGluY3VycmlkbyBlbiBjb25kdWN0YXMgY29udHJhcmlhcyBhIGVzdGEgTGV5IHkgYSBsYSBDb25zdGl0dWNpw7NuIFBvbMOtdGljYS4KClBhcmEgZWZlY3RvcyBkZSBlamVyY2VyIHN1cyBkZXJlY2hvcyBkZSBjb25vY2VyLCBhY3R1YWxpemFyLCByZWN0aWZpY2FyIHkgc3VwcmltaXIgaW5mb3JtYWNpw7NuLCByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24sIGVudHJlIG90cm9zOyBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgYWN1ZGlyIGEgbGEgRVNDVUVMQSBERSBJTkdFTklFUsONQSBERSBBTlRJT1FVSUEsIGNvbW8gcmVzcG9uc2FibGUgZGVsIHRyYXRhbWllbnRvIGRlIGRhdG9zIGFsIMOhcmVhIGRlIGNvbXVuaWNhY2lvbmVzLCBtZWRpYW50ZSBjb3JyZW8gZWxlY3Ryw7NuaWNvIGEgd2VibWFzdGVyQGVpYS5lZHUuY28gLgoKRW4gY2FzbyBkZSBpbmZyYWNjaW9uZXMgYSBsYSBsZXkgMTU4MSBkZSAyMDEyLCBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgcHJlc2VudGFyIHF1ZWphIGFudGUgbGEgU3VwZXJpbnRlbmRlbmNpYSBkZSBJbmR1c3RyaWEgeSBDb21lcmNpbyAoU0lDKS4KCkVsIHRpdHVsYXIgc2Vyw6EgaW5mb3JtYWRvIGFjZXJjYSBkZSBsYSBubyBvYmxpZ2F0b3JpZWRhZCBkZSBsYXMgcmVzcHVlc3RhcyBhIGxhcyBwcmVndW50YXMgcXVlIGxlIHNlYW4gaGVjaGFzLCBjdWFuZG8gw6lzdGFzIHZlcnNlbiBzb2JyZSBkYXRvcyBzZW5zaWJsZXMsIHRhbGVzIGNvbW8gb3JpZ2VuIHJhY2lhbCBvIMOpdG5pY28sIG9yaWVudGFjacOzbiBwb2zDrXRpY2EsIGNvbnZpY2Npb25lcyByZWxpZ2lvc2FzICwgcGVydGVuZW5jaWEgYSBzaW5kaWNhdG9zLCBvcmdhbml6YWNpb25lcyBzb2NpYWxlcyBkZSBkZXJlY2hvcyBodW1hbm9zLCBkYXRvcyByZWxhdGl2b3MgYSBsYSBzYWx1ZCwgYSBsYSB2aWRhIHNleHVhbCB5IGRhdG9zIGJpb23DqXRyaWNvcyBvIHNvYnJlIGxvcyBkYXRvcyBkZSBsb3MgbmnDsW9zLCBuacOxYXMgeSBhZG9sZXNjZW50ZXMuCgpFbCB0aXR1bGFyIHBvZHLDoSBjb25vY2VyIG51ZXN0cmEgcG9sw610aWNhIGRlIHRyYXRhbWllbnRvLCBsb3MgZGF0b3Mgc3VzdGFuY2lhbGVzIHF1ZSBzZSBsbGVndWVuIGEgcHJvZHVjaXIgZW4gZWwgcHJlc2VudGUgYXZpc28gbyBlbiBsYXMgcG9sw610aWNhcyBkZSB0cmF0YW1pZW50bywgc2Vyw6FuIHB1YmxpY2FkYXMgZW4gbnVlc3RybyBzaXRpbyB3ZWIsIG1lZGlvIGVsZWN0csOzbmljbyBoYWJpdHVhbCBkZSBjb250YWN0byBjb24gbG9zIHRpdHVsYXJlcy4KCg== |