Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer

124 páginas

Autores:
Castillo Uparela, Daniel Eduardo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad EIA .
Repositorio:
Repositorio EIA .
Idioma:
spa
OAI Identifier:
oai:repository.eia.edu.co:11190/6832
Acceso en línea:
https://repository.eia.edu.co/handle/11190/6832
Palabra clave:
Oncología
Inmunoterapia
Biomarcador
RNA-seq
Inteligencia Artificial
Modelo Computacional
Oncology
Immunotherapy
Biomarker
RNA-seq
Artificial intelligence
Computational model
Rights
openAccess
License
Derechos Reservados - Universidad EIA, 2024
id REIA2_f90e2a713a0fa2c72ffb46c3dd2b2233
oai_identifier_str oai:repository.eia.edu.co:11190/6832
network_acronym_str REIA2
network_name_str Repositorio EIA .
repository_id_str
dc.title.spa.fl_str_mv Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
title Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
spellingShingle Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
Oncología
Inmunoterapia
Biomarcador
RNA-seq
Inteligencia Artificial
Modelo Computacional
Oncology
Immunotherapy
Biomarker
RNA-seq
Artificial intelligence
Computational model
title_short Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
title_full Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
title_fullStr Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
title_full_unstemmed Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
title_sort Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
dc.creator.fl_str_mv Castillo Uparela, Daniel Eduardo
dc.contributor.advisor.none.fl_str_mv Castaño Portilla, Carolina
dc.contributor.author.none.fl_str_mv Castillo Uparela, Daniel Eduardo
dc.subject.proposal.spa.fl_str_mv Oncología
Inmunoterapia
Biomarcador
RNA-seq
Inteligencia Artificial
Modelo Computacional
topic Oncología
Inmunoterapia
Biomarcador
RNA-seq
Inteligencia Artificial
Modelo Computacional
Oncology
Immunotherapy
Biomarker
RNA-seq
Artificial intelligence
Computational model
dc.subject.proposal.eng.fl_str_mv Oncology
Immunotherapy
Biomarker
RNA-seq
Artificial intelligence
Computational model
description 124 páginas
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-11-29T16:35:25Z
dc.date.available.none.fl_str_mv 2024-11-29T16:35:25Z
dc.date.issued.none.fl_str_mv 2024
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
dc.type.coarversion.none.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
format http://purl.org/coar/resource_type/c_7a1f
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repository.eia.edu.co/handle/11190/6832
url https://repository.eia.edu.co/handle/11190/6832
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv Derechos Reservados - Universidad EIA, 2024
dc.rights.license.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Derechos Reservados - Universidad EIA, 2024
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad EIA
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Escuela de Ingeniería y Ciencias Básicas
dc.publisher.place.none.fl_str_mv Envigado (Antioquia, Colombia)
publisher.none.fl_str_mv Universidad EIA
institution Universidad EIA .
bitstream.url.fl_str_mv https://repository.eia.edu.co/bitstreams/0e1e708f-927e-4ae5-9a81-4873a05103c8/download
https://repository.eia.edu.co/bitstreams/3fb26a33-7d48-4d40-97c5-8d75378208e7/download
https://repository.eia.edu.co/bitstreams/d4199efc-c0ad-498c-9b60-c1908fd11f20/download
https://repository.eia.edu.co/bitstreams/de147639-23fd-4ee0-a95a-5ab5efc98a89/download
bitstream.checksum.fl_str_mv 2264fce645ac2952653ce3f3b8fa781e
51f87cd967cc9f811a6bf4453928ba38
8ed4dc3e12fd46ad71b061292e597a5e
686181a95231be24c75d65310826ae58
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad EIA
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1818099046555844608
spelling Castaño Portilla, CarolinaCastillo Uparela, Daniel Eduardo2024-11-29T16:35:25Z2024-11-29T16:35:25Z2024https://repository.eia.edu.co/handle/11190/6832124 páginasRESUMEN: El cáncer es una enfermedad caracterizada por la pérdida de control en la proliferación celular debido a la rápida expansión y transformación de células normales en células cancerosas, lo que constituye un desafío científico crucial para el desarrollo de tratamientos menos invasivos y más efectivos. Según la Agencia Internacional para la Investigación del Cáncer, en el año 2020 la enfermedad fue responsable de casi 10 millones de defunciones a nivel mundial, representando aproximadamente una de cada seis muertes registradas. Ante el desalentador escenario del cáncer, las terapias dirigidas ofrecen una alternativa con menos efectos secundarios en comparación con tratamientos tradicionales como la quimioterapia, posicionando a la inmunoterapia como una de las opciones más prometedoras en los últimos años. A diferencia de los métodos invasivos tradicionales que atacan indiscriminadamente las células tumorales, la inmunoterapia estimula el sistema inmunitario para que sea este el encargado de destruir el tumor, demostrando ser una estrategia innovadora y menos agresiva. Esta metodología terapéutica no solo implica menos efectos secundarios, sino que también representa una oportunidad significativa para combatir la proliferación de la enfermedad a lo largo del organismo. Este trabajo propone un modelo computacional basado en inteligencia artificial y técnicas bioinformáticas para identificar firmas de expresión génica asociadas con la respuesta a la inmunoterapia basada en inhibidores de puntos de control inmunitario anti PD1/PD-L1 en cáncer. Se utilizó un enfoque metodológico robusto, que incluyó la corrección del efecto batch inducido por las máquinas de secuenciación utilizando la librería Inmoose, así como la normalización de los datos de expresión génica mediante TPM. Adicionalmente, se aplicaron técnicas de reducción dimensional como el Análisis de Componentes Principales (PCA) para la visualización bidimensional y tridimensional de los datos. El balanceo de clases se realizó empleando técnicas como SMOTE, NearMiss y SMOTETomek integradas en Scikit-learn, mejorando significativamente el rendimiento del modelo. La optimización de hiperparámetros se llevó a cabo con la biblioteca Optuna, y la identificación de firmas genéticas se realizó utilizando Mlxtend. Estos métodos permitieron la creación de un repositorio digital de datos de expresión génica de pacientes con tumores sólidos y la implementación de un modelo computacional fundamentado en algoritmos de Machine Learning para predecir la respuesta a la inmunoterapia. Los resultados obtenidos demuestran que la firma de 14 genes seleccionada es capaz de clasificar con precisión la respuesta al tratamiento en pacientes con cáncer, mostrando un notable desempeño y potencial para futuras investigaciones. Este modelo tiene el potencial de convertirse en una herramienta valiosa para guiar investigaciones adicionales y apoyar decisiones médicas en el contexto de la inmunoterapia como terapia dirigida.ABSTRACT: Cancer is a disease characterized by the loss of control in cell proliferation due to the rapid expansion and transformation of normal cells into cancer cells, which constitutes a crucial scientific challenge for the development of less invasive and more effective treatments. According to the International Agency for Research on Cancer, in 2020 the disease was responsible for almost ten million deaths worldwide, representing approximately one in six deaths recorded. Given the discouraging cancer scenario, targeted therapies offer an alternative with fewer side effects compared to traditional treatments such as chemotherapy, positioning immunotherapy as one of the most promising options in recent years. Unlike traditional invasive methods that indiscriminately attack tumor cells, immunotherapy stimulates the immune system to destroy the tumor, proving to be an innovative and less aggressive strategy. This therapeutic methodology not only involves fewer side effects, but also represents a significant opportunity to combat the proliferation of the disease throughout the body. This work proposes a computational model based on artificial intelligence and bioinformatics techniques to identify gene expression signatures associated with the response to immunotherapy based on anti-PD1/PD-L1 immune checkpoint inhibitors in cancer. A robust methodological approach was used, which included batch correction induced by sequencing machines using the Inmoose library, as well as gene expression data normalization using TPM. Additionally, dimensional reduction techniques such as Principal Component Analysis (PCA) were applied for two- and three-dimensional visualization of the data. Class balancing was performed using techniques such as SMOTE, NearMiss, and SMOTETomek integrated in Scikit-learn, significantly improving model performance. Hyperparameter optimization was performed with the Optuna library, and gene signature identification was performed using Mlxtend. These methods allowed the creation of a digital repository of gene expression data from patients with solid tumors and the implementation of a computational model based on Machine Learning algorithms to predict response to immunotherapy. The results obtained demonstrate that the selected 14-gene signature is capable of accurately classifying treatment response in cancer patients, showing remarkable performance and potential for future research. This model has the potential to become a valuable tool to guide further research and support medical decisions in the context of immunotherapy as a targeted therapy.PregradoIngeniero(a) de Sistemas y Computaciónapplication/pdfspaUniversidad EIAIngeniería de Sistemas y ComputaciónEscuela de Ingeniería y Ciencias BásicasEnvigado (Antioquia, Colombia)Derechos Reservados - Universidad EIA, 2024Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncerTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionTexthttp://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_970fb48d4fbd8a85OncologíaInmunoterapiaBiomarcadorRNA-seqInteligencia ArtificialModelo ComputacionalOncologyImmunotherapyBiomarkerRNA-seqArtificial intelligenceComputational modelPublicationLICENSElicense.txtlicense.txttext/plain; charset=utf-82553https://repository.eia.edu.co/bitstreams/0e1e708f-927e-4ae5-9a81-4873a05103c8/download2264fce645ac2952653ce3f3b8fa781eMD57ORIGINALCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdfCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdfTrabajo de gradoapplication/pdf3856138https://repository.eia.edu.co/bitstreams/3fb26a33-7d48-4d40-97c5-8d75378208e7/download51f87cd967cc9f811a6bf4453928ba38MD58TEXTCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.txtCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.txtExtracted texttext/plain101954https://repository.eia.edu.co/bitstreams/d4199efc-c0ad-498c-9b60-c1908fd11f20/download8ed4dc3e12fd46ad71b061292e597a5eMD59THUMBNAILCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.jpgCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.jpgGenerated Thumbnailimage/jpeg9642https://repository.eia.edu.co/bitstreams/de147639-23fd-4ee0-a95a-5ab5efc98a89/download686181a95231be24c75d65310826ae58MD51011190/6832oai:repository.eia.edu.co:11190/68322024-11-29 11:37:52.108open.accesshttps://repository.eia.edu.coRepositorio Institucional Universidad EIAbdigital@metabiblioteca.comCjxjZW50ZXI+PGI+QVZJU08gREUgUFJJVkFDSURBRDwvYj48L2NlbnRlcj4KPGJyPgo8cD5MYSBFc2N1ZWxhIGRlIEluZ2VuaWVyw61hIGRlIEFudGlvcXVpYSBhIHRyYXbDqXMgZGUgZXN0ZSBhdmlzbywgaW5mb3JtYSBhIGxvcyB0aXR1bGFyZXMgZGUgZGF0b3MgcGVyc29uYWxlcyBxdWUgc2UgZW5jdWVudHJlbiBlbiBzdXMgYmFzZXMgZGUgZGF0b3MgcXVlIGxhcyBwb2zDrXRpY2FzIGRlIHRyYXRhbWllbnRvIGRlIGRhdG9zIHBlcnNvbmFsZXMgbGEgRUlBIHNvbjo8L3A+CjxwPkFsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHNlIGxlIHJlc3BldGFyw6FuIHN1cyBkZXJlY2hvcyBhIGNvbm9jZXIgw61udGVncmFtZW50ZSB5IGRlIGZvcm1hIGdyYXR1aXRhIHN1cyBkYXRvcyBwZXJzb25hbGVzLCBhc8OtIGNvbW8gYSBhY3R1YWxpemFybG9zIHkgcmVjdGlmaWNhcmxvcyBmcmVudGUgYSBsYSBFSUEgbyBsb3MgZW5jYXJnYWRvcyBkZWwgdHJhdGFtaWVudG8uPC9wPgo8cD5BbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwZXJzb25hbGVzIGVuIHRyYXRhbWllbnRvLCBwb2Ryw6EgY29ub2NlciBlbCB1c28gcXVlIHNlIGxlIGhhIGRhZG8gYSBzdXMgZGF0b3MgcGVyc29uYWxlcywgcHJldmlhIHNvbGljaXR1ZC48L3A+CjxwPkVsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHBvZHLDoSBzb2xpY2l0YXIgcHJ1ZWJhIGRlIGxhIGF1dG9yaXphY2nDs24gb3RvcmdhZGEgYSBsYSBFSUEuIHNhbHZvIGN1YW5kbyBleHByZXNhbWVudGUgc2UgZXhjZXB0w7plIGNvbW8gcmVxdWlzaXRvIHBhcmEgZWwgdHJhdGFtaWVudG8sIGRlIGNvbmZvcm1pZGFkIGNvbiBsYSBsZXkuPC9wPgo8cD5FbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwdWVkZSByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24geSBzb2xpY2l0YXIgbGEgc3VwcmVzacOzbiBkZWwgZGF0byBjdWFuZG8gZW4gZWwgdHJhdGFtaWVudG8gbm8gc2UgcmVzcGV0ZW4gbG9zIHByaW5jaXBpb3MsIGRlcmVjaG9zIHkgZ2FyYW50w61hcyBjb25zdGl0dWNpb25hbGVzIHkgbGVnYWxlcy4gTGEgcmV2b2NhdG9yaWEgeSBzdXByZXNpw7NuIHByb2NlZGVyw6EgY3VhbmRvIGxhIFN1cGVyaW50ZW5kZW5jaWEgZGUgSW5kdXN0cmlhIHkgQ29tZXJjaW8gKFNJQykgaGF5YSBkZXRlcm1pbmFkbyBxdWUgZW4gZWwgdHJhdGFtaWVudG8sIGxhIEVTQ1VFTEEgREUgSU5HRU5JRVLDjUEgREUgQU5USU9RVUlBIGhhIGluY3VycmlkbyBlbiBjb25kdWN0YXMgY29udHJhcmlhcyBhIGVzdGEgTGV5IHkgYSBsYSBDb25zdGl0dWNpw7NuIFBvbMOtdGljYS48L3A+CjxwPlBhcmEgZWZlY3RvcyBkZSBlamVyY2VyIHN1cyBkZXJlY2hvcyBkZSBjb25vY2VyLCBhY3R1YWxpemFyLCByZWN0aWZpY2FyIHkgc3VwcmltaXIgaW5mb3JtYWNpw7NuLCByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24sIGVudHJlIG90cm9zOyBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgYWN1ZGlyIGEgbGEgRVNDVUVMQSBERSBJTkdFTklFUsONQSBERSBBTlRJT1FVSUEsIGNvbW8gcmVzcG9uc2FibGUgZGVsIHRyYXRhbWllbnRvIGRlIGRhdG9zIGFsIMOhcmVhIGRlIGNvbXVuaWNhY2lvbmVzLCBtZWRpYW50ZSBjb3JyZW8gZWxlY3Ryw7NuaWNvIGEgd2VibWFzdGVyQGVpYS5lZHUuY28gLjwvcD4KPHA+RW4gY2FzbyBkZSBpbmZyYWNjaW9uZXMgYSBsYSBsZXkgMTU4MSBkZSAyMDEyLCBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgcHJlc2VudGFyIHF1ZWphIGFudGUgbGEgU3VwZXJpbnRlbmRlbmNpYSBkZSBJbmR1c3RyaWEgeSBDb21lcmNpbyAoU0lDKS48L3A+CjxwPkVsIHRpdHVsYXIgc2Vyw6EgaW5mb3JtYWRvIGFjZXJjYSBkZSBsYSBubyBvYmxpZ2F0b3JpZWRhZCBkZSBsYXMgcmVzcHVlc3RhcyBhIGxhcyBwcmVndW50YXMgcXVlIGxlIHNlYW4gaGVjaGFzLCBjdWFuZG8gw6lzdGFzIHZlcnNlbiBzb2JyZSBkYXRvcyBzZW5zaWJsZXMsIHRhbGVzIGNvbW8gb3JpZ2VuIHJhY2lhbCBvIMOpdG5pY28sIG9yaWVudGFjacOzbiBwb2zDrXRpY2EsIGNvbnZpY2Npb25lcyByZWxpZ2lvc2FzICwgcGVydGVuZW5jaWEgYSBzaW5kaWNhdG9zLCBvcmdhbml6YWNpb25lcyBzb2NpYWxlcyBkZSBkZXJlY2hvcyBodW1hbm9zLCBkYXRvcyByZWxhdGl2b3MgYSBsYSBzYWx1ZCwgYSBsYSB2aWRhIHNleHVhbCB5IGRhdG9zIGJpb23DqXRyaWNvcyBvIHNvYnJlIGxvcyBkYXRvcyBkZSBsb3MgbmnDsW9zLCBuacOxYXMgeSBhZG9sZXNjZW50ZXMuPC9wPgo8cD5FbCB0aXR1bGFyIHBvZHLDoSBjb25vY2VyIG51ZXN0cmEgcG9sw610aWNhIGRlIHRyYXRhbWllbnRvLCBsb3MgZGF0b3Mgc3VzdGFuY2lhbGVzIHF1ZSBzZSBsbGVndWVuIGEgcHJvZHVjaXIgZW4gZWwgcHJlc2VudGUgYXZpc28gbyBlbiBsYXMgcG9sw610aWNhcyBkZSB0cmF0YW1pZW50bywgc2Vyw6FuIHB1YmxpY2FkYXMgZW4gbnVlc3RybyBzaXRpbyB3ZWIsIG1lZGlvIGVsZWN0csOzbmljbyBoYWJpdHVhbCBkZSBjb250YWN0byBjb24gbG9zIHRpdHVsYXJlcy4K