Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer
124 páginas
- Autores:
-
Castillo Uparela, Daniel Eduardo
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad EIA .
- Repositorio:
- Repositorio EIA .
- Idioma:
- spa
- OAI Identifier:
- oai:repository.eia.edu.co:11190/6832
- Acceso en línea:
- https://repository.eia.edu.co/handle/11190/6832
- Palabra clave:
- Oncología
Inmunoterapia
Biomarcador
RNA-seq
Inteligencia Artificial
Modelo Computacional
Oncology
Immunotherapy
Biomarker
RNA-seq
Artificial intelligence
Computational model
- Rights
- openAccess
- License
- Derechos Reservados - Universidad EIA, 2024
id |
REIA2_f90e2a713a0fa2c72ffb46c3dd2b2233 |
---|---|
oai_identifier_str |
oai:repository.eia.edu.co:11190/6832 |
network_acronym_str |
REIA2 |
network_name_str |
Repositorio EIA . |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
title |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
spellingShingle |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer Oncología Inmunoterapia Biomarcador RNA-seq Inteligencia Artificial Modelo Computacional Oncology Immunotherapy Biomarker RNA-seq Artificial intelligence Computational model |
title_short |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
title_full |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
title_fullStr |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
title_full_unstemmed |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
title_sort |
Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncer |
dc.creator.fl_str_mv |
Castillo Uparela, Daniel Eduardo |
dc.contributor.advisor.none.fl_str_mv |
Castaño Portilla, Carolina |
dc.contributor.author.none.fl_str_mv |
Castillo Uparela, Daniel Eduardo |
dc.subject.proposal.spa.fl_str_mv |
Oncología Inmunoterapia Biomarcador RNA-seq Inteligencia Artificial Modelo Computacional |
topic |
Oncología Inmunoterapia Biomarcador RNA-seq Inteligencia Artificial Modelo Computacional Oncology Immunotherapy Biomarker RNA-seq Artificial intelligence Computational model |
dc.subject.proposal.eng.fl_str_mv |
Oncology Immunotherapy Biomarker RNA-seq Artificial intelligence Computational model |
description |
124 páginas |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-11-29T16:35:25Z |
dc.date.available.none.fl_str_mv |
2024-11-29T16:35:25Z |
dc.date.issued.none.fl_str_mv |
2024 |
dc.type.none.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.content.none.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
dc.type.coarversion.none.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
publishedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repository.eia.edu.co/handle/11190/6832 |
url |
https://repository.eia.edu.co/handle/11190/6832 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
Derechos Reservados - Universidad EIA, 2024 |
dc.rights.license.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Derechos Reservados - Universidad EIA, 2024 Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad EIA |
dc.publisher.program.none.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.none.fl_str_mv |
Escuela de Ingeniería y Ciencias Básicas |
dc.publisher.place.none.fl_str_mv |
Envigado (Antioquia, Colombia) |
publisher.none.fl_str_mv |
Universidad EIA |
institution |
Universidad EIA . |
bitstream.url.fl_str_mv |
https://repository.eia.edu.co/bitstreams/0e1e708f-927e-4ae5-9a81-4873a05103c8/download https://repository.eia.edu.co/bitstreams/3fb26a33-7d48-4d40-97c5-8d75378208e7/download https://repository.eia.edu.co/bitstreams/d4199efc-c0ad-498c-9b60-c1908fd11f20/download https://repository.eia.edu.co/bitstreams/de147639-23fd-4ee0-a95a-5ab5efc98a89/download |
bitstream.checksum.fl_str_mv |
2264fce645ac2952653ce3f3b8fa781e 51f87cd967cc9f811a6bf4453928ba38 8ed4dc3e12fd46ad71b061292e597a5e 686181a95231be24c75d65310826ae58 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad EIA |
repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
_version_ |
1818099046555844608 |
spelling |
Castaño Portilla, CarolinaCastillo Uparela, Daniel Eduardo2024-11-29T16:35:25Z2024-11-29T16:35:25Z2024https://repository.eia.edu.co/handle/11190/6832124 páginasRESUMEN: El cáncer es una enfermedad caracterizada por la pérdida de control en la proliferación celular debido a la rápida expansión y transformación de células normales en células cancerosas, lo que constituye un desafío científico crucial para el desarrollo de tratamientos menos invasivos y más efectivos. Según la Agencia Internacional para la Investigación del Cáncer, en el año 2020 la enfermedad fue responsable de casi 10 millones de defunciones a nivel mundial, representando aproximadamente una de cada seis muertes registradas. Ante el desalentador escenario del cáncer, las terapias dirigidas ofrecen una alternativa con menos efectos secundarios en comparación con tratamientos tradicionales como la quimioterapia, posicionando a la inmunoterapia como una de las opciones más prometedoras en los últimos años. A diferencia de los métodos invasivos tradicionales que atacan indiscriminadamente las células tumorales, la inmunoterapia estimula el sistema inmunitario para que sea este el encargado de destruir el tumor, demostrando ser una estrategia innovadora y menos agresiva. Esta metodología terapéutica no solo implica menos efectos secundarios, sino que también representa una oportunidad significativa para combatir la proliferación de la enfermedad a lo largo del organismo. Este trabajo propone un modelo computacional basado en inteligencia artificial y técnicas bioinformáticas para identificar firmas de expresión génica asociadas con la respuesta a la inmunoterapia basada en inhibidores de puntos de control inmunitario anti PD1/PD-L1 en cáncer. Se utilizó un enfoque metodológico robusto, que incluyó la corrección del efecto batch inducido por las máquinas de secuenciación utilizando la librería Inmoose, así como la normalización de los datos de expresión génica mediante TPM. Adicionalmente, se aplicaron técnicas de reducción dimensional como el Análisis de Componentes Principales (PCA) para la visualización bidimensional y tridimensional de los datos. El balanceo de clases se realizó empleando técnicas como SMOTE, NearMiss y SMOTETomek integradas en Scikit-learn, mejorando significativamente el rendimiento del modelo. La optimización de hiperparámetros se llevó a cabo con la biblioteca Optuna, y la identificación de firmas genéticas se realizó utilizando Mlxtend. Estos métodos permitieron la creación de un repositorio digital de datos de expresión génica de pacientes con tumores sólidos y la implementación de un modelo computacional fundamentado en algoritmos de Machine Learning para predecir la respuesta a la inmunoterapia. Los resultados obtenidos demuestran que la firma de 14 genes seleccionada es capaz de clasificar con precisión la respuesta al tratamiento en pacientes con cáncer, mostrando un notable desempeño y potencial para futuras investigaciones. Este modelo tiene el potencial de convertirse en una herramienta valiosa para guiar investigaciones adicionales y apoyar decisiones médicas en el contexto de la inmunoterapia como terapia dirigida.ABSTRACT: Cancer is a disease characterized by the loss of control in cell proliferation due to the rapid expansion and transformation of normal cells into cancer cells, which constitutes a crucial scientific challenge for the development of less invasive and more effective treatments. According to the International Agency for Research on Cancer, in 2020 the disease was responsible for almost ten million deaths worldwide, representing approximately one in six deaths recorded. Given the discouraging cancer scenario, targeted therapies offer an alternative with fewer side effects compared to traditional treatments such as chemotherapy, positioning immunotherapy as one of the most promising options in recent years. Unlike traditional invasive methods that indiscriminately attack tumor cells, immunotherapy stimulates the immune system to destroy the tumor, proving to be an innovative and less aggressive strategy. This therapeutic methodology not only involves fewer side effects, but also represents a significant opportunity to combat the proliferation of the disease throughout the body. This work proposes a computational model based on artificial intelligence and bioinformatics techniques to identify gene expression signatures associated with the response to immunotherapy based on anti-PD1/PD-L1 immune checkpoint inhibitors in cancer. A robust methodological approach was used, which included batch correction induced by sequencing machines using the Inmoose library, as well as gene expression data normalization using TPM. Additionally, dimensional reduction techniques such as Principal Component Analysis (PCA) were applied for two- and three-dimensional visualization of the data. Class balancing was performed using techniques such as SMOTE, NearMiss, and SMOTETomek integrated in Scikit-learn, significantly improving model performance. Hyperparameter optimization was performed with the Optuna library, and gene signature identification was performed using Mlxtend. These methods allowed the creation of a digital repository of gene expression data from patients with solid tumors and the implementation of a computational model based on Machine Learning algorithms to predict response to immunotherapy. The results obtained demonstrate that the selected 14-gene signature is capable of accurately classifying treatment response in cancer patients, showing remarkable performance and potential for future research. This model has the potential to become a valuable tool to guide further research and support medical decisions in the context of immunotherapy as a targeted therapy.PregradoIngeniero(a) de Sistemas y Computaciónapplication/pdfspaUniversidad EIAIngeniería de Sistemas y ComputaciónEscuela de Ingeniería y Ciencias BásicasEnvigado (Antioquia, Colombia)Derechos Reservados - Universidad EIA, 2024Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelo computacional para la identificación de firmas de expresión génica asociadas con la respuesta a inhibidores de puntos de control en cáncerTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionTexthttp://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_970fb48d4fbd8a85OncologíaInmunoterapiaBiomarcadorRNA-seqInteligencia ArtificialModelo ComputacionalOncologyImmunotherapyBiomarkerRNA-seqArtificial intelligenceComputational modelPublicationLICENSElicense.txtlicense.txttext/plain; charset=utf-82553https://repository.eia.edu.co/bitstreams/0e1e708f-927e-4ae5-9a81-4873a05103c8/download2264fce645ac2952653ce3f3b8fa781eMD57ORIGINALCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdfCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdfTrabajo de gradoapplication/pdf3856138https://repository.eia.edu.co/bitstreams/3fb26a33-7d48-4d40-97c5-8d75378208e7/download51f87cd967cc9f811a6bf4453928ba38MD58TEXTCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.txtCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.txtExtracted texttext/plain101954https://repository.eia.edu.co/bitstreams/d4199efc-c0ad-498c-9b60-c1908fd11f20/download8ed4dc3e12fd46ad71b061292e597a5eMD59THUMBNAILCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.jpgCastilloDaniel_2024_ModeloComputacionalIdentificacion.pdf.jpgGenerated Thumbnailimage/jpeg9642https://repository.eia.edu.co/bitstreams/de147639-23fd-4ee0-a95a-5ab5efc98a89/download686181a95231be24c75d65310826ae58MD51011190/6832oai:repository.eia.edu.co:11190/68322024-11-29 11:37:52.108open.accesshttps://repository.eia.edu.coRepositorio Institucional Universidad EIAbdigital@metabiblioteca.comCjxjZW50ZXI+PGI+QVZJU08gREUgUFJJVkFDSURBRDwvYj48L2NlbnRlcj4KPGJyPgo8cD5MYSBFc2N1ZWxhIGRlIEluZ2VuaWVyw61hIGRlIEFudGlvcXVpYSBhIHRyYXbDqXMgZGUgZXN0ZSBhdmlzbywgaW5mb3JtYSBhIGxvcyB0aXR1bGFyZXMgZGUgZGF0b3MgcGVyc29uYWxlcyBxdWUgc2UgZW5jdWVudHJlbiBlbiBzdXMgYmFzZXMgZGUgZGF0b3MgcXVlIGxhcyBwb2zDrXRpY2FzIGRlIHRyYXRhbWllbnRvIGRlIGRhdG9zIHBlcnNvbmFsZXMgbGEgRUlBIHNvbjo8L3A+CjxwPkFsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHNlIGxlIHJlc3BldGFyw6FuIHN1cyBkZXJlY2hvcyBhIGNvbm9jZXIgw61udGVncmFtZW50ZSB5IGRlIGZvcm1hIGdyYXR1aXRhIHN1cyBkYXRvcyBwZXJzb25hbGVzLCBhc8OtIGNvbW8gYSBhY3R1YWxpemFybG9zIHkgcmVjdGlmaWNhcmxvcyBmcmVudGUgYSBsYSBFSUEgbyBsb3MgZW5jYXJnYWRvcyBkZWwgdHJhdGFtaWVudG8uPC9wPgo8cD5BbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwZXJzb25hbGVzIGVuIHRyYXRhbWllbnRvLCBwb2Ryw6EgY29ub2NlciBlbCB1c28gcXVlIHNlIGxlIGhhIGRhZG8gYSBzdXMgZGF0b3MgcGVyc29uYWxlcywgcHJldmlhIHNvbGljaXR1ZC48L3A+CjxwPkVsIHRpdHVsYXIgZGUgbG9zIGRhdG9zIHBlcnNvbmFsZXMgZW4gdHJhdGFtaWVudG8sIHBvZHLDoSBzb2xpY2l0YXIgcHJ1ZWJhIGRlIGxhIGF1dG9yaXphY2nDs24gb3RvcmdhZGEgYSBsYSBFSUEuIHNhbHZvIGN1YW5kbyBleHByZXNhbWVudGUgc2UgZXhjZXB0w7plIGNvbW8gcmVxdWlzaXRvIHBhcmEgZWwgdHJhdGFtaWVudG8sIGRlIGNvbmZvcm1pZGFkIGNvbiBsYSBsZXkuPC9wPgo8cD5FbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwdWVkZSByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24geSBzb2xpY2l0YXIgbGEgc3VwcmVzacOzbiBkZWwgZGF0byBjdWFuZG8gZW4gZWwgdHJhdGFtaWVudG8gbm8gc2UgcmVzcGV0ZW4gbG9zIHByaW5jaXBpb3MsIGRlcmVjaG9zIHkgZ2FyYW50w61hcyBjb25zdGl0dWNpb25hbGVzIHkgbGVnYWxlcy4gTGEgcmV2b2NhdG9yaWEgeSBzdXByZXNpw7NuIHByb2NlZGVyw6EgY3VhbmRvIGxhIFN1cGVyaW50ZW5kZW5jaWEgZGUgSW5kdXN0cmlhIHkgQ29tZXJjaW8gKFNJQykgaGF5YSBkZXRlcm1pbmFkbyBxdWUgZW4gZWwgdHJhdGFtaWVudG8sIGxhIEVTQ1VFTEEgREUgSU5HRU5JRVLDjUEgREUgQU5USU9RVUlBIGhhIGluY3VycmlkbyBlbiBjb25kdWN0YXMgY29udHJhcmlhcyBhIGVzdGEgTGV5IHkgYSBsYSBDb25zdGl0dWNpw7NuIFBvbMOtdGljYS48L3A+CjxwPlBhcmEgZWZlY3RvcyBkZSBlamVyY2VyIHN1cyBkZXJlY2hvcyBkZSBjb25vY2VyLCBhY3R1YWxpemFyLCByZWN0aWZpY2FyIHkgc3VwcmltaXIgaW5mb3JtYWNpw7NuLCByZXZvY2FyIGxhIGF1dG9yaXphY2nDs24sIGVudHJlIG90cm9zOyBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgYWN1ZGlyIGEgbGEgRVNDVUVMQSBERSBJTkdFTklFUsONQSBERSBBTlRJT1FVSUEsIGNvbW8gcmVzcG9uc2FibGUgZGVsIHRyYXRhbWllbnRvIGRlIGRhdG9zIGFsIMOhcmVhIGRlIGNvbXVuaWNhY2lvbmVzLCBtZWRpYW50ZSBjb3JyZW8gZWxlY3Ryw7NuaWNvIGEgd2VibWFzdGVyQGVpYS5lZHUuY28gLjwvcD4KPHA+RW4gY2FzbyBkZSBpbmZyYWNjaW9uZXMgYSBsYSBsZXkgMTU4MSBkZSAyMDEyLCBlbCB0aXR1bGFyIGRlIGxvcyBkYXRvcyBwb2Ryw6EgcHJlc2VudGFyIHF1ZWphIGFudGUgbGEgU3VwZXJpbnRlbmRlbmNpYSBkZSBJbmR1c3RyaWEgeSBDb21lcmNpbyAoU0lDKS48L3A+CjxwPkVsIHRpdHVsYXIgc2Vyw6EgaW5mb3JtYWRvIGFjZXJjYSBkZSBsYSBubyBvYmxpZ2F0b3JpZWRhZCBkZSBsYXMgcmVzcHVlc3RhcyBhIGxhcyBwcmVndW50YXMgcXVlIGxlIHNlYW4gaGVjaGFzLCBjdWFuZG8gw6lzdGFzIHZlcnNlbiBzb2JyZSBkYXRvcyBzZW5zaWJsZXMsIHRhbGVzIGNvbW8gb3JpZ2VuIHJhY2lhbCBvIMOpdG5pY28sIG9yaWVudGFjacOzbiBwb2zDrXRpY2EsIGNvbnZpY2Npb25lcyByZWxpZ2lvc2FzICwgcGVydGVuZW5jaWEgYSBzaW5kaWNhdG9zLCBvcmdhbml6YWNpb25lcyBzb2NpYWxlcyBkZSBkZXJlY2hvcyBodW1hbm9zLCBkYXRvcyByZWxhdGl2b3MgYSBsYSBzYWx1ZCwgYSBsYSB2aWRhIHNleHVhbCB5IGRhdG9zIGJpb23DqXRyaWNvcyBvIHNvYnJlIGxvcyBkYXRvcyBkZSBsb3MgbmnDsW9zLCBuacOxYXMgeSBhZG9sZXNjZW50ZXMuPC9wPgo8cD5FbCB0aXR1bGFyIHBvZHLDoSBjb25vY2VyIG51ZXN0cmEgcG9sw610aWNhIGRlIHRyYXRhbWllbnRvLCBsb3MgZGF0b3Mgc3VzdGFuY2lhbGVzIHF1ZSBzZSBsbGVndWVuIGEgcHJvZHVjaXIgZW4gZWwgcHJlc2VudGUgYXZpc28gbyBlbiBsYXMgcG9sw610aWNhcyBkZSB0cmF0YW1pZW50bywgc2Vyw6FuIHB1YmxpY2FkYXMgZW4gbnVlc3RybyBzaXRpbyB3ZWIsIG1lZGlvIGVsZWN0csOzbmljbyBoYWJpdHVhbCBkZSBjb250YWN0byBjb24gbG9zIHRpdHVsYXJlcy4K |