Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de Amér...
- Autores:
-
Carlos Andrés Gómez Vasco
- Tipo de recurso:
- Masters Thesis
- Fecha de publicación:
- 2023
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- spa
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/842
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/842
- Palabra clave:
- Enfermedades tropicales
Leishmaniasis
Vectores
Tratamiento tóxico
Aprendizaje automático
Mutaciones genéticas
Polimorfismo de nucleótido único (SNP)
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc/4.0/
id |
Vitela2_51b19e3bc847e1bbde564447a545e41e |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/842 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
title |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
spellingShingle |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning Enfermedades tropicales Leishmaniasis Vectores Tratamiento tóxico Aprendizaje automático Mutaciones genéticas Polimorfismo de nucleótido único (SNP) |
title_short |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
title_full |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
title_fullStr |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
title_full_unstemmed |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
title_sort |
Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning |
dc.creator.fl_str_mv |
Carlos Andrés Gómez Vasco |
dc.contributor.advisor.spa.fl_str_mv |
Gloria Inés Álvarez Vargas Diego Luis Linares Ospina |
dc.contributor.author.spa.fl_str_mv |
Carlos Andrés Gómez Vasco |
dc.subject.proposal.spa.fl_str_mv |
Enfermedades tropicales Leishmaniasis Vectores Tratamiento tóxico Aprendizaje automático Mutaciones genéticas Polimorfismo de nucleótido único (SNP) |
topic |
Enfermedades tropicales Leishmaniasis Vectores Tratamiento tóxico Aprendizaje automático Mutaciones genéticas Polimorfismo de nucleótido único (SNP) |
description |
La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de América Latina. Aunque existen diferentes tratamientos terapéuticos, son muy complicados para los pacientes y suelen ser bastante tóxicos para otros órganos del cuerpo, y, en general, tienen altos índices porcentuales de fallo, es decir, cumplido el tratamiento los pacientes no se recuperan. Actualmente no existe una herramienta clínica que le permita a un médico tratante determinar la probabilidad a priori de que un tratamiento sea efectivo. Por el contrario, de manera indiscriminada se aplica a los pacientes las terapias bajo la premisa del ensayo y error. En este proyecto aplicado, se realiza un estudio basado en mutaciones genéticas producidas por polimorfismo de nucleótido único (SNP) a un conjunto de setenta y dos (72) pacientes tratados con las técnicas terapéuticas existentes. A estos pacientes se les realizó una secuenciación genética consiguiendo 618,872 SNPs para cada uno y la información clínica del grupo étnico, así como la respuesta al tratamiento después de aplicado, etiquetado como cura o falla. Esta información es suficiente para generar un dataset que fue analizado mediante GWAS (Estudio de asociación de genoma completo) consiguiendo tres datasets denominados COMPLETO, AFRODESCENDIENTES y NO-AFRODESCENDIENTES con 41, 14 y 36 SNPs correspondientemente. Mediante técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), eliminación recursiva de características y regresión LASSO, se reduce el número de variables a aquellas mutaciones genéticas más relevantes para la respuesta inmune al tratamiento consiguiendo 69 subconjuntos de características. Mediante técnicas de aprendizaje automático se construyen 483 clasificadores basados en algoritmos de Regresión Lineal (RL), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Boosting (BT) y Gradient Boosting (GB) de los 69 subconjuntos, para clasificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Se utilizaron métricas de evaluación, como accuracy, precision, recall y F1 score para medir el rendimiento de los clasificadores. Estas métricas proporcionaron una visión detallada de la capacidad de los modelos para identificar correctamente las mutaciones relevantes. Después de la evaluación inicial de los 683 experimentos, se realizó la optimización de los hiperparámetros de los modelos mediante una búsqueda por cuadrícula explorando diferentes combinaciones y configuraciones, lo que permitió refinar los modelos y nuevamente estimar su desempeño permitiendo evaluar y comparar los resultados antes y después de la optimización, confirmando la mejora significativa en la capacidad de los clasificadores para identificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Al final, se consiguió una selección de 22 SNPs ubicados en genes con funciones biológicas altamente relacionadas con movimiento, transcripción, estructura y transporte celular, así como el transporte de metales, respuesta inmune y cicatrización. Evidenciando que las técnicas aplicadas son eficientes en la identificación de biomarcadores asociados con la respuesta al tratamiento contra la leishmaniasis. |
publishDate |
2023 |
dc.date.accessioned.spa.fl_str_mv |
2023-01-30T18:39:19Z |
dc.date.available.spa.fl_str_mv |
2023-01-30T18:39:19Z |
dc.date.issued.spa.fl_str_mv |
2023 |
dc.date.accessioned.none.fl_str_mv |
2024-02-03T04:46:02Z |
dc.date.available.none.fl_str_mv |
2024-02-03T04:46:02Z |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_bdcc |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Maestría |
dc.type.hasversion.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TM |
format |
http://purl.org/coar/resource_type/c_bdcc |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/842 |
url |
https://vitela.javerianacali.edu.co/handle/11522/842 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.rights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.creativecommons.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessRights.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.spa.fl_str_mv |
application/pdf |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Pontificia Universidad Javeriana de Cali |
dc.publisher.place.spa.fl_str_mv |
Cali |
dc.source.spa.fl_str_mv |
Pontificia Universidad Javeriana de Cali Vitela |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/839e9f70-e64e-448f-97b6-d275e909a633/download https://vitela.javerianacali.edu.co/bitstreams/1de9d1c0-97b3-49b7-af5c-2f31f26676f0/download https://vitela.javerianacali.edu.co/bitstreams/e078b6a5-5963-4fa7-bd04-2e48c09f806a/download https://vitela.javerianacali.edu.co/bitstreams/8911dc35-9610-4f67-b53e-4139d68ef7dc/download https://vitela.javerianacali.edu.co/bitstreams/2bdaf5ad-3281-49a7-99e3-238b328c66ce/download https://vitela.javerianacali.edu.co/bitstreams/c97c4f7c-aa17-4afd-b896-a337bf61a007/download |
bitstream.checksum.fl_str_mv |
fd7eededa0fff241de316dd6266a2050 cbcc7eb08e58e57a4828d9c3e760a4bb d6aebe4c8b02f476152f69e6c45132a1 e5855eb2424a70061dd38f7d11fb6f27 50df704a94d9e81f1bddb7e842d7bcd0 a36c1923a3e246ecfe13305545c85f76 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1812095065363841024 |
spelling |
Gloria Inés Álvarez VargasDiego Luis Linares Ospina Carlos Andrés Gómez Vasco2023-01-30T18:39:19Z2024-02-03T04:46:02Z2023-01-30T18:39:19Z2024-02-03T04:46:02Z2023https://vitela.javerianacali.edu.co/handle/11522/842La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de América Latina. Aunque existen diferentes tratamientos terapéuticos, son muy complicados para los pacientes y suelen ser bastante tóxicos para otros órganos del cuerpo, y, en general, tienen altos índices porcentuales de fallo, es decir, cumplido el tratamiento los pacientes no se recuperan. Actualmente no existe una herramienta clínica que le permita a un médico tratante determinar la probabilidad a priori de que un tratamiento sea efectivo. Por el contrario, de manera indiscriminada se aplica a los pacientes las terapias bajo la premisa del ensayo y error. En este proyecto aplicado, se realiza un estudio basado en mutaciones genéticas producidas por polimorfismo de nucleótido único (SNP) a un conjunto de setenta y dos (72) pacientes tratados con las técnicas terapéuticas existentes. A estos pacientes se les realizó una secuenciación genética consiguiendo 618,872 SNPs para cada uno y la información clínica del grupo étnico, así como la respuesta al tratamiento después de aplicado, etiquetado como cura o falla. Esta información es suficiente para generar un dataset que fue analizado mediante GWAS (Estudio de asociación de genoma completo) consiguiendo tres datasets denominados COMPLETO, AFRODESCENDIENTES y NO-AFRODESCENDIENTES con 41, 14 y 36 SNPs correspondientemente. Mediante técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), eliminación recursiva de características y regresión LASSO, se reduce el número de variables a aquellas mutaciones genéticas más relevantes para la respuesta inmune al tratamiento consiguiendo 69 subconjuntos de características. Mediante técnicas de aprendizaje automático se construyen 483 clasificadores basados en algoritmos de Regresión Lineal (RL), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Boosting (BT) y Gradient Boosting (GB) de los 69 subconjuntos, para clasificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Se utilizaron métricas de evaluación, como accuracy, precision, recall y F1 score para medir el rendimiento de los clasificadores. Estas métricas proporcionaron una visión detallada de la capacidad de los modelos para identificar correctamente las mutaciones relevantes. Después de la evaluación inicial de los 683 experimentos, se realizó la optimización de los hiperparámetros de los modelos mediante una búsqueda por cuadrícula explorando diferentes combinaciones y configuraciones, lo que permitió refinar los modelos y nuevamente estimar su desempeño permitiendo evaluar y comparar los resultados antes y después de la optimización, confirmando la mejora significativa en la capacidad de los clasificadores para identificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Al final, se consiguió una selección de 22 SNPs ubicados en genes con funciones biológicas altamente relacionadas con movimiento, transcripción, estructura y transporte celular, así como el transporte de metales, respuesta inmune y cicatrización. Evidenciando que las técnicas aplicadas son eficientes en la identificación de biomarcadores asociados con la respuesta al tratamiento contra la leishmaniasis.application/pdfapplication/pdfspaPontificia Universidad Javeriana de CaliCaliinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc/4.0/https://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2http://purl.org/coar/access_right/c_abf2Pontificia Universidad Javeriana de CaliVitelaClasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine LearningEnfermedades tropicalesLeishmaniasisVectoresTratamiento tóxicoAprendizaje automáticoMutaciones genéticasPolimorfismo de nucleótido único (SNP)http://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisTesis/Trabajo de grado - Monografía - Maestríainfo:eu-repo/semantics/acceptedVersionhttps://purl.org/redcol/resource_type/TMhttp://purl.org/coar/version/c_ab4af688f83e57aaORIGINAL1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdfapplication/pdf206360https://vitela.javerianacali.edu.co/bitstreams/839e9f70-e64e-448f-97b6-d275e909a633/downloadfd7eededa0fff241de316dd6266a2050MD51Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdfapplication/pdf3933825https://vitela.javerianacali.edu.co/bitstreams/1de9d1c0-97b3-49b7-af5c-2f31f26676f0/downloadcbcc7eb08e58e57a4828d9c3e760a4bbMD52TEXT1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.txt1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.txtExtracted texttext/plain4935https://vitela.javerianacali.edu.co/bitstreams/e078b6a5-5963-4fa7-bd04-2e48c09f806a/downloadd6aebe4c8b02f476152f69e6c45132a1MD511Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.txtDocumento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.txtExtracted texttext/plain101961https://vitela.javerianacali.edu.co/bitstreams/8911dc35-9610-4f67-b53e-4139d68ef7dc/downloade5855eb2424a70061dd38f7d11fb6f27MD513THUMBNAIL1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.jpg1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.jpgGenerated Thumbnailimage/jpeg5296https://vitela.javerianacali.edu.co/bitstreams/2bdaf5ad-3281-49a7-99e3-238b328c66ce/download50df704a94d9e81f1bddb7e842d7bcd0MD512Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.jpgDocumento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.jpgGenerated Thumbnailimage/jpeg3548https://vitela.javerianacali.edu.co/bitstreams/c97c4f7c-aa17-4afd-b896-a337bf61a007/downloada36c1923a3e246ecfe13305545c85f76MD51411522/842oai:vitela.javerianacali.edu.co:11522/8422024-06-25 05:12:49.041https://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.co |