Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning

La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de Amér...

Full description

Autores:
Carlos Andrés Gómez Vasco
Tipo de recurso:
Masters Thesis
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/842
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/842
Palabra clave:
Enfermedades tropicales
Leishmaniasis
Vectores
Tratamiento tóxico
Aprendizaje automático
Mutaciones genéticas
Polimorfismo de nucleótido único (SNP)
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc/4.0/
id Vitela2_51b19e3bc847e1bbde564447a545e41e
oai_identifier_str oai:vitela.javerianacali.edu.co:11522/842
network_acronym_str Vitela2
network_name_str Vitela
repository_id_str
dc.title.spa.fl_str_mv Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
title Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
spellingShingle Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
Enfermedades tropicales
Leishmaniasis
Vectores
Tratamiento tóxico
Aprendizaje automático
Mutaciones genéticas
Polimorfismo de nucleótido único (SNP)
title_short Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
title_full Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
title_fullStr Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
title_full_unstemmed Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
title_sort Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning
dc.creator.fl_str_mv Carlos Andrés Gómez Vasco
dc.contributor.advisor.spa.fl_str_mv Gloria Inés Álvarez Vargas
Diego Luis Linares Ospina
dc.contributor.author.spa.fl_str_mv Carlos Andrés Gómez Vasco
dc.subject.proposal.spa.fl_str_mv Enfermedades tropicales
Leishmaniasis
Vectores
Tratamiento tóxico
Aprendizaje automático
Mutaciones genéticas
Polimorfismo de nucleótido único (SNP)
topic Enfermedades tropicales
Leishmaniasis
Vectores
Tratamiento tóxico
Aprendizaje automático
Mutaciones genéticas
Polimorfismo de nucleótido único (SNP)
description La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de América Latina. Aunque existen diferentes tratamientos terapéuticos, son muy complicados para los pacientes y suelen ser bastante tóxicos para otros órganos del cuerpo, y, en general, tienen altos índices porcentuales de fallo, es decir, cumplido el tratamiento los pacientes no se recuperan. Actualmente no existe una herramienta clínica que le permita a un médico tratante determinar la probabilidad a priori de que un tratamiento sea efectivo. Por el contrario, de manera indiscriminada se aplica a los pacientes las terapias bajo la premisa del ensayo y error. En este proyecto aplicado, se realiza un estudio basado en mutaciones genéticas producidas por polimorfismo de nucleótido único (SNP) a un conjunto de setenta y dos (72) pacientes tratados con las técnicas terapéuticas existentes. A estos pacientes se les realizó una secuenciación genética consiguiendo 618,872 SNPs para cada uno y la información clínica del grupo étnico, así como la respuesta al tratamiento después de aplicado, etiquetado como cura o falla. Esta información es suficiente para generar un dataset que fue analizado mediante GWAS (Estudio de asociación de genoma completo) consiguiendo tres datasets denominados COMPLETO, AFRODESCENDIENTES y NO-AFRODESCENDIENTES con 41, 14 y 36 SNPs correspondientemente. Mediante técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), eliminación recursiva de características y regresión LASSO, se reduce el número de variables a aquellas mutaciones genéticas más relevantes para la respuesta inmune al tratamiento consiguiendo 69 subconjuntos de características. Mediante técnicas de aprendizaje automático se construyen 483 clasificadores basados en algoritmos de Regresión Lineal (RL), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Boosting (BT) y Gradient Boosting (GB) de los 69 subconjuntos, para clasificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Se utilizaron métricas de evaluación, como accuracy, precision, recall y F1 score para medir el rendimiento de los clasificadores. Estas métricas proporcionaron una visión detallada de la capacidad de los modelos para identificar correctamente las mutaciones relevantes. Después de la evaluación inicial de los 683 experimentos, se realizó la optimización de los hiperparámetros de los modelos mediante una búsqueda por cuadrícula explorando diferentes combinaciones y configuraciones, lo que permitió refinar los modelos y nuevamente estimar su desempeño permitiendo evaluar y comparar los resultados antes y después de la optimización, confirmando la mejora significativa en la capacidad de los clasificadores para identificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Al final, se consiguió una selección de 22 SNPs ubicados en genes con funciones biológicas altamente relacionadas con movimiento, transcripción, estructura y transporte celular, así como el transporte de metales, respuesta inmune y cicatrización. Evidenciando que las técnicas aplicadas son eficientes en la identificación de biomarcadores asociados con la respuesta al tratamiento contra la leishmaniasis.
publishDate 2023
dc.date.accessioned.spa.fl_str_mv 2023-01-30T18:39:19Z
dc.date.available.spa.fl_str_mv 2023-01-30T18:39:19Z
dc.date.issued.spa.fl_str_mv 2023
dc.date.accessioned.none.fl_str_mv 2024-02-03T04:46:02Z
dc.date.available.none.fl_str_mv 2024-02-03T04:46:02Z
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Maestría
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TM
format http://purl.org/coar/resource_type/c_bdcc
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://vitela.javerianacali.edu.co/handle/11522/842
url https://vitela.javerianacali.edu.co/handle/11522/842
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessRights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.spa.fl_str_mv application/pdf
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Pontificia Universidad Javeriana de Cali
dc.publisher.place.spa.fl_str_mv Cali
dc.source.spa.fl_str_mv Pontificia Universidad Javeriana de Cali
Vitela
institution Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv https://vitela.javerianacali.edu.co/bitstreams/839e9f70-e64e-448f-97b6-d275e909a633/download
https://vitela.javerianacali.edu.co/bitstreams/1de9d1c0-97b3-49b7-af5c-2f31f26676f0/download
https://vitela.javerianacali.edu.co/bitstreams/e078b6a5-5963-4fa7-bd04-2e48c09f806a/download
https://vitela.javerianacali.edu.co/bitstreams/8911dc35-9610-4f67-b53e-4139d68ef7dc/download
https://vitela.javerianacali.edu.co/bitstreams/2bdaf5ad-3281-49a7-99e3-238b328c66ce/download
https://vitela.javerianacali.edu.co/bitstreams/c97c4f7c-aa17-4afd-b896-a337bf61a007/download
bitstream.checksum.fl_str_mv fd7eededa0fff241de316dd6266a2050
cbcc7eb08e58e57a4828d9c3e760a4bb
d6aebe4c8b02f476152f69e6c45132a1
e5855eb2424a70061dd38f7d11fb6f27
50df704a94d9e81f1bddb7e842d7bcd0
a36c1923a3e246ecfe13305545c85f76
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Vitela
repository.mail.fl_str_mv vitela.mail@javerianacali.edu.co
_version_ 1812095065363841024
spelling Gloria Inés Álvarez VargasDiego Luis Linares Ospina Carlos Andrés Gómez Vasco2023-01-30T18:39:19Z2024-02-03T04:46:02Z2023-01-30T18:39:19Z2024-02-03T04:46:02Z2023https://vitela.javerianacali.edu.co/handle/11522/842La leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de América Latina. Aunque existen diferentes tratamientos terapéuticos, son muy complicados para los pacientes y suelen ser bastante tóxicos para otros órganos del cuerpo, y, en general, tienen altos índices porcentuales de fallo, es decir, cumplido el tratamiento los pacientes no se recuperan. Actualmente no existe una herramienta clínica que le permita a un médico tratante determinar la probabilidad a priori de que un tratamiento sea efectivo. Por el contrario, de manera indiscriminada se aplica a los pacientes las terapias bajo la premisa del ensayo y error. En este proyecto aplicado, se realiza un estudio basado en mutaciones genéticas producidas por polimorfismo de nucleótido único (SNP) a un conjunto de setenta y dos (72) pacientes tratados con las técnicas terapéuticas existentes. A estos pacientes se les realizó una secuenciación genética consiguiendo 618,872 SNPs para cada uno y la información clínica del grupo étnico, así como la respuesta al tratamiento después de aplicado, etiquetado como cura o falla. Esta información es suficiente para generar un dataset que fue analizado mediante GWAS (Estudio de asociación de genoma completo) consiguiendo tres datasets denominados COMPLETO, AFRODESCENDIENTES y NO-AFRODESCENDIENTES con 41, 14 y 36 SNPs correspondientemente. Mediante técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), eliminación recursiva de características y regresión LASSO, se reduce el número de variables a aquellas mutaciones genéticas más relevantes para la respuesta inmune al tratamiento consiguiendo 69 subconjuntos de características. Mediante técnicas de aprendizaje automático se construyen 483 clasificadores basados en algoritmos de Regresión Lineal (RL), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Boosting (BT) y Gradient Boosting (GB) de los 69 subconjuntos, para clasificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Se utilizaron métricas de evaluación, como accuracy, precision, recall y F1 score para medir el rendimiento de los clasificadores. Estas métricas proporcionaron una visión detallada de la capacidad de los modelos para identificar correctamente las mutaciones relevantes. Después de la evaluación inicial de los 683 experimentos, se realizó la optimización de los hiperparámetros de los modelos mediante una búsqueda por cuadrícula explorando diferentes combinaciones y configuraciones, lo que permitió refinar los modelos y nuevamente estimar su desempeño permitiendo evaluar y comparar los resultados antes y después de la optimización, confirmando la mejora significativa en la capacidad de los clasificadores para identificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Al final, se consiguió una selección de 22 SNPs ubicados en genes con funciones biológicas altamente relacionadas con movimiento, transcripción, estructura y transporte celular, así como el transporte de metales, respuesta inmune y cicatrización. Evidenciando que las técnicas aplicadas son eficientes en la identificación de biomarcadores asociados con la respuesta al tratamiento contra la leishmaniasis.application/pdfapplication/pdfspaPontificia Universidad Javeriana de CaliCaliinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc/4.0/https://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2http://purl.org/coar/access_right/c_abf2Pontificia Universidad Javeriana de CaliVitelaClasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine LearningEnfermedades tropicalesLeishmaniasisVectoresTratamiento tóxicoAprendizaje automáticoMutaciones genéticasPolimorfismo de nucleótido único (SNP)http://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisTesis/Trabajo de grado - Monografía - Maestríainfo:eu-repo/semantics/acceptedVersionhttps://purl.org/redcol/resource_type/TMhttp://purl.org/coar/version/c_ab4af688f83e57aaORIGINAL1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdfapplication/pdf206360https://vitela.javerianacali.edu.co/bitstreams/839e9f70-e64e-448f-97b6-d275e909a633/downloadfd7eededa0fff241de316dd6266a2050MD51Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdfapplication/pdf3933825https://vitela.javerianacali.edu.co/bitstreams/1de9d1c0-97b3-49b7-af5c-2f31f26676f0/downloadcbcc7eb08e58e57a4828d9c3e760a4bbMD52TEXT1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.txt1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.txtExtracted texttext/plain4935https://vitela.javerianacali.edu.co/bitstreams/e078b6a5-5963-4fa7-bd04-2e48c09f806a/downloadd6aebe4c8b02f476152f69e6c45132a1MD511Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.txtDocumento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.txtExtracted texttext/plain101961https://vitela.javerianacali.edu.co/bitstreams/8911dc35-9610-4f67-b53e-4139d68ef7dc/downloade5855eb2424a70061dd38f7d11fb6f27MD513THUMBNAIL1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.jpg1. LICENCIA DE USO - TG__Carlos_Andres_Gomez_Vasco.pdf.jpgGenerated Thumbnailimage/jpeg5296https://vitela.javerianacali.edu.co/bitstreams/2bdaf5ad-3281-49a7-99e3-238b328c66ce/download50df704a94d9e81f1bddb7e842d7bcd0MD512Documento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.jpgDocumento_Final_MCD_Carlos_Andres_Gomez_Vasco_.pdf.jpgGenerated Thumbnailimage/jpeg3548https://vitela.javerianacali.edu.co/bitstreams/c97c4f7c-aa17-4afd-b896-a337bf61a007/downloada36c1923a3e246ecfe13305545c85f76MD51411522/842oai:vitela.javerianacali.edu.co:11522/8422024-06-25 05:12:49.041https://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.co