Técnicas de clustering aplicadas en un conjunto metabolitos perteneciente a pacientes de Leishmaniasis cutánea para predecir la efectividad del tratamiento glucantime a través de modelos de aprendizaje automático clásicos

Los medicamentos usados para el tratamiento de la leishmaniasis pueden ser tóxicos y detrimentales para la salud. Peor aún, estos tratamientos no prometen curar al paciente en todos los casos. Para evitar recetar estos tratamientos a pacientes a quienes no van a recibir beneficios, se han hecho vari...

Full description

Autores:
Luna Mejía, Juan Pablo
Sadeghian Perskie, Naim Samuel
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2635
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2635
Palabra clave:
Aprendizaje de máquina
Leishmaniasis
Clustering
Gaussian Mixtures
KMeans
DBSCAN
Agglomerative
Reducción de dimensionalidad
Rights
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:Los medicamentos usados para el tratamiento de la leishmaniasis pueden ser tóxicos y detrimentales para la salud. Peor aún, estos tratamientos no prometen curar al paciente en todos los casos. Para evitar recetar estos tratamientos a pacientes a quienes no van a recibir beneficios, se han hecho varios estudios [4][7] para tratar de predecir, por medio de muestras de metabolitos en la sangre, en qué pacientes el tratamiento será efectivo. En este proyecto se hizo una continuación de estos estudios, basados en los mismos datos usados. Estos datos observaron 535 atributos/metabolitos para solo 36 pacientes. El grueso de este proyecto estaba en reducir la dimensionalidad del conjunto de datos (2 a 5 metabolitos) y poder llegar a resultados cercanos o mejores a los ya existentes. Se entrenaron 4 diferentes modelos de clustering para encontrar posibles grupos y de cada uno escoger un representante. Para cada modelo se buscaron los parámetros los cuales llegaban a clusters con un mejor grado de separación. En la fase de escoger los representantes de cada cluster se usaron diferentes métricas como: cercanía al centro del cluster, o probabilidad de ser miembro del cluster, para decidir cuáles podrían ser los mejores representantes. Después de tener los representantes de cada grupo, se pasó a la fase de predicción, donde se observó qué tan buena era la predicción con este pequeño conjunto de atributos. Finalmente se llegó a un modelo con 3 metabolitos y un puntaje f1 de 0.82 el cual fue muy prometedor para una forma de reducción de la dimensionalidad tan particular y descriptiva como lo es ella selección por representantes de un agrupamiento.