Técnicas de clustering aplicadas en un conjunto metabolitos perteneciente a pacientes de Leishmaniasis cutánea para predecir la efectividad del tratamiento glucantime a través de modelos de aprendizaje automático clásicos
Los medicamentos usados para el tratamiento de la leishmaniasis pueden ser tóxicos y detrimentales para la salud. Peor aún, estos tratamientos no prometen curar al paciente en todos los casos. Para evitar recetar estos tratamientos a pacientes a quienes no van a recibir beneficios, se han hecho vari...
- Autores:
-
Luna Mejía, Juan Pablo
Sadeghian Perskie, Naim Samuel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- spa
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2635
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2635
- Palabra clave:
- Aprendizaje de máquina
Leishmaniasis
Clustering
Gaussian Mixtures
KMeans
DBSCAN
Agglomerative
Reducción de dimensionalidad
- Rights
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
Summary: | Los medicamentos usados para el tratamiento de la leishmaniasis pueden ser tóxicos y detrimentales para la salud. Peor aún, estos tratamientos no prometen curar al paciente en todos los casos. Para evitar recetar estos tratamientos a pacientes a quienes no van a recibir beneficios, se han hecho varios estudios [4][7] para tratar de predecir, por medio de muestras de metabolitos en la sangre, en qué pacientes el tratamiento será efectivo. En este proyecto se hizo una continuación de estos estudios, basados en los mismos datos usados. Estos datos observaron 535 atributos/metabolitos para solo 36 pacientes. El grueso de este proyecto estaba en reducir la dimensionalidad del conjunto de datos (2 a 5 metabolitos) y poder llegar a resultados cercanos o mejores a los ya existentes. Se entrenaron 4 diferentes modelos de clustering para encontrar posibles grupos y de cada uno escoger un representante. Para cada modelo se buscaron los parámetros los cuales llegaban a clusters con un mejor grado de separación. En la fase de escoger los representantes de cada cluster se usaron diferentes métricas como: cercanía al centro del cluster, o probabilidad de ser miembro del cluster, para decidir cuáles podrían ser los mejores representantes. Después de tener los representantes de cada grupo, se pasó a la fase de predicción, donde se observó qué tan buena era la predicción con este pequeño conjunto de atributos. Finalmente se llegó a un modelo con 3 metabolitos y un puntaje f1 de 0.82 el cual fue muy prometedor para una forma de reducción de la dimensionalidad tan particular y descriptiva como lo es ella selección por representantes de un agrupamiento. |
---|