Procesamiento del Lenguaje Natural para el Apoyo en el Diagnóstico de Tuberculosis
La tuberculosis (TB) es una enfermedad infecciosa causada por la Mycobacterium Tuberculosis, que puede afectar a cualquier órgano del cuerpo, siendo la TB pulmonar la forma más frecuente de la enfermedad y la que más muertes causa. Según la Organización Mundial de la Salud (OMS), la TB se encuentra...
- Autores:
-
Romero Gómez, Andrés Felipe
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Escuela Colombiana de Ingeniería Julio Garavito
- Repositorio:
- Repositorio Institucional ECI
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.escuelaing.edu.co:001/1527
- Acceso en línea:
- https://repositorio.escuelaing.edu.co/handle/001/1527
https://catalogo.escuelaing.edu.co/cgi-bin/koha/opac-detail.pl?biblionumber=22634
- Palabra clave:
- Inteligencia artificial
Procesamiento de lenguaje natural
Tuberculosis
Procesamiento del Lenguaje Natural
Inteligencia Artificial
Historia Clínica
- Rights
- openAccess
- License
- http://purl.org/coar/access_right/c_abf2
Summary: | La tuberculosis (TB) es una enfermedad infecciosa causada por la Mycobacterium Tuberculosis, que puede afectar a cualquier órgano del cuerpo, siendo la TB pulmonar la forma más frecuente de la enfermedad y la que más muertes causa. Según la Organización Mundial de la Salud (OMS), la TB se encuentra entre las 10 principales causas de muerte a nivel mundial, y en el caso de Colombia la TB es una enfermedad de interés en cuanto a la salud pública, por el alto número de casos que son reportados en el territorio, respecto a otras enfermedades transmisibles. Uno de los principales problemas para manejo de la TB está en los métodos de diagnóstico, para los cuales se necesita de personal e infraestructura que no siempre están disponibles en lugares con sistemas de salud deficientes. Según el protocolo nacional para la detección de la TB, el diagnóstico de la TB pulmonar se debe hacer mediante una confirmación microbiológica, para lo cual se tienen tres tipos de pruebas, las baciloscopias, las pruebas moleculares y los cultivos. Todas las pruebas tienen un coste asociado y su disponibilidad es limitada, por lo que la generación de herramientas que den apoyo en el diagnóstico de la TB, pueden ayudar a tener un mejor control de la enfermedad. La inteligencia artificial (IA) es un área de la informática que busca dotar a las máquinas de comportamientos inteligentes, con el fin de que realicen una tarea especifica. Una de las aplicaciones de la IA son los sistemas de apoyo a la toma de decisiones del inglés Decision Support System (DSS), estos sistemas aplicados en salud, buscan generar modelos que se basan en grandes volúmenes de datos y conocimientos clínicos previos, para ayudar al médico en la toma de mejores decisiones respecto a los pacientes. Con el fin de generar herramientas que ayuden en el manejo de la TB, en el presente trabajo se utilizan técnicas de IA para el desarrollo un DSS que de apoyo en el diagnóstico de la TB, usando la información contenida en las historias clínicas electrónicas (HCE). Las HCE son fuentes de información ampliamente usadas por los médicos, en las cuales se registra el estado de salud de los pacientes, por lo que se espera que con la información contenida en ellas, se pueda generar una herramienta computacional que ayude a los profesionales de la salud en el manejo de la TB. Para el desarrollo del trabajo se construyó una base de datos a partir de 151 HCE de pacientes sospechosos de TB pulmonar, en la base de datos se encuentran los reportes clínicos de los pacientes en fechas previas a la realización de las pruebas diagnósticas, de manera que en los reportes no se encuentra información sobre el diagnóstico final de TB. Para la creación de la herramienta diagnóstica, se tomaron los reportes clínicos y se les aplicó un preprocesamiento para limpiar el texto, luego, se extrajeron características usando 2 métodos TF-IDF (del inglés, term-frequency - inverse document frequency) y Word2Vec; posteriormente, se usaron modelos de aprendizaje automático para hacer la predicción de la TB. La exploración de modelos se realizó mediante validación cruzada, encontrando que los mejores resultados se obtienen haciendo una reducción de la dimensionalidad de las características obtenidas con TF-IDF, y usando del algoritmo de árboles aleatorios para la clasificación. Las métricas de desempeño obtenidas sobre los conjuntos de prueba con este modelo son: 0.721, 0.802, 0.462, y 0.723, en exactitud, sensibilidad, especificidad, y F1-score respectivamente. Este trabajo se desarrolló dentro del proyecto Generación de modelos alternativos basados en inteligencia computacional para tamización y diagnóstico de tuberculosis pulmonar (minciencias, Universidad del Rosario, Universidad Antonio Nariño, Subred Integrada de Servicios de Salud Centro-Oriente–Hospital Santa Clara), el cual es un proyecto conformado por un equipo conjunto de médicos e ingenieros, y tiene por objetivo generar herramientas computacionales, que puedan ser empleadas en lugares con infraestructura precaria para el diagnóstico de la TB pulmonar. Dentro del proyecto se están desarrollando modelos computacionales usando variables clínicas, epidemiológicas y sociodemográficas, se espera en un futuro integrar este trabajo con otras estrategias generadas dentro del proyecto, para la construcción de un sistema más robusto, que pueda apoyar al médico en el diagnóstico de la TB pulmonar. |
---|