Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning

RESUMEN: Los textos resumen de una consulta, encuentro o seguimiento médico sirven para dar contexto de la historia clínica del paciente pues dan cuenta de datos importantes como: información general del paciente, antecedentes, medicamentos y otros hallazgos de la consulta. En este proyecto se prese...

Full description

Autores:
Fernández Madrid, Luisa Fernanda
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/15955
Acceso en línea:
http://hdl.handle.net/10495/15955
Palabra clave:
Algoritmo
Algorithms
Lenguaje de programación
Computer languages
Centro médico
Medical centres
Paciente
Patients
Base de datos
Databases
Procesamiento del lenguaje natural
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept6007
http://vocabularies.unesco.org/thesaurus/concept4895
http://vocabularies.unesco.org/thesaurus/concept11776
http://vocabularies.unesco.org/thesaurus/concept501
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id UDEA2_2bf64b1040ca533b494e77367ab15344
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/15955
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
title Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
spellingShingle Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
Algoritmo
Algorithms
Lenguaje de programación
Computer languages
Centro médico
Medical centres
Paciente
Patients
Base de datos
Databases
Procesamiento del lenguaje natural
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept6007
http://vocabularies.unesco.org/thesaurus/concept4895
http://vocabularies.unesco.org/thesaurus/concept11776
http://vocabularies.unesco.org/thesaurus/concept501
title_short Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
title_full Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
title_fullStr Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
title_full_unstemmed Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
title_sort Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine Learning
dc.creator.fl_str_mv Fernández Madrid, Luisa Fernanda
dc.contributor.advisor.none.fl_str_mv Gallego Londoño, Jonathan
Niebles Reyes, María Camila
dc.contributor.author.none.fl_str_mv Fernández Madrid, Luisa Fernanda
dc.subject.unesco.none.fl_str_mv Algoritmo
Algorithms
Lenguaje de programación
Computer languages
Centro médico
Medical centres
Paciente
Patients
Base de datos
Databases
topic Algoritmo
Algorithms
Lenguaje de programación
Computer languages
Centro médico
Medical centres
Paciente
Patients
Base de datos
Databases
Procesamiento del lenguaje natural
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept6007
http://vocabularies.unesco.org/thesaurus/concept4895
http://vocabularies.unesco.org/thesaurus/concept11776
http://vocabularies.unesco.org/thesaurus/concept501
dc.subject.proposal.spa.fl_str_mv Procesamiento del lenguaje natural
dc.subject.unescouri.none.fl_str_mv http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept6007
http://vocabularies.unesco.org/thesaurus/concept4895
http://vocabularies.unesco.org/thesaurus/concept11776
http://vocabularies.unesco.org/thesaurus/concept501
description RESUMEN: Los textos resumen de una consulta, encuentro o seguimiento médico sirven para dar contexto de la historia clínica del paciente pues dan cuenta de datos importantes como: información general del paciente, antecedentes, medicamentos y otros hallazgos de la consulta. En este proyecto se presenta un algoritmo desarrollado por el departamento de T.I de la I.P.S Neumomed S.A.S para suplir la necesidad de generar en tiempo real el texto resumen de un encuentro médico. Para la creación de esta funcionalidad se identificaron los siguientes requerimientos: el algoritmo debe generar un texto resumen introductorio del paciente que contenga la información general de este y del último encuentro médico del paciente, debe recibir variables con información clínica del paciente y generar un texto resumen, debe ser escalable y fácilmente implementable en cualquier cliente de la I.P.S. Para cumplir con los requerimientos expresados anteriormente, se construyó un modelo supervisado de machine learning tipo árbol de decisiones, que cuenta una fase de entrenamiento y otra de implementación, para la generación automatizada de textos implementando técnicas de procesamiento de lenguaje natural. El modelo generado se validó mediante técnicas de regresión logística y análisis típicos de algoritmos de inteligencia artificial con base en la matriz de confusión y la medición de exactitud (accuracy). De igual manera se evalúo la calidad del texto generado por medio de revisiones manuales y automatizadas, para garantizar la legibilidad, orden, coherencia y buena ortografía del mismo, finalmente se realizaron validaciones de seguridad y desempeño del algoritmo.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-08-03T13:10:35Z
dc.date.available.none.fl_str_mv 2020-08-03T13:10:35Z
dc.date.issued.none.fl_str_mv 2020
dc.type.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/draft
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
format http://purl.org/coar/resource_type/c_7a1f
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/15955
url http://hdl.handle.net/10495/15955
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.accessrights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 32
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
institution Universidad de Antioquia
bitstream.url.fl_str_mv http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/5/license.txt
http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/4/license_rdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/3/FernandezLuisa_2020_ProcesamientoLenguajeNatural.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
b88b088d9957e670ce3b3fbe2eedbc13
96c1ed14f2ce5c1f4e398a1c969deb68
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Antioquia
repository.mail.fl_str_mv andres.perez@udea.edu.co
_version_ 1812173211432910848
spelling Gallego Londoño, JonathanNiebles Reyes, María CamilaFernández Madrid, Luisa Fernanda2020-08-03T13:10:35Z2020-08-03T13:10:35Z2020http://hdl.handle.net/10495/15955RESUMEN: Los textos resumen de una consulta, encuentro o seguimiento médico sirven para dar contexto de la historia clínica del paciente pues dan cuenta de datos importantes como: información general del paciente, antecedentes, medicamentos y otros hallazgos de la consulta. En este proyecto se presenta un algoritmo desarrollado por el departamento de T.I de la I.P.S Neumomed S.A.S para suplir la necesidad de generar en tiempo real el texto resumen de un encuentro médico. Para la creación de esta funcionalidad se identificaron los siguientes requerimientos: el algoritmo debe generar un texto resumen introductorio del paciente que contenga la información general de este y del último encuentro médico del paciente, debe recibir variables con información clínica del paciente y generar un texto resumen, debe ser escalable y fácilmente implementable en cualquier cliente de la I.P.S. Para cumplir con los requerimientos expresados anteriormente, se construyó un modelo supervisado de machine learning tipo árbol de decisiones, que cuenta una fase de entrenamiento y otra de implementación, para la generación automatizada de textos implementando técnicas de procesamiento de lenguaje natural. El modelo generado se validó mediante técnicas de regresión logística y análisis típicos de algoritmos de inteligencia artificial con base en la matriz de confusión y la medición de exactitud (accuracy). De igual manera se evalúo la calidad del texto generado por medio de revisiones manuales y automatizadas, para garantizar la legibilidad, orden, coherencia y buena ortografía del mismo, finalmente se realizaron validaciones de seguridad y desempeño del algoritmo.ABSTRACT: The electronic medical record serves to give context to the patient's medical history, since they account for important data such as: general patient information, history, medications and other findings of the consultation. This project presents an algorithm developed by the T.I department of Neumomed S.A.S to supply the need to generate medical record in real time. To create this functionality, the following requirements were identified: the algorithm must generate an introductory text about the patient, it must contain general information of this and the patient's last medical meeting, must receive variables with the patient's clinical information and generate a text summary, it must be scalable and easily deployable in any client. To accomplish the requirements expressed above, a supervised decision tree machine learning model was built, it includes a training phase and an implementation phase that implement natural language processing techniques. The generated model was validated using logistic regression techniques and was analysed based on the confusion matrix and the accuracy measurement. In the same way, the quality of the generated text was evaluated through manual and automated revisions, to guarantee its legibility, order, coherence, and good spelling. Finally, security and performance validations were carried.32application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/version/c_b1a7d7d4d402bcceAtribución-NoComercial-SinDerivadas 2.5 Colombiainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-nd/4.0/Diseño e implementación de algoritmos de procesamiento de lenguaje natural para automatizar la construcción de resúmenes de consultas médicas en la IPS Neumomed S.A.S. mediante técnicas de Machine LearningMedellín, ColombiaAlgoritmoAlgorithmsLenguaje de programaciónComputer languagesCentro médicoMedical centresPacientePatientsBase de datosDatabasesProcesamiento del lenguaje naturalhttp://vocabularies.unesco.org/thesaurus/concept2024http://vocabularies.unesco.org/thesaurus/concept6007http://vocabularies.unesco.org/thesaurus/concept4895http://vocabularies.unesco.org/thesaurus/concept11776http://vocabularies.unesco.org/thesaurus/concept501BioingenieraPregradoFacultad de Ingeniería. Carrera de BioingenieríaUniversidad de AntioquiaLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/4/license_rdfb88b088d9957e670ce3b3fbe2eedbc13MD54ORIGINALFernandezLuisa_2020_ProcesamientoLenguajeNatural.pdfFernandezLuisa_2020_ProcesamientoLenguajeNatural.pdfTrabajo de grado de pregradoapplication/pdf1922544http://bibliotecadigital.udea.edu.co/bitstream/10495/15955/3/FernandezLuisa_2020_ProcesamientoLenguajeNatural.pdf96c1ed14f2ce5c1f4e398a1c969deb68MD5310495/15955oai:bibliotecadigital.udea.edu.co:10495/159552021-06-24 16:48:30.613Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=