SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades

SafeRecords es una solución innovadora de software que aborda la necesidad crítica de anonimizar registros médicos, protegiendo la privacidad de los pacientes mientras preserva la utilidad de los datos para investigaciones científicas. Inspirado en los avances recientes de la inteligencia artificial...

Full description

Autores:
Mercado, Santiago Andrés
Gutiérrez, Daniel David
Henríquez, David Daniel
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/12988
Acceso en línea:
http://hdl.handle.net/10584/12988
Palabra clave:
Anonimización
Registros médicos
Reconocimiento de entidades
Inteligencia artificial
Modelos BERT
Privacidad de datos
Procesamiento de lenguaje natural (PLN)
Desidentificación
Seguridad de datos
Transformadores
Anonymization
Medical records
Named entity recognition (NER)
Artificial intelligence
BERT models
Data privacy
Natural language processing (NLP)
De-identification
Data security
Transformers
Rights
License
Universidad del Norte
id REPOUNORT2_46368aae208973298b7c20891c770159
oai_identifier_str oai:manglar.uninorte.edu.co:10584/12988
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
dc.title.en_US.fl_str_mv SafeRecords: A Software Solution for Medical Record Anonymization Using Entity Recognition Models
title SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
spellingShingle SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
Anonimización
Registros médicos
Reconocimiento de entidades
Inteligencia artificial
Modelos BERT
Privacidad de datos
Procesamiento de lenguaje natural (PLN)
Desidentificación
Seguridad de datos
Transformadores
Anonymization
Medical records
Named entity recognition (NER)
Artificial intelligence
BERT models
Data privacy
Natural language processing (NLP)
De-identification
Data security
Transformers
title_short SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
title_full SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
title_fullStr SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
title_full_unstemmed SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
title_sort SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
dc.creator.fl_str_mv Mercado, Santiago Andrés
Gutiérrez, Daniel David
Henríquez, David Daniel
dc.contributor.advisor.none.fl_str_mv Posada, Jose
dc.contributor.author.none.fl_str_mv Mercado, Santiago Andrés
Gutiérrez, Daniel David
Henríquez, David Daniel
dc.subject.es_ES.fl_str_mv Anonimización
Registros médicos
Reconocimiento de entidades
Inteligencia artificial
Modelos BERT
Privacidad de datos
Procesamiento de lenguaje natural (PLN)
Desidentificación
Seguridad de datos
Transformadores
topic Anonimización
Registros médicos
Reconocimiento de entidades
Inteligencia artificial
Modelos BERT
Privacidad de datos
Procesamiento de lenguaje natural (PLN)
Desidentificación
Seguridad de datos
Transformadores
Anonymization
Medical records
Named entity recognition (NER)
Artificial intelligence
BERT models
Data privacy
Natural language processing (NLP)
De-identification
Data security
Transformers
dc.subject.en_US.fl_str_mv Anonymization
Medical records
Named entity recognition (NER)
Artificial intelligence
BERT models
Data privacy
Natural language processing (NLP)
De-identification
Data security
Transformers
description SafeRecords es una solución innovadora de software que aborda la necesidad crítica de anonimizar registros médicos, protegiendo la privacidad de los pacientes mientras preserva la utilidad de los datos para investigaciones científicas. Inspirado en los avances recientes de la inteligencia artificial, el proyecto implementa un modelo BERT de reconocimiento de entidades para identificar y eliminar información sensible de manera precisa. La solución se desarrolla como una aplicación web accesible, diseñada para procesar datos localmente en el navegador. Esto elimina la necesidad de transferir información a servidores externos, garantizando una mayor privacidad. Utilizando tecnologías modernas como Transformers.js y ONNX, SafeRecords puede anonimizar registros en múltiples idiomas con alta precisión, manteniendo un equilibrio entre seguridad y eficiencia. El proyecto incluye funcionalidades como carga de documentos en formatos comunes, selección de modos de anonimización (genérico y avanzado), y la opción de descargar los resultados procesados. Las pruebas demostraron que la herramienta es capaz de procesar grandes volúmenes de datos de forma estable, alcanzando un promedio de precisión del 74 %. Con un enfoque en la usabilidad, SafeRecords está diseñado para profesionales de la salud e investigadores, ofreciendo una solución práctica para manejar datos sensibles en conformidad con normativas legales como el GDPR y HIPAA. Este proyecto establece un precedente en la aplicación de IA para la protección de datos en el sector salud.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-12-02T20:55:49Z
dc.date.available.none.fl_str_mv 2024-12-02T20:55:49Z
dc.date.issued.none.fl_str_mv 2024-11-28
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/12988
url http://hdl.handle.net/10584/12988
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2024
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/12988/1/Imagen%20SafeRecords.png
https://manglar.uninorte.edu.co/bitstream/10584/12988/2/Informe%20Proyecto%20SafeRecords.pdf
https://manglar.uninorte.edu.co/bitstream/10584/12988/3/license.txt
bitstream.checksum.fl_str_mv 22481451070cc4c3255c5f93f6f5c87e
f86c2ae5dea6c559f66290c3aac2d380
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1828169886699880448
spelling Posada, JoseMercado, Santiago AndrésGutiérrez, Daniel DavidHenríquez, David Daniel2024-12-02T20:55:49Z2024-12-02T20:55:49Z2024-11-28http://hdl.handle.net/10584/12988SafeRecords es una solución innovadora de software que aborda la necesidad crítica de anonimizar registros médicos, protegiendo la privacidad de los pacientes mientras preserva la utilidad de los datos para investigaciones científicas. Inspirado en los avances recientes de la inteligencia artificial, el proyecto implementa un modelo BERT de reconocimiento de entidades para identificar y eliminar información sensible de manera precisa. La solución se desarrolla como una aplicación web accesible, diseñada para procesar datos localmente en el navegador. Esto elimina la necesidad de transferir información a servidores externos, garantizando una mayor privacidad. Utilizando tecnologías modernas como Transformers.js y ONNX, SafeRecords puede anonimizar registros en múltiples idiomas con alta precisión, manteniendo un equilibrio entre seguridad y eficiencia. El proyecto incluye funcionalidades como carga de documentos en formatos comunes, selección de modos de anonimización (genérico y avanzado), y la opción de descargar los resultados procesados. Las pruebas demostraron que la herramienta es capaz de procesar grandes volúmenes de datos de forma estable, alcanzando un promedio de precisión del 74 %. Con un enfoque en la usabilidad, SafeRecords está diseñado para profesionales de la salud e investigadores, ofreciendo una solución práctica para manejar datos sensibles en conformidad con normativas legales como el GDPR y HIPAA. Este proyecto establece un precedente en la aplicación de IA para la protección de datos en el sector salud.SafeRecords is an innovative software solution addressing the critical need for anonymizing medical records, ensuring patient privacy while preserving the data's utility for scientific research. Inspired by recent advancements in artificial intelligence, the project leverages a BERT-based named entity recognition model to accurately identify and remove sensitive information. The solution is developed as an accessible web application designed to process data locally within the browser, eliminating the need for external server transfers and enhancing privacy. By employing modern technologies such as Transformers.js and ONNX, SafeRecords can anonymize records in multiple languages with high precision, striking a balance between security and efficiency. The project features capabilities such as uploading documents in common formats, selecting anonymization modes (generic and advanced), and downloading processed results. Tests demonstrated the tool's ability to handle large data volumes reliably, achieving an average accuracy of 74%. Focused on usability, SafeRecords is designed for healthcare professionals and researchers, offering a practical solution to manage sensitive data in compliance with legal regulations like GDPR and HIPAA. This project sets a benchmark for applying AI to data protection in the healthcare sector.spaBarranquilla, Universidad del Norte, 2024Universidad del Nortehttp://purl.org/coar/access_right/c_abf2AnonimizaciónRegistros médicosReconocimiento de entidadesInteligencia artificialModelos BERTPrivacidad de datosProcesamiento de lenguaje natural (PLN)DesidentificaciónSeguridad de datosTransformadoresAnonymizationMedical recordsNamed entity recognition (NER)Artificial intelligenceBERT modelsData privacyNatural language processing (NLP)De-identificationData securityTransformersSafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidadesSafeRecords: A Software Solution for Medical Record Anonymization Using Entity Recognition Modelsarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALImagen SafeRecords.pngImagen SafeRecords.pngImagen SafeRecordsimage/png121482https://manglar.uninorte.edu.co/bitstream/10584/12988/1/Imagen%20SafeRecords.png22481451070cc4c3255c5f93f6f5c87eMD51Informe Proyecto SafeRecords.pdfInforme Proyecto SafeRecords.pdfArtículo principalapplication/pdf916259https://manglar.uninorte.edu.co/bitstream/10584/12988/2/Informe%20Proyecto%20SafeRecords.pdff86c2ae5dea6c559f66290c3aac2d380MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/12988/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/12988oai:manglar.uninorte.edu.co:10584/129882024-12-02 15:55:49.727Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=