Optimización del flujo de carga masiva de datos en tecnologías de la información competentes a la telemedicina mediante técnicas OCR (Optical character recognition) y procesamiento multinúcleo

RESUMEN : Las empresas del área de la salud basadas en software que incurren en el área de tecnologías de la información suelen tener una gran cantidad transacciones de datos que superan la capacidad de la memoria RAM de sus equipos, lo cual es un problema comúnmente denominado “Big Data”. Este proy...

Full description

Autores:
Ortiz Ceballos, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/26053
Acceso en línea:
http://hdl.handle.net/10495/26053
Palabra clave:
Equipos y Suministros
Equipment and Supplies
Programa de ordenador
Computer software
Diseño de sistemas
Systems design
Informática
Computer science
Biotecnología
Biotechnology
http://vocabularies.unesco.org/thesaurus/concept6081
http://vocabularies.unesco.org/thesaurus/concept6101
http://vocabularies.unesco.org/thesaurus/concept450
http://vocabularies.unesco.org/thesaurus/concept619
Rights
openAccess
License
http://creativecommons.org/publicdomain/zero/1.0/
Description
Summary:RESUMEN : Las empresas del área de la salud basadas en software que incurren en el área de tecnologías de la información suelen tener una gran cantidad transacciones de datos que superan la capacidad de la memoria RAM de sus equipos, lo cual es un problema comúnmente denominado “Big Data”. Este proyecto intenta mitigar esta problemática aplicando técnicas de reconocimiento de caracteres (OCR) y procesamiento multinúcleo en archivos de tipo imagen y pdf para extraer información precisa sin necesidad de analizar un archivo por completo. Como resultado se obtuvo un proceso eficaz pero lento, tardando 5 segundos en procesar un archivo y cuyo comportamiento es exponencial a medida que el volumen de archivos incrementa. Sin embargo al extraer información precisa y evitar el bloqueo del hilo principal de la plataforma de software mediante técnicas de multiprocesamiento, se logró optimizar el uso de recursos y la fluidez del servicio, mejorando el rendimiento de la plataforma y la experiencia del usuario que use este tipo de servicios.