Implementación de una aplicación web que integre una base de datos, y realice el pre-procesamiento de audio, video y texto integrada a un conjunto de módulos de clasificación y a un sistema de visualización y adquisición de información

Este proyecto presenta el desarrollo de una aplicación web basada en Django que utiliza bases de datos relacionales (MySQL) y no relacionales (MongoDB) para almacenar grabaciones de vídeo cifradas en formato mp4. Su objetivo principal es detectar la depresión mediante el análisis de estas grabacione...

Full description

Autores:
Restrepo Urrego , Juan Manuel
Aroca Ariza, Juan José
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Tecnológica de Pereira
Repositorio:
Repositorio Institucional UTP
Idioma:
spa
OAI Identifier:
oai:repositorio.utp.edu.co:11059/14907
Acceso en línea:
https://hdl.handle.net/11059/14907
https://repositorio.utp.edu.co/home
Palabra clave:
000 - Ciencias de la computación, información y obras generales::006 - Métodos especiales de computación
Procesamiento de Lenguaje Natural
Aplicacion Web
Bases de Datos No Relacionales
Desarrollo de aplicaciones web
Python, django
Procesamiento
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:Este proyecto presenta el desarrollo de una aplicación web basada en Django que utiliza bases de datos relacionales (MySQL) y no relacionales (MongoDB) para almacenar grabaciones de vídeo cifradas en formato mp4. Su objetivo principal es detectar la depresión mediante el análisis de estas grabaciones y el procesamiento de lenguaje natural. Los usuarios, ya sean pacientes o médicos, pueden iniciar sesión o registrarse para acceder a la cámara y el audio de sus dispositivos e iniciar una entrevista virtual con la ayuda de un entrevistador, el sistema permite el acceso a la cámara de video y al audio de los dispositivos que serán grabados para procesamiento. La aplicación permite realizar entrevistas presenciales o completar formularios a través de un chatbot. Una vez finalizada la entrevista, la grabación se descarga y se sube al servidor para su procesamiento. El servidor convierte el formato de la grabación, la divide en segmentos y genera archivos wav para su análisis en la detección de depresión. El alcance del proyecto se centra en el desarrollo del backend de la aplicación web, incluyendo el inicio de sesión, registro de usuarios, gestión de permisos y búsqueda de pacientes y profesionales de la salud. Se ha desarrollado también un analizador de texto basado en el procesamiento de lenguaje natural para detectar conversaciones en los archivos de audio. La aplicación ha sido probada en servidores Windows y Linux sin problemas y se han utilizado diversas librerías de Python, como Django, MySQL, moviepy, speech recognition, cryptography y ffmpeg. Destaca la importancia de la librería speech recognition para la detección de conversaciones y procesamiento del lenguaje natural utilizando una API de Google.