FitVoice, un aplicativo móvil de registro de dieta usando modelos de speech-to-text y grandes modelos de lenguaje

Este proyecto se dedica a desarrollar una aplicación móvil de vanguardia para el seguimiento de dietas, aprovechando los últimos avances en tecnología de reconocimiento de voz y grandes modelos lingüísticos. La motivación de esta iniciativa es la creciente prevalencia de enfermedades relacionadas co...

Full description

Autores:
Puche, Diego
Jiménez, Kemer
Sierra, Miguel
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/11936
Acceso en línea:
http://hdl.handle.net/10584/11936
Palabra clave:
Reconocimiento por voz
Procesamiento de lenguaje natural
GPT-3.5
Whisper
Aplicaciones móviles
Monitoreo de dieta
Inteligencia artificial
Speech-to-text
Voice recognition
Natural language processing
Mobile applications
Diet monitoring
Artificial Intelligence
Rights
License
Universidad del Norte
Description
Summary:Este proyecto se dedica a desarrollar una aplicación móvil de vanguardia para el seguimiento de dietas, aprovechando los últimos avances en tecnología de reconocimiento de voz y grandes modelos lingüísticos. La motivación de esta iniciativa es la creciente prevalencia de enfermedades relacionadas con la dieta, como la diabetes de tipo 2 y las cardiopatías coronarias. Nuestro objetivo es atender a un amplio espectro de usuarios, incluidos los que buscan mejorar su salud, así como las personas centradas en el control del peso, tanto si su objetivo es ganar peso como perderlo. Al incorporar tecnologías avanzadas como Whisper para el procesamiento de audio y GPT-3.5 para el procesamiento de texto, este proyecto aspira a revolucionar la accesibilidad y facilidad de uso de las herramientas de seguimiento dietético. La aplicación simplifica el proceso de registro de la ingesta de alimentos al permitir a los usuarios hacerlo mediante comandos de voz, eliminando así los obstáculos asociados a la introducción manual de texto y la navegación táctil. Los resultados muestran una precisión de reconocimiento de alimentos del 92.51%. Por otro lado, el componente de conversión de voz a texto obtuvo una precisión del 98.75% en la transcripción de palabras clave y un 100% en la transcripción de unidades.