Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM

Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, D...

Full description

Autores:
Sáenz, Salomón
Constante, Samuel
Barandica, Sebastián
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/13002
Acceso en línea:
http://hdl.handle.net/10584/13002
Palabra clave:
Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.
Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.
Rights
License
Universidad del Norte
id REPOUNORT2_9e0b38154533069cc256738e11244a6c
oai_identifier_str oai:manglar.uninorte.edu.co:10584/13002
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
dc.title.en_US.fl_str_mv Module for Speech-to-Text Processing and Task Identification in Projects with LLM Models
title Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
spellingShingle Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.
Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.
title_short Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
title_full Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
title_fullStr Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
title_full_unstemmed Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
title_sort Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
dc.creator.fl_str_mv Sáenz, Salomón
Constante, Samuel
Barandica, Sebastián
dc.contributor.advisor.none.fl_str_mv Nieto, Wilson
dc.contributor.author.none.fl_str_mv Sáenz, Salomón
Constante, Samuel
Barandica, Sebastián
dc.subject.es_ES.fl_str_mv Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.
topic Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.
Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.
dc.subject.en_US.fl_str_mv Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.
description Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, Deepgram, Gemini AI y Vertex AI para obtener transcripciones precisas, que posteriormente se utilizan para generar tareas estructuradas almacenadas en una base de datos y accesibles a través de una interfaz web. La metodología adoptada incluye la integración de modelos de lenguaje a gran escala y aprendizaje supervisado para mejorar la precisión de las transcripciones y la categorización de tareas. Los resultados demuestran una mejora significativa en la gestión y seguimiento de proyectos al automatizar el reconocimiento y estructuración de tareas, optimizando así la productividad del equipo. Este enfoque proporciona una base sólida para futuras implementaciones en herramientas relacionadas con la gestión de proyectos.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-12-03T19:16:31Z
dc.date.available.none.fl_str_mv 2024-12-03T19:16:31Z
dc.date.issued.none.fl_str_mv 2024-12-02
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/13002
url http://hdl.handle.net/10584/13002
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2024
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/13002/1/Proyecto_Final_Salomon_Samuel_Sebastian___2024.pdf
https://manglar.uninorte.edu.co/bitstream/10584/13002/2/license.txt
bitstream.checksum.fl_str_mv c9692f4804d9db3c1a698bdbfe7b8b7e
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1828169937116463104
spelling Nieto, WilsonSáenz, SalomónConstante, SamuelBarandica, Sebastián2024-12-03T19:16:31Z2024-12-03T19:16:31Z2024-12-02http://hdl.handle.net/10584/13002Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, Deepgram, Gemini AI y Vertex AI para obtener transcripciones precisas, que posteriormente se utilizan para generar tareas estructuradas almacenadas en una base de datos y accesibles a través de una interfaz web. La metodología adoptada incluye la integración de modelos de lenguaje a gran escala y aprendizaje supervisado para mejorar la precisión de las transcripciones y la categorización de tareas. Los resultados demuestran una mejora significativa en la gestión y seguimiento de proyectos al automatizar el reconocimiento y estructuración de tareas, optimizando así la productividad del equipo. Este enfoque proporciona una base sólida para futuras implementaciones en herramientas relacionadas con la gestión de proyectos.This project focuses on the development of an advanced speech-to-text processing module for task recognition in projects, particularly those utilizing large language models (LLMs), based on recordings of team meetings. It leverages cutting-edge technologies such as Google Cloud Speech-to-Text, Deepgram, Gemini AI, and Vertex AI to obtain highly accurate transcriptions. These transcriptions are then analyzed and used to generate structured tasks, which are stored in a centralized database and can be easily accessed via an intuitive web interface. The adopted methodology includes the integration of LLMs and supervised learning techniques, which work together to significantly enhance the accuracy of both the transcriptions and the categorization of tasks. The results from this approach demonstrate a substantial improvement in project management and tracking, as it automates the process of recognizing, structuring, and categorizing tasks. This automation significantly optimizes team productivity by reducing manual effort and ensuring tasks are captured in a highly organized manner. The project also presents a robust and scalable solution that can serve as a solid foundation for future implementations in various tools related to project management and team collaboration. With these capabilities, it offers immense potential for streamlining workflows and enhancing the efficiency of project execution across diverse industries.spaBarranquilla, Universidad del Norte, 2024Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLMModule for Speech-to-Text Processing and Task Identification in Projects with LLM Modelsarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALProyecto_Final_Salomon_Samuel_Sebastian___2024.pdfProyecto_Final_Salomon_Samuel_Sebastian___2024.pdfapplication/pdf1023417https://manglar.uninorte.edu.co/bitstream/10584/13002/1/Proyecto_Final_Salomon_Samuel_Sebastian___2024.pdfc9692f4804d9db3c1a698bdbfe7b8b7eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13002/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5210584/13002oai:manglar.uninorte.edu.co:10584/130022024-12-03 14:16:32.177Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=