Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM
Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, D...
- Autores:
-
Sáenz, Salomón
Constante, Samuel
Barandica, Sebastián
- Tipo de recurso:
- Fecha de publicación:
- 2024
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/13002
- Acceso en línea:
- http://hdl.handle.net/10584/13002
- Palabra clave:
- Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.
Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_9e0b38154533069cc256738e11244a6c |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/13002 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
dc.title.en_US.fl_str_mv |
Module for Speech-to-Text Processing and Task Identification in Projects with LLM Models |
title |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
spellingShingle |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram. Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram. |
title_short |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
title_full |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
title_fullStr |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
title_full_unstemmed |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
title_sort |
Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLM |
dc.creator.fl_str_mv |
Sáenz, Salomón Constante, Samuel Barandica, Sebastián |
dc.contributor.advisor.none.fl_str_mv |
Nieto, Wilson |
dc.contributor.author.none.fl_str_mv |
Sáenz, Salomón Constante, Samuel Barandica, Sebastián |
dc.subject.es_ES.fl_str_mv |
Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram. |
topic |
Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram. Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram. |
dc.subject.en_US.fl_str_mv |
Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram. |
description |
Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, Deepgram, Gemini AI y Vertex AI para obtener transcripciones precisas, que posteriormente se utilizan para generar tareas estructuradas almacenadas en una base de datos y accesibles a través de una interfaz web. La metodología adoptada incluye la integración de modelos de lenguaje a gran escala y aprendizaje supervisado para mejorar la precisión de las transcripciones y la categorización de tareas. Los resultados demuestran una mejora significativa en la gestión y seguimiento de proyectos al automatizar el reconocimiento y estructuración de tareas, optimizando así la productividad del equipo. Este enfoque proporciona una base sólida para futuras implementaciones en herramientas relacionadas con la gestión de proyectos. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-12-03T19:16:31Z |
dc.date.available.none.fl_str_mv |
2024-12-03T19:16:31Z |
dc.date.issued.none.fl_str_mv |
2024-12-02 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/13002 |
url |
http://hdl.handle.net/10584/13002 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2024 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
https://manglar.uninorte.edu.co/bitstream/10584/13002/1/Proyecto_Final_Salomon_Samuel_Sebastian___2024.pdf https://manglar.uninorte.edu.co/bitstream/10584/13002/2/license.txt |
bitstream.checksum.fl_str_mv |
c9692f4804d9db3c1a698bdbfe7b8b7e 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1828169937116463104 |
spelling |
Nieto, WilsonSáenz, SalomónConstante, SamuelBarandica, Sebastián2024-12-03T19:16:31Z2024-12-03T19:16:31Z2024-12-02http://hdl.handle.net/10584/13002Este proyecto se centra en el desarrollo de un módulo de procesamiento de voz a texto para el reconocimiento de tareas en proyectos, utilizando modelos de lenguaje a gran escala (LLM) basados en grabaciones de reuniones de equipo. Se emplean herramientas avanzadas como Google Cloud Speech-to-Text, Deepgram, Gemini AI y Vertex AI para obtener transcripciones precisas, que posteriormente se utilizan para generar tareas estructuradas almacenadas en una base de datos y accesibles a través de una interfaz web. La metodología adoptada incluye la integración de modelos de lenguaje a gran escala y aprendizaje supervisado para mejorar la precisión de las transcripciones y la categorización de tareas. Los resultados demuestran una mejora significativa en la gestión y seguimiento de proyectos al automatizar el reconocimiento y estructuración de tareas, optimizando así la productividad del equipo. Este enfoque proporciona una base sólida para futuras implementaciones en herramientas relacionadas con la gestión de proyectos.This project focuses on the development of an advanced speech-to-text processing module for task recognition in projects, particularly those utilizing large language models (LLMs), based on recordings of team meetings. It leverages cutting-edge technologies such as Google Cloud Speech-to-Text, Deepgram, Gemini AI, and Vertex AI to obtain highly accurate transcriptions. These transcriptions are then analyzed and used to generate structured tasks, which are stored in a centralized database and can be easily accessed via an intuitive web interface. The adopted methodology includes the integration of LLMs and supervised learning techniques, which work together to significantly enhance the accuracy of both the transcriptions and the categorization of tasks. The results from this approach demonstrate a substantial improvement in project management and tracking, as it automates the process of recognizing, structuring, and categorizing tasks. This automation significantly optimizes team productivity by reducing manual effort and ensuring tasks are captured in a highly organized manner. The project also presents a robust and scalable solution that can serve as a solid foundation for future implementations in various tools related to project management and team collaboration. With these capabilities, it offers immense potential for streamlining workflows and enhancing the efficiency of project execution across diverse industries.spaBarranquilla, Universidad del Norte, 2024Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Speech-to-text, Reconocimiento de tareas, Gestión de proyectos, Modelos grandes de lenguaje, Transcripción, Aprendizaje supervisado, Gemini AI, Vertex AI, Deepgram.Speech-to-text, Task recognition, Project management, Large language models (LLM), Transcription accuracy, Supervised learning, Gemini AI, Vertex AI, Deepgram.Módulo de procesamiento speech to text para reconocimiento de tareas en proyectos mediante modelos LLMModule for Speech-to-Text Processing and Task Identification in Projects with LLM Modelsarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALProyecto_Final_Salomon_Samuel_Sebastian___2024.pdfProyecto_Final_Salomon_Samuel_Sebastian___2024.pdfapplication/pdf1023417https://manglar.uninorte.edu.co/bitstream/10584/13002/1/Proyecto_Final_Salomon_Samuel_Sebastian___2024.pdfc9692f4804d9db3c1a698bdbfe7b8b7eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13002/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5210584/13002oai:manglar.uninorte.edu.co:10584/130022024-12-03 14:16:32.177Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |