Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
Con el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el prese...
- Autores:
-
Morelo Mejia, Ibrahimme
Villegas Oyola, Andrés Ramiro
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Universidad El Bosque
- Repositorio:
- Repositorio U. El Bosque
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unbosque.edu.co:20.500.12495/7150
- Acceso en línea:
- http://hdl.handle.net/20.500.12495/7150
- Palabra clave:
- Reconocimiento de voz
Inteligencia artificial
Redes neuronales convolucionales
Aprendizaje automático
621.3
Speech recognition
Artificial intelligence
Convolutional neural network
Machine learning
Computación en la nube
Sistemas de procesamiento de la voz
Lingüística computacional
- Rights
- openAccess
- License
- Atribución-NoComercial-CompartirIgual 4.0 Internacional
id |
UNBOSQUE2_f1b8a5ce2eb2fcacbedec5be99157375 |
---|---|
oai_identifier_str |
oai:repositorio.unbosque.edu.co:20.500.12495/7150 |
network_acronym_str |
UNBOSQUE2 |
network_name_str |
Repositorio U. El Bosque |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
dc.title.translated.spa.fl_str_mv |
Offline speech command recognition system for Raspberry Pi using machine learning |
title |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
spellingShingle |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático Reconocimiento de voz Inteligencia artificial Redes neuronales convolucionales Aprendizaje automático 621.3 Speech recognition Artificial intelligence Convolutional neural network Machine learning Computación en la nube Sistemas de procesamiento de la voz Lingüística computacional |
title_short |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
title_full |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
title_fullStr |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
title_full_unstemmed |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
title_sort |
Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático |
dc.creator.fl_str_mv |
Morelo Mejia, Ibrahimme Villegas Oyola, Andrés Ramiro |
dc.contributor.advisor.none.fl_str_mv |
Romero Alvarez, Fran Ernesto |
dc.contributor.author.none.fl_str_mv |
Morelo Mejia, Ibrahimme Villegas Oyola, Andrés Ramiro |
dc.subject.spa.fl_str_mv |
Reconocimiento de voz Inteligencia artificial Redes neuronales convolucionales Aprendizaje automático |
topic |
Reconocimiento de voz Inteligencia artificial Redes neuronales convolucionales Aprendizaje automático 621.3 Speech recognition Artificial intelligence Convolutional neural network Machine learning Computación en la nube Sistemas de procesamiento de la voz Lingüística computacional |
dc.subject.ddc.none.fl_str_mv |
621.3 |
dc.subject.keywords.spa.fl_str_mv |
Speech recognition Artificial intelligence Convolutional neural network Machine learning |
dc.subject.armarc.spa.fl_str_mv |
Computación en la nube Sistemas de procesamiento de la voz Lingüística computacional |
description |
Con el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el presente documento se propuso el desarrollo de un sistema de reconocimiento de voz offline orientado a comandos de desplazamiento terrestre en idioma español para un robot construido sobre arquitecturas de bajo costo como Raspberry Pi y la aceleradora USB Coral. Se usaron las redes neuronales convolucionales para el entrenamiento del modelo, así como dos conjuntos de datos obtenidos a través de voluntarios y usuarios del sistema en cuestión. En alineación con la modalidad del proyecto (desarrollo tecnológico), se utilizó la metodología ágil SCRUM para sostener una mejor comunicación y alineación con el cliente. El sistema de reconocimiento de voz alcanzó una eficiencia promedio expresada en tiempo de 0.31 segundos necesarios para realizar la acción solicitada, la eficacia del sistema medida en precisión fue del 86% considerada alta para el contexto. Estos resultados fueron obtenidos en entornos sin ruidos externos y con usuarios que hicieron parte del entrenamiento del modelo. El estudio mostró cómo se pueden desarrollar sistemas de reconocimiento de voz desconectados de internet y con buen desempeño. |
publishDate |
2021 |
dc.date.issued.none.fl_str_mv |
2021 |
dc.date.accessioned.none.fl_str_mv |
2022-03-07T20:03:12Z |
dc.date.available.none.fl_str_mv |
2022-03-07T20:03:12Z |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12495/7150 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad El Bosque |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad El Bosque |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repositorio.unbosque.edu.co |
url |
http://hdl.handle.net/20.500.12495/7150 |
identifier_str_mv |
instname:Universidad El Bosque reponame:Repositorio Institucional Universidad El Bosque repourl:https://repositorio.unbosque.edu.co |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.*.fl_str_mv |
Atribución-NoComercial-CompartirIgual 4.0 Internacional |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.local.spa.fl_str_mv |
Acceso abierto |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-CompartirIgual 4.0 Internacional http://creativecommons.org/licenses/by-nc-sa/4.0/ Acceso abierto http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.program.spa.fl_str_mv |
Ingeniería de sistemas |
dc.publisher.grantor.spa.fl_str_mv |
Universidad El Bosque |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería |
institution |
Universidad El Bosque |
bitstream.url.fl_str_mv |
https://repositorio.unbosque.edu.co/bitstreams/799a5197-01d1-460f-bcbf-3624aaa274f4/download https://repositorio.unbosque.edu.co/bitstreams/aeb84ba4-6203-47bc-b4b9-7eea5d9e6ea6/download https://repositorio.unbosque.edu.co/bitstreams/9666b2dc-ae8a-4484-900f-e3240d7534af/download https://repositorio.unbosque.edu.co/bitstreams/883fc8c1-a7f2-4664-b4d7-380aead72d10/download https://repositorio.unbosque.edu.co/bitstreams/12ec7265-f637-4bec-95da-9695503c06cc/download https://repositorio.unbosque.edu.co/bitstreams/1cb17082-6129-4abd-a108-592711353561/download https://repositorio.unbosque.edu.co/bitstreams/9a2ba9a9-b5af-4902-843f-7e48273ad226/download https://repositorio.unbosque.edu.co/bitstreams/fb53f8a9-ace1-4172-a201-63386b2a65a1/download |
bitstream.checksum.fl_str_mv |
061b524e3c456591dece53cbc9d8a024 877cabfc259d644c418ea609579c336b 934f4ca17e109e0a05eaeaba504d7ce4 8a4605be74aa9ea9d79846c1fba20a33 fbbde5f25d255296f8f32387aa5fd675 ca5046f7e81dbf988f32e9c75ba5b1f3 25866b59d377905dd2c0edcb4cafc504 568def4874a9ed54e4c8b6099a6dd101 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad El Bosque |
repository.mail.fl_str_mv |
bibliotecas@biteca.com |
_version_ |
1814100740721868800 |
spelling |
Romero Alvarez, Fran ErnestoMorelo Mejia, IbrahimmeVillegas Oyola, Andrés Ramiro2022-03-07T20:03:12Z2022-03-07T20:03:12Z2021http://hdl.handle.net/20.500.12495/7150instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coCon el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el presente documento se propuso el desarrollo de un sistema de reconocimiento de voz offline orientado a comandos de desplazamiento terrestre en idioma español para un robot construido sobre arquitecturas de bajo costo como Raspberry Pi y la aceleradora USB Coral. Se usaron las redes neuronales convolucionales para el entrenamiento del modelo, así como dos conjuntos de datos obtenidos a través de voluntarios y usuarios del sistema en cuestión. En alineación con la modalidad del proyecto (desarrollo tecnológico), se utilizó la metodología ágil SCRUM para sostener una mejor comunicación y alineación con el cliente. El sistema de reconocimiento de voz alcanzó una eficiencia promedio expresada en tiempo de 0.31 segundos necesarios para realizar la acción solicitada, la eficacia del sistema medida en precisión fue del 86% considerada alta para el contexto. Estos resultados fueron obtenidos en entornos sin ruidos externos y con usuarios que hicieron parte del entrenamiento del modelo. El estudio mostró cómo se pueden desarrollar sistemas de reconocimiento de voz desconectados de internet y con buen desempeño.Ingeniero de sistemasPregradoWith cloud computing's exponential rise, more and more systems are using it without considering the latency generated, for speech recognition the cloud is generally used because of the amount of data. In the present paper, a system of speech command recognition in Spanish was proposed to perform land displacement operations in a robot built with low-cost tools like Raspberry Pi and USB Accelerator Google Cora. A Neural network convolutional was used to train two datasets obtained through forms and a module developed for this purpose. According to project mode (technological development), the agile SCRUM methodology was used to have better communication with the project client. The system reached an efficiency (response time) average of 0.31 seconds, on the other hand, the efficacy measured in precision was 86% with it is high for the test context. These results were obtained in environments without external noise and with users who were part of the model's training. The study showed how developing speech commands recognition systems offline can be a good option to reach good performance.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Reconocimiento de vozInteligencia artificialRedes neuronales convolucionalesAprendizaje automático621.3Speech recognitionArtificial intelligenceConvolutional neural networkMachine learningComputación en la nubeSistemas de procesamiento de la vozLingüística computacionalSistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automáticoOffline speech command recognition system for Raspberry Pi using machine learningIngeniería de sistemasUniversidad El BosqueFacultad de IngenieríaTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALMorelo_Mejia_Ibrahimme_2021.pdfMorelo_Mejia_Ibrahimme_2021.pdfSistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automáticoapplication/pdf3025902https://repositorio.unbosque.edu.co/bitstreams/799a5197-01d1-460f-bcbf-3624aaa274f4/download061b524e3c456591dece53cbc9d8a024MD51Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdfMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdfCarta de autorizaciónapplication/pdf332882https://repositorio.unbosque.edu.co/bitstreams/aeb84ba4-6203-47bc-b4b9-7eea5d9e6ea6/download877cabfc259d644c418ea609579c336bMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/9666b2dc-ae8a-4484-900f-e3240d7534af/download934f4ca17e109e0a05eaeaba504d7ce4MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unbosque.edu.co/bitstreams/883fc8c1-a7f2-4664-b4d7-380aead72d10/download8a4605be74aa9ea9d79846c1fba20a33MD54THUMBNAILMorelo_Mejia_Ibrahimme_2021.pdf.jpgMorelo_Mejia_Ibrahimme_2021.pdf.jpgIM Thumbnailimage/jpeg5184https://repositorio.unbosque.edu.co/bitstreams/12ec7265-f637-4bec-95da-9695503c06cc/downloadfbbde5f25d255296f8f32387aa5fd675MD55Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.jpgMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.jpgIM Thumbnailimage/jpeg7878https://repositorio.unbosque.edu.co/bitstreams/1cb17082-6129-4abd-a108-592711353561/downloadca5046f7e81dbf988f32e9c75ba5b1f3MD56TEXTMorelo_Mejia_Ibrahimme_2021.pdf.txtMorelo_Mejia_Ibrahimme_2021.pdf.txtExtracted texttext/plain101267https://repositorio.unbosque.edu.co/bitstreams/9a2ba9a9-b5af-4902-843f-7e48273ad226/download25866b59d377905dd2c0edcb4cafc504MD57Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.txtMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.txtExtracted texttext/plain4804https://repositorio.unbosque.edu.co/bitstreams/fb53f8a9-ace1-4172-a201-63386b2a65a1/download568def4874a9ed54e4c8b6099a6dd101MD5820.500.12495/7150oai:repositorio.unbosque.edu.co:20.500.12495/71502024-02-07 02:28:03.322http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |