Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático

Con el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el prese...

Full description

Autores:
Morelo Mejia, Ibrahimme
Villegas Oyola, Andrés Ramiro
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/7150
Acceso en línea:
http://hdl.handle.net/20.500.12495/7150
Palabra clave:
Reconocimiento de voz
Inteligencia artificial
Redes neuronales convolucionales
Aprendizaje automático
621.3
Speech recognition
Artificial intelligence
Convolutional neural network
Machine learning
Computación en la nube
Sistemas de procesamiento de la voz
Lingüística computacional
Rights
openAccess
License
Atribución-NoComercial-CompartirIgual 4.0 Internacional
id UNBOSQUE2_f1b8a5ce2eb2fcacbedec5be99157375
oai_identifier_str oai:repositorio.unbosque.edu.co:20.500.12495/7150
network_acronym_str UNBOSQUE2
network_name_str Repositorio U. El Bosque
repository_id_str
dc.title.spa.fl_str_mv Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
dc.title.translated.spa.fl_str_mv Offline speech command recognition system for Raspberry Pi using machine learning
title Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
spellingShingle Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
Reconocimiento de voz
Inteligencia artificial
Redes neuronales convolucionales
Aprendizaje automático
621.3
Speech recognition
Artificial intelligence
Convolutional neural network
Machine learning
Computación en la nube
Sistemas de procesamiento de la voz
Lingüística computacional
title_short Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
title_full Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
title_fullStr Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
title_full_unstemmed Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
title_sort Sistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automático
dc.creator.fl_str_mv Morelo Mejia, Ibrahimme
Villegas Oyola, Andrés Ramiro
dc.contributor.advisor.none.fl_str_mv Romero Alvarez, Fran Ernesto
dc.contributor.author.none.fl_str_mv Morelo Mejia, Ibrahimme
Villegas Oyola, Andrés Ramiro
dc.subject.spa.fl_str_mv Reconocimiento de voz
Inteligencia artificial
Redes neuronales convolucionales
Aprendizaje automático
topic Reconocimiento de voz
Inteligencia artificial
Redes neuronales convolucionales
Aprendizaje automático
621.3
Speech recognition
Artificial intelligence
Convolutional neural network
Machine learning
Computación en la nube
Sistemas de procesamiento de la voz
Lingüística computacional
dc.subject.ddc.none.fl_str_mv 621.3
dc.subject.keywords.spa.fl_str_mv Speech recognition
Artificial intelligence
Convolutional neural network
Machine learning
dc.subject.armarc.spa.fl_str_mv Computación en la nube
Sistemas de procesamiento de la voz
Lingüística computacional
description Con el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el presente documento se propuso el desarrollo de un sistema de reconocimiento de voz offline orientado a comandos de desplazamiento terrestre en idioma español para un robot construido sobre arquitecturas de bajo costo como Raspberry Pi y la aceleradora USB Coral. Se usaron las redes neuronales convolucionales para el entrenamiento del modelo, así como dos conjuntos de datos obtenidos a través de voluntarios y usuarios del sistema en cuestión. En alineación con la modalidad del proyecto (desarrollo tecnológico), se utilizó la metodología ágil SCRUM para sostener una mejor comunicación y alineación con el cliente. El sistema de reconocimiento de voz alcanzó una eficiencia promedio expresada en tiempo de 0.31 segundos necesarios para realizar la acción solicitada, la eficacia del sistema medida en precisión fue del 86% considerada alta para el contexto. Estos resultados fueron obtenidos en entornos sin ruidos externos y con usuarios que hicieron parte del entrenamiento del modelo. El estudio mostró cómo se pueden desarrollar sistemas de reconocimiento de voz desconectados de internet y con buen desempeño.
publishDate 2021
dc.date.issued.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2022-03-07T20:03:12Z
dc.date.available.none.fl_str_mv 2022-03-07T20:03:12Z
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12495/7150
dc.identifier.instname.spa.fl_str_mv instname:Universidad El Bosque
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad El Bosque
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.unbosque.edu.co
url http://hdl.handle.net/20.500.12495/7150
identifier_str_mv instname:Universidad El Bosque
reponame:Repositorio Institucional Universidad El Bosque
repourl:https://repositorio.unbosque.edu.co
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.local.spa.fl_str_mv Acceso abierto
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
http://creativecommons.org/licenses/by-nc-sa/4.0/
Acceso abierto
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Ingeniería de sistemas
dc.publisher.grantor.spa.fl_str_mv Universidad El Bosque
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería
institution Universidad El Bosque
bitstream.url.fl_str_mv https://repositorio.unbosque.edu.co/bitstreams/799a5197-01d1-460f-bcbf-3624aaa274f4/download
https://repositorio.unbosque.edu.co/bitstreams/aeb84ba4-6203-47bc-b4b9-7eea5d9e6ea6/download
https://repositorio.unbosque.edu.co/bitstreams/9666b2dc-ae8a-4484-900f-e3240d7534af/download
https://repositorio.unbosque.edu.co/bitstreams/883fc8c1-a7f2-4664-b4d7-380aead72d10/download
https://repositorio.unbosque.edu.co/bitstreams/12ec7265-f637-4bec-95da-9695503c06cc/download
https://repositorio.unbosque.edu.co/bitstreams/1cb17082-6129-4abd-a108-592711353561/download
https://repositorio.unbosque.edu.co/bitstreams/9a2ba9a9-b5af-4902-843f-7e48273ad226/download
https://repositorio.unbosque.edu.co/bitstreams/fb53f8a9-ace1-4172-a201-63386b2a65a1/download
bitstream.checksum.fl_str_mv 061b524e3c456591dece53cbc9d8a024
877cabfc259d644c418ea609579c336b
934f4ca17e109e0a05eaeaba504d7ce4
8a4605be74aa9ea9d79846c1fba20a33
fbbde5f25d255296f8f32387aa5fd675
ca5046f7e81dbf988f32e9c75ba5b1f3
25866b59d377905dd2c0edcb4cafc504
568def4874a9ed54e4c8b6099a6dd101
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad El Bosque
repository.mail.fl_str_mv bibliotecas@biteca.com
_version_ 1814100740721868800
spelling Romero Alvarez, Fran ErnestoMorelo Mejia, IbrahimmeVillegas Oyola, Andrés Ramiro2022-03-07T20:03:12Z2022-03-07T20:03:12Z2021http://hdl.handle.net/20.500.12495/7150instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coCon el auge exponencial de la computación en la nube cada vez son más los sistemas que la adoptan sin tener en cuenta la latencia producida en la internet, el reconocimiento de voz es uno de los campos donde comúnmente se hace uso de la nube dado el volumen de datos que usa para tal fin. En el presente documento se propuso el desarrollo de un sistema de reconocimiento de voz offline orientado a comandos de desplazamiento terrestre en idioma español para un robot construido sobre arquitecturas de bajo costo como Raspberry Pi y la aceleradora USB Coral. Se usaron las redes neuronales convolucionales para el entrenamiento del modelo, así como dos conjuntos de datos obtenidos a través de voluntarios y usuarios del sistema en cuestión. En alineación con la modalidad del proyecto (desarrollo tecnológico), se utilizó la metodología ágil SCRUM para sostener una mejor comunicación y alineación con el cliente. El sistema de reconocimiento de voz alcanzó una eficiencia promedio expresada en tiempo de 0.31 segundos necesarios para realizar la acción solicitada, la eficacia del sistema medida en precisión fue del 86% considerada alta para el contexto. Estos resultados fueron obtenidos en entornos sin ruidos externos y con usuarios que hicieron parte del entrenamiento del modelo. El estudio mostró cómo se pueden desarrollar sistemas de reconocimiento de voz desconectados de internet y con buen desempeño.Ingeniero de sistemasPregradoWith cloud computing's exponential rise, more and more systems are using it without considering the latency generated, for speech recognition the cloud is generally used because of the amount of data. In the present paper, a system of speech command recognition in Spanish was proposed to perform land displacement operations in a robot built with low-cost tools like Raspberry Pi and USB Accelerator Google Cora. A Neural network convolutional was used to train two datasets obtained through forms and a module developed for this purpose. According to project mode (technological development), the agile SCRUM methodology was used to have better communication with the project client. The system reached an efficiency (response time) average of 0.31 seconds, on the other hand, the efficacy measured in precision was 86% with it is high for the test context. These results were obtained in environments without external noise and with users who were part of the model's training. The study showed how developing speech commands recognition systems offline can be a good option to reach good performance.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Reconocimiento de vozInteligencia artificialRedes neuronales convolucionalesAprendizaje automático621.3Speech recognitionArtificial intelligenceConvolutional neural networkMachine learningComputación en la nubeSistemas de procesamiento de la vozLingüística computacionalSistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automáticoOffline speech command recognition system for Raspberry Pi using machine learningIngeniería de sistemasUniversidad El BosqueFacultad de IngenieríaTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALMorelo_Mejia_Ibrahimme_2021.pdfMorelo_Mejia_Ibrahimme_2021.pdfSistema offline de reconocimiento de comandos de voz para raspberry pi usando aprendizaje automáticoapplication/pdf3025902https://repositorio.unbosque.edu.co/bitstreams/799a5197-01d1-460f-bcbf-3624aaa274f4/download061b524e3c456591dece53cbc9d8a024MD51Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdfMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdfCarta de autorizaciónapplication/pdf332882https://repositorio.unbosque.edu.co/bitstreams/aeb84ba4-6203-47bc-b4b9-7eea5d9e6ea6/download877cabfc259d644c418ea609579c336bMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/9666b2dc-ae8a-4484-900f-e3240d7534af/download934f4ca17e109e0a05eaeaba504d7ce4MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unbosque.edu.co/bitstreams/883fc8c1-a7f2-4664-b4d7-380aead72d10/download8a4605be74aa9ea9d79846c1fba20a33MD54THUMBNAILMorelo_Mejia_Ibrahimme_2021.pdf.jpgMorelo_Mejia_Ibrahimme_2021.pdf.jpgIM Thumbnailimage/jpeg5184https://repositorio.unbosque.edu.co/bitstreams/12ec7265-f637-4bec-95da-9695503c06cc/downloadfbbde5f25d255296f8f32387aa5fd675MD55Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.jpgMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.jpgIM Thumbnailimage/jpeg7878https://repositorio.unbosque.edu.co/bitstreams/1cb17082-6129-4abd-a108-592711353561/downloadca5046f7e81dbf988f32e9c75ba5b1f3MD56TEXTMorelo_Mejia_Ibrahimme_2021.pdf.txtMorelo_Mejia_Ibrahimme_2021.pdf.txtExtracted texttext/plain101267https://repositorio.unbosque.edu.co/bitstreams/9a2ba9a9-b5af-4902-843f-7e48273ad226/download25866b59d377905dd2c0edcb4cafc504MD57Morelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.txtMorelo_Mejia_Ibrahimme_2021_Carta_de_autorización.pdf.txtExtracted texttext/plain4804https://repositorio.unbosque.edu.co/bitstreams/fb53f8a9-ace1-4172-a201-63386b2a65a1/download568def4874a9ed54e4c8b6099a6dd101MD5820.500.12495/7150oai:repositorio.unbosque.edu.co:20.500.12495/71502024-02-07 02:28:03.322http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=