Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza

La Ley 906 de 2004 otorga a los fiscales la facultad para interceptar comunicaciones, bajo el cumplimiento de los requisitos legales. Esta herramienta, clave en investigaciones penales, enfrenta desafíos crecientes debido a la adopción de las tecnologías de comunicación encriptada y el alto volumen...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Rosario
Repositorio:
Repositorio EdocUR - U. Rosario
Idioma:
spa
OAI Identifier:
oai:repository.urosario.edu.co:10336/43409
Acceso en línea:
https://repository.urosario.edu.co/handle/10336/43409
Palabra clave:
Espectogramas
Convolucional
Red neuronal
Interceptación de comunicaciones
Huella de voz
Spectrograms, convolutional, neural network, communications interception, voice print
Rights
License
Attribution-NonCommercial 4.0 International
id EDOCUR2_15ceaa61ae9f4f9e91c2406f2cea1814
oai_identifier_str oai:repository.urosario.edu.co:10336/43409
network_acronym_str EDOCUR2
network_name_str Repositorio EdocUR - U. Rosario
repository_id_str
dc.title.none.fl_str_mv Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
dc.title.TranslatedTitle.none.fl_str_mv Voice recognition system: an application to increase the efficiency of the Esperanza system
title Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
spellingShingle Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
Espectogramas
Convolucional
Red neuronal
Interceptación de comunicaciones
Huella de voz
Spectrograms, convolutional, neural network, communications interception, voice print
title_short Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
title_full Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
title_fullStr Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
title_full_unstemmed Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
title_sort Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
dc.contributor.advisor.none.fl_str_mv Morales Pinto, Yiby Karolina
dc.contributor.gruplac.none.fl_str_mv Matemáticas Aplicadas y Computación - MACC
dc.subject.none.fl_str_mv Espectogramas
Convolucional
Red neuronal
Interceptación de comunicaciones
Huella de voz
topic Espectogramas
Convolucional
Red neuronal
Interceptación de comunicaciones
Huella de voz
Spectrograms, convolutional, neural network, communications interception, voice print
dc.subject.keyword.none.fl_str_mv Spectrograms, convolutional, neural network, communications interception, voice print
description La Ley 906 de 2004 otorga a los fiscales la facultad para interceptar comunicaciones, bajo el cumplimiento de los requisitos legales. Esta herramienta, clave en investigaciones penales, enfrenta desafíos crecientes debido a la adopción de las tecnologías de comunicación encriptada y el alto volumen de datos. En este contexto, surge la necesidad de implementar nuevas metodologías de an´alisis de datos que incrementen la eficiencia del sistema de interceptación de comunicaciones. El reconocimiento e identificación de voz es una de estas metodologías, permitiendo a través de la generación de una huella digital, identificar y rastrear a la persona a la que pertenece dicha huella dentro de un conjunto de datos. Esta t´ecnica resulta particularmente útil en el contexto judicial, ya que facilita la asociación de casos y mejora la eficiencia del sistema al identificar si una misma persona está siendo o ha sido monitoreada en diferentes salas posibilitando la construcción de casos m´as sólidos. La base t´ecnica de este método incluye el an´alisis de frecuencias de sonido y el uso de espectrogramas, que actúan como huellas digitales en la identificación de voces. Para el análisis de estos datos se emplean dos modelos de redes neuronales convolucionales, modelos que son ampliamente usados para el an´alisis de este tipo de datos no estructurados. Las métricas de desempeño calculadas para cada uno de los modelos y experimentos diseñados muestran resultados satisfactorios para la solución del problema de identificación del hablante, sin embargo, uno de los modelos planteados domina todas las métricas aplicadas, siendo este el candidato para su implementación.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-09-17T20:52:12Z
dc.date.available.none.fl_str_mv 2024-09-17T20:52:12Z
dc.date.created.none.fl_str_mv 2024-05-25
dc.type.none.fl_str_mv bachelorThesis
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.document.none.fl_str_mv Trabajo de grado
dc.type.spa.none.fl_str_mv Trabajo de grado
dc.identifier.uri.none.fl_str_mv https://repository.urosario.edu.co/handle/10336/43409
url https://repository.urosario.edu.co/handle/10336/43409
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Attribution-NonCommercial 4.0 International
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.acceso.none.fl_str_mv Abierto (Texto Completo)
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
rights_invalid_str_mv Attribution-NonCommercial 4.0 International
Abierto (Texto Completo)
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 44 pp
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad del Rosario
dc.publisher.department.spa.fl_str_mv Escuela de Ingeniería, Ciencia y Tecnología
dc.publisher.program.spa.fl_str_mv Maestría en Matemáticas Aplicadas y Ciencias de la Computación
institution Universidad del Rosario
dc.source.bibliographicCitation.none.fl_str_mv C. Macleoad, abracadabra: How does Shazam work? https://www.cameronmacleod.com/blog/howdoes-shazam-work, 2022.
F. G. de la Naci´on, “Directiva 0004,” Fiscal´ıa General de la Naci´on, 2021.
Fiscalia General de la Naci´on, “Directiva 004 de 2021,” 2021, 02 de noviembre de 2021.
R. S. U. Investigativa, “Esperanza: el misterioso sistema de interceptaciones del caso uribe- cepeda,” Revista Semana, 2018.
A. L.-C. Wang, “An industrial-strength audio search algorithm,” Shazam Entertainment, Ltd., 2013.
H. Salehghaffari, “Speaker verification using convolutional neuronal networks,” Control Research Laboratory, vol. 14, no. 3, pp. 342–351, 2018.
A. K. M. S. M. B. M. Wang, T. Sirlapu and R. Nicolas, “Speaker recognition using convolutional neural network with minimal training data for smart home solutions,” International Conference on Human System Interaction (HSI), vol. 14, pp. 139–145, 2018.
Y. Jia, X. Chen, J. Yu et al., “Speaker recognition based on characteristic spectrograms and an improved self-organizing feature map neural network,” Complex Intelligent Systems, vol. 7, pp. 1749–1757, 2021. [Online]. Available: https://doi.org/10.1007/s40747-020-00172-1
N. K. J. Hourri, Soufiane. Nikolo, “Convolutional neural network vectors forspeaker recognition,” Vol.:(0123456789)1 3International Journal of Speech Technology, vol. 24, pp. 389–400, 2021.
S. R. Arshad, S. M. Haider, and A. B. Mughal, “Speaker identification using speech recognition,” ArXiv, vol. abs/2205.14649, 2022.
C. Li, X. Ma, B. Jiang, X. Li, X. Zhang, X. Liu, Y. Cao, A. Kannan, and Z. Zhu, “Deep speaker: an end-to-end neural speaker embedding system,” 2017.
N. Dave, “Feature extraction methods lpc, plp and mfcc in speech recognition,” International Journal For Advance Research in Engineering And Technology(ISSN 2320-6802), vol. Volume 1, 07 2013.
dc.source.instname.none.fl_str_mv instname:Universidad del Rosario
dc.source.reponame.spa.fl_str_mv reponame:Repositorio Institucional EdocUR
bitstream.url.fl_str_mv https://repository.urosario.edu.co/bitstreams/0d8c8732-17cb-434d-ad84-6fcc605db169/download
https://repository.urosario.edu.co/bitstreams/5ba0cee9-3175-4737-973b-d432276df4cb/download
https://repository.urosario.edu.co/bitstreams/91615acb-9e09-4fee-8925-2b5b0545c2d5/download
https://repository.urosario.edu.co/bitstreams/acc9eca0-8b5b-459a-b075-236cdf67ba0d/download
https://repository.urosario.edu.co/bitstreams/ffc684fa-b66d-4add-a8bb-2f26ba5eadee/download
bitstream.checksum.fl_str_mv b2825df9f458e9d5d96ee8b7cd74fde6
d93f5db78fcf73cec9795c8fea744a8b
649c650a61ebbd6cab2656cd7038f379
f95c362a5feb0616c8a82a036ca30079
db0a173ddf88eb975360a67346c4fa59
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional EdocUR
repository.mail.fl_str_mv edocur@urosario.edu.co
_version_ 1814167483775451136
spelling Morales Pinto, Yiby Karolina1020737718-1Matemáticas Aplicadas y Computación - MACCLizarazo Malambo, WilliamMagíster en Matemáticas Aplicadas y Ciencias de la ComputaciónFull time3bc1beb2-6cfc-44da-9696-cf3a83fe984e-12024-09-17T20:52:12Z2024-09-17T20:52:12Z2024-05-25La Ley 906 de 2004 otorga a los fiscales la facultad para interceptar comunicaciones, bajo el cumplimiento de los requisitos legales. Esta herramienta, clave en investigaciones penales, enfrenta desafíos crecientes debido a la adopción de las tecnologías de comunicación encriptada y el alto volumen de datos. En este contexto, surge la necesidad de implementar nuevas metodologías de an´alisis de datos que incrementen la eficiencia del sistema de interceptación de comunicaciones. El reconocimiento e identificación de voz es una de estas metodologías, permitiendo a través de la generación de una huella digital, identificar y rastrear a la persona a la que pertenece dicha huella dentro de un conjunto de datos. Esta t´ecnica resulta particularmente útil en el contexto judicial, ya que facilita la asociación de casos y mejora la eficiencia del sistema al identificar si una misma persona está siendo o ha sido monitoreada en diferentes salas posibilitando la construcción de casos m´as sólidos. La base t´ecnica de este método incluye el an´alisis de frecuencias de sonido y el uso de espectrogramas, que actúan como huellas digitales en la identificación de voces. Para el análisis de estos datos se emplean dos modelos de redes neuronales convolucionales, modelos que son ampliamente usados para el an´alisis de este tipo de datos no estructurados. Las métricas de desempeño calculadas para cada uno de los modelos y experimentos diseñados muestran resultados satisfactorios para la solución del problema de identificación del hablante, sin embargo, uno de los modelos planteados domina todas las métricas aplicadas, siendo este el candidato para su implementación.Law 906 of 2004 grants prosecutors the power to intercept communications, subject to compliance with legal requirements. This tool, key in criminal investigations, faces growing challenges due to the adoption of encrypted communication technologies and the high volume of data. In this context, the need arises to implement new data analysis methodologies that increase the efficiency of the communications interception system. Voice recognition and identification is one of these methodologies, allowing, through the generation of a digital fingerprint, to identify and track the person to whom said fingerprint belongs within a set of data. This technique is particularly useful in the judicial context, since it facilitates the association of cases and improves the efficiency of the system by identifying whether the same person is being or has been monitored in different rooms, enabling the construction of more solid cases. The technical basis of this method includes the analysis of sound frequencies and the use of spectrograms, which act as fingerprints in the identification of voices. To analyze this data, two convolutional neural network models are used, models that are widely used for the analysis of this type of unstructured data. The performance metrics calculated for each of the designed models and experiments show satisfactory results for solving the speaker identification problem, however, one of the proposed models dominates all the applied metrics, making this the candidate for implementation.44 ppapplication/pdfhttps://repository.urosario.edu.co/handle/10336/43409spaUniversidad del RosarioEscuela de Ingeniería, Ciencia y TecnologíaMaestría en Matemáticas Aplicadas y Ciencias de la ComputaciónAttribution-NonCommercial 4.0 InternationalAbierto (Texto Completo)http://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2C. Macleoad, abracadabra: How does Shazam work? https://www.cameronmacleod.com/blog/howdoes-shazam-work, 2022.F. G. de la Naci´on, “Directiva 0004,” Fiscal´ıa General de la Naci´on, 2021.Fiscalia General de la Naci´on, “Directiva 004 de 2021,” 2021, 02 de noviembre de 2021.R. S. U. Investigativa, “Esperanza: el misterioso sistema de interceptaciones del caso uribe- cepeda,” Revista Semana, 2018.A. L.-C. Wang, “An industrial-strength audio search algorithm,” Shazam Entertainment, Ltd., 2013.H. Salehghaffari, “Speaker verification using convolutional neuronal networks,” Control Research Laboratory, vol. 14, no. 3, pp. 342–351, 2018.A. K. M. S. M. B. M. Wang, T. Sirlapu and R. Nicolas, “Speaker recognition using convolutional neural network with minimal training data for smart home solutions,” International Conference on Human System Interaction (HSI), vol. 14, pp. 139–145, 2018.Y. Jia, X. Chen, J. Yu et al., “Speaker recognition based on characteristic spectrograms and an improved self-organizing feature map neural network,” Complex Intelligent Systems, vol. 7, pp. 1749–1757, 2021. [Online]. Available: https://doi.org/10.1007/s40747-020-00172-1N. K. J. Hourri, Soufiane. Nikolo, “Convolutional neural network vectors forspeaker recognition,” Vol.:(0123456789)1 3International Journal of Speech Technology, vol. 24, pp. 389–400, 2021.S. R. Arshad, S. M. Haider, and A. B. Mughal, “Speaker identification using speech recognition,” ArXiv, vol. abs/2205.14649, 2022.C. Li, X. Ma, B. Jiang, X. Li, X. Zhang, X. Liu, Y. Cao, A. Kannan, and Z. Zhu, “Deep speaker: an end-to-end neural speaker embedding system,” 2017.N. Dave, “Feature extraction methods lpc, plp and mfcc in speech recognition,” International Journal For Advance Research in Engineering And Technology(ISSN 2320-6802), vol. Volume 1, 07 2013.instname:Universidad del Rosarioreponame:Repositorio Institucional EdocUREspectogramasConvolucionalRed neuronalInterceptación de comunicacionesHuella de vozSpectrograms, convolutional, neural network, communications interception, voice printSistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanzaVoice recognition system: an application to increase the efficiency of the Esperanza systembachelorThesisTrabajo de gradoTrabajo de gradohttp://purl.org/coar/resource_type/c_7a1fEscuela de Ingeniería, Ciencia y TecnologíaBogotáLICENSElicense.txtlicense.txttext/plain1483https://repository.urosario.edu.co/bitstreams/0d8c8732-17cb-434d-ad84-6fcc605db169/downloadb2825df9f458e9d5d96ee8b7cd74fde6MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81025https://repository.urosario.edu.co/bitstreams/5ba0cee9-3175-4737-973b-d432276df4cb/downloadd93f5db78fcf73cec9795c8fea744a8bMD53ORIGINALSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdfSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdfapplication/pdf2472490https://repository.urosario.edu.co/bitstreams/91615acb-9e09-4fee-8925-2b5b0545c2d5/download649c650a61ebbd6cab2656cd7038f379MD54TEXTSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdf.txtSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdf.txtExtracted texttext/plain86939https://repository.urosario.edu.co/bitstreams/acc9eca0-8b5b-459a-b075-236cdf67ba0d/downloadf95c362a5feb0616c8a82a036ca30079MD55THUMBNAILSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdf.jpgSistema_de_reconocimiento_de_voz_una_aplicacion_para_aumentar_la_eficiencia_del_sistema_esperanza.pdf.jpgGenerated Thumbnailimage/jpeg2627https://repository.urosario.edu.co/bitstreams/ffc684fa-b66d-4add-a8bb-2f26ba5eadee/downloaddb0a173ddf88eb975360a67346c4fa59MD5610336/43409oai:repository.urosario.edu.co:10336/434092024-09-18 03:00:53.572http://creativecommons.org/licenses/by-nc/4.0/Attribution-NonCommercial 4.0 Internationalhttps://repository.urosario.edu.coRepositorio institucional EdocURedocur@urosario.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8gbGEgb2JyYSBlcyBkZSBleGNsdXNpdmEgYXV0b3LDrWEgeSB0aWVuZSBsYSB0aXR1bGFyaWRhZCBzb2JyZSBsYSBtaXNtYS4KPGJyLz4KUEFSQUdSQUZPOiBFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgRUwgQVVUT1IsIGFzdW1pcsOhIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkLCB5IHNhbGRyw6EgZW4gZGVmZW5zYSBkZSBsb3MgZGVyZWNob3MgYXF1w60gYXV0b3JpemFkb3M7IHBhcmEgdG9kb3MgbG9zIGVmZWN0b3MgbGEgdW5pdmVyc2lkYWQgYWN0w7phIGNvbW8gdW4gdGVyY2VybyBkZSBidWVuYSBmZS4KPGhyLz4KRUwgQVVUT1IsIGF1dG9yaXphIGEgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8sICBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBhbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCAgdXRpbGljZSB5IHVzZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuLgoKLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KClBPTElUSUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuIERlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcyBwb3IgcGFydGUgZGUgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8gIHBhcmEgZmluZXMgYWNhZMOpbWljb3MgeSBlbiBhcGxpY2FjacOzbiBkZSBjb252ZW5pb3MgY29uIHRlcmNlcm9zIG8gc2VydmljaW9zIGNvbmV4b3MgY29uIGFjdGl2aWRhZGVzIHByb3BpYXMgZGUgbGEgYWNhZGVtaWEsIGNvbiBlc3RyaWN0byBjdW1wbGltaWVudG8gZGUgbG9zIHByaW5jaXBpb3MgZGUgbGV5LiBQYXJhIGVsIGNvcnJlY3RvIGVqZXJjaWNpbyBkZSBtaSBkZXJlY2hvIGRlIGhhYmVhcyBkYXRhICBjdWVudG8gY29uIGxhIGN1ZW50YSBkZSBjb3JyZW8gaGFiZWFzZGF0YUB1cm9zYXJpby5lZHUuY28sIGRvbmRlIHByZXZpYSBpZGVudGlmaWNhY2nDs24gIHBvZHLDqSBzb2xpY2l0YXIgbGEgY29uc3VsdGEsIGNvcnJlY2Npw7NuIHkgc3VwcmVzacOzbiBkZSBtaXMgZGF0b3MuCg==