Técnicas para reconocimiento automático de locutores

La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2007
Institución:
Universidad Tecnológica de Bolívar
Repositorio:
Repositorio Institucional UTB
Idioma:
spa
OAI Identifier:
oai:repositorio.utb.edu.co:20.500.12585/554
Acceso en línea:
https://hdl.handle.net/20.500.12585/554
Palabra clave:
Reconocimiento automático de la voz
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UTB2_9c46e9d3ce4a6ced4ef5883cbe22e6aa
oai_identifier_str oai:repositorio.utb.edu.co:20.500.12585/554
network_acronym_str UTB2
network_name_str Repositorio Institucional UTB
repository_id_str
dc.title.none.fl_str_mv Técnicas para reconocimiento automático de locutores
title Técnicas para reconocimiento automático de locutores
spellingShingle Técnicas para reconocimiento automático de locutores
Reconocimiento automático de la voz
title_short Técnicas para reconocimiento automático de locutores
title_full Técnicas para reconocimiento automático de locutores
title_fullStr Técnicas para reconocimiento automático de locutores
title_full_unstemmed Técnicas para reconocimiento automático de locutores
title_sort Técnicas para reconocimiento automático de locutores
dc.contributor.director.none.fl_str_mv Gómez Vásquez, Eduardo
dc.subject.other.none.fl_str_mv Reconocimiento automático de la voz
topic Reconocimiento automático de la voz
description La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias entre los procesos de verificación e identificación desde la dependencia de texto, independencia de texto y texto solicitado. Para llegar a las técnicas de parametrización antes se citan los niveles de información de acuerdo con la facilidad o complejidad para extraer de estos, características de forma automática. Desde esta instancia se resuelve de manera general un sistema ASR a partir de cada una de sus etapas. En esta sección del documento se presentan los tipos de reconocimiento automático del habla de acuerdo con un conjunto de criterios. Cabe destacar que todas estas formas de reconocimiento se pueden hacer en función del portavoz y en consecuencia, todos los tipos de reconocimiento de habla que se exponen pueden ser validos para el reconocimiento de un locutor. Los niveles de información que aparecen en el primer capitulo descifran el alcance de las técnicas de parametrización y cual es realmente el estado del arte en cuanto a extracción de características. EL balance que se presenta es bastante completo, se incluyen los métodos tradicionales, pasando por los métodos espectrales y retomando aquellos que aparecen en las últimas publicaciones. De igual modo, en la etapa de clasificación, que no es mas que la técnica o conjunto de técnicas para la clasificación de características. Se ordena casi que de manera cronológica. Claro esta que en la mayoría de ellas, se hace una presentación de los fundamentos y alcances en cuanto al reconocimiento se refiere. En la parte final de esta sección se establece un marco experimental y comparativo entre las técnicas que constituyen el estado del arte. Finalmente, de acuerdo con los procesos de identificación y verificación de la primera parte, se presenta un inventario de las aplicaciones de los sistemas SIV. Aquí se tienen en cuenta las industrias y perfiles que ameritan incluirse en la clasificación de estas aplicaciones. También se explican los procedimientos intermedios involucrados por todo proceso SIV. También se establece un marco categórico para las aplicaciones y se explican detalladamente las aplicaciones comunes que en algunos lugares del mundo se han aplicado o se encuentran vigentes. Esta sección concluye con las tendencias y aplicaciones del futuro que según los expertos dominaran muchos sectores de la economía.
publishDate 2007
dc.date.created.none.fl_str_mv 2007
dc.date.issued.none.fl_str_mv 2007
dc.date.other.none.fl_str_mv 2007
dc.date.accessioned.none.fl_str_mv 2019-10-18T18:32:22Z
dc.date.available.none.fl_str_mv 2019-10-18T18:32:22Z
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.hasVersion.none.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.other.none.fl_str_mv (ALEPH)000018420UTB01
(janium) 18716
18714
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12585/554
dc.identifier.instname.none.fl_str_mv Universidad Tecnológica de Bolívar
dc.identifier.reponame.none.fl_str_mv Repositorio UTB
dc.identifier.ddc.none.fl_str_mv 621.3822 M186
identifier_str_mv (ALEPH)000018420UTB01
(janium) 18716
18714
Universidad Tecnológica de Bolívar
Repositorio UTB
621.3822 M186
url https://hdl.handle.net/20.500.12585/554
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessRights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.cc.none.fl_str_mv Atribución-NoComercial 4.0 Internacional
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
Atribución-NoComercial 4.0 Internacional
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 148 p
dc.format.medium.none.fl_str_mv CD-Rom
dc.format.mimetype.none.fl_str_mv application/pdf
dc.coverage.spatial.none.fl_str_mv Cartagena de Indias
dc.publisher.university.none.fl_str_mv Universidad Tecnológica de Bolívar
institution Universidad Tecnológica de Bolívar
dc.source.uri.none.fl_str_mv http://biblioteca.utb.edu.co/notas/tesis/0040351.pdf
bitstream.url.fl_str_mv https://repositorio.utb.edu.co/bitstream/20.500.12585/554/1/0040351.pdf
https://repositorio.utb.edu.co/bitstream/20.500.12585/554/4/0040351.pdf.txt
https://repositorio.utb.edu.co/bitstream/20.500.12585/554/5/0040351.pdf.jpg
bitstream.checksum.fl_str_mv 5b0a5e3e8bcfff96e6543adeb5744309
ba040a70080b8f064858d9ce7b981e10
e0186508061d09aa5ecbbd0d5c2dde9c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UTB
repository.mail.fl_str_mv repositorioutb@utb.edu.co
_version_ 1814021638026428416
spelling Los usuarios del Repositorio de la UTB estarán autorizados para adaptar, transformar y crear a partir del contenido de esta publicación incluso para fines comerciales, sin embargo toda obra derivada de la publicación original deberá ser distribuida bajo la misma licencia CC-BY-SA. El autor o autores, sin excepción deberán ser claramente identificados como titulares de los derechos de autor de la publicación original.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial 4.0 Internacionalhttp://purl.org/coar/access_right/c_abf2Cartagena de Indias2019-10-18T18:32:22Z2019-10-18T18:32:22Z200720072007(ALEPH)000018420UTB01(janium) 1871618714https://hdl.handle.net/20.500.12585/554Universidad Tecnológica de BolívarRepositorio UTB621.3822 M186La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias entre los procesos de verificación e identificación desde la dependencia de texto, independencia de texto y texto solicitado. Para llegar a las técnicas de parametrización antes se citan los niveles de información de acuerdo con la facilidad o complejidad para extraer de estos, características de forma automática. Desde esta instancia se resuelve de manera general un sistema ASR a partir de cada una de sus etapas. En esta sección del documento se presentan los tipos de reconocimiento automático del habla de acuerdo con un conjunto de criterios. Cabe destacar que todas estas formas de reconocimiento se pueden hacer en función del portavoz y en consecuencia, todos los tipos de reconocimiento de habla que se exponen pueden ser validos para el reconocimiento de un locutor. Los niveles de información que aparecen en el primer capitulo descifran el alcance de las técnicas de parametrización y cual es realmente el estado del arte en cuanto a extracción de características. EL balance que se presenta es bastante completo, se incluyen los métodos tradicionales, pasando por los métodos espectrales y retomando aquellos que aparecen en las últimas publicaciones. De igual modo, en la etapa de clasificación, que no es mas que la técnica o conjunto de técnicas para la clasificación de características. Se ordena casi que de manera cronológica. Claro esta que en la mayoría de ellas, se hace una presentación de los fundamentos y alcances en cuanto al reconocimiento se refiere. En la parte final de esta sección se establece un marco experimental y comparativo entre las técnicas que constituyen el estado del arte. Finalmente, de acuerdo con los procesos de identificación y verificación de la primera parte, se presenta un inventario de las aplicaciones de los sistemas SIV. Aquí se tienen en cuenta las industrias y perfiles que ameritan incluirse en la clasificación de estas aplicaciones. También se explican los procedimientos intermedios involucrados por todo proceso SIV. También se establece un marco categórico para las aplicaciones y se explican detalladamente las aplicaciones comunes que en algunos lugares del mundo se han aplicado o se encuentran vigentes. Esta sección concluye con las tendencias y aplicaciones del futuro que según los expertos dominaran muchos sectores de la economía.Incluye bibliografía148 pCD-Romapplication/pdfspahttp://biblioteca.utb.edu.co/notas/tesis/0040351.pdfReconocimiento automático de la vozTécnicas para reconocimiento automático de locutoresUniversidad Tecnológica de Bolívarinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85http://purl.org/coar/resource_type/c_7a1fGómez Vásquez, EduardoMaestre R., JoséSerje D., Christianhttp://purl.org/coar/resource_type/c_7a1fIngeniería EléctricaTesis pregradoIngeniero ElectricistaUniversidad Tecnológica de BolivarORIGINAL0040351.pdfapplication/pdf2272695https://repositorio.utb.edu.co/bitstream/20.500.12585/554/1/0040351.pdf5b0a5e3e8bcfff96e6543adeb5744309MD51TEXT0040351.pdf.txt0040351.pdf.txtExtracted texttext/plain298241https://repositorio.utb.edu.co/bitstream/20.500.12585/554/4/0040351.pdf.txtba040a70080b8f064858d9ce7b981e10MD54THUMBNAIL0040351.pdf.jpg0040351.pdf.jpgGenerated Thumbnailimage/jpeg17438https://repositorio.utb.edu.co/bitstream/20.500.12585/554/5/0040351.pdf.jpge0186508061d09aa5ecbbd0d5c2dde9cMD5520.500.12585/554oai:repositorio.utb.edu.co:20.500.12585/5542020-10-22 15:08:43.679Repositorio Institucional UTBrepositorioutb@utb.edu.co