Técnicas para reconocimiento automático de locutores
La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias...
- Autores:
- Tipo de recurso:
- Fecha de publicación:
- 2007
- Institución:
- Universidad Tecnológica de Bolívar
- Repositorio:
- Repositorio Institucional UTB
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.utb.edu.co:20.500.12585/554
- Acceso en línea:
- https://hdl.handle.net/20.500.12585/554
- Palabra clave:
- Reconocimiento automático de la voz
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UTB2_9c46e9d3ce4a6ced4ef5883cbe22e6aa |
---|---|
oai_identifier_str |
oai:repositorio.utb.edu.co:20.500.12585/554 |
network_acronym_str |
UTB2 |
network_name_str |
Repositorio Institucional UTB |
repository_id_str |
|
dc.title.none.fl_str_mv |
Técnicas para reconocimiento automático de locutores |
title |
Técnicas para reconocimiento automático de locutores |
spellingShingle |
Técnicas para reconocimiento automático de locutores Reconocimiento automático de la voz |
title_short |
Técnicas para reconocimiento automático de locutores |
title_full |
Técnicas para reconocimiento automático de locutores |
title_fullStr |
Técnicas para reconocimiento automático de locutores |
title_full_unstemmed |
Técnicas para reconocimiento automático de locutores |
title_sort |
Técnicas para reconocimiento automático de locutores |
dc.contributor.director.none.fl_str_mv |
Gómez Vásquez, Eduardo |
dc.subject.other.none.fl_str_mv |
Reconocimiento automático de la voz |
topic |
Reconocimiento automático de la voz |
description |
La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias entre los procesos de verificación e identificación desde la dependencia de texto, independencia de texto y texto solicitado. Para llegar a las técnicas de parametrización antes se citan los niveles de información de acuerdo con la facilidad o complejidad para extraer de estos, características de forma automática. Desde esta instancia se resuelve de manera general un sistema ASR a partir de cada una de sus etapas. En esta sección del documento se presentan los tipos de reconocimiento automático del habla de acuerdo con un conjunto de criterios. Cabe destacar que todas estas formas de reconocimiento se pueden hacer en función del portavoz y en consecuencia, todos los tipos de reconocimiento de habla que se exponen pueden ser validos para el reconocimiento de un locutor. Los niveles de información que aparecen en el primer capitulo descifran el alcance de las técnicas de parametrización y cual es realmente el estado del arte en cuanto a extracción de características. EL balance que se presenta es bastante completo, se incluyen los métodos tradicionales, pasando por los métodos espectrales y retomando aquellos que aparecen en las últimas publicaciones. De igual modo, en la etapa de clasificación, que no es mas que la técnica o conjunto de técnicas para la clasificación de características. Se ordena casi que de manera cronológica. Claro esta que en la mayoría de ellas, se hace una presentación de los fundamentos y alcances en cuanto al reconocimiento se refiere. En la parte final de esta sección se establece un marco experimental y comparativo entre las técnicas que constituyen el estado del arte. Finalmente, de acuerdo con los procesos de identificación y verificación de la primera parte, se presenta un inventario de las aplicaciones de los sistemas SIV. Aquí se tienen en cuenta las industrias y perfiles que ameritan incluirse en la clasificación de estas aplicaciones. También se explican los procedimientos intermedios involucrados por todo proceso SIV. También se establece un marco categórico para las aplicaciones y se explican detalladamente las aplicaciones comunes que en algunos lugares del mundo se han aplicado o se encuentran vigentes. Esta sección concluye con las tendencias y aplicaciones del futuro que según los expertos dominaran muchos sectores de la economía. |
publishDate |
2007 |
dc.date.created.none.fl_str_mv |
2007 |
dc.date.issued.none.fl_str_mv |
2007 |
dc.date.other.none.fl_str_mv |
2007 |
dc.date.accessioned.none.fl_str_mv |
2019-10-18T18:32:22Z |
dc.date.available.none.fl_str_mv |
2019-10-18T18:32:22Z |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.hasVersion.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.other.none.fl_str_mv |
(ALEPH)000018420UTB01 (janium) 18716 18714 |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12585/554 |
dc.identifier.instname.none.fl_str_mv |
Universidad Tecnológica de Bolívar |
dc.identifier.reponame.none.fl_str_mv |
Repositorio UTB |
dc.identifier.ddc.none.fl_str_mv |
621.3822 M186 |
identifier_str_mv |
(ALEPH)000018420UTB01 (janium) 18716 18714 Universidad Tecnológica de Bolívar Repositorio UTB 621.3822 M186 |
url |
https://hdl.handle.net/20.500.12585/554 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessRights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.cc.none.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ Atribución-NoComercial 4.0 Internacional http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
148 p |
dc.format.medium.none.fl_str_mv |
CD-Rom |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.coverage.spatial.none.fl_str_mv |
Cartagena de Indias |
dc.publisher.university.none.fl_str_mv |
Universidad Tecnológica de Bolívar |
institution |
Universidad Tecnológica de Bolívar |
dc.source.uri.none.fl_str_mv |
http://biblioteca.utb.edu.co/notas/tesis/0040351.pdf |
bitstream.url.fl_str_mv |
https://repositorio.utb.edu.co/bitstream/20.500.12585/554/1/0040351.pdf https://repositorio.utb.edu.co/bitstream/20.500.12585/554/4/0040351.pdf.txt https://repositorio.utb.edu.co/bitstream/20.500.12585/554/5/0040351.pdf.jpg |
bitstream.checksum.fl_str_mv |
5b0a5e3e8bcfff96e6543adeb5744309 ba040a70080b8f064858d9ce7b981e10 e0186508061d09aa5ecbbd0d5c2dde9c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional UTB |
repository.mail.fl_str_mv |
repositorioutb@utb.edu.co |
_version_ |
1814021638026428416 |
spelling |
Los usuarios del Repositorio de la UTB estarán autorizados para adaptar, transformar y crear a partir del contenido de esta publicación incluso para fines comerciales, sin embargo toda obra derivada de la publicación original deberá ser distribuida bajo la misma licencia CC-BY-SA. El autor o autores, sin excepción deberán ser claramente identificados como titulares de los derechos de autor de la publicación original.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial 4.0 Internacionalhttp://purl.org/coar/access_right/c_abf2Cartagena de Indias2019-10-18T18:32:22Z2019-10-18T18:32:22Z200720072007(ALEPH)000018420UTB01(janium) 1871618714https://hdl.handle.net/20.500.12585/554Universidad Tecnológica de BolívarRepositorio UTB621.3822 M186La monografía que se presenta en este documento esta orientada básicamente a la tarea del reconocimiento de un locutor. Para tal propósito, se ha empezado con la definición de esta tarea y de las formas validas que hay para llevarse a cabo. En el capitulo introductorio se establecen las diferencias entre los procesos de verificación e identificación desde la dependencia de texto, independencia de texto y texto solicitado. Para llegar a las técnicas de parametrización antes se citan los niveles de información de acuerdo con la facilidad o complejidad para extraer de estos, características de forma automática. Desde esta instancia se resuelve de manera general un sistema ASR a partir de cada una de sus etapas. En esta sección del documento se presentan los tipos de reconocimiento automático del habla de acuerdo con un conjunto de criterios. Cabe destacar que todas estas formas de reconocimiento se pueden hacer en función del portavoz y en consecuencia, todos los tipos de reconocimiento de habla que se exponen pueden ser validos para el reconocimiento de un locutor. Los niveles de información que aparecen en el primer capitulo descifran el alcance de las técnicas de parametrización y cual es realmente el estado del arte en cuanto a extracción de características. EL balance que se presenta es bastante completo, se incluyen los métodos tradicionales, pasando por los métodos espectrales y retomando aquellos que aparecen en las últimas publicaciones. De igual modo, en la etapa de clasificación, que no es mas que la técnica o conjunto de técnicas para la clasificación de características. Se ordena casi que de manera cronológica. Claro esta que en la mayoría de ellas, se hace una presentación de los fundamentos y alcances en cuanto al reconocimiento se refiere. En la parte final de esta sección se establece un marco experimental y comparativo entre las técnicas que constituyen el estado del arte. Finalmente, de acuerdo con los procesos de identificación y verificación de la primera parte, se presenta un inventario de las aplicaciones de los sistemas SIV. Aquí se tienen en cuenta las industrias y perfiles que ameritan incluirse en la clasificación de estas aplicaciones. También se explican los procedimientos intermedios involucrados por todo proceso SIV. También se establece un marco categórico para las aplicaciones y se explican detalladamente las aplicaciones comunes que en algunos lugares del mundo se han aplicado o se encuentran vigentes. Esta sección concluye con las tendencias y aplicaciones del futuro que según los expertos dominaran muchos sectores de la economía.Incluye bibliografía148 pCD-Romapplication/pdfspahttp://biblioteca.utb.edu.co/notas/tesis/0040351.pdfReconocimiento automático de la vozTécnicas para reconocimiento automático de locutoresUniversidad Tecnológica de Bolívarinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85http://purl.org/coar/resource_type/c_7a1fGómez Vásquez, EduardoMaestre R., JoséSerje D., Christianhttp://purl.org/coar/resource_type/c_7a1fIngeniería EléctricaTesis pregradoIngeniero ElectricistaUniversidad Tecnológica de BolivarORIGINAL0040351.pdfapplication/pdf2272695https://repositorio.utb.edu.co/bitstream/20.500.12585/554/1/0040351.pdf5b0a5e3e8bcfff96e6543adeb5744309MD51TEXT0040351.pdf.txt0040351.pdf.txtExtracted texttext/plain298241https://repositorio.utb.edu.co/bitstream/20.500.12585/554/4/0040351.pdf.txtba040a70080b8f064858d9ce7b981e10MD54THUMBNAIL0040351.pdf.jpg0040351.pdf.jpgGenerated Thumbnailimage/jpeg17438https://repositorio.utb.edu.co/bitstream/20.500.12585/554/5/0040351.pdf.jpge0186508061d09aa5ecbbd0d5c2dde9cMD5520.500.12585/554oai:repositorio.utb.edu.co:20.500.12585/5542020-10-22 15:08:43.679Repositorio Institucional UTBrepositorioutb@utb.edu.co |