Recuperación de información bilingüe

En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lengua...

Full description

Autores:
Támara López, Daniel Enrique
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/56996
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/56996
http://bdigital.unal.edu.co/53058/
Palabra clave:
4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_1e15c0dcb39308227dec000f790467da
oai_identifier_str oai:repositorio.unal.edu.co:unal/56996
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Acosta Medina, Carlos Daniel (Thesis advisor)794beb7e-0d16-4ef9-83ce-e43e6d1e038bMejía Salazar, Carlos Enrique (Thesis advisor)7a5b0dc4-e789-4105-b446-e4de7557b2f1Támara López, Daniel Enrique9c13b75a-5169-4e3f-bbaa-0cf44afbf73d3002019-07-02T12:18:40Z2019-07-02T12:18:40Z2016https://repositorio.unal.edu.co/handle/unal/56996http://bdigital.unal.edu.co/53058/En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLABThis thesis presents a method for the recovery of bilingual information based in Semidiscrete Matrix Decomposition (SDD). Four cases studies that exhibit the performance of use LSI via SDD for cross-language information retrieval (CLIR) are displayed. Concurrently these results are compared with those obtained by applying LSI via singular value decomposition (SVD). Two languages (english and spanish) are combined by adding a small portion of documents in a language to the corresponding document in the other language. The routines used to implement and compare methods are proper and implemented in MATLABMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ciencias Exactas y Naturales Departamento de Matemáticas y EstadísticaDepartamento de Matemáticas y EstadísticaTámara López, Daniel Enrique (2016) Recuperación de información bilingüe. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.4 Lenguas / Language41 Ligüística / Linguistics51 Matemáticas / MathematicsRecuperación de informaciónIndexación semántica latenteDescomposición semidiscretaDescomposición en valores singularesIdiomas cruzadosInformation retrievalLatent semantic indexingSemidiscrete decompositionSingular value decompositionCross-languajeRecuperación de información bilingüeTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1102841908.2016.pdfTesis de Maestría en Ciencias - Matemática Aplicadaapplication/pdf522189https://repositorio.unal.edu.co/bitstream/unal/56996/1/1102841908.2016.pdff8e2c46a414440fe095a76220925fbbbMD51THUMBNAIL1102841908.2016.pdf.jpg1102841908.2016.pdf.jpgGenerated Thumbnailimage/jpeg4063https://repositorio.unal.edu.co/bitstream/unal/56996/2/1102841908.2016.pdf.jpg17610bd820b4a2948ea8afb11e2ba5cbMD52unal/56996oai:repositorio.unal.edu.co:unal/569962024-04-29 08:07:06.789Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Recuperación de información bilingüe
title Recuperación de información bilingüe
spellingShingle Recuperación de información bilingüe
4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
title_short Recuperación de información bilingüe
title_full Recuperación de información bilingüe
title_fullStr Recuperación de información bilingüe
title_full_unstemmed Recuperación de información bilingüe
title_sort Recuperación de información bilingüe
dc.creator.fl_str_mv Támara López, Daniel Enrique
dc.contributor.advisor.spa.fl_str_mv Acosta Medina, Carlos Daniel (Thesis advisor)
Mejía Salazar, Carlos Enrique (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Támara López, Daniel Enrique
dc.subject.ddc.spa.fl_str_mv 4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
topic 4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
dc.subject.proposal.spa.fl_str_mv Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
description En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLAB
publishDate 2016
dc.date.issued.spa.fl_str_mv 2016
dc.date.accessioned.spa.fl_str_mv 2019-07-02T12:18:40Z
dc.date.available.spa.fl_str_mv 2019-07-02T12:18:40Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/56996
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/53058/
url https://repositorio.unal.edu.co/handle/unal/56996
http://bdigital.unal.edu.co/53058/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ciencias Exactas y Naturales Departamento de Matemáticas y Estadística
Departamento de Matemáticas y Estadística
dc.relation.references.spa.fl_str_mv Támara López, Daniel Enrique (2016) Recuperación de información bilingüe. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/56996/1/1102841908.2016.pdf
https://repositorio.unal.edu.co/bitstream/unal/56996/2/1102841908.2016.pdf.jpg
bitstream.checksum.fl_str_mv f8e2c46a414440fe095a76220925fbbb
17610bd820b4a2948ea8afb11e2ba5cb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886031503392768