Recuperación de información bilingüe

En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lengua...

Full description

Autores:
Támara López, Daniel Enrique
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/56996
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/56996
http://bdigital.unal.edu.co/53058/
Palabra clave:
4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLAB