Recuperación de información bilingüe
En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lengua...
- Autores:
-
Támara López, Daniel Enrique
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/56996
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/56996
http://bdigital.unal.edu.co/53058/
- Palabra clave:
- 4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLAB |
---|