Recuperación de información bilingüe
En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lengua...
- Autores:
-
Támara López, Daniel Enrique
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/56996
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/56996
http://bdigital.unal.edu.co/53058/
- Palabra clave:
- 4 Lenguas / Language
41 Ligüística / Linguistics
51 Matemáticas / Mathematics
Recuperación de información
Indexación semántica latente
Descomposición semidiscreta
Descomposición en valores singulares
Idiomas cruzados
Information retrieval
Latent semantic indexing
Semidiscrete decomposition
Singular value decomposition
Cross-languaje
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_1e15c0dcb39308227dec000f790467da |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/56996 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Acosta Medina, Carlos Daniel (Thesis advisor)794beb7e-0d16-4ef9-83ce-e43e6d1e038bMejía Salazar, Carlos Enrique (Thesis advisor)7a5b0dc4-e789-4105-b446-e4de7557b2f1Támara López, Daniel Enrique9c13b75a-5169-4e3f-bbaa-0cf44afbf73d3002019-07-02T12:18:40Z2019-07-02T12:18:40Z2016https://repositorio.unal.edu.co/handle/unal/56996http://bdigital.unal.edu.co/53058/En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLABThis thesis presents a method for the recovery of bilingual information based in Semidiscrete Matrix Decomposition (SDD). Four cases studies that exhibit the performance of use LSI via SDD for cross-language information retrieval (CLIR) are displayed. Concurrently these results are compared with those obtained by applying LSI via singular value decomposition (SVD). Two languages (english and spanish) are combined by adding a small portion of documents in a language to the corresponding document in the other language. The routines used to implement and compare methods are proper and implemented in MATLABMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ciencias Exactas y Naturales Departamento de Matemáticas y EstadísticaDepartamento de Matemáticas y EstadísticaTámara López, Daniel Enrique (2016) Recuperación de información bilingüe. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.4 Lenguas / Language41 Ligüística / Linguistics51 Matemáticas / MathematicsRecuperación de informaciónIndexación semántica latenteDescomposición semidiscretaDescomposición en valores singularesIdiomas cruzadosInformation retrievalLatent semantic indexingSemidiscrete decompositionSingular value decompositionCross-languajeRecuperación de información bilingüeTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1102841908.2016.pdfTesis de Maestría en Ciencias - Matemática Aplicadaapplication/pdf522189https://repositorio.unal.edu.co/bitstream/unal/56996/1/1102841908.2016.pdff8e2c46a414440fe095a76220925fbbbMD51THUMBNAIL1102841908.2016.pdf.jpg1102841908.2016.pdf.jpgGenerated Thumbnailimage/jpeg4063https://repositorio.unal.edu.co/bitstream/unal/56996/2/1102841908.2016.pdf.jpg17610bd820b4a2948ea8afb11e2ba5cbMD52unal/56996oai:repositorio.unal.edu.co:unal/569962024-04-29 08:07:06.789Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |
dc.title.spa.fl_str_mv |
Recuperación de información bilingüe |
title |
Recuperación de información bilingüe |
spellingShingle |
Recuperación de información bilingüe 4 Lenguas / Language 41 Ligüística / Linguistics 51 Matemáticas / Mathematics Recuperación de información Indexación semántica latente Descomposición semidiscreta Descomposición en valores singulares Idiomas cruzados Information retrieval Latent semantic indexing Semidiscrete decomposition Singular value decomposition Cross-languaje |
title_short |
Recuperación de información bilingüe |
title_full |
Recuperación de información bilingüe |
title_fullStr |
Recuperación de información bilingüe |
title_full_unstemmed |
Recuperación de información bilingüe |
title_sort |
Recuperación de información bilingüe |
dc.creator.fl_str_mv |
Támara López, Daniel Enrique |
dc.contributor.advisor.spa.fl_str_mv |
Acosta Medina, Carlos Daniel (Thesis advisor) Mejía Salazar, Carlos Enrique (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Támara López, Daniel Enrique |
dc.subject.ddc.spa.fl_str_mv |
4 Lenguas / Language 41 Ligüística / Linguistics 51 Matemáticas / Mathematics |
topic |
4 Lenguas / Language 41 Ligüística / Linguistics 51 Matemáticas / Mathematics Recuperación de información Indexación semántica latente Descomposición semidiscreta Descomposición en valores singulares Idiomas cruzados Information retrieval Latent semantic indexing Semidiscrete decomposition Singular value decomposition Cross-languaje |
dc.subject.proposal.spa.fl_str_mv |
Recuperación de información Indexación semántica latente Descomposición semidiscreta Descomposición en valores singulares Idiomas cruzados Information retrieval Latent semantic indexing Semidiscrete decomposition Singular value decomposition Cross-languaje |
description |
En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLAB |
publishDate |
2016 |
dc.date.issued.spa.fl_str_mv |
2016 |
dc.date.accessioned.spa.fl_str_mv |
2019-07-02T12:18:40Z |
dc.date.available.spa.fl_str_mv |
2019-07-02T12:18:40Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/56996 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/53058/ |
url |
https://repositorio.unal.edu.co/handle/unal/56996 http://bdigital.unal.edu.co/53058/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Manizales Facultad de Ciencias Exactas y Naturales Departamento de Matemáticas y Estadística Departamento de Matemáticas y Estadística |
dc.relation.references.spa.fl_str_mv |
Támara López, Daniel Enrique (2016) Recuperación de información bilingüe. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/56996/1/1102841908.2016.pdf https://repositorio.unal.edu.co/bitstream/unal/56996/2/1102841908.2016.pdf.jpg |
bitstream.checksum.fl_str_mv |
f8e2c46a414440fe095a76220925fbbb 17610bd820b4a2948ea8afb11e2ba5cb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089333010857984 |