A strategy for interactive exploration of multimodal image collections
La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos...
- Autores:
-
Camargo Mendoza, Jorge Eliécer
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2014
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/51797
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/51797
http://bdigital.unal.edu.co/45995/
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Exploración de colecciones de imágenes
Aprendizaje de máquina
Procesamiento de imágenes
Construcción de resúmenes
Funcionaes de kernel
Análisis de temas latentes
Image collection exploration
Machine Learning
Image processing
Summarization
Kernel functions
Latent topic analysis
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_d10991945c7385e76709a31d50e00dc7 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/51797 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
A strategy for interactive exploration of multimodal image collections |
title |
A strategy for interactive exploration of multimodal image collections |
spellingShingle |
A strategy for interactive exploration of multimodal image collections 0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering Exploración de colecciones de imágenes Aprendizaje de máquina Procesamiento de imágenes Construcción de resúmenes Funcionaes de kernel Análisis de temas latentes Image collection exploration Machine Learning Image processing Summarization Kernel functions Latent topic analysis |
title_short |
A strategy for interactive exploration of multimodal image collections |
title_full |
A strategy for interactive exploration of multimodal image collections |
title_fullStr |
A strategy for interactive exploration of multimodal image collections |
title_full_unstemmed |
A strategy for interactive exploration of multimodal image collections |
title_sort |
A strategy for interactive exploration of multimodal image collections |
dc.creator.fl_str_mv |
Camargo Mendoza, Jorge Eliécer |
dc.contributor.author.spa.fl_str_mv |
Camargo Mendoza, Jorge Eliécer |
dc.contributor.spa.fl_str_mv |
González Osorio, Fabio Augusto |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering |
topic |
0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering Exploración de colecciones de imágenes Aprendizaje de máquina Procesamiento de imágenes Construcción de resúmenes Funcionaes de kernel Análisis de temas latentes Image collection exploration Machine Learning Image processing Summarization Kernel functions Latent topic analysis |
dc.subject.proposal.spa.fl_str_mv |
Exploración de colecciones de imágenes Aprendizaje de máquina Procesamiento de imágenes Construcción de resúmenes Funcionaes de kernel Análisis de temas latentes Image collection exploration Machine Learning Image processing Summarization Kernel functions Latent topic analysis |
description |
La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos computacionales efectivos y eficientes. En el caso de texto, una gran cantidad de trabajo se ha realizado por parte de la comunidad de recuperación de información, y gracias a ese esfuerzo, hoy contamos con motores de búsqueda de documentos de texto apropiados, los cuales nos permiten fácilmente encontrar información. Sin embargo, para el caso de otros tipos de información multimedia, como es el caso de las imágenes, los resultados no son todavía satisfactorios. Nuevos mecanismos para explorar grandes colecciones de imágenes son necesarios de tal forma que se le ofrezca al usuario diferentes alternativas para acceder y encontrar información. La exploración de colecciones de imágenes es un nuevo mecanismo para acceder grandes repositorios de imágenes de una manera más eficiente y intuitiva. Este mecanismo está siendo activamente investigado por la comunidad científica. El proceso de exploración de colecciones de imágenes se compone de los siguientes componentes: (1) Representación de la colección de imágenes; (2) Construcción de resúmenes; (3) Visualización de colecciones de imágenes; y (4) Interacción con la colección de imágenes. La mayoría de estrategias de exploración que se encuentran en la literatura usan principalmente contenido visual en cada uno de estos componentes, ignorando otras posibles fuentes de información (modalidades) tales como texto, el cual puede complementar cada uno de estos componentes de un sistema de exploración de imágenes. En esta tesis se estudia cómo conjuntamente utilizar información visual y textual con el fin de modelar de una mejor manera cada uno de los componentes de los sistemas de exploración. Para alcanzar este objetivo, se propone una familia de algoritmos que fusionan ambas modalidades de diferentes formas utilizando métodos de kernel y análisis de semántica latente. |
publishDate |
2014 |
dc.date.issued.spa.fl_str_mv |
2014 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-29T12:49:10Z |
dc.date.available.spa.fl_str_mv |
2019-06-29T12:49:10Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Doctorado |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TD |
format |
http://purl.org/coar/resource_type/c_db06 |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/51797 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/45995/ |
url |
https://repositorio.unal.edu.co/handle/unal/51797 http://bdigital.unal.edu.co/45995/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Departamento de Ingeniería de Sistemas e Industrial |
dc.relation.references.spa.fl_str_mv |
Camargo Mendoza, Jorge Eliécer (2014) A strategy for interactive exploration of multimodal image collections. Doctorado thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/51797/1/02299809.2014.pdf https://repositorio.unal.edu.co/bitstream/unal/51797/2/02299809.2014.pdf.jpg |
bitstream.checksum.fl_str_mv |
e020e30989eeb1333aa027b01ad88411 1e660c455ea38786bac824fece854553 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089785466159104 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoCamargo Mendoza, Jorge Eliécer402d90df-b20f-45c1-bcda-333cbecc9e273002019-06-29T12:49:10Z2019-06-29T12:49:10Z2014https://repositorio.unal.edu.co/handle/unal/51797http://bdigital.unal.edu.co/45995/La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos computacionales efectivos y eficientes. En el caso de texto, una gran cantidad de trabajo se ha realizado por parte de la comunidad de recuperación de información, y gracias a ese esfuerzo, hoy contamos con motores de búsqueda de documentos de texto apropiados, los cuales nos permiten fácilmente encontrar información. Sin embargo, para el caso de otros tipos de información multimedia, como es el caso de las imágenes, los resultados no son todavía satisfactorios. Nuevos mecanismos para explorar grandes colecciones de imágenes son necesarios de tal forma que se le ofrezca al usuario diferentes alternativas para acceder y encontrar información. La exploración de colecciones de imágenes es un nuevo mecanismo para acceder grandes repositorios de imágenes de una manera más eficiente y intuitiva. Este mecanismo está siendo activamente investigado por la comunidad científica. El proceso de exploración de colecciones de imágenes se compone de los siguientes componentes: (1) Representación de la colección de imágenes; (2) Construcción de resúmenes; (3) Visualización de colecciones de imágenes; y (4) Interacción con la colección de imágenes. La mayoría de estrategias de exploración que se encuentran en la literatura usan principalmente contenido visual en cada uno de estos componentes, ignorando otras posibles fuentes de información (modalidades) tales como texto, el cual puede complementar cada uno de estos componentes de un sistema de exploración de imágenes. En esta tesis se estudia cómo conjuntamente utilizar información visual y textual con el fin de modelar de una mejor manera cada uno de los componentes de los sistemas de exploración. Para alcanzar este objetivo, se propone una familia de algoritmos que fusionan ambas modalidades de diferentes formas utilizando métodos de kernel y análisis de semántica latente.Abstract. Multimedia content production, including documents with text, images, videos and audio, has experienced an exponential growth thanks to the development of computer and communication systems. The process of finding and accessing this vast volume of information requires effective and efficient computational methods. In the case of text, a lot of work has been done by the information retrieval community, and thanks to this effort, today we have suitable text document search engines that allow us to easily find information. However, in the case of other type of multimedia content, such as images, the results are not as satisfactory yet. New mechanisms to explore large image collections are necessary to offer the user different alternatives for accessing and finding information. Image collection exploration is a new mechanism to access large image repositories in a more efficient and intuitive way. This mechanism is being actively studied by the research community. Image collection exploration consists of the following stages: (1) Image collection representation; (2) Image collection summarization; (3) Image collection visualization; and (4) Image collection interaction. Most of the image collection exploration strategies found in the literature mainly use visual content to model each one of these stages, ignoring other possible information sources (modalities) such as text, which may complement each stage of an image collection exploration system. In this thesis we investigated how to jointly use visual and textual modalities to better model each stage of an image collection exploration system. To reach this goal, we proposed a family of algorithms that fuse both modalities in different ways such as kernel-based methods and latent semantic analysis. Systematic experiments were conducted on different data sets to evaluate the proposed image collection exploration algorithms in a qualitative and quantitative way. The experimental results showed that the proposed strategy is an effective mechanism for designing image collection exploration systems.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialCamargo Mendoza, Jorge Eliécer (2014) A strategy for interactive exploration of multimodal image collections. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringExploración de colecciones de imágenesAprendizaje de máquinaProcesamiento de imágenesConstrucción de resúmenesFuncionaes de kernelAnálisis de temas latentesImage collection explorationMachine LearningImage processingSummarizationKernel functionsLatent topic analysisA strategy for interactive exploration of multimodal image collectionsTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL02299809.2014.pdfapplication/pdf5490587https://repositorio.unal.edu.co/bitstream/unal/51797/1/02299809.2014.pdfe020e30989eeb1333aa027b01ad88411MD51THUMBNAIL02299809.2014.pdf.jpg02299809.2014.pdf.jpgGenerated Thumbnailimage/jpeg4207https://repositorio.unal.edu.co/bitstream/unal/51797/2/02299809.2014.pdf.jpg1e660c455ea38786bac824fece854553MD52unal/51797oai:repositorio.unal.edu.co:unal/517972024-02-27 23:08:45.313Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |