A strategy for interactive exploration of multimodal image collections

La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos...

Full description

Autores:
Camargo Mendoza, Jorge Eliécer
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2014
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/51797
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/51797
http://bdigital.unal.edu.co/45995/
Palabra clave:
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Exploración de colecciones de imágenes
Aprendizaje de máquina
Procesamiento de imágenes
Construcción de resúmenes
Funcionaes de kernel
Análisis de temas latentes
Image collection exploration
Machine Learning
Image processing
Summarization
Kernel functions
Latent topic analysis
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_d10991945c7385e76709a31d50e00dc7
oai_identifier_str oai:repositorio.unal.edu.co:unal/51797
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv A strategy for interactive exploration of multimodal image collections
title A strategy for interactive exploration of multimodal image collections
spellingShingle A strategy for interactive exploration of multimodal image collections
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Exploración de colecciones de imágenes
Aprendizaje de máquina
Procesamiento de imágenes
Construcción de resúmenes
Funcionaes de kernel
Análisis de temas latentes
Image collection exploration
Machine Learning
Image processing
Summarization
Kernel functions
Latent topic analysis
title_short A strategy for interactive exploration of multimodal image collections
title_full A strategy for interactive exploration of multimodal image collections
title_fullStr A strategy for interactive exploration of multimodal image collections
title_full_unstemmed A strategy for interactive exploration of multimodal image collections
title_sort A strategy for interactive exploration of multimodal image collections
dc.creator.fl_str_mv Camargo Mendoza, Jorge Eliécer
dc.contributor.author.spa.fl_str_mv Camargo Mendoza, Jorge Eliécer
dc.contributor.spa.fl_str_mv González Osorio, Fabio Augusto
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Exploración de colecciones de imágenes
Aprendizaje de máquina
Procesamiento de imágenes
Construcción de resúmenes
Funcionaes de kernel
Análisis de temas latentes
Image collection exploration
Machine Learning
Image processing
Summarization
Kernel functions
Latent topic analysis
dc.subject.proposal.spa.fl_str_mv Exploración de colecciones de imágenes
Aprendizaje de máquina
Procesamiento de imágenes
Construcción de resúmenes
Funcionaes de kernel
Análisis de temas latentes
Image collection exploration
Machine Learning
Image processing
Summarization
Kernel functions
Latent topic analysis
description La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos computacionales efectivos y eficientes. En el caso de texto, una gran cantidad de trabajo se ha realizado por parte de la comunidad de recuperación de información, y gracias a ese esfuerzo, hoy contamos con motores de búsqueda de documentos de texto apropiados, los cuales nos permiten fácilmente encontrar información. Sin embargo, para el caso de otros tipos de información multimedia, como es el caso de las imágenes, los resultados no son todavía satisfactorios. Nuevos mecanismos para explorar grandes colecciones de imágenes son necesarios de tal forma que se le ofrezca al usuario diferentes alternativas para acceder y encontrar información. La exploración de colecciones de imágenes es un nuevo mecanismo para acceder grandes repositorios de imágenes de una manera más eficiente y intuitiva. Este mecanismo está siendo activamente investigado por la comunidad científica. El proceso de exploración de colecciones de imágenes se compone de los siguientes componentes: (1) Representación de la colección de imágenes; (2) Construcción de resúmenes; (3) Visualización de colecciones de imágenes; y (4) Interacción con la colección de imágenes. La mayoría de estrategias de exploración que se encuentran en la literatura usan principalmente contenido visual en cada uno de estos componentes, ignorando otras posibles fuentes de información (modalidades) tales como texto, el cual puede complementar cada uno de estos componentes de un sistema de exploración de imágenes. En esta tesis se estudia cómo conjuntamente utilizar información visual y textual con el fin de modelar de una mejor manera cada uno de los componentes de los sistemas de exploración. Para alcanzar este objetivo, se propone una familia de algoritmos que fusionan ambas modalidades de diferentes formas utilizando métodos de kernel y análisis de semántica latente.
publishDate 2014
dc.date.issued.spa.fl_str_mv 2014
dc.date.accessioned.spa.fl_str_mv 2019-06-29T12:49:10Z
dc.date.available.spa.fl_str_mv 2019-06-29T12:49:10Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/51797
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/45995/
url https://repositorio.unal.edu.co/handle/unal/51797
http://bdigital.unal.edu.co/45995/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
Departamento de Ingeniería de Sistemas e Industrial
dc.relation.references.spa.fl_str_mv Camargo Mendoza, Jorge Eliécer (2014) A strategy for interactive exploration of multimodal image collections. Doctorado thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/51797/1/02299809.2014.pdf
https://repositorio.unal.edu.co/bitstream/unal/51797/2/02299809.2014.pdf.jpg
bitstream.checksum.fl_str_mv e020e30989eeb1333aa027b01ad88411
1e660c455ea38786bac824fece854553
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886384380674048
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoCamargo Mendoza, Jorge Eliécer402d90df-b20f-45c1-bcda-333cbecc9e273002019-06-29T12:49:10Z2019-06-29T12:49:10Z2014https://repositorio.unal.edu.co/handle/unal/51797http://bdigital.unal.edu.co/45995/La producción de contenido multimedia incluyendo documentos de texto, imágenes, videos y audio, ha experimentado un crecimiento exponencial producto del desarrollo de los sistemas de computación y comunicaciones. El proceso de encontrar y acceder este gran volumen de información requiere de métodos computacionales efectivos y eficientes. En el caso de texto, una gran cantidad de trabajo se ha realizado por parte de la comunidad de recuperación de información, y gracias a ese esfuerzo, hoy contamos con motores de búsqueda de documentos de texto apropiados, los cuales nos permiten fácilmente encontrar información. Sin embargo, para el caso de otros tipos de información multimedia, como es el caso de las imágenes, los resultados no son todavía satisfactorios. Nuevos mecanismos para explorar grandes colecciones de imágenes son necesarios de tal forma que se le ofrezca al usuario diferentes alternativas para acceder y encontrar información. La exploración de colecciones de imágenes es un nuevo mecanismo para acceder grandes repositorios de imágenes de una manera más eficiente y intuitiva. Este mecanismo está siendo activamente investigado por la comunidad científica. El proceso de exploración de colecciones de imágenes se compone de los siguientes componentes: (1) Representación de la colección de imágenes; (2) Construcción de resúmenes; (3) Visualización de colecciones de imágenes; y (4) Interacción con la colección de imágenes. La mayoría de estrategias de exploración que se encuentran en la literatura usan principalmente contenido visual en cada uno de estos componentes, ignorando otras posibles fuentes de información (modalidades) tales como texto, el cual puede complementar cada uno de estos componentes de un sistema de exploración de imágenes. En esta tesis se estudia cómo conjuntamente utilizar información visual y textual con el fin de modelar de una mejor manera cada uno de los componentes de los sistemas de exploración. Para alcanzar este objetivo, se propone una familia de algoritmos que fusionan ambas modalidades de diferentes formas utilizando métodos de kernel y análisis de semántica latente.Abstract. Multimedia content production, including documents with text, images, videos and audio, has experienced an exponential growth thanks to the development of computer and communication systems. The process of finding and accessing this vast volume of information requires effective and efficient computational methods. In the case of text, a lot of work has been done by the information retrieval community, and thanks to this effort, today we have suitable text document search engines that allow us to easily find information. However, in the case of other type of multimedia content, such as images, the results are not as satisfactory yet. New mechanisms to explore large image collections are necessary to offer the user different alternatives for accessing and finding information. Image collection exploration is a new mechanism to access large image repositories in a more efficient and intuitive way. This mechanism is being actively studied by the research community. Image collection exploration consists of the following stages: (1) Image collection representation; (2) Image collection summarization; (3) Image collection visualization; and (4) Image collection interaction. Most of the image collection exploration strategies found in the literature mainly use visual content to model each one of these stages, ignoring other possible information sources (modalities) such as text, which may complement each stage of an image collection exploration system. In this thesis we investigated how to jointly use visual and textual modalities to better model each stage of an image collection exploration system. To reach this goal, we proposed a family of algorithms that fuse both modalities in different ways such as kernel-based methods and latent semantic analysis. Systematic experiments were conducted on different data sets to evaluate the proposed image collection exploration algorithms in a qualitative and quantitative way. The experimental results showed that the proposed strategy is an effective mechanism for designing image collection exploration systems.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialCamargo Mendoza, Jorge Eliécer (2014) A strategy for interactive exploration of multimodal image collections. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringExploración de colecciones de imágenesAprendizaje de máquinaProcesamiento de imágenesConstrucción de resúmenesFuncionaes de kernelAnálisis de temas latentesImage collection explorationMachine LearningImage processingSummarizationKernel functionsLatent topic analysisA strategy for interactive exploration of multimodal image collectionsTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL02299809.2014.pdfapplication/pdf5490587https://repositorio.unal.edu.co/bitstream/unal/51797/1/02299809.2014.pdfe020e30989eeb1333aa027b01ad88411MD51THUMBNAIL02299809.2014.pdf.jpg02299809.2014.pdf.jpgGenerated Thumbnailimage/jpeg4207https://repositorio.unal.edu.co/bitstream/unal/51797/2/02299809.2014.pdf.jpg1e660c455ea38786bac824fece854553MD52unal/51797oai:repositorio.unal.edu.co:unal/517972024-02-27 23:08:45.313Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co