Multimodal information spaces for content-based image retrieval

Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often cont...

Full description

Autores:
Caicedo Rueda, Juan Carlos
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/20154
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/20154
http://bdigital.unal.edu.co/10591/
Palabra clave:
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Image databases
Indexing methods
Image search
Multimodal data
Analysis
Machine learning
Pattern recognition
Matrix factorization
Bases de datos de imágenes
Métodos de indexación
Búsqueda de imágenes
Análisis de datos multimodal
Aprendizaje de máquina
Reconocimiento de patrones
Factorización de matrices
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_3bebf70d4182247330a536520517a765
oai_identifier_str oai:repositorio.unal.edu.co:unal/20154
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Multimodal information spaces for content-based image retrieval
title Multimodal information spaces for content-based image retrieval
spellingShingle Multimodal information spaces for content-based image retrieval
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Image databases
Indexing methods
Image search
Multimodal data
Analysis
Machine learning
Pattern recognition
Matrix factorization
Bases de datos de imágenes
Métodos de indexación
Búsqueda de imágenes
Análisis de datos multimodal
Aprendizaje de máquina
Reconocimiento de patrones
Factorización de matrices
title_short Multimodal information spaces for content-based image retrieval
title_full Multimodal information spaces for content-based image retrieval
title_fullStr Multimodal information spaces for content-based image retrieval
title_full_unstemmed Multimodal information spaces for content-based image retrieval
title_sort Multimodal information spaces for content-based image retrieval
dc.creator.fl_str_mv Caicedo Rueda, Juan Carlos
dc.contributor.author.spa.fl_str_mv Caicedo Rueda, Juan Carlos
dc.contributor.spa.fl_str_mv Gonzalez Osorio, Fabio A.
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Image databases
Indexing methods
Image search
Multimodal data
Analysis
Machine learning
Pattern recognition
Matrix factorization
Bases de datos de imágenes
Métodos de indexación
Búsqueda de imágenes
Análisis de datos multimodal
Aprendizaje de máquina
Reconocimiento de patrones
Factorización de matrices
dc.subject.proposal.spa.fl_str_mv Image databases
Indexing methods
Image search
Multimodal data
Analysis
Machine learning
Pattern recognition
Matrix factorization
Bases de datos de imágenes
Métodos de indexación
Búsqueda de imágenes
Análisis de datos multimodal
Aprendizaje de máquina
Reconocimiento de patrones
Factorización de matrices
description Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often contain complementary modalities, such as attached text resources, which can be used to build an index for querying with keywords. However, sometimes users do not have or do not know the right words to express what they need, and, in addition, keywords do not express all the visual variations that an image may contain. Using example images as queries can be viewed as an alternative in different scenarios such as searching images using a mobile phone with a coupled camera, or supporting medical diagnosis by searching a large medical image collection. Still, matching only visual features between the query and image databases may lead to undesirable results from the user's perspective. These conditions make the process of finding relevant images for a specific information need very challenging, time consuming or even frustrating. Instead of considering only a single data modality to build image search indexes, the simultaneous use of both, visual and text data modalities, has been suggested. Non-visual information modalities may provide complementary information to enrich the image representation. The goal of this research work is to study the relationships between visual contents and text terms to build useful indexes for image search. A family of algorithms based on matrix factorization are proposed for extracting the multimodal aspects from an image collection. Using this knowledge about how visual features and text terms correlate, a search index is constructed, which can be searched using keywords, example images or combinations of both. Systematic experiments were conducted on different data sets to evaluate the proposed indexing algorithms. The experimental results showed that multimodal indexing is an effective strategy for designing image search systems.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-25T18:24:36Z
dc.date.available.spa.fl_str_mv 2019-06-25T18:24:36Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/20154
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/10591/
url https://repositorio.unal.edu.co/handle/unal/20154
http://bdigital.unal.edu.co/10591/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
Departamento de Ingeniería de Sistemas e Industrial
dc.relation.references.spa.fl_str_mv Caicedo Rueda, Juan Carlos (2012) Multimodal information spaces for content-based image retrieval. Doctorado thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/20154/1/299767.2012.pdf
https://repositorio.unal.edu.co/bitstream/unal/20154/2/299767.2012.pdf.jpg
bitstream.checksum.fl_str_mv 0073cefa0a127a028097d6ab266ab986
009a51213c2db4d7fe2116063cf61656
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089497009192960
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Gonzalez Osorio, Fabio A.Caicedo Rueda, Juan Carlosad68170d-0b0b-43fa-9bdf-764bd6da11673002019-06-25T18:24:36Z2019-06-25T18:24:36Z2012https://repositorio.unal.edu.co/handle/unal/20154http://bdigital.unal.edu.co/10591/Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often contain complementary modalities, such as attached text resources, which can be used to build an index for querying with keywords. However, sometimes users do not have or do not know the right words to express what they need, and, in addition, keywords do not express all the visual variations that an image may contain. Using example images as queries can be viewed as an alternative in different scenarios such as searching images using a mobile phone with a coupled camera, or supporting medical diagnosis by searching a large medical image collection. Still, matching only visual features between the query and image databases may lead to undesirable results from the user's perspective. These conditions make the process of finding relevant images for a specific information need very challenging, time consuming or even frustrating. Instead of considering only a single data modality to build image search indexes, the simultaneous use of both, visual and text data modalities, has been suggested. Non-visual information modalities may provide complementary information to enrich the image representation. The goal of this research work is to study the relationships between visual contents and text terms to build useful indexes for image search. A family of algorithms based on matrix factorization are proposed for extracting the multimodal aspects from an image collection. Using this knowledge about how visual features and text terms correlate, a search index is constructed, which can be searched using keywords, example images or combinations of both. Systematic experiments were conducted on different data sets to evaluate the proposed indexing algorithms. The experimental results showed that multimodal indexing is an effective strategy for designing image search systems.Las colecciones de imágenes hoy en día son muy grandes y crecen constantemente. Sin la ayuda de sistemas para la búsqueda de imágenes esos abundantes registros visuales que han sido recolectados en diferentes areas del conocimiento pueden permanecer aislados sin uso. Muchas bases de datos de imágenes contienen modalidades de datos complementarias, como los recursos textuales que pueden ser utilizados para crear índices de búsqueda. Sin embargo, algunas veces los usuarios no tienen o no saben qué palabras utilizar para encontrar lo que necesitan, y adicionalmente, las palabras clave no expresan todas las variaciones visuales que una imagen puede tener. Utilizar imágenes de ejemplo para expresar la consulta puede ser visto como una alternativa, por ejemplo buscar imágenes con teléfonos móviles, o dar soporte al diagnóstico médico con las imágenes de los pacientes. Aún así, emparejar correctamente las características visuales de la consulta y las imágenes en la base de datos puede llevar a resultados semánticamente incorrectos. Estas condiciones hacen que el proceso de buscar imágenes relevantes para una necesidad de información particular sea una tarea difícil, que consume mucho tiempo o que incluso puede ser frustrante. En lugar de considerar solo una modalidad de datos para construir índices de búsqueda para imágenes, el uso simultáneo de las modalidades visual y textual ha sido sugerido. Las modalidades no visuales pueden proporcionar información complementaria para enriquecer la representación de las imágenes. El objetivo de este trabajo de investigación es estudiar las relaciones entre los contenidos visuales y los términos textuales, para construir índices de búsqueda útiles. Este trabajo propone una familia de algoritmos basados en factorización de matrices para extraer los aspectos multimodales de una colección de imágenes. Utilizando este conocimiento acerca de cómo las características visuales se correlacionan con los términos textuales, se construye un índice que puede ser consultado con palabras clave, imágenes de ejemplo o por combinaciones de estas dos. Se realizaron experimentos sistemáticos en diferentes conjuntos de datos para evaluar los algoritmos de indexamiento propuestos. Los resultados muestran que el indexamiento multimodal es una estrategia efectiva para diseñar sistemas de búsqueda de imágenes.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialCaicedo Rueda, Juan Carlos (2012) Multimodal information spaces for content-based image retrieval. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works51 Matemáticas / Mathematics62 Ingeniería y operaciones afines / EngineeringImage databasesIndexing methodsImage searchMultimodal dataAnalysisMachine learningPattern recognitionMatrix factorizationBases de datos de imágenesMétodos de indexaciónBúsqueda de imágenesAnálisis de datos multimodalAprendizaje de máquinaReconocimiento de patronesFactorización de matricesMultimodal information spaces for content-based image retrievalTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL299767.2012.pdfapplication/pdf10227339https://repositorio.unal.edu.co/bitstream/unal/20154/1/299767.2012.pdf0073cefa0a127a028097d6ab266ab986MD51THUMBNAIL299767.2012.pdf.jpg299767.2012.pdf.jpgGenerated Thumbnailimage/jpeg3980https://repositorio.unal.edu.co/bitstream/unal/20154/2/299767.2012.pdf.jpg009a51213c2db4d7fe2116063cf61656MD52unal/20154oai:repositorio.unal.edu.co:unal/201542022-11-02 16:19:53.822Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co