Multimodal information spaces for content-based image retrieval
Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often cont...
- Autores:
-
Caicedo Rueda, Juan Carlos
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2012
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/20154
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/20154
http://bdigital.unal.edu.co/10591/
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Image databases
Indexing methods
Image search
Multimodal data
Analysis
Machine learning
Pattern recognition
Matrix factorization
Bases de datos de imágenes
Métodos de indexación
Búsqueda de imágenes
Análisis de datos multimodal
Aprendizaje de máquina
Reconocimiento de patrones
Factorización de matrices
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_3bebf70d4182247330a536520517a765 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/20154 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Multimodal information spaces for content-based image retrieval |
title |
Multimodal information spaces for content-based image retrieval |
spellingShingle |
Multimodal information spaces for content-based image retrieval 0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering Image databases Indexing methods Image search Multimodal data Analysis Machine learning Pattern recognition Matrix factorization Bases de datos de imágenes Métodos de indexación Búsqueda de imágenes Análisis de datos multimodal Aprendizaje de máquina Reconocimiento de patrones Factorización de matrices |
title_short |
Multimodal information spaces for content-based image retrieval |
title_full |
Multimodal information spaces for content-based image retrieval |
title_fullStr |
Multimodal information spaces for content-based image retrieval |
title_full_unstemmed |
Multimodal information spaces for content-based image retrieval |
title_sort |
Multimodal information spaces for content-based image retrieval |
dc.creator.fl_str_mv |
Caicedo Rueda, Juan Carlos |
dc.contributor.author.spa.fl_str_mv |
Caicedo Rueda, Juan Carlos |
dc.contributor.spa.fl_str_mv |
Gonzalez Osorio, Fabio A. |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering |
topic |
0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering Image databases Indexing methods Image search Multimodal data Analysis Machine learning Pattern recognition Matrix factorization Bases de datos de imágenes Métodos de indexación Búsqueda de imágenes Análisis de datos multimodal Aprendizaje de máquina Reconocimiento de patrones Factorización de matrices |
dc.subject.proposal.spa.fl_str_mv |
Image databases Indexing methods Image search Multimodal data Analysis Machine learning Pattern recognition Matrix factorization Bases de datos de imágenes Métodos de indexación Búsqueda de imágenes Análisis de datos multimodal Aprendizaje de máquina Reconocimiento de patrones Factorización de matrices |
description |
Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often contain complementary modalities, such as attached text resources, which can be used to build an index for querying with keywords. However, sometimes users do not have or do not know the right words to express what they need, and, in addition, keywords do not express all the visual variations that an image may contain. Using example images as queries can be viewed as an alternative in different scenarios such as searching images using a mobile phone with a coupled camera, or supporting medical diagnosis by searching a large medical image collection. Still, matching only visual features between the query and image databases may lead to undesirable results from the user's perspective. These conditions make the process of finding relevant images for a specific information need very challenging, time consuming or even frustrating. Instead of considering only a single data modality to build image search indexes, the simultaneous use of both, visual and text data modalities, has been suggested. Non-visual information modalities may provide complementary information to enrich the image representation. The goal of this research work is to study the relationships between visual contents and text terms to build useful indexes for image search. A family of algorithms based on matrix factorization are proposed for extracting the multimodal aspects from an image collection. Using this knowledge about how visual features and text terms correlate, a search index is constructed, which can be searched using keywords, example images or combinations of both. Systematic experiments were conducted on different data sets to evaluate the proposed indexing algorithms. The experimental results showed that multimodal indexing is an effective strategy for designing image search systems. |
publishDate |
2012 |
dc.date.issued.spa.fl_str_mv |
2012 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-25T18:24:36Z |
dc.date.available.spa.fl_str_mv |
2019-06-25T18:24:36Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Doctorado |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TD |
format |
http://purl.org/coar/resource_type/c_db06 |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/20154 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/10591/ |
url |
https://repositorio.unal.edu.co/handle/unal/20154 http://bdigital.unal.edu.co/10591/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Departamento de Ingeniería de Sistemas e Industrial |
dc.relation.references.spa.fl_str_mv |
Caicedo Rueda, Juan Carlos (2012) Multimodal information spaces for content-based image retrieval. Doctorado thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/20154/1/299767.2012.pdf https://repositorio.unal.edu.co/bitstream/unal/20154/2/299767.2012.pdf.jpg |
bitstream.checksum.fl_str_mv |
0073cefa0a127a028097d6ab266ab986 009a51213c2db4d7fe2116063cf61656 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089497009192960 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Gonzalez Osorio, Fabio A.Caicedo Rueda, Juan Carlosad68170d-0b0b-43fa-9bdf-764bd6da11673002019-06-25T18:24:36Z2019-06-25T18:24:36Z2012https://repositorio.unal.edu.co/handle/unal/20154http://bdigital.unal.edu.co/10591/Abstract. Image collections today are increasingly larger in size, and they continue to grow constantly. Without the help of image search systems these abundant visual records collected in many different fields and domains may remain unused and inaccessible. Many available image databases often contain complementary modalities, such as attached text resources, which can be used to build an index for querying with keywords. However, sometimes users do not have or do not know the right words to express what they need, and, in addition, keywords do not express all the visual variations that an image may contain. Using example images as queries can be viewed as an alternative in different scenarios such as searching images using a mobile phone with a coupled camera, or supporting medical diagnosis by searching a large medical image collection. Still, matching only visual features between the query and image databases may lead to undesirable results from the user's perspective. These conditions make the process of finding relevant images for a specific information need very challenging, time consuming or even frustrating. Instead of considering only a single data modality to build image search indexes, the simultaneous use of both, visual and text data modalities, has been suggested. Non-visual information modalities may provide complementary information to enrich the image representation. The goal of this research work is to study the relationships between visual contents and text terms to build useful indexes for image search. A family of algorithms based on matrix factorization are proposed for extracting the multimodal aspects from an image collection. Using this knowledge about how visual features and text terms correlate, a search index is constructed, which can be searched using keywords, example images or combinations of both. Systematic experiments were conducted on different data sets to evaluate the proposed indexing algorithms. The experimental results showed that multimodal indexing is an effective strategy for designing image search systems.Las colecciones de imágenes hoy en día son muy grandes y crecen constantemente. Sin la ayuda de sistemas para la búsqueda de imágenes esos abundantes registros visuales que han sido recolectados en diferentes areas del conocimiento pueden permanecer aislados sin uso. Muchas bases de datos de imágenes contienen modalidades de datos complementarias, como los recursos textuales que pueden ser utilizados para crear índices de búsqueda. Sin embargo, algunas veces los usuarios no tienen o no saben qué palabras utilizar para encontrar lo que necesitan, y adicionalmente, las palabras clave no expresan todas las variaciones visuales que una imagen puede tener. Utilizar imágenes de ejemplo para expresar la consulta puede ser visto como una alternativa, por ejemplo buscar imágenes con teléfonos móviles, o dar soporte al diagnóstico médico con las imágenes de los pacientes. Aún así, emparejar correctamente las características visuales de la consulta y las imágenes en la base de datos puede llevar a resultados semánticamente incorrectos. Estas condiciones hacen que el proceso de buscar imágenes relevantes para una necesidad de información particular sea una tarea difícil, que consume mucho tiempo o que incluso puede ser frustrante. En lugar de considerar solo una modalidad de datos para construir índices de búsqueda para imágenes, el uso simultáneo de las modalidades visual y textual ha sido sugerido. Las modalidades no visuales pueden proporcionar información complementaria para enriquecer la representación de las imágenes. El objetivo de este trabajo de investigación es estudiar las relaciones entre los contenidos visuales y los términos textuales, para construir índices de búsqueda útiles. Este trabajo propone una familia de algoritmos basados en factorización de matrices para extraer los aspectos multimodales de una colección de imágenes. Utilizando este conocimiento acerca de cómo las características visuales se correlacionan con los términos textuales, se construye un índice que puede ser consultado con palabras clave, imágenes de ejemplo o por combinaciones de estas dos. Se realizaron experimentos sistemáticos en diferentes conjuntos de datos para evaluar los algoritmos de indexamiento propuestos. Los resultados muestran que el indexamiento multimodal es una estrategia efectiva para diseñar sistemas de búsqueda de imágenes.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialCaicedo Rueda, Juan Carlos (2012) Multimodal information spaces for content-based image retrieval. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works51 Matemáticas / Mathematics62 Ingeniería y operaciones afines / EngineeringImage databasesIndexing methodsImage searchMultimodal dataAnalysisMachine learningPattern recognitionMatrix factorizationBases de datos de imágenesMétodos de indexaciónBúsqueda de imágenesAnálisis de datos multimodalAprendizaje de máquinaReconocimiento de patronesFactorización de matricesMultimodal information spaces for content-based image retrievalTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL299767.2012.pdfapplication/pdf10227339https://repositorio.unal.edu.co/bitstream/unal/20154/1/299767.2012.pdf0073cefa0a127a028097d6ab266ab986MD51THUMBNAIL299767.2012.pdf.jpg299767.2012.pdf.jpgGenerated Thumbnailimage/jpeg3980https://repositorio.unal.edu.co/bitstream/unal/20154/2/299767.2012.pdf.jpg009a51213c2db4d7fe2116063cf61656MD52unal/20154oai:repositorio.unal.edu.co:unal/201542022-11-02 16:19:53.822Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |