Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características

La anotación automática de imágenes médicas se ha convertido en un proceso necesario para la gestión, búsqueda y exploración de las crecientes bases de datos médicas para apoyo al diagnóstico y análisis de imágenes en investigación biomédica. La anotación automática consiste en asignar conceptos de...

Full description

Autores:
Cruz Roa, Angel Alfonso
Tipo de recurso:
Fecha de publicación:
2011
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/9025
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/9025
http://bdigital.unal.edu.co/5774/
Palabra clave:
61 Ciencias médicas; Medicina / Medicine and health
Investigación biomédica
anotación automática
Bolsa de Características
Métodos de Kernel / Biomedical research
automatic annotation
Bag of Features
Kernel Methods
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_2373eccdcb22194744fdb705c3d4af42
oai_identifier_str oai:repositorio.unal.edu.co:unal/9025
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
title Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
spellingShingle Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
61 Ciencias médicas; Medicina / Medicine and health
Investigación biomédica
anotación automática
Bolsa de Características
Métodos de Kernel / Biomedical research
automatic annotation
Bag of Features
Kernel Methods
title_short Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
title_full Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
title_fullStr Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
title_full_unstemmed Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
title_sort Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características
dc.creator.fl_str_mv Cruz Roa, Angel Alfonso
dc.contributor.author.spa.fl_str_mv Cruz Roa, Angel Alfonso
dc.contributor.spa.fl_str_mv González Osorio,, Fabio Augusto
dc.subject.ddc.spa.fl_str_mv 61 Ciencias médicas; Medicina / Medicine and health
topic 61 Ciencias médicas; Medicina / Medicine and health
Investigación biomédica
anotación automática
Bolsa de Características
Métodos de Kernel / Biomedical research
automatic annotation
Bag of Features
Kernel Methods
dc.subject.proposal.spa.fl_str_mv Investigación biomédica
anotación automática
Bolsa de Características
Métodos de Kernel / Biomedical research
automatic annotation
Bag of Features
Kernel Methods
description La anotación automática de imágenes médicas se ha convertido en un proceso necesario para la gestión, búsqueda y exploración de las crecientes bases de datos médicas para apoyo al diagnóstico y análisis de imágenes en investigación biomédica. La anotación automática consiste en asignar conceptos de alto nivel a imágenes a partir de las características visuales de bajo nivel. Para esto se busca tener una representación de la imagen que caracterice el contenido visual de ésta y un modelo de aprendizaje entrenado con ejemplos de imágenes anotadas. Este trabajo propone explorar la Bolsa de Características (BdC) para la representación de las imágenes de histología y los Métodos de Kernel (MK) como modelos de aprendizaje de máquina para la anotación automática. Adicionalmente se exploró una metodología de análisis de colecciones de imágenes para encontrar patrones visuales y sus relaciones con los conceptos semánticos usando Análisis de Información Mutua, Selección de Características con Máxima-Relevancia y Mínima-Redundancia (mRMR) y Análisis de Biclustering. La metodología propuesta fue evaluada en dos bases de datos de imágenes, una con imá- genes anotadas con los cuatro tejidos fundamentales y otra con imágenes de tipo de cáncer de piel conocido como carcinoma basocelular. Los resultados en análisis de imágenes revelan que es posible encontrar patrones implícitos en colecciones de imágenes a partir de la representación BdC seleccionan- do las palabras visuales relevantes de la colección y asociándolas a conceptos semánticos mientras que el análisis de biclustering permitió encontrar algunos grupos de imágenes similares que comparten palabras visuales asociadas al tipo de tinción o conceptos. En anotación automática se evaluaron distintas configuraciones del enfoque BdC. Los mejores resultados obtenidos presentan una Precisión de 91 % y un Recall de 88 % en las imágenes de histología, y una Precisión de 59 % y un Recall de 23 % en las imágenes de histopatología. La configuración de la metodología BdC con los mejores resultados en ambas colecciones fue obtenida usando las palabras visuales basadas en DCT con un diccionario de tamaño 1,000 con un kernel Gaussiano. / Abstract. The automatic annotation of medical images has become a necessary process for managing, searching and exploration of growing medical image databases for diagnostic support and image analysis in biomedical research. The automatic annotation is to assign high-level concepts to images from the low-level visual features. For this, is needed to have a image representation that characterizes its visual content and a learning model trained with examples of annotated images. This paper aims to explore the Bag of Features (BOF) for the representation of histology images and Kernel Methods (KM) as models of machine learning for automatic annotation. Additionally, we explored a methodology for image collection analysis in order to _nd visual patterns and their relationships with semantic concepts using Mutual Information Analysis, Features Selection with Max-Relevance and Min- Redundancy (mRMR) and Biclustering Analysis. The proposed methodology was evaluated in two image databases, the _rst have images annotated with the four fundamental tissues, and the second have images of a type of skin cancer known as Basal-cell carcinoma. The image analysis results show that it is possible to _nd implicit patterns in image collections from the BOF representation. This by selecting the relevant visual words in the collection and associating them with semantic concepts, whereas biclustering analysis allowed to _nd groups of similar images that share visual words associated with the type of stain or concepts. The Automatic annotation was evaluated in di_erent settings of BOF approach. The best results have a Precision of 91% and Recall of 88% in the histology images, and a Precision of 59% and Recall of 23% in histopathology images. The con_guration of BOF methodology with the best results in both datasets was obtained using the DCT-based visual words in a dictionary size of 1; 000 with a Gaussian kernel.
publishDate 2011
dc.date.issued.spa.fl_str_mv 2011-02-14
dc.date.accessioned.spa.fl_str_mv 2019-06-24T17:51:03Z
dc.date.available.spa.fl_str_mv 2019-06-24T17:51:03Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/9025
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/5774/
url https://repositorio.unal.edu.co/handle/unal/9025
http://bdigital.unal.edu.co/5774/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://www.informed.unal.edu.co/aacruzr/
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Medicina Instituto de Investigaciones Biomédicas
Instituto de Investigaciones Biomédicas
dc.relation.references.spa.fl_str_mv Cruz Roa, Angel Alfonso (2011) Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/9025/1/598199_2011.pdf
https://repositorio.unal.edu.co/bitstream/unal/9025/2/598199_2011.pdf.jpg
bitstream.checksum.fl_str_mv 7e1b5dacd4b360164eda583cba5de3b4
1e029242c171be3d135a489250479c9d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089430523183104
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio,, Fabio AugustoCruz Roa, Angel Alfonso15e59f29-e322-4487-8dec-afaab4fc97363002019-06-24T17:51:03Z2019-06-24T17:51:03Z2011-02-14https://repositorio.unal.edu.co/handle/unal/9025http://bdigital.unal.edu.co/5774/La anotación automática de imágenes médicas se ha convertido en un proceso necesario para la gestión, búsqueda y exploración de las crecientes bases de datos médicas para apoyo al diagnóstico y análisis de imágenes en investigación biomédica. La anotación automática consiste en asignar conceptos de alto nivel a imágenes a partir de las características visuales de bajo nivel. Para esto se busca tener una representación de la imagen que caracterice el contenido visual de ésta y un modelo de aprendizaje entrenado con ejemplos de imágenes anotadas. Este trabajo propone explorar la Bolsa de Características (BdC) para la representación de las imágenes de histología y los Métodos de Kernel (MK) como modelos de aprendizaje de máquina para la anotación automática. Adicionalmente se exploró una metodología de análisis de colecciones de imágenes para encontrar patrones visuales y sus relaciones con los conceptos semánticos usando Análisis de Información Mutua, Selección de Características con Máxima-Relevancia y Mínima-Redundancia (mRMR) y Análisis de Biclustering. La metodología propuesta fue evaluada en dos bases de datos de imágenes, una con imá- genes anotadas con los cuatro tejidos fundamentales y otra con imágenes de tipo de cáncer de piel conocido como carcinoma basocelular. Los resultados en análisis de imágenes revelan que es posible encontrar patrones implícitos en colecciones de imágenes a partir de la representación BdC seleccionan- do las palabras visuales relevantes de la colección y asociándolas a conceptos semánticos mientras que el análisis de biclustering permitió encontrar algunos grupos de imágenes similares que comparten palabras visuales asociadas al tipo de tinción o conceptos. En anotación automática se evaluaron distintas configuraciones del enfoque BdC. Los mejores resultados obtenidos presentan una Precisión de 91 % y un Recall de 88 % en las imágenes de histología, y una Precisión de 59 % y un Recall de 23 % en las imágenes de histopatología. La configuración de la metodología BdC con los mejores resultados en ambas colecciones fue obtenida usando las palabras visuales basadas en DCT con un diccionario de tamaño 1,000 con un kernel Gaussiano. / Abstract. The automatic annotation of medical images has become a necessary process for managing, searching and exploration of growing medical image databases for diagnostic support and image analysis in biomedical research. The automatic annotation is to assign high-level concepts to images from the low-level visual features. For this, is needed to have a image representation that characterizes its visual content and a learning model trained with examples of annotated images. This paper aims to explore the Bag of Features (BOF) for the representation of histology images and Kernel Methods (KM) as models of machine learning for automatic annotation. Additionally, we explored a methodology for image collection analysis in order to _nd visual patterns and their relationships with semantic concepts using Mutual Information Analysis, Features Selection with Max-Relevance and Min- Redundancy (mRMR) and Biclustering Analysis. The proposed methodology was evaluated in two image databases, the _rst have images annotated with the four fundamental tissues, and the second have images of a type of skin cancer known as Basal-cell carcinoma. The image analysis results show that it is possible to _nd implicit patterns in image collections from the BOF representation. This by selecting the relevant visual words in the collection and associating them with semantic concepts, whereas biclustering analysis allowed to _nd groups of similar images that share visual words associated with the type of stain or concepts. The Automatic annotation was evaluated in di_erent settings of BOF approach. The best results have a Precision of 91% and Recall of 88% in the histology images, and a Precision of 59% and Recall of 23% in histopathology images. The con_guration of BOF methodology with the best results in both datasets was obtained using the DCT-based visual words in a dictionary size of 1; 000 with a Gaussian kernel.Maestríaapplication/pdfspahttp://www.informed.unal.edu.co/aacruzr/Universidad Nacional de Colombia Sede Bogotá Facultad de Medicina Instituto de Investigaciones BiomédicasInstituto de Investigaciones BiomédicasCruz Roa, Angel Alfonso (2011) Anotación Automática de Imágenes Médicas Usando la Representación de Bolsa de Características. Maestría thesis, Universidad Nacional de Colombia.61 Ciencias médicas; Medicina / Medicine and healthInvestigación biomédicaanotación automáticaBolsa de CaracterísticasMétodos de Kernel / Biomedical researchautomatic annotationBag of FeaturesKernel MethodsAnotación Automática de Imágenes Médicas Usando la Representación de Bolsa de CaracterísticasTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL598199_2011.pdfapplication/pdf15440116https://repositorio.unal.edu.co/bitstream/unal/9025/1/598199_2011.pdf7e1b5dacd4b360164eda583cba5de3b4MD51THUMBNAIL598199_2011.pdf.jpg598199_2011.pdf.jpgGenerated Thumbnailimage/jpeg4243https://repositorio.unal.edu.co/bitstream/unal/9025/2/598199_2011.pdf.jpg1e029242c171be3d135a489250479c9dMD52unal/9025oai:repositorio.unal.edu.co:unal/90252022-11-22 13:59:11.277Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co