Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning

El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia par...

Full description

Autores:
Movilla Mendoza, Vanessa Paola
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/48853
Acceso en línea:
http://hdl.handle.net/1992/48853
Palabra clave:
Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_dcf0d1c30ccd65a4142de3a307fa1af9
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/48853
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
title Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
spellingShingle Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
title_short Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
title_full Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
title_fullStr Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
title_full_unstemmed Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
title_sort Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
dc.creator.fl_str_mv Movilla Mendoza, Vanessa Paola
dc.contributor.advisor.none.fl_str_mv Arbeláez Escalante, Pablo Andrés
Higuera Arias, Carolina
Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Movilla Mendoza, Vanessa Paola
dc.contributor.jury.none.fl_str_mv Giraldo Trujillo, Luis Felipe
dc.subject.armarc.es_CO.fl_str_mv Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
topic Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativos
publishDate 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2021-02-18T12:34:58Z
dc.date.available.none.fl_str_mv 2021-02-18T12:34:58Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/48853
dc.identifier.pdf.none.fl_str_mv u833479.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/48853
identifier_str_mv u833479.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 25 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/2770565f-b901-4a90-8122-9fce9604ec48/download
https://repositorio.uniandes.edu.co/bitstreams/f05295d4-0fbd-4590-9cb0-7c5f90743a52/download
https://repositorio.uniandes.edu.co/bitstreams/21030a85-393f-42be-ab46-538f42bdc072/download
bitstream.checksum.fl_str_mv 25404dafda8c36d6d32d8263e3aead50
c4453434efa8e062b2172ff1418658df
b2deb83fba4dc620df21536c17981582
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133887590006784
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arbeláez Escalante, Pablo Andrésb386017b-fe04-4081-853a-8327e77a02b3400Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::5734-1Movilla Mendoza, Vanessa Paola31738d2d-6325-4056-89f3-7b448d9931ad500Giraldo Trujillo, Luis Felipe2021-02-18T12:34:58Z2021-02-18T12:34:58Z2019http://hdl.handle.net/1992/48853u833479.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativosBreast cancer is the most common cancer in women, both worldwide and in Latin America. The proper analysis of images produced by breast biopsy is of great importance in determining whether cancer cells have acquired the ability to spread. The goal is to implement a system of automatic identification of metastatic tissue in histological images of biopsies to facilitate this process. During the development of the project, tests were carried out on two different models based on a convolutional neural network presented in the Pcam challenge and more traditional algorithms found in the literature. The data was preprocesed and the respective classifier was trained. The first set was the segmentation of the nuclei of the cells present in the image, for which operations such as morphological closures and percentile thresholding were performed. Once the mask is obtained, several morphological characteristics are calculated for each, which are used to train different classifiers. For classifier selection, a hyperparameter search is performed for RandomForest and SVM (Support Vector Machine). The second model tests different architectures of convolutional neural networks, the input of which corresponds to the normalized images. Once the architecture with the best ACA and F-measure is chosen, the classification threshold is varied because it is necessary to decrease the number of false negativesIngeniero ElectrónicoPregrado25 hojasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaIdentificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learningTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPProcesamiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neurales (Computadores)Neoplasmas de la mamaIngenieríaPublicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::5734-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::5734-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::5734-1TEXTu833479.pdf.txtu833479.pdf.txtExtracted texttext/plain47911https://repositorio.uniandes.edu.co/bitstreams/2770565f-b901-4a90-8122-9fce9604ec48/download25404dafda8c36d6d32d8263e3aead50MD54ORIGINALu833479.pdfapplication/pdf2022609https://repositorio.uniandes.edu.co/bitstreams/f05295d4-0fbd-4590-9cb0-7c5f90743a52/downloadc4453434efa8e062b2172ff1418658dfMD51THUMBNAILu833479.pdf.jpgu833479.pdf.jpgIM Thumbnailimage/jpeg9846https://repositorio.uniandes.edu.co/bitstreams/21030a85-393f-42be-ab46-538f42bdc072/downloadb2deb83fba4dc620df21536c17981582MD551992/48853oai:repositorio.uniandes.edu.co:1992/488532024-03-13 13:00:46.278https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co