Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning

El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia par...

Full description

Autores:
Movilla Mendoza, Vanessa Paola
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/48853
Acceso en línea:
http://hdl.handle.net/1992/48853
Palabra clave:
Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Description
Summary:El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativos