Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia par...
- Autores:
-
Movilla Mendoza, Vanessa Paola
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/48853
- Acceso en línea:
- http://hdl.handle.net/1992/48853
- Palabra clave:
- Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Summary: | El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativos |
---|