Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning
El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia par...
- Autores:
-
Movilla Mendoza, Vanessa Paola
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/48853
- Acceso en línea:
- http://hdl.handle.net/1992/48853
- Palabra clave:
- Procesamiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neurales (Computadores)
Neoplasmas de la mama
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id |
UNIANDES2_dcf0d1c30ccd65a4142de3a307fa1af9 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/48853 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.es_CO.fl_str_mv |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
title |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
spellingShingle |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning Procesamiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neurales (Computadores) Neoplasmas de la mama Ingeniería |
title_short |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
title_full |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
title_fullStr |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
title_full_unstemmed |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
title_sort |
Identificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learning |
dc.creator.fl_str_mv |
Movilla Mendoza, Vanessa Paola |
dc.contributor.advisor.none.fl_str_mv |
Arbeláez Escalante, Pablo Andrés Higuera Arias, Carolina Lozano Martínez, Fernando Enrique |
dc.contributor.author.none.fl_str_mv |
Movilla Mendoza, Vanessa Paola |
dc.contributor.jury.none.fl_str_mv |
Giraldo Trujillo, Luis Felipe |
dc.subject.armarc.es_CO.fl_str_mv |
Procesamiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neurales (Computadores) Neoplasmas de la mama |
topic |
Procesamiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neurales (Computadores) Neoplasmas de la mama Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativos |
publishDate |
2019 |
dc.date.issued.none.fl_str_mv |
2019 |
dc.date.accessioned.none.fl_str_mv |
2021-02-18T12:34:58Z |
dc.date.available.none.fl_str_mv |
2021-02-18T12:34:58Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/48853 |
dc.identifier.pdf.none.fl_str_mv |
u833479.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/48853 |
identifier_str_mv |
u833479.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
25 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería Electrónica |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería Eléctrica y Electrónica |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/2770565f-b901-4a90-8122-9fce9604ec48/download https://repositorio.uniandes.edu.co/bitstreams/f05295d4-0fbd-4590-9cb0-7c5f90743a52/download https://repositorio.uniandes.edu.co/bitstreams/21030a85-393f-42be-ab46-538f42bdc072/download |
bitstream.checksum.fl_str_mv |
25404dafda8c36d6d32d8263e3aead50 c4453434efa8e062b2172ff1418658df b2deb83fba4dc620df21536c17981582 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133887590006784 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arbeláez Escalante, Pablo Andrésb386017b-fe04-4081-853a-8327e77a02b3400Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::5734-1Movilla Mendoza, Vanessa Paola31738d2d-6325-4056-89f3-7b448d9931ad500Giraldo Trujillo, Luis Felipe2021-02-18T12:34:58Z2021-02-18T12:34:58Z2019http://hdl.handle.net/1992/48853u833479.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/El cáncer de mama es el cáncer más común en las mujeres, tanto mundialmente como en América latina. Uno de los primeros sitios de diseminación del cáncer de mama son los ganglios linfáticos, por lo que el correcto análisis de las imágenes producidas por la biopsia de estos es de gran importancia para determinar si las células cancerosas han adquirido la capacidad para diseminarse. Se busca implementar un sistema de identificación automática del tejido metastásico en imágenes histológicas de las biopsias para así facilitar este proceso. Durante el desarrollo del proyecto se realizaron pruebas con dos modelos diferentes basados en una red neuronal convolucional presentada en el reto Pcam y algoritmos más tradicionales encontrados en la literatura. Se realizo el preprocesamiento de los datos y se entrenó el respectivo clasificador. Para el primer modelo se trabajó en la segmentación de los núcleos de las células presentes en la imagen, para lo cual se realizaron operaciones como clausuras morfológicas y umbralización por percentil. Una vez obtenida la máscara de núcleos, se calculan varias características morfológicas para cada uno, las cuales son usadas para entrenar distintos clasificadores. Para la selección del clasificador, se realiza una búsqueda de hiperparametros para RandomForest y SVM(Support Vector Machine). En el segundo modelo se prueban distintas arquitecturas de redes neuronales convolucionales, cuya entrada corresponde a las imágenes normalizadas. Una vez es elegida la arquitectura con mejor ACA y F-medida, se varía el umbral de clasificación debido a que es necesario disminuir el número de falsos negativosBreast cancer is the most common cancer in women, both worldwide and in Latin America. The proper analysis of images produced by breast biopsy is of great importance in determining whether cancer cells have acquired the ability to spread. The goal is to implement a system of automatic identification of metastatic tissue in histological images of biopsies to facilitate this process. During the development of the project, tests were carried out on two different models based on a convolutional neural network presented in the Pcam challenge and more traditional algorithms found in the literature. The data was preprocesed and the respective classifier was trained. The first set was the segmentation of the nuclei of the cells present in the image, for which operations such as morphological closures and percentile thresholding were performed. Once the mask is obtained, several morphological characteristics are calculated for each, which are used to train different classifiers. For classifier selection, a hyperparameter search is performed for RandomForest and SVM (Support Vector Machine). The second model tests different architectures of convolutional neural networks, the input of which corresponds to the normalized images. Once the architecture with the best ACA and F-measure is chosen, the classification threshold is varied because it is necessary to decrease the number of false negativesIngeniero ElectrónicoPregrado25 hojasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaIdentificación automática de tejido metastásico en imágenes de nódulos linfáticos usando machine learningTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPProcesamiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neurales (Computadores)Neoplasmas de la mamaIngenieríaPublicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::5734-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::5734-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::5734-1TEXTu833479.pdf.txtu833479.pdf.txtExtracted texttext/plain47911https://repositorio.uniandes.edu.co/bitstreams/2770565f-b901-4a90-8122-9fce9604ec48/download25404dafda8c36d6d32d8263e3aead50MD54ORIGINALu833479.pdfapplication/pdf2022609https://repositorio.uniandes.edu.co/bitstreams/f05295d4-0fbd-4590-9cb0-7c5f90743a52/downloadc4453434efa8e062b2172ff1418658dfMD51THUMBNAILu833479.pdf.jpgu833479.pdf.jpgIM Thumbnailimage/jpeg9846https://repositorio.uniandes.edu.co/bitstreams/21030a85-393f-42be-ab46-538f42bdc072/downloadb2deb83fba4dc620df21536c17981582MD551992/48853oai:repositorio.uniandes.edu.co:1992/488532024-03-13 13:00:46.278https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |