Metodología para el aprendizaje de máquina a partir de múltiples expertos en procesos de clasificación de bioseñales

En este trabajo se presenta una metodología de entrenamiento de máquina a partir de ambientes multi-etiquetador, cuando la presencia de un conjunto de etiquetas confiable o Ground Truth no puede obtenerse de manera trivial y requiere obtenerse a partir del criterio de un grupo de evaluadores. Median...

Full description

Autores:
Murillo Rendón, Santiago
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/12022
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/12022
http://bdigital.unal.edu.co/9624/
Palabra clave:
61 Ciencias médicas; Medicina / Medicine and health
62 Ingeniería y operaciones afines / Engineering
Aprendizaje automático (inteligencia artificial)
electrónica médica
fonocardiografía
Reconocimiento óptico de modelos
Machine learning
medical electronics
phonocardiography
Multi-etiquetador
vector de etiquetas
lti-labeler, labeling vector
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En este trabajo se presenta una metodología de entrenamiento de máquina a partir de ambientes multi-etiquetador, cuando la presencia de un conjunto de etiquetas confiable o Ground Truth no puede obtenerse de manera trivial y requiere obtenerse a partir del criterio de un grupo de evaluadores. Mediante la modificación de la formulación estándar de una máquina de soporte vectorial es posible no solo obtener un conjunto de etiquetas confiable, sino también penalizar la calidad de evaluación de cada persona y emitir un valor de carácter objetivo de cara a la naturaleza de los datos. La metodología es probada sobre bases de datos reales como son la base de datos de voz para el estudio de hipernasalidad y la base de datos de fonocardiografía para el estudio de soplos, ambas bases de datos cuentan con etiquetas obtenidas de personal especialista. También es sometida a la base de datos Iris, ampliamente utilizada para ilustrar procedimientos relacionados con el reconocimiento de patrones y a la cual se han adicionado conjuntos de etiquetas simulados para presentar características particulares de la metodología expuesta. De manera adicional, se presenta la extensión de la metodología al caso multiclase abordado desde las propuestas habituales para máquinas de soporte vectorial y se sugiere una formulación especial del problema de optimización que incluye los datos de todas las clases al tiempo