Metodología para el aprendizaje de máquina a partir de múltiples expertos en procesos de clasificación de bioseñales
En este trabajo se presenta una metodología de entrenamiento de máquina a partir de ambientes multi-etiquetador, cuando la presencia de un conjunto de etiquetas confiable o Ground Truth no puede obtenerse de manera trivial y requiere obtenerse a partir del criterio de un grupo de evaluadores. Median...
- Autores:
-
Murillo Rendón, Santiago
- Tipo de recurso:
- Fecha de publicación:
- 2013
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/12022
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/12022
http://bdigital.unal.edu.co/9624/
- Palabra clave:
- 61 Ciencias médicas; Medicina / Medicine and health
62 Ingeniería y operaciones afines / Engineering
Aprendizaje automático (inteligencia artificial)
electrónica médica
fonocardiografía
Reconocimiento óptico de modelos
Machine learning
medical electronics
phonocardiography
Multi-etiquetador
vector de etiquetas
lti-labeler, labeling vector
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | En este trabajo se presenta una metodología de entrenamiento de máquina a partir de ambientes multi-etiquetador, cuando la presencia de un conjunto de etiquetas confiable o Ground Truth no puede obtenerse de manera trivial y requiere obtenerse a partir del criterio de un grupo de evaluadores. Mediante la modificación de la formulación estándar de una máquina de soporte vectorial es posible no solo obtener un conjunto de etiquetas confiable, sino también penalizar la calidad de evaluación de cada persona y emitir un valor de carácter objetivo de cara a la naturaleza de los datos. La metodología es probada sobre bases de datos reales como son la base de datos de voz para el estudio de hipernasalidad y la base de datos de fonocardiografía para el estudio de soplos, ambas bases de datos cuentan con etiquetas obtenidas de personal especialista. También es sometida a la base de datos Iris, ampliamente utilizada para ilustrar procedimientos relacionados con el reconocimiento de patrones y a la cual se han adicionado conjuntos de etiquetas simulados para presentar características particulares de la metodología expuesta. De manera adicional, se presenta la extensión de la metodología al caso multiclase abordado desde las propuestas habituales para máquinas de soporte vectorial y se sugiere una formulación especial del problema de optimización que incluye los datos de todas las clases al tiempo |
---|