Selección de características usando modelo hibrido basado en algoritmos genéticos

En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las c...

Full description

Autores:
Giraldo, Luis Felipe
Trejos, Edilson Delgado
Riaño, Juan Carlos
Castellanos Domínguez, Germán
Tipo de recurso:
Article of journal
Fecha de publicación:
2006
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/28779
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/28779
http://bdigital.unal.edu.co/18827/
Palabra clave:
feature selection
genetic algorithm
decision tree
the k nearest neighbor rule
relevancy
selección de características
algoritmos genéticos
árboles de decisión
k-vecinos más cercanos
relevancia
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_e428540347afba5004964437c2f78ab0
oai_identifier_str oai:repositorio.unal.edu.co:unal/28779
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Selección de características usando modelo hibrido basado en algoritmos genéticos
title Selección de características usando modelo hibrido basado en algoritmos genéticos
spellingShingle Selección de características usando modelo hibrido basado en algoritmos genéticos
feature selection
genetic algorithm
decision tree
the k nearest neighbor rule
relevancy
selección de características
algoritmos genéticos
árboles de decisión
k-vecinos más cercanos
relevancia
title_short Selección de características usando modelo hibrido basado en algoritmos genéticos
title_full Selección de características usando modelo hibrido basado en algoritmos genéticos
title_fullStr Selección de características usando modelo hibrido basado en algoritmos genéticos
title_full_unstemmed Selección de características usando modelo hibrido basado en algoritmos genéticos
title_sort Selección de características usando modelo hibrido basado en algoritmos genéticos
dc.creator.fl_str_mv Giraldo, Luis Felipe
Trejos, Edilson Delgado
Riaño, Juan Carlos
Castellanos Domínguez, Germán
dc.contributor.author.spa.fl_str_mv Giraldo, Luis Felipe
Trejos, Edilson Delgado
Riaño, Juan Carlos
Castellanos Domínguez, Germán
dc.subject.proposal.spa.fl_str_mv feature selection
genetic algorithm
decision tree
the k nearest neighbor rule
relevancy
selección de características
algoritmos genéticos
árboles de decisión
k-vecinos más cercanos
relevancia
topic feature selection
genetic algorithm
decision tree
the k nearest neighbor rule
relevancy
selección de características
algoritmos genéticos
árboles de decisión
k-vecinos más cercanos
relevancia
description En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las cuales seguidamente se evalúa su relevancia mediante el criterio del mínimo error de clasificación. El procedimiento de evaluación se desarrolla empleando la regla de los k-vecinos más cercanos. Usualmente, la reducción de espacios supone una cota de error de clasificación; sin embargo, en este trabajo la sintonización del modelo hibrido de selección se realiza usando algoritmos genéticos, con lo cual se obtiene de forma simultánea la minimización tanto del número de características de entrenamiento, como del error de clasificación. De manera adicional, a diferencia de las técnicas convencionales de selección, el modelo propuesto permite cuantificar el nivel de relevancia de cada característica perteneciente al conjunto reducido de entrenamiento. Las pruebas del modelo se realizan para la identificación de hipernasalidad, en el caso de voz, y cardiopatía isquémica, en el caso de registros de electrocardiografía. Las bases de datos corresponden a una población de 90 niños (45 registros por clase) y a 100 registros electrocardiográficos (50 por clase). Los resultados obtenidos muestran una efectividad promedio para la reducción del espacio de entrenamiento inicial hasta de un 88%, con una tasa promedio de error de clasificación inferior al 6%.
publishDate 2006
dc.date.issued.spa.fl_str_mv 2006
dc.date.accessioned.spa.fl_str_mv 2019-06-26T10:23:55Z
dc.date.available.spa.fl_str_mv 2019-06-26T10:23:55Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/28779
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/18827/
url https://repositorio.unal.edu.co/handle/unal/28779
http://bdigital.unal.edu.co/18827/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/ingeinv/article/view/14759
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e Investigación
Ingeniería e Investigación
dc.relation.ispartofseries.none.fl_str_mv Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609
dc.relation.references.spa.fl_str_mv Giraldo, Luis Felipe and Trejos, Edilson Delgado and Riaño, Juan Carlos and Castellanos Domínguez, Germán (2006) Selección de características usando modelo hibrido basado en algoritmos genéticos. Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia - Facultad de Ingeniería
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/28779/1/14759-57125-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/28779/2/14759-57125-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv ea64d229a837098bf80b9f4fedcbbfc4
0809804df71ffd0368c9ea8939364803
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886593327267840
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Giraldo, Luis Felipe1682b87a-9c76-4f5d-90db-5c6f32cb2ee6300Trejos, Edilson Delgadoa58e67ca-c4ea-4ff1-8c25-5db6c2ddb0e7300Riaño, Juan Carlosc42b6cf9-9dae-4d5a-a1c5-06764ab5143a300Castellanos Domínguez, Germánff52d7c8-eec7-4dca-bce8-b3a7876023403002019-06-26T10:23:55Z2019-06-26T10:23:55Z2006https://repositorio.unal.edu.co/handle/unal/28779http://bdigital.unal.edu.co/18827/En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las cuales seguidamente se evalúa su relevancia mediante el criterio del mínimo error de clasificación. El procedimiento de evaluación se desarrolla empleando la regla de los k-vecinos más cercanos. Usualmente, la reducción de espacios supone una cota de error de clasificación; sin embargo, en este trabajo la sintonización del modelo hibrido de selección se realiza usando algoritmos genéticos, con lo cual se obtiene de forma simultánea la minimización tanto del número de características de entrenamiento, como del error de clasificación. De manera adicional, a diferencia de las técnicas convencionales de selección, el modelo propuesto permite cuantificar el nivel de relevancia de cada característica perteneciente al conjunto reducido de entrenamiento. Las pruebas del modelo se realizan para la identificación de hipernasalidad, en el caso de voz, y cardiopatía isquémica, en el caso de registros de electrocardiografía. Las bases de datos corresponden a una población de 90 niños (45 registros por clase) y a 100 registros electrocardiográficos (50 por clase). Los resultados obtenidos muestran una efectividad promedio para la reducción del espacio de entrenamiento inicial hasta de un 88%, con una tasa promedio de error de clasificación inferior al 6%.The present work proposes a hybrid feature selection model aimed at reducing training time whilst maintaining classification accuracy. The model includes adlusting a decision tree for producing feature subsets. Such subsets’ statistical relevance was evaluated from their resulting classification error. Evaluation involved using the k-nearest neighbors’ rule. Dimension reduction techniques usually assume an element of error; however, the hybrid selection model was tuned by means of genetic algorithms in this work. They simultaneously minimise the number of fea- tures and training error. Contrasting with conventional methods, this model also led to quantifying the relevance of each training set’s features. The model was tested on speech signals (hypernasality classification) and ECG identification (ischemic cardiopathy). In the case of speech signals, the database consisted of 90 children (45 recordings per sample); the ECG database had 100 electrocardiograph records (50 recordings per sample). Results showed average reduction rates of up to 88%, classification error being less than 6%.application/pdfspaUniversidad Nacional de Colombia - Facultad de Ingenieríahttp://revistas.unal.edu.co/index.php/ingeinv/article/view/14759Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e InvestigaciónIngeniería e InvestigaciónIngeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609Giraldo, Luis Felipe and Trejos, Edilson Delgado and Riaño, Juan Carlos and Castellanos Domínguez, Germán (2006) Selección de características usando modelo hibrido basado en algoritmos genéticos. Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609 .Selección de características usando modelo hibrido basado en algoritmos genéticosArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTfeature selectiongenetic algorithmdecision treethe k nearest neighbor rulerelevancyselección de característicasalgoritmos genéticosárboles de decisiónk-vecinos más cercanosrelevanciaORIGINAL14759-57125-1-PB.pdfapplication/pdf681430https://repositorio.unal.edu.co/bitstream/unal/28779/1/14759-57125-1-PB.pdfea64d229a837098bf80b9f4fedcbbfc4MD51THUMBNAIL14759-57125-1-PB.pdf.jpg14759-57125-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg8491https://repositorio.unal.edu.co/bitstream/unal/28779/2/14759-57125-1-PB.pdf.jpg0809804df71ffd0368c9ea8939364803MD52unal/28779oai:repositorio.unal.edu.co:unal/287792023-11-11 23:28:56.413Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co