Selección de características usando modelo hibrido basado en algoritmos genéticos
En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las c...
- Autores:
-
Giraldo, Luis Felipe
Trejos, Edilson Delgado
Riaño, Juan Carlos
Castellanos Domínguez, Germán
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2006
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/28779
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/28779
http://bdigital.unal.edu.co/18827/
- Palabra clave:
- feature selection
genetic algorithm
decision tree
the k nearest neighbor rule
relevancy
selección de características
algoritmos genéticos
árboles de decisión
k-vecinos más cercanos
relevancia
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_e428540347afba5004964437c2f78ab0 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/28779 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
title |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
spellingShingle |
Selección de características usando modelo hibrido basado en algoritmos genéticos feature selection genetic algorithm decision tree the k nearest neighbor rule relevancy selección de características algoritmos genéticos árboles de decisión k-vecinos más cercanos relevancia |
title_short |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
title_full |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
title_fullStr |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
title_full_unstemmed |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
title_sort |
Selección de características usando modelo hibrido basado en algoritmos genéticos |
dc.creator.fl_str_mv |
Giraldo, Luis Felipe Trejos, Edilson Delgado Riaño, Juan Carlos Castellanos Domínguez, Germán |
dc.contributor.author.spa.fl_str_mv |
Giraldo, Luis Felipe Trejos, Edilson Delgado Riaño, Juan Carlos Castellanos Domínguez, Germán |
dc.subject.proposal.spa.fl_str_mv |
feature selection genetic algorithm decision tree the k nearest neighbor rule relevancy selección de características algoritmos genéticos árboles de decisión k-vecinos más cercanos relevancia |
topic |
feature selection genetic algorithm decision tree the k nearest neighbor rule relevancy selección de características algoritmos genéticos árboles de decisión k-vecinos más cercanos relevancia |
description |
En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las cuales seguidamente se evalúa su relevancia mediante el criterio del mínimo error de clasificación. El procedimiento de evaluación se desarrolla empleando la regla de los k-vecinos más cercanos. Usualmente, la reducción de espacios supone una cota de error de clasificación; sin embargo, en este trabajo la sintonización del modelo hibrido de selección se realiza usando algoritmos genéticos, con lo cual se obtiene de forma simultánea la minimización tanto del número de características de entrenamiento, como del error de clasificación. De manera adicional, a diferencia de las técnicas convencionales de selección, el modelo propuesto permite cuantificar el nivel de relevancia de cada característica perteneciente al conjunto reducido de entrenamiento. Las pruebas del modelo se realizan para la identificación de hipernasalidad, en el caso de voz, y cardiopatía isquémica, en el caso de registros de electrocardiografía. Las bases de datos corresponden a una población de 90 niños (45 registros por clase) y a 100 registros electrocardiográficos (50 por clase). Los resultados obtenidos muestran una efectividad promedio para la reducción del espacio de entrenamiento inicial hasta de un 88%, con una tasa promedio de error de clasificación inferior al 6%. |
publishDate |
2006 |
dc.date.issued.spa.fl_str_mv |
2006 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-26T10:23:55Z |
dc.date.available.spa.fl_str_mv |
2019-06-26T10:23:55Z |
dc.type.spa.fl_str_mv |
Artículo de revista |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/ART |
format |
http://purl.org/coar/resource_type/c_6501 |
status_str |
publishedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/28779 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/18827/ |
url |
https://repositorio.unal.edu.co/handle/unal/28779 http://bdigital.unal.edu.co/18827/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.spa.fl_str_mv |
http://revistas.unal.edu.co/index.php/ingeinv/article/view/14759 |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e Investigación Ingeniería e Investigación |
dc.relation.ispartofseries.none.fl_str_mv |
Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609 |
dc.relation.references.spa.fl_str_mv |
Giraldo, Luis Felipe and Trejos, Edilson Delgado and Riaño, Juan Carlos and Castellanos Domínguez, Germán (2006) Selección de características usando modelo hibrido basado en algoritmos genéticos. Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609 . |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Universidad Nacional de Colombia - Facultad de Ingeniería |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/28779/1/14759-57125-1-PB.pdf https://repositorio.unal.edu.co/bitstream/unal/28779/2/14759-57125-1-PB.pdf.jpg |
bitstream.checksum.fl_str_mv |
ea64d229a837098bf80b9f4fedcbbfc4 0809804df71ffd0368c9ea8939364803 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090047976112128 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Giraldo, Luis Felipe1682b87a-9c76-4f5d-90db-5c6f32cb2ee6300Trejos, Edilson Delgadoa58e67ca-c4ea-4ff1-8c25-5db6c2ddb0e7300Riaño, Juan Carlosc42b6cf9-9dae-4d5a-a1c5-06764ab5143a300Castellanos Domínguez, Germánff52d7c8-eec7-4dca-bce8-b3a7876023403002019-06-26T10:23:55Z2019-06-26T10:23:55Z2006https://repositorio.unal.edu.co/handle/unal/28779http://bdigital.unal.edu.co/18827/En el articulo se propone un modelo hibrido de selección de características con el objeto de reducir la dimensión del espacio de entrenamiento, sin comprometer la precisión de clasificación. El modelo incluye la inducción de un árbol de decisión que genera subconjuntos de características, para las cuales seguidamente se evalúa su relevancia mediante el criterio del mínimo error de clasificación. El procedimiento de evaluación se desarrolla empleando la regla de los k-vecinos más cercanos. Usualmente, la reducción de espacios supone una cota de error de clasificación; sin embargo, en este trabajo la sintonización del modelo hibrido de selección se realiza usando algoritmos genéticos, con lo cual se obtiene de forma simultánea la minimización tanto del número de características de entrenamiento, como del error de clasificación. De manera adicional, a diferencia de las técnicas convencionales de selección, el modelo propuesto permite cuantificar el nivel de relevancia de cada característica perteneciente al conjunto reducido de entrenamiento. Las pruebas del modelo se realizan para la identificación de hipernasalidad, en el caso de voz, y cardiopatía isquémica, en el caso de registros de electrocardiografía. Las bases de datos corresponden a una población de 90 niños (45 registros por clase) y a 100 registros electrocardiográficos (50 por clase). Los resultados obtenidos muestran una efectividad promedio para la reducción del espacio de entrenamiento inicial hasta de un 88%, con una tasa promedio de error de clasificación inferior al 6%.The present work proposes a hybrid feature selection model aimed at reducing training time whilst maintaining classification accuracy. The model includes adlusting a decision tree for producing feature subsets. Such subsets’ statistical relevance was evaluated from their resulting classification error. Evaluation involved using the k-nearest neighbors’ rule. Dimension reduction techniques usually assume an element of error; however, the hybrid selection model was tuned by means of genetic algorithms in this work. They simultaneously minimise the number of fea- tures and training error. Contrasting with conventional methods, this model also led to quantifying the relevance of each training set’s features. The model was tested on speech signals (hypernasality classification) and ECG identification (ischemic cardiopathy). In the case of speech signals, the database consisted of 90 children (45 recordings per sample); the ECG database had 100 electrocardiograph records (50 recordings per sample). Results showed average reduction rates of up to 88%, classification error being less than 6%.application/pdfspaUniversidad Nacional de Colombia - Facultad de Ingenieríahttp://revistas.unal.edu.co/index.php/ingeinv/article/view/14759Universidad Nacional de Colombia Revistas electrónicas UN Ingeniería e InvestigaciónIngeniería e InvestigaciónIngeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609Giraldo, Luis Felipe and Trejos, Edilson Delgado and Riaño, Juan Carlos and Castellanos Domínguez, Germán (2006) Selección de características usando modelo hibrido basado en algoritmos genéticos. Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 Ingeniería e Investigación; Vol. 26, núm. 3 (2006); 113-119 2248-8723 0120-5609 .Selección de características usando modelo hibrido basado en algoritmos genéticosArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTfeature selectiongenetic algorithmdecision treethe k nearest neighbor rulerelevancyselección de característicasalgoritmos genéticosárboles de decisiónk-vecinos más cercanosrelevanciaORIGINAL14759-57125-1-PB.pdfapplication/pdf681430https://repositorio.unal.edu.co/bitstream/unal/28779/1/14759-57125-1-PB.pdfea64d229a837098bf80b9f4fedcbbfc4MD51THUMBNAIL14759-57125-1-PB.pdf.jpg14759-57125-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg8491https://repositorio.unal.edu.co/bitstream/unal/28779/2/14759-57125-1-PB.pdf.jpg0809804df71ffd0368c9ea8939364803MD52unal/28779oai:repositorio.unal.edu.co:unal/287792023-11-11 23:28:56.413Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |