Minería de datos utilizando el algoritmo de clasificación C4.5
El objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación...
- Autores:
-
Lamo Badillo, Bladimir
Escobar Ocampo, Giovanni
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2000
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/26015
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/26015
- Palabra clave:
- Systems engineer
Technological innovations
Algorithms
Data mining
Educational variables
Qualitative variables
Computer programs
Artificial intelligence
Academic evaluation
Ingeniería de sistemas
Innovaciones tecnológicas
Programas para computador
Minería de datos
Inteligencia artificial
Evaluación académica
Algoritmos
Variables educativas
Variables cualitativas
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_66dab5aab0e61b9ee0f598d9a11b0c42 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/26015 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
dc.title.translated.spa.fl_str_mv |
Data mining using the C4.5 classification algorithm |
title |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
spellingShingle |
Minería de datos utilizando el algoritmo de clasificación C4.5 Systems engineer Technological innovations Algorithms Data mining Educational variables Qualitative variables Computer programs Artificial intelligence Academic evaluation Ingeniería de sistemas Innovaciones tecnológicas Programas para computador Minería de datos Inteligencia artificial Evaluación académica Algoritmos Variables educativas Variables cualitativas |
title_short |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
title_full |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
title_fullStr |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
title_full_unstemmed |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
title_sort |
Minería de datos utilizando el algoritmo de clasificación C4.5 |
dc.creator.fl_str_mv |
Lamo Badillo, Bladimir Escobar Ocampo, Giovanni |
dc.contributor.advisor.none.fl_str_mv |
García Díaz, Juan Carlos |
dc.contributor.author.none.fl_str_mv |
Lamo Badillo, Bladimir Escobar Ocampo, Giovanni |
dc.contributor.cvlac.spa.fl_str_mv |
García Diaz, Juan Carlos [0000201529] |
dc.subject.keywords.spa.fl_str_mv |
Systems engineer Technological innovations Algorithms Data mining Educational variables Qualitative variables Computer programs Artificial intelligence Academic evaluation |
topic |
Systems engineer Technological innovations Algorithms Data mining Educational variables Qualitative variables Computer programs Artificial intelligence Academic evaluation Ingeniería de sistemas Innovaciones tecnológicas Programas para computador Minería de datos Inteligencia artificial Evaluación académica Algoritmos Variables educativas Variables cualitativas |
dc.subject.lemb.spa.fl_str_mv |
Ingeniería de sistemas Innovaciones tecnológicas Programas para computador Minería de datos Inteligencia artificial Evaluación académica |
dc.subject.proposal.spa.fl_str_mv |
Algoritmos Variables educativas Variables cualitativas |
description |
El objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio. |
publishDate |
2000 |
dc.date.issued.none.fl_str_mv |
2000 |
dc.date.accessioned.none.fl_str_mv |
2024-08-13T18:20:42Z |
dc.date.available.none.fl_str_mv |
2024-08-13T18:20:42Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.local.spa.fl_str_mv |
Trabajo de Grado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.hasversion.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/26015 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.unab.edu.co |
url |
http://hdl.handle.net/20.500.12749/26015 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB repourl:https://repository.unab.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
ASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999 SALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997. CABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998 CABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999. QUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993. AHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana. UNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8]. Mining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.html Managomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.html UNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.html SIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory. |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) Atribución-NoComercial-SinDerivadas 2.5 Colombia http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spatial.spa.fl_str_mv |
Bucaramanga (Santander, Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería de Sistemas |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/26015/1/2000_Tesis_Bladimir_Badillo.pdf https://repository.unab.edu.co/bitstream/20.500.12749/26015/2/license.txt https://repository.unab.edu.co/bitstream/20.500.12749/26015/3/2000_Tesis_Bladimir_Badillo.pdf.jpg |
bitstream.checksum.fl_str_mv |
528c707b8fdf64ab80be76bcecf6a8fd 3755c0cfdb77e29f2b9125d7a45dd316 1b175b0ec51663436f9891d514a1e92d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814278002424414208 |
spelling |
García Díaz, Juan Carlosc59c6cfc-d09a-4b1a-991f-afcd2793bdd0Lamo Badillo, Bladimirfdfd35f6-4d3b-4314-a72d-15eb7e0e7750Escobar Ocampo, Giovannif211bc8c-4031-4472-ae46-dce641a55f4dGarcía Diaz, Juan Carlos [0000201529]Bucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-08-13T18:20:42Z2024-08-13T18:20:42Z2000http://hdl.handle.net/20.500.12749/26015instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coEl objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio.introducción ........................................................................................................................................................................................14 1.antecedentes................................................................................................................................................................................ 16 2. planteamiento y justificación del problema.................................................................................................................................... 17 3. marco teórico................................................................................................................................................................................ 19 3.1 minería de datos................................................................................................................................................................................ 19 3.1.1 pasos para el proceso de minería de datos............................................................................................................................ 20 3.1.1.1 definir objetivos......................................................................................................................................................................... 20 3.1.1.2 selección do los datos.............................................................................................................................................................. 20 3.1.1.3 procesamiento de los datos..................................................................................................................................................... 20 3.1.1.4 minería de datos........................................................................................................................................................................ 20 3.1.1.5 análisis de resultados ...............................................................................................................................................................21 3.1.1.6 asimilación de conocimiento ...................................................................................................................................................21 3.1.2 algoritmos de minería de datos ..................................................................................................................................................21 3.1.3 algoritmo de clasificación c4.5.................................................................................................................................................... 24 3.1.3.1 conceptos básicos del algoritmo............................................................................................................................................... 26 3.1.3.2 ejemplo ..........................................................................................................................................................................................30 4. estado del arte.................................................................................................................................................................................... 35 4.2 data servidor ......................................................................................................................................................................................35 4.3 dataengine......................................................................................................................................................................................... 36 4.4 cupid .....................................................................................................................................................................................................36 4.5 dbminer................................................................................................................................................................................ 37 5. desarrollo del algoritmo de clasificación c4.5................................................................................................................................ 38 5.1 implementación ................................................................................................................................................................................38 5.2 definición de datos de entrada .......................................................................................................................................................39 5.3 algoritmo de clasificación c4.5........................................................................................................................................................ 40 5.3.1 funciones de la aplicación.............................................................................................................................................................. 40 5.3.1.1 función quienes.......................................................................................................................................................................... 41 5.3.1.2 función cuantos........................................................................................................................................................................... 41 5.3.1.3 función entropía............................................................................................................................................................................42 5.3.1.4 función impureza .........................................................................................................................................................................42 5.3.1.5 función menor impureza............................................................................................................................................................ 43 5.4 programa principal........................................................................................................................................................................... 44 5.4.1 conversión de variables cuantitativas a variables cualitativas................................................................................................ 44 5.4.2 proceso principal ............................................................................................................................................................................47 5.4.3 diccionario de datos ........................................................................................................................................................................50 6. funcionabilidad de la herramienta.................................................................................................................................................... 53 7. minería de datos aplicando el algoritmo c4.5 en la base de datos de docentes....................................................................... 60 7.1 determinación de los objetivos del negocio de la facultad de la ingeniería de sistemas........................................................ 60 7.2 objetivos del estudio de minería de datos.................................................................................................................................... 63 7.3 preparación de los datos................................................................................................................................................................ 63 7.3.1 selección de los datos................................................................................................................................................................. 64 7.3.2 estructura de la base de datos de evaluación de docentes ....................................................................................................65 7.3.2.1 variables sicológicas ..................................................................................................................................................................68 7.3.2.2 variables educativas .................................................................................................................................................................70 7.4 procesamiento de datos.................................................................................................................................................................. 71 7.5 reglas de comportamiento ...........................................................................................................................................................71 7.6 interpretaciones................................................................................................................................................................................ 74 7.7 estrategias........................................................................................................................................................................................... 76 8. conclusiones y recomendaciones...................................................................................................................................................... 78 8.1 conclusiones .................................................................................................................................................................................78 8.2 recomendaciones ............................................................................................................................................................................78 bibliografía ................................................................................................................................................................................81 anexos.......................................................................................................................................................................................................83PregradoThe objective of this work is to apply a knowledge extraction methodology from the database of teachers of the Faculty of Systems Engineering of UNAS, in order to provide support in decision making on the administration of human resources of the FIS, through the application of an artificial intelligence technique such as data mining applied to large databases. The Artificial Intelligence technique used in data mining was the C4.5 classification algorithm applied to the database of the evaluation of teachers of the FIS to identify behavioral patterns of teachers who work in the faculty. The behavioral rules where the teacher works depending on the variables taken into account for the study.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Minería de datos utilizando el algoritmo de clasificación C4.5Data mining using the C4.5 classification algorithmIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPSystems engineerTechnological innovationsAlgorithmsData miningEducational variablesQualitative variablesComputer programsArtificial intelligenceAcademic evaluationIngeniería de sistemasInnovaciones tecnológicasProgramas para computadorMinería de datosInteligencia artificialEvaluación académicaAlgoritmosVariables educativasVariables cualitativasASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999SALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997.CABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998CABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999.QUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993.AHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana.UNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8].Mining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.htmlManagomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.htmlUNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.htmlSIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory.ORIGINAL2000_Tesis_Bladimir_Badillo.pdf2000_Tesis_Bladimir_Badillo.pdfTesisapplication/pdf16291519https://repository.unab.edu.co/bitstream/20.500.12749/26015/1/2000_Tesis_Bladimir_Badillo.pdf528c707b8fdf64ab80be76bcecf6a8fdMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/26015/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2000_Tesis_Bladimir_Badillo.pdf.jpg2000_Tesis_Bladimir_Badillo.pdf.jpgIM Thumbnailimage/jpeg8732https://repository.unab.edu.co/bitstream/20.500.12749/26015/3/2000_Tesis_Bladimir_Badillo.pdf.jpg1b175b0ec51663436f9891d514a1e92dMD53open access20.500.12749/26015oai:repository.unab.edu.co:20.500.12749/260152024-10-16 15:13:32.948open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg== |