Minería de datos utilizando el algoritmo de clasificación C4.5

El objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación...

Full description

Autores:
Lamo Badillo, Bladimir
Escobar Ocampo, Giovanni
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2000
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/26015
Acceso en línea:
http://hdl.handle.net/20.500.12749/26015
Palabra clave:
Systems engineer
Technological innovations
Algorithms
Data mining
Educational variables
Qualitative variables
Computer programs
Artificial intelligence
Academic evaluation
Ingeniería de sistemas
Innovaciones tecnológicas
Programas para computador
Minería de datos
Inteligencia artificial
Evaluación académica
Algoritmos
Variables educativas
Variables cualitativas
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_66dab5aab0e61b9ee0f598d9a11b0c42
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/26015
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Minería de datos utilizando el algoritmo de clasificación C4.5
dc.title.translated.spa.fl_str_mv Data mining using the C4.5 classification algorithm
title Minería de datos utilizando el algoritmo de clasificación C4.5
spellingShingle Minería de datos utilizando el algoritmo de clasificación C4.5
Systems engineer
Technological innovations
Algorithms
Data mining
Educational variables
Qualitative variables
Computer programs
Artificial intelligence
Academic evaluation
Ingeniería de sistemas
Innovaciones tecnológicas
Programas para computador
Minería de datos
Inteligencia artificial
Evaluación académica
Algoritmos
Variables educativas
Variables cualitativas
title_short Minería de datos utilizando el algoritmo de clasificación C4.5
title_full Minería de datos utilizando el algoritmo de clasificación C4.5
title_fullStr Minería de datos utilizando el algoritmo de clasificación C4.5
title_full_unstemmed Minería de datos utilizando el algoritmo de clasificación C4.5
title_sort Minería de datos utilizando el algoritmo de clasificación C4.5
dc.creator.fl_str_mv Lamo Badillo, Bladimir
Escobar Ocampo, Giovanni
dc.contributor.advisor.none.fl_str_mv García Díaz, Juan Carlos
dc.contributor.author.none.fl_str_mv Lamo Badillo, Bladimir
Escobar Ocampo, Giovanni
dc.contributor.cvlac.spa.fl_str_mv García Diaz, Juan Carlos [0000201529]
dc.subject.keywords.spa.fl_str_mv Systems engineer
Technological innovations
Algorithms
Data mining
Educational variables
Qualitative variables
Computer programs
Artificial intelligence
Academic evaluation
topic Systems engineer
Technological innovations
Algorithms
Data mining
Educational variables
Qualitative variables
Computer programs
Artificial intelligence
Academic evaluation
Ingeniería de sistemas
Innovaciones tecnológicas
Programas para computador
Minería de datos
Inteligencia artificial
Evaluación académica
Algoritmos
Variables educativas
Variables cualitativas
dc.subject.lemb.spa.fl_str_mv Ingeniería de sistemas
Innovaciones tecnológicas
Programas para computador
Minería de datos
Inteligencia artificial
Evaluación académica
dc.subject.proposal.spa.fl_str_mv Algoritmos
Variables educativas
Variables cualitativas
description El objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio.
publishDate 2000
dc.date.issued.none.fl_str_mv 2000
dc.date.accessioned.none.fl_str_mv 2024-08-13T18:20:42Z
dc.date.available.none.fl_str_mv 2024-08-13T18:20:42Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/26015
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/26015
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv ASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999
SALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997.
CABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998
CABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999.
QUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993.
AHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana.
UNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8].
Mining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.html
Managomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.html
UNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.html
SIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Bucaramanga (Santander, Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería de Sistemas
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/26015/1/2000_Tesis_Bladimir_Badillo.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/26015/2/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/26015/3/2000_Tesis_Bladimir_Badillo.pdf.jpg
bitstream.checksum.fl_str_mv 528c707b8fdf64ab80be76bcecf6a8fd
3755c0cfdb77e29f2b9125d7a45dd316
1b175b0ec51663436f9891d514a1e92d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814278002424414208
spelling García Díaz, Juan Carlosc59c6cfc-d09a-4b1a-991f-afcd2793bdd0Lamo Badillo, Bladimirfdfd35f6-4d3b-4314-a72d-15eb7e0e7750Escobar Ocampo, Giovannif211bc8c-4031-4472-ae46-dce641a55f4dGarcía Diaz, Juan Carlos [0000201529]Bucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-08-13T18:20:42Z2024-08-13T18:20:42Z2000http://hdl.handle.net/20.500.12749/26015instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coEl objetivo do este trabajo es aplicar una metodología de extracción de conocimiento de la base de datos de docentes de la Facultad de Ingeniería de Sistemas de la UNAS, con el fin de brindar apoyo en la toma de decisiones sobre la administración del recurso humano de la FIS, mediante la aplicación de una técnica de inteligencia artificial como es la minería do datos aplicada a grandes bases de datos. La técnica de Inteligencia Artificial utilizada en la minería de datos (Data Mining) fue el algoritmo de clasificación C4.5 aplicada a la base de datos de la evaluación de docentes de la FIS para identificar patrones de comportamiento de los docentes que laboran en la facultad. La;, reglas de comportamiento donde labora el docente dependiendo de las variables tenidas en cuenta para el estudio.introducción ........................................................................................................................................................................................14 1.antecedentes................................................................................................................................................................................ 16 2. planteamiento y justificación del problema.................................................................................................................................... 17 3. marco teórico................................................................................................................................................................................ 19 3.1 minería de datos................................................................................................................................................................................ 19 3.1.1 pasos para el proceso de minería de datos............................................................................................................................ 20 3.1.1.1 definir objetivos......................................................................................................................................................................... 20 3.1.1.2 selección do los datos.............................................................................................................................................................. 20 3.1.1.3 procesamiento de los datos..................................................................................................................................................... 20 3.1.1.4 minería de datos........................................................................................................................................................................ 20 3.1.1.5 análisis de resultados ...............................................................................................................................................................21 3.1.1.6 asimilación de conocimiento ...................................................................................................................................................21 3.1.2 algoritmos de minería de datos ..................................................................................................................................................21 3.1.3 algoritmo de clasificación c4.5.................................................................................................................................................... 24 3.1.3.1 conceptos básicos del algoritmo............................................................................................................................................... 26 3.1.3.2 ejemplo ..........................................................................................................................................................................................30 4. estado del arte.................................................................................................................................................................................... 35 4.2 data servidor ......................................................................................................................................................................................35 4.3 dataengine......................................................................................................................................................................................... 36 4.4 cupid .....................................................................................................................................................................................................36 4.5 dbminer................................................................................................................................................................................ 37 5. desarrollo del algoritmo de clasificación c4.5................................................................................................................................ 38 5.1 implementación ................................................................................................................................................................................38 5.2 definición de datos de entrada .......................................................................................................................................................39 5.3 algoritmo de clasificación c4.5........................................................................................................................................................ 40 5.3.1 funciones de la aplicación.............................................................................................................................................................. 40 5.3.1.1 función quienes.......................................................................................................................................................................... 41 5.3.1.2 función cuantos........................................................................................................................................................................... 41 5.3.1.3 función entropía............................................................................................................................................................................42 5.3.1.4 función impureza .........................................................................................................................................................................42 5.3.1.5 función menor impureza............................................................................................................................................................ 43 5.4 programa principal........................................................................................................................................................................... 44 5.4.1 conversión de variables cuantitativas a variables cualitativas................................................................................................ 44 5.4.2 proceso principal ............................................................................................................................................................................47 5.4.3 diccionario de datos ........................................................................................................................................................................50 6. funcionabilidad de la herramienta.................................................................................................................................................... 53 7. minería de datos aplicando el algoritmo c4.5 en la base de datos de docentes....................................................................... 60 7.1 determinación de los objetivos del negocio de la facultad de la ingeniería de sistemas........................................................ 60 7.2 objetivos del estudio de minería de datos.................................................................................................................................... 63 7.3 preparación de los datos................................................................................................................................................................ 63 7.3.1 selección de los datos................................................................................................................................................................. 64 7.3.2 estructura de la base de datos de evaluación de docentes ....................................................................................................65 7.3.2.1 variables sicológicas ..................................................................................................................................................................68 7.3.2.2 variables educativas .................................................................................................................................................................70 7.4 procesamiento de datos.................................................................................................................................................................. 71 7.5 reglas de comportamiento ...........................................................................................................................................................71 7.6 interpretaciones................................................................................................................................................................................ 74 7.7 estrategias........................................................................................................................................................................................... 76 8. conclusiones y recomendaciones...................................................................................................................................................... 78 8.1 conclusiones .................................................................................................................................................................................78 8.2 recomendaciones ............................................................................................................................................................................78 bibliografía ................................................................................................................................................................................81 anexos.......................................................................................................................................................................................................83PregradoThe objective of this work is to apply a knowledge extraction methodology from the database of teachers of the Faculty of Systems Engineering of UNAS, in order to provide support in decision making on the administration of human resources of the FIS, through the application of an artificial intelligence technique such as data mining applied to large databases. The Artificial Intelligence technique used in data mining was the C4.5 classification algorithm applied to the database of the evaluation of teachers of the FIS to identify behavioral patterns of teachers who work in the faculty. The behavioral rules where the teacher works depending on the variables taken into account for the study.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Minería de datos utilizando el algoritmo de clasificación C4.5Data mining using the C4.5 classification algorithmIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPSystems engineerTechnological innovationsAlgorithmsData miningEducational variablesQualitative variablesComputer programsArtificial intelligenceAcademic evaluationIngeniería de sistemasInnovaciones tecnológicasProgramas para computadorMinería de datosInteligencia artificialEvaluación académicaAlgoritmosVariables educativasVariables cualitativasASOCIACION DE TECNICOS DE INFORMATICA. Edición No. 138. España. WWW.ati.es/PUBI ICACIONES/novatica/1999/138/enre138.html. 1.999SALCEDO, l laider Martín. ‘Sistema de información de control efectivo del recurso humano para la Facultad de Ingeniería do Sistemas UNAB'. Tesis de grado, Facultad de Ingeniería de Sistemas. 1997.CABENA, Peter. HADJINIAN, Pablo, STADLER, Rolf, VERDEES, Jaap, ZANASI, Alessandro. Discovering Data Mining, From Concepto To Implementation. Ediioiial Preritice i lall. 1.998CABEZA, Camilo García, CHAPARRO PELÁEZ, Julián. http://www.fcee.ulpgc.es/Acede98/acede/mesa11/11_03c.html. Universidad Politécnica de Madrid. 1999.QUINLAN, J. Ross. C4.5:Programs for machine learning. Editorial Morgan Kaufmann Publishers. University of Sidney. 1.993.AHO, Alfred V, HOPCROFT, John E, ULLMAN, Jeffrey D. Estructura de datos y algoritmos. Editorial Addison-Wesley Iberoamericana.UNIVERSIDAD DE HUELVA, España. Grupo de Inteligencia Artificial en Contabilidad y Administración de Empresas. Sistemas de inducción de árboles de decisión. http://ciberconta.unizar.es/Biblioteca/0007/arboles.html. 82 [8].Mining Web Data for Personalization http://Kdnuggets.com/software/sitt/datasurveyor.htmlManagomont Intelligentes Technologies. http://www.mitgmbh.de/mit/t_de.htmlUNIVERSITY OF PORTSMOUTH. Facultad de tecnología. http://www.sis.port.ac.uk/conference/abstracts /94/ jmallen.htmlSIMON FRASFR UNIVERSITY. http://www.cs.sfu.ca/DBMiner Database System Laboratory.ORIGINAL2000_Tesis_Bladimir_Badillo.pdf2000_Tesis_Bladimir_Badillo.pdfTesisapplication/pdf16291519https://repository.unab.edu.co/bitstream/20.500.12749/26015/1/2000_Tesis_Bladimir_Badillo.pdf528c707b8fdf64ab80be76bcecf6a8fdMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/26015/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2000_Tesis_Bladimir_Badillo.pdf.jpg2000_Tesis_Bladimir_Badillo.pdf.jpgIM Thumbnailimage/jpeg8732https://repository.unab.edu.co/bitstream/20.500.12749/26015/3/2000_Tesis_Bladimir_Badillo.pdf.jpg1b175b0ec51663436f9891d514a1e92dMD53open access20.500.12749/26015oai:repository.unab.edu.co:20.500.12749/260152024-10-16 15:13:32.948open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==