Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto

Las entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de...

Full description

Autores:
Parra Moreno, Juan Camilo
Espinosa Orjuela, Paola Andrea
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2021
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/41225
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/41225
https://noesis.uis.edu.co
Palabra clave:
Minería de datos
Aprendizaje automático
Algoritmos
Analítica de datos
Metodología KDD
aprendizaje no supervisado
aprendizaje supervisado
Data mining
Machine learning
Algorithms
Data analytics
KDD Methodology
unsupervised learning
supervised learning
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id UISANTADR2_a9a924dbd516d5b65a0a88bff808b1ee
oai_identifier_str oai:noesis.uis.edu.co:20.500.14071/41225
network_acronym_str UISANTADR2
network_name_str Repositorio UIS
repository_id_str
dc.title.none.fl_str_mv Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
dc.title.english.none.fl_str_mv Application of data mining techniques to the Saber Pro 2019 test results in Industrial Engineering students.4*
title Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
spellingShingle Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
Minería de datos
Aprendizaje automático
Algoritmos
Analítica de datos
Metodología KDD
aprendizaje no supervisado
aprendizaje supervisado
Data mining
Machine learning
Algorithms
Data analytics
KDD Methodology
unsupervised learning
supervised learning
title_short Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
title_full Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
title_fullStr Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
title_full_unstemmed Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
title_sort Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
dc.creator.fl_str_mv Parra Moreno, Juan Camilo
Espinosa Orjuela, Paola Andrea
dc.contributor.advisor.none.fl_str_mv Lamos Díaz, Henry
dc.contributor.author.none.fl_str_mv Parra Moreno, Juan Camilo
Espinosa Orjuela, Paola Andrea
dc.subject.none.fl_str_mv Minería de datos
Aprendizaje automático
Algoritmos
Analítica de datos
Metodología KDD
aprendizaje no supervisado
aprendizaje supervisado
topic Minería de datos
Aprendizaje automático
Algoritmos
Analítica de datos
Metodología KDD
aprendizaje no supervisado
aprendizaje supervisado
Data mining
Machine learning
Algorithms
Data analytics
KDD Methodology
unsupervised learning
supervised learning
dc.subject.keyword.none.fl_str_mv Data mining
Machine learning
Algorithms
Data analytics
KDD Methodology
unsupervised learning
supervised learning
description Las entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de políticas públicas .En este artículo se explora la aplicación de la metodología KDD (Knowledge Discovery in Databases) a una base de datos que contiene los resultados del examen Saber Pro2019 publicados por el ICFES. Se realizaron análisis estadísticos y matemáticos a las variables consideradas de interés, se ajustó un modelo de clasificación a Instituciones de Educación Superior (IES) , se agruparon los estudiantes por medio de una clasificación socioeconómica y se crearon los perfiles tipológicos de cada grupo. Adicionalmente, se estudió la relación entre la clasificación socioeconómica, la institución de educación superior y el puntaje global por medio de un árbol de decisión. Por último, se realizó un análisis de sentimientos y se construyeron nubes de palabras con base a los resultados de una encuesta relacionada con las pruebas saber Pro. Se concluye que la categoría socioeconómica si es una variable con significancia estadística sobre el puntaje global, sin embargo, su influencia se ve trivializada en comparación con el efecto de la institución de educación superior con el puntaje. También se observa que hay una mayor proporción de estudiantes con categorías socioeconómicas más altas conforme aumenta la categoría la universidad. 1*
publishDate 2021
dc.date.available.none.fl_str_mv 2021
2024-03-04T01:14:00Z
dc.date.created.none.fl_str_mv 2021
dc.date.issued.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2024-03-04T01:14:00Z
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
format http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.identifier.uri.none.fl_str_mv https://noesis.uis.edu.co/handle/20.500.14071/41225
dc.identifier.instname.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.reponame.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.repourl.none.fl_str_mv https://noesis.uis.edu.co
url https://noesis.uis.edu.co/handle/20.500.14071/41225
https://noesis.uis.edu.co
identifier_str_mv Universidad Industrial de Santander
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.none.fl_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
rights_invalid_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
http://creativecommons.org/licenses/by/4.0/
http://creativecommons.org/licenses/by-nc/4.0
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Industrial de Santander
dc.publisher.faculty.none.fl_str_mv Facultad de Ingenierías Fisicomecánicas
dc.publisher.program.none.fl_str_mv Ingeniería Industrial
dc.publisher.school.none.fl_str_mv Escuela de Estudios Industriales y Empresariales
publisher.none.fl_str_mv Universidad Industrial de Santander
institution Universidad Industrial de Santander
bitstream.url.fl_str_mv https://noesis.uis.edu.co/bitstreams/0aef9a73-c6f9-440c-8d45-16e7508de33a/download
https://noesis.uis.edu.co/bitstreams/f2ac0431-e0b1-4dac-a83b-9d8fca91698e/download
https://noesis.uis.edu.co/bitstreams/cdf58e9c-02a3-416c-a6db-462faa52b3d0/download
bitstream.checksum.fl_str_mv 08ff07e53a5b9c13af0f51f41381828e
a3c1107b9a7123b015d225bc93595fc8
74ea27bb44af548e5cb7a05c791e4436
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv DSpace at UIS
repository.mail.fl_str_mv noesis@uis.edu.co
_version_ 1808402389578809344
spelling Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)http://creativecommons.org/licenses/by/4.0/http://creativecommons.org/licenses/by-nc/4.0Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2Lamos Díaz, HenryParra Moreno, Juan CamiloEspinosa Orjuela, Paola Andrea2024-03-04T01:14:00Z20212024-03-04T01:14:00Z20212021https://noesis.uis.edu.co/handle/20.500.14071/41225Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coLas entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de políticas públicas .En este artículo se explora la aplicación de la metodología KDD (Knowledge Discovery in Databases) a una base de datos que contiene los resultados del examen Saber Pro2019 publicados por el ICFES. Se realizaron análisis estadísticos y matemáticos a las variables consideradas de interés, se ajustó un modelo de clasificación a Instituciones de Educación Superior (IES) , se agruparon los estudiantes por medio de una clasificación socioeconómica y se crearon los perfiles tipológicos de cada grupo. Adicionalmente, se estudió la relación entre la clasificación socioeconómica, la institución de educación superior y el puntaje global por medio de un árbol de decisión. Por último, se realizó un análisis de sentimientos y se construyeron nubes de palabras con base a los resultados de una encuesta relacionada con las pruebas saber Pro. Se concluye que la categoría socioeconómica si es una variable con significancia estadística sobre el puntaje global, sin embargo, su influencia se ve trivializada en comparación con el efecto de la institución de educación superior con el puntaje. También se observa que hay una mayor proporción de estudiantes con categorías socioeconómicas más altas conforme aumenta la categoría la universidad. 1*PregradoIngeniero IndustrialThe Colombian State generates a large amount of data daily through his missionary processes, this data must be transformed into useful information that leads to improved government efficiency in practices aimed at the analysis and improvement of public policy design. This article explores the application of the KDD (Knowledge Discovery in Databases) methodology to a database containing the results of the Saber Pro2019 tests published by the ICFES. Statistical and mathematical analyses were performed on the variables deemed of interest, a classification model was adjusted on the Higher Education Institutions (IES), students were grouped by socioeconomic classification and typological profiles were created for each group. Additionally, the relationship between socioeconomic classification, higher education institution and overall score was studied by means of a decision tree. Finally, a sentiment analysis was performed and word clouds were constructed based on the results of a survey related to the saber Pro tests. It is concluded that the socioeconomic category is a variable with statistical significance on the overall score; however, its influence is trivialized in comparison with the effect that the institution of higher education has over the global score. It is also observed that there is a greater proportion of students with higher socioeconomic categories as the university category increases.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingenierías FisicomecánicasIngeniería IndustrialEscuela de Estudios Industriales y EmpresarialesMinería de datosAprendizaje automáticoAlgoritmosAnalítica de datosMetodología KDDaprendizaje no supervisadoaprendizaje supervisadoData miningMachine learningAlgorithmsData analyticsKDD Methodologyunsupervised learningsupervised learningAnálisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de textoApplication of data mining techniques to the Saber Pro 2019 test results in Industrial Engineering students.4*Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf112098https://noesis.uis.edu.co/bitstreams/0aef9a73-c6f9-440c-8d45-16e7508de33a/download08ff07e53a5b9c13af0f51f41381828eMD51Documento.pdfapplication/pdf2771827https://noesis.uis.edu.co/bitstreams/f2ac0431-e0b1-4dac-a83b-9d8fca91698e/downloada3c1107b9a7123b015d225bc93595fc8MD52Nota de proyecto.pdfapplication/pdf75431https://noesis.uis.edu.co/bitstreams/cdf58e9c-02a3-416c-a6db-462faa52b3d0/download74ea27bb44af548e5cb7a05c791e4436MD5320.500.14071/41225oai:noesis.uis.edu.co:20.500.14071/412252024-03-03 20:14:00.426http://creativecommons.org/licenses/by-nc/4.0http://creativecommons.org/licenses/by/4.0/open.accesshttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co