Analítica de datos para la predicción del desempeño en el examen saber 11

La analítica de datos que es la ciencia que tiene como tarea examinar los datos en bruto, y sacar conclusiones útiles, y el Machine Learning es una importante área en la Inteligencia Artificial, dos de las más populares áreas del conocimiento en la actualidad y es porque buscan automatizar procesos...

Full description

Autores:
Forero Africano, Aron Rene
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2018
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/38589
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/38589
https://noesis.uis.edu.co
Palabra clave:
Icfes
Examen Saber11
Desempeño En El Examen Saber11
Deserción Estudiantil
Analítica De Datos
Machine Learning
Inteligencia Artificial.
Icfes
Saber11 Exam
Performance In Saber11 Exam
Data Analytics
Machine Learning
Artificial Intelligence.
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id UISANTADR2_00af7d16bab7a4d2b8c8ce34ed1698d0
oai_identifier_str oai:noesis.uis.edu.co:20.500.14071/38589
network_acronym_str UISANTADR2
network_name_str Repositorio UIS
repository_id_str
dc.title.none.fl_str_mv Analítica de datos para la predicción del desempeño en el examen saber 11
dc.title.english.none.fl_str_mv Data analytics for predicting performance in the saber11 exam.
title Analítica de datos para la predicción del desempeño en el examen saber 11
spellingShingle Analítica de datos para la predicción del desempeño en el examen saber 11
Icfes
Examen Saber11
Desempeño En El Examen Saber11
Deserción Estudiantil
Analítica De Datos
Machine Learning
Inteligencia Artificial.
Icfes
Saber11 Exam
Performance In Saber11 Exam
Data Analytics
Machine Learning
Artificial Intelligence.
title_short Analítica de datos para la predicción del desempeño en el examen saber 11
title_full Analítica de datos para la predicción del desempeño en el examen saber 11
title_fullStr Analítica de datos para la predicción del desempeño en el examen saber 11
title_full_unstemmed Analítica de datos para la predicción del desempeño en el examen saber 11
title_sort Analítica de datos para la predicción del desempeño en el examen saber 11
dc.creator.fl_str_mv Forero Africano, Aron Rene
dc.contributor.advisor.none.fl_str_mv Pedraza Ferreira, Gabriel Rodrigo
Ramos Pollan, Raul
dc.contributor.author.none.fl_str_mv Forero Africano, Aron Rene
dc.subject.none.fl_str_mv Icfes
Examen Saber11
Desempeño En El Examen Saber11
Deserción Estudiantil
Analítica De Datos
Machine Learning
Inteligencia Artificial.
topic Icfes
Examen Saber11
Desempeño En El Examen Saber11
Deserción Estudiantil
Analítica De Datos
Machine Learning
Inteligencia Artificial.
Icfes
Saber11 Exam
Performance In Saber11 Exam
Data Analytics
Machine Learning
Artificial Intelligence.
dc.subject.keyword.none.fl_str_mv Icfes
Saber11 Exam
Performance In Saber11 Exam
Data Analytics
Machine Learning
Artificial Intelligence.
description La analítica de datos que es la ciencia que tiene como tarea examinar los datos en bruto, y sacar conclusiones útiles, y el Machine Learning es una importante área en la Inteligencia Artificial, dos de las más populares áreas del conocimiento en la actualidad y es porque buscan automatizar procesos que se realizan manualmente, pero que pueden ser llevados a cabo por una máquina. La educación colombiana si bien ha visto una evolución significativa en los últimos años, se sitúa muy atrás en comparación con otros países. Los procesos de seguimiento y mejoramiento de la educación no dan los mejores resultados, y los programas de apoyo a los estudiantes son muy ineficaces y lentos; por tanto en esta investigación se propone la construcción de una herramienta de machine learning que contribuya a la identificación de los factores socio-económicos que afectan el rendimiento académico de los estudiantes. Se plantea utilizar los datos que proporciona las pruebas SABER11, desde el año 2000 hasta el año 2017. A estos datos se les hizo un análisis exploratorio y luego una limpieza profunda para que fuese posible su uso posterior en un modelo de machine learning. Con los datos ya limpios se hizo un análisis más profundo para tratar cualquier fenómeno particular que presentaran los datos. Lo siguiente fue plantear los modelos predictivos, realizar las respectivas pruebas, la selección de mejores algoritmos y la experimentación para obtener resultados. Se consiguió un error medio absoluto de 7.13 y finalmente se realizó un análisis a los resultados y se concluyó que factores como los ingresos familiares, la educación de los padres, algunos aspectos del colegio, entre otros, influyen en el rendimiento académico del estudiante.
publishDate 2018
dc.date.available.none.fl_str_mv 2018
2024-03-04T00:04:25Z
dc.date.created.none.fl_str_mv 2018
dc.date.issued.none.fl_str_mv 2018
dc.date.accessioned.none.fl_str_mv 2024-03-04T00:04:25Z
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
format http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.identifier.uri.none.fl_str_mv https://noesis.uis.edu.co/handle/20.500.14071/38589
dc.identifier.instname.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.reponame.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.repourl.none.fl_str_mv https://noesis.uis.edu.co
url https://noesis.uis.edu.co/handle/20.500.14071/38589
https://noesis.uis.edu.co
identifier_str_mv Universidad Industrial de Santander
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.none.fl_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
rights_invalid_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
http://creativecommons.org/licenses/by/4.0/
http://creativecommons.org/licenses/by-nc/4.0
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Industrial de Santander
dc.publisher.faculty.none.fl_str_mv Facultad de Ingenierías Fisicomecánicas
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas
dc.publisher.school.none.fl_str_mv Escuela de Ingeniería de Sistemas e Informática
publisher.none.fl_str_mv Universidad Industrial de Santander
institution Universidad Industrial de Santander
bitstream.url.fl_str_mv https://noesis.uis.edu.co/bitstreams/46d92b5f-e08b-407e-b2ae-1d8502d6b5cf/download
https://noesis.uis.edu.co/bitstreams/33ff7a76-a92e-45d1-bb0b-b85a1b17f8d7/download
https://noesis.uis.edu.co/bitstreams/03360020-de2d-4db8-b208-48f35c4f1c1c/download
bitstream.checksum.fl_str_mv 1a4c12790662055670c01b4a8363d28c
9f2ec65daf33a49dfab697c829fed3e0
15597b553793e9f11a68ec8e5b861b3c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv DSpace at UIS
repository.mail.fl_str_mv noesis@uis.edu.co
_version_ 1814095180278530048
spelling Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)http://creativecommons.org/licenses/by/4.0/http://creativecommons.org/licenses/by-nc/4.0Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2Pedraza Ferreira, Gabriel RodrigoRamos Pollan, RaulForero Africano, Aron Rene2024-03-04T00:04:25Z20182024-03-04T00:04:25Z20182018https://noesis.uis.edu.co/handle/20.500.14071/38589Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coLa analítica de datos que es la ciencia que tiene como tarea examinar los datos en bruto, y sacar conclusiones útiles, y el Machine Learning es una importante área en la Inteligencia Artificial, dos de las más populares áreas del conocimiento en la actualidad y es porque buscan automatizar procesos que se realizan manualmente, pero que pueden ser llevados a cabo por una máquina. La educación colombiana si bien ha visto una evolución significativa en los últimos años, se sitúa muy atrás en comparación con otros países. Los procesos de seguimiento y mejoramiento de la educación no dan los mejores resultados, y los programas de apoyo a los estudiantes son muy ineficaces y lentos; por tanto en esta investigación se propone la construcción de una herramienta de machine learning que contribuya a la identificación de los factores socio-económicos que afectan el rendimiento académico de los estudiantes. Se plantea utilizar los datos que proporciona las pruebas SABER11, desde el año 2000 hasta el año 2017. A estos datos se les hizo un análisis exploratorio y luego una limpieza profunda para que fuese posible su uso posterior en un modelo de machine learning. Con los datos ya limpios se hizo un análisis más profundo para tratar cualquier fenómeno particular que presentaran los datos. Lo siguiente fue plantear los modelos predictivos, realizar las respectivas pruebas, la selección de mejores algoritmos y la experimentación para obtener resultados. Se consiguió un error medio absoluto de 7.13 y finalmente se realizó un análisis a los resultados y se concluyó que factores como los ingresos familiares, la educación de los padres, algunos aspectos del colegio, entre otros, influyen en el rendimiento académico del estudiante.PregradoIngeniero de SistemasData analysis is the science that has the task to examine the pure data and make useful conclusions, and machine learning a really important area of the artificial intelligence, are two of the most popular areas of the knowledge in the present and that is because are looking for automation in a lot of processes that are manually done, but could be done by a machine. The Colombian education although have seen a good improvement in the last years, it is located far back in comparison to other countries. The monitoring processes and the processes of improvement are not giving the better results, and the students support programs are so slow and ineffective; thus in this investigation the construction of a machine learning tool that contributes to identify the socio-economic factors that affects the academic performance of the student is proposed. It is proposed to use the SABER11 data, since the 2000 to the 2017 year. An exploratory analysis was done and then a data cleaning to this data with the purpose of using it into a machine learning model. With the data already cleaned a deeper analysis was done to treat any particular phenomenon that could exist. The next step was purpose the predictive models, do the respective tests, the selection of the best algorithms and the experimentation to get the results. A mean absolute error of 7.13 was achieved and finally an analysis of the results was done, and it was conclude that factors such as family income, parents education, some aspects of the school among others, influence the academic performance of the students.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingenierías FisicomecánicasIngeniería de SistemasEscuela de Ingeniería de Sistemas e InformáticaIcfesExamen Saber11Desempeño En El Examen Saber11Deserción EstudiantilAnalítica De DatosMachine LearningInteligencia Artificial.IcfesSaber11 ExamPerformance In Saber11 ExamData AnalyticsMachine LearningArtificial Intelligence.Analítica de datos para la predicción del desempeño en el examen saber 11Data analytics for predicting performance in the saber11 exam.Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf1491844https://noesis.uis.edu.co/bitstreams/46d92b5f-e08b-407e-b2ae-1d8502d6b5cf/download1a4c12790662055670c01b4a8363d28cMD51Documento.pdfapplication/pdf5168675https://noesis.uis.edu.co/bitstreams/33ff7a76-a92e-45d1-bb0b-b85a1b17f8d7/download9f2ec65daf33a49dfab697c829fed3e0MD52Nota de proyecto.pdfapplication/pdf162018https://noesis.uis.edu.co/bitstreams/03360020-de2d-4db8-b208-48f35c4f1c1c/download15597b553793e9f11a68ec8e5b861b3cMD5320.500.14071/38589oai:noesis.uis.edu.co:20.500.14071/385892024-03-03 19:04:25.251http://creativecommons.org/licenses/by-nc/4.0http://creativecommons.org/licenses/by/4.0/open.accesshttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co