Analysis of academic performance using machine learning techniques with assembly methods

Contreras Bravo, Leonardo Emiro; Fuentes López, Héctor Javier; Rivas Trujilllo, Edwin

Red de Bibliotecas Virtuales de Ciencias Sociales en
América Latina y el Caribe

Por favor, use este identificador para citar o enlazar este ítem: https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/216547

Título :	Analysis of academic performance using machine learning techniques with assembly methods Análisis del rendimiento académico mediante técnicas de aprendizaje automático con métodos de ensamble
Palabras clave :	Boosting;Educational data analytics;Ensemble;Machine learning;Student academic performance;Análisis de datos educativo;Aprendizaje automático;Educación superior;Modelo;Rendimiento académico
Editorial :	Red Iberoamericana de Pedagogía
Descripción :	In recent years, the educational field has been permeated by data analysis models and algorithms that aim to search for knowledge from data to improve academic performance and other indicators. The main objective of this research is to predict the academic performance of students through machine learning techniques. Through feature selection methods are analyzed 324 variables, in order to determine the influential variables. The university academic performance prediction model is evaluated by means of supervised algorithms (KNN, SVC, Naive Bayes and decision tree), which are optimized using Python language. In addition, assembly algorithms are implemented that allow improving the accuracy of the previous classifiers. Bagging (CART, Random Forest; ExtraTreesClassifier), Boosting (AdaBoost, GBM, XGBoost, CatBoost, Light Boost) and Voting (Blending, Stacking) methods are implemented. The results show that the Stacking and Blending algorithms with accuracy values in each semester that oscillate around 85% and 75% for training and testing, respectively, yield the best results. En los últimos años el campo educativo se ha visto permeado por modelos y algoritmos de análisis de datos que pretenden la búsqueda de conocimiento a partir de los datos para mejorar el rendimiento académico y otros indicadores. El objetivo principal de este trabajo es predecir el rendimiento académico de estudiantes mediante técnicas de aprendizaje automático. Se analizan 324 variables mediante métodos de selección de características, con el fin de determinar las variables influyentes. El modelo de predicción del rendimiento académico universitario es evaluado por medio de algoritmos supervisados (KNN, SVC, Naive Bayes y árbol de decisión), los cuales son optimizados mediante lenguaje Python. Además, son implementados algoritmos de ensamble que permiten mejorar la exactitud de los clasificadores previos. Se implementan métodos Bagging (CART, Random Forest; ExtraTreesClassifier), métodos Boosting (AdaBoost, GBM, XGBoost, CatBoost, Light Boost) y Voting (Blending, Stacking). Los resultados muestran que los algoritmos Stacking y Blending con valores de precisión en cada semestre que oscilan alrededor de 85% y 75% para entrenamiento y prueba respetivamente arrojan los mejores resultados.
URI :	https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/216547
Otros identificadores :	https://revista.redipe.org/index.php/1/article/view/1737 10.36260/rbr.v10i13.1737
Aparece en las colecciones:	Red Iberoamericana de Pedagogía - REDIPE - Cosecha

Ficheros en este ítem:

No hay ficheros asociados a este ítem.

Mostrar el registro Dublin Core completo del ítem

Red de Bibliotecas Virtuales de Ciencias Sociales en América Latina y el Caribe

Red de Bibliotecas Virtuales de Ciencias Sociales en
América Latina y el Caribe