Red de Bibliotecas Virtuales de Ciencias Sociales en
América Latina y el Caribe
Por favor, use este identificador para citar o enlazar este ítem:
https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/216547
Título : | Analysis of academic performance using machine learning techniques with assembly methods Análisis del rendimiento académico mediante técnicas de aprendizaje automático con métodos de ensamble |
Palabras clave : | Boosting;Educational data analytics;Ensemble;Machine learning;Student academic performance;Análisis de datos educativo;Aprendizaje automático;Educación superior;Modelo;Rendimiento académico |
Editorial : | Red Iberoamericana de Pedagogía |
Descripción : | In recent years, the educational field has been permeated by data analysis models and algorithms that aim to search for knowledge from data to improve academic performance and other indicators. The main objective of this research is to predict the academic performance of students through machine learning techniques. Through feature selection methods are analyzed 324 variables, in order to determine the influential variables. The university academic performance prediction model is evaluated by means of supervised algorithms (KNN, SVC, Naive Bayes and decision tree), which are optimized using Python language. In addition, assembly algorithms are implemented that allow improving the accuracy of the previous classifiers. Bagging (CART, Random Forest; ExtraTreesClassifier), Boosting (AdaBoost, GBM, XGBoost, CatBoost, Light Boost) and Voting (Blending, Stacking) methods are implemented. The results show that the Stacking and Blending algorithms with accuracy values in each semester that oscillate around 85% and 75% for training and testing, respectively, yield the best results. En los últimos años el campo educativo se ha visto permeado por modelos y algoritmos de análisis de datos que pretenden la búsqueda de conocimiento a partir de los datos para mejorar el rendimiento académico y otros indicadores. El objetivo principal de este trabajo es predecir el rendimiento académico de estudiantes mediante técnicas de aprendizaje automático. Se analizan 324 variables mediante métodos de selección de características, con el fin de determinar las variables influyentes. El modelo de predicción del rendimiento académico universitario es evaluado por medio de algoritmos supervisados (KNN, SVC, Naive Bayes y árbol de decisión), los cuales son optimizados mediante lenguaje Python. Además, son implementados algoritmos de ensamble que permiten mejorar la exactitud de los clasificadores previos. Se implementan métodos Bagging (CART, Random Forest; ExtraTreesClassifier), métodos Boosting (AdaBoost, GBM, XGBoost, CatBoost, Light Boost) y Voting (Blending, Stacking). Los resultados muestran que los algoritmos Stacking y Blending con valores de precisión en cada semestre que oscilan alrededor de 85% y 75% para entrenamiento y prueba respetivamente arrojan los mejores resultados. |
URI : | https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/216547 |
Otros identificadores : | https://revista.redipe.org/index.php/1/article/view/1737 10.36260/rbr.v10i13.1737 |
Aparece en las colecciones: | Red Iberoamericana de Pedagogía - REDIPE - Cosecha |
Ficheros en este ítem:
No hay ficheros asociados a este ítem.
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.