Dropout Prediction in Distance Learning Courses: a Decision Tree-Based Model Integrating Exogenous and Endogenous Causes

Authors

DOI:

https://doi.org/10.18264/eadf.v15i1.2504

Keywords:

Dropout, Data Science, Distance education, Predictive models, Data science, Supervised learning

Abstract

Although most HEIs are developing programs to control dropout rates, many existing predictive models are based on data or causes that do not directly impact the high dropout rates. In this context, and considering recent studies that recommend the use of data science to develop predictive models, this research aimed to propose a predictive model for dropout in undergraduate EAD courses. Using machine learning and a supervised learning algorithm called decision tree, the model integrated exogenous and endogenous causes of dropout. The research, applied in nature and qualitative in approach, was classified as exploratory and included a case study and literature review. The results revealed the importance and interaction between the variables of engagement, age, and the distance between the student's residence municipality and the EAD center. These findings provide valuable insights for retention strategies in institutions offering distance education.

 

Keywords: Distance education. Dropout. Predictive models. Data science. Supervised learning.

Downloads

Download data is not yet available.

References

ABED – Associação Brasileira de Educação a Distância. Censo ead.br [livro eletrônico]: relatório analítico da aprendizagem a distância no Brasil 2023 = censo ead.br: analytic report of distance learning in Brazil 2023. Edição bilíngue: português/inglês. Tradução por Camila Rosa. Curitiba, PR: InterSaberes, 2024. 1 recurso online (PDF; 2 MB). ISBN 978-85-227-1596-1.

AMARAL, F. Introdução à ciência de dados: mineração de dados e big data. 1. ed. Starlin Altas Book, 2016.

BITTENCOURT, I. M.; MERCADO, L. P. L. Evasão nos cursos na modalidade de educação a distância: estudo de caso do Curso Piloto de Administração da UFAL/UAB. p. 465-504, 2014.

BRESSAN, G. M.; ENDO, W. Métodos de machine learning para classificação da temperatura no processo de mistura em uma planta industrial. Disponível em: https://revistas.uepg.br/index.php/ret/article/view/18484/209209215370 Acesso em: 6 maio 2024.

CARVALHO, P. S. A.; ALMEIDA, E. A.; CAVALCANTI, M. da C. M. Análise da evasão na Educação a Distância: um estudo no curso de bacharelado em Administração Pública do IFPB/UAB, 2018.

CURTY, R. G.; SERAFIM, J. D. S. A formação em ciência de dados: uma análise preliminar do panorama estadunidense. Informação & Informação, v. 21, n. 2, p. 307, 2016. Disponível em: https://doi.org/10.5433/1981-8920.2016v21n2p307 Acesso em: 10 maio 2024.

DE FÁTIMA BRUNO-FARIA, M.; LOPES FRANCO, A. Causas da evasão em curso de graduação a distância em Administração em uma universidade pública federal, 2011.

DE OLIVEIRA, C. V. S. B.; BEZERRA, D. H. D. Revisão sistemática da literatura sobre as causas de evasão da Educação a Distância no Brasil, 2021.

FILATRO, A. C. Data science da educação. Editora Saraiva, 2020.

GRUS, J. Data Science do Zero. Editora Alta Books, 2021.

HABOWSKI, A. C.; BRANCO, L. S. A.; CONTE, E. Evasão na EAD: perspectivas de prevenção. Perspectiva, v. 38, n. 3, p. 1-20, 2020.

Disponível em: https://doi.org/10.5007/2175-795x.2020.e62978 Acesso em: 7 maio 2024.

KAUR, H.; KUMARI, V. Predictive modelling and analytics for diabetes using a machine learning approach. Applied Computing and Informatics, v. 18, n. 1-2, p. 90-100, 2022. Disponívelem: https://doi.org/10.1016/j.aci.2018.12.004 Acesso em: 16 junho 2024.

KOWALSKI, A. et al. Evasão no Ensino Superior a Distância: Revisão da Literatura em Língua Portuguesa. EaD Em Foco, v. 10, n. 2, 2020. Disponível em: https://doi.org/10.18264/eadf.v10i2.983 Acesso em: 16 maio 2024.

RAUTENBERG, S.; CARMO, P. R. V. do. Big data e ciência de dados. Brazilian Journal of Information Science: Research Trends, v. 13, n. 1, p. 56-67, 2019. Disponível em: https://doi.org/10.36311/1981-1640.2019.v13n1.06.p56 Acesso em: 20 julho 2024.

SICSÚ, A. L. Técnicas de machine learning. Editora Blucher, 2023. Disponível em: https://app.minhabiblioteca.com.br/#/books/9786555063974/ Acesso em: 20 julho 2024.

UMEKAWA, E. E. R. Preditores de fatores relacionados à evasão e à persistência discente em ações educacionais a distância, 2014. Disponível em: https://doi.org/10.11606/D.59.2014.tde-23032014-115420 Acesso em: 02 abril 2024.

VELLOZO, S. R. G. et al. Evasão na educação a distância: uma revisão sistemática. Revista EDaPECI, v. 19, n. 3, p. 85-94, 2019. Disponível em: https://doi.org/10.29276/redapeci.2019.19.312213.85-94 Acesso em: 02 abril 2024.

Published

2025-05-15

How to Cite

Juliani, J. P. (2025). Dropout Prediction in Distance Learning Courses: a Decision Tree-Based Model Integrating Exogenous and Endogenous Causes. EaD Em Foco, 15(1), e2504. https://doi.org/10.18264/eadf.v15i1.2504

Issue

Section

Estudos de Caso

Most read articles by the same author(s)