@MASTERSTHESIS{ 2026:244315372, title = {Modelagem preditiva explicável para apoio à prevenção da evasão em cursos de graduação}, year = {2026}, url = "https://tedebc.ufma.br/jspui/handle/tede/6963", abstract = "A evasão acadêmica ainda é um desafio recorrente nas instituições de ensino superior, gerando impactos pessoais para os estudantes e consequências sociais e institucionais relevantes. Nos últimos anos, modelos de aprendizado de máquina têm sido utilizados para estimar o risco de desligamento a partir de dados acadêmicos, demográficos e socioeconômicos dos discentes. Entretanto, apesar do bom desempenho preditivo, muitos desses modelos operam com baixa transparência, o que dificulta interpretar seus resultados. Nesse cenário, abordagens de Inteligência Artificial Explicável (XAI) surgem como alternativa para tornar as previsões mais compreensíveis e úteis na prática. Esta dissertação investiga como técnicas de Inteligência Artificial Explicável podem ser aplicadas a modelos preditivos para estimar o risco de desligamento acadêmico em cursos de graduação, com o objetivo de identificar os fatores que mais influenciam as decisões dos modelos e analisar o potencial das explicações geradas como suporte ao planejamento de estratégias institucionais de prevenção à evasão. A pesquisa foi conduzida a partir de dados de cursos de graduação presenciais da Universidade Federal do Maranhão- UFMA e adotou uma abordagem analítica estruturada que combina análise exploratória, modelagem preditiva segmentada por curso e técnicas de explicabilidade global e local. Foram utilizados diferentes algoritmos de aprendizado de máquina para estimar o risco de desligamento e métodos da XAI como SHAP, Permutation Importance, LIME e Anchors foram aplicados para interpretar as previsões e analisar a contribuição das variáveis nas decisões dos modelos. Osresultados indicam que os modelos preditivos apresentam bom desempenho na identificação de estudantes em risco, embora com variações entre cursos. As análises explicativas mostraram convergência entre técnicas ao apontar três dimensões acadêmicas como centrais na estrutura das previsões: a eficiência na conversão da carga horária matriculada em aprovações (IECH), o ritmo de progressão ao longo do curso (IEPL) e o desempenho global representado pela média de conclusão (MC). No contexto analisado, as variáveis demográficas apresentaram influência menos significativa nas previsões. Alémdisso os resultados sugerem que integrar modelagem preditiva e técnicas de explicabilidade torna o risco de desligamento mais interpretável, ao evidenciar padrões de desempenho acadêmico associados ao evento. As explicações ajudam a compreender quais fatores sustentam as estimativas de risco em diferentes cursos. Com isso, a abordagem pode apoiar a gestão acadêmica na identificação de perfis que demandam maior atenção e no planejamento de ações institucionais voltadas à permanência estudantil.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET}, note = {DEPARTAMENTO DE INFORMÁTICA/CCET} }