Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://tedebc.ufma.br/jspui/handle/tede/tede/3207
Tipo do documento: | Dissertação |
Título: | Classificação de risco em transferências voluntárias federais utilizando XGBoost |
Título(s) alternativo(s): | Risk classification in federal voluntary transfers using XGBoost |
Autor: | GUILHON, Daniel Moreira |
Primeiro orientador: | PAIVA, Anselmo Cardoso |
Primeiro coorientador: | GOMES JÚNIOR, Daniel Lima |
Primeiro membro da banca: | PAIVA, Anselmo Cardoso |
Segundo membro da banca: | GOMES JÚNIOR, Daniel Lima |
Terceiro membro da banca: | BRAZ JÚNIOR, Geraldo |
Quarto membro da banca: | BAPTISTA, Cláudio de Souza |
Resumo: | Com a redemocratização no Brasil, estados e municípios passaram a contar com transferências voluntárias de recursos por parte do Governo Federal para a consecução de suas políticas públicas. Para uma maior tempestividade na recuperação de recursos eventualmente gastos de forma inadequada, é necessária uma ferramenta de classificação para atribuir perfis de risco de sucesso ou fracasso dessas transferências. Neste trabalho, propomos o uso do algoritmo eXtreme Gradient Boosting (XGBoost) usando conjuntos de dados balanceados e desbalanceados, com técnicas de otimização de hiperparâmetros Tree-structured Parzen Estimator bayesiano (TPE). Os resultados alcançaram boas taxas de sucesso. Os resultados do XGBoost mostraram uma taxa de sensibilidade usando dados balanceados de 89,3% e dados desbalanceados 87,8%. No entanto, para os dados desbalanceados, a AUC foi de 98,1%, contra 97,9% para os dados balanceados. Incorporar dados como informações acerca do objeto pactuado utilizando-se técnicas de processamento de linguagem natural pode melhorar os resultados obtidos. |
Abstract: | After the Brazilian re-democratization, states and municipalities had to rely on federal government’s voluntary transfers of resources to achieve their public policies. For greater timeliness in the recovery of resources that may have been spent inappropriately, it is necessary to assign risk profiles of success or failure of these transfers. In this work, we propose a methodology that uses eXtreme Gradient Boosting (XGBoost) algorithm, using balanced and unbalanced data sets, with the use of hyperparameter optimization techniques, such as Tree-structured Parzen Bayesian Estimator (TPE). The results achieved good success rates. Results for XGBoost using balanced data showed a recall of 89.3% and unbalanced data a recall of 87.8%. However, for unbalanced data, the AUC score was 98.1%, against 97.9% for balanced data. Incorporating information data about the agreed object using natural language processing techniques can improve the results obtained. |
Palavras-chave: | Transferências voluntárias Aprendizagem computacional XGBoost Predição de risco Voluntary Transfers Machine Learning XGBoost Risk Prediction |
Área(s) do CNPq: | Ciência da Computação Ciência da Computação |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal do Maranhão |
Sigla da instituição: | UFMA |
Departamento: | DEPARTAMENTO DE INFORMÁTICA/CCET |
Programa: | PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET |
Citação: | GUILHON, Daniel Moreira. Classificação de risco em transferências voluntárias federais utilizando XGBoost. 2020. 84 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2020. |
Tipo de acesso: | Acesso Aberto |
URI: | https://tedebc.ufma.br/jspui/handle/tede/tede/3207 |
Data de defesa: | 16-Jul-2020 |
Aparece nas coleções: | DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DanielGuilhon.pdf | Dissertação de Mestrado | 2,53 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.