Aprendizado por reforço aplicado ao problema de alocação de berços graneleiros com controle de estoque

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/6964

Tipo do documento:	Tese
Título:	Aprendizado por reforço aplicado ao problema de alocação de berços graneleiros com controle de estoque
Título(s) alternativo(s):	Reinforcement learning applied to the grain silo allocation problem with inventory control.
Autor:	SILVA, Victor Hugo Barros
Primeiro orientador:	OLIVEIRA, Alexandre César Muniz de
Primeiro membro da banca:	OLIVEIRA, Alexandre César Muniz de
Segundo membro da banca:	CANUTO, Anne Magaly de Paula
Terceiro membro da banca:	CARVALHO, Alexandre Plastino de
Quarto membro da banca:	CORTÉS, Omar Andrés Carmona
Quinto membro da banca:	COUTINHO, Luciano Reis
Resumo:	O transporte marítimo internacional consolidou-se como o pilar da economia global, sendo responsável por movimentar cerca de 80% do volume e mais de 70% do valor total do comércio mundial de bens. Diante dessa magnitude, a otimização da eficiência das operações portuárias tornou-se estratégica para a resiliência das cadeias de suprimentos. Contudo, o cenário recente (2020-2025) foi marcado por uma sucessão de eventos disruptivos, incluindo crises geopolíticas em rotas críticas e instabilidades climáticas, que impuseram desafios sem precedentes à logística portuária. Neste contexto, o Problema de Alocação de Berços (PAB), embora tradicional na literatura, demanda novas abordagens que ofereçam maior robustez diante de incertezas. As metodologias clássicas de otimização frequentemente apresentam limitações de escalabilidade e adotam premissas simplificadoras que negligenciam a alta dimensionalidade e a volatilidade operacional de terminais reais. Esta tese propõe uma formulação do PAB para granéis sólidos, integrada ao controle de estoque, modelada sob o paradigma de Aprendizado por Reforço Profundo (Deep Reinforcement Learning- DRL). A investigação utiliza inicialmente o algoritmo DQN (Deep Q-Network) e, subsequentemente, evolui para uma arquitetura que incorpora células LSTM (Long Short-Term Memory), visando capturar as dependências temporais intrínsecas a problemas de tomada de decisão sequencial complexos. Os resultados experimentais demonstram que a abordagem proposta não apenas gera soluções de alta qualidade em cenários dinâmicos, mas também é eficaz na mitigação de falhas de estoque, superando as limitações das heurísticas tradicionais.
Abstract:	International maritime transport has established itself as the cornerstone of the global economy, accounting for approximately 80% of the volume and more than 70% of the total value of world trade in goods. Given this magnitude, optimizing port operations efficiency has become strategic for supply chain resilience. However, the recent period (2020–2025) was marked by a succession of disruptive events, including geopolitical crises along critical routes and climatic instability, which posed unprecedented challenges to port logistics. In this context, the Berth Allocation Problem (BAP), although well-established in the literature, demands new approaches that offer greater robustness to uncertainty. Classical optimization methodologies often exhibit scalability limitations and make simplifying assumptions that neglect the high dimensionality and operational volatility of real terminals. This thesis proposes a formulation of the BAP for dry bulk cargo, integrated with inventory control, and modeled under the Deep Reinforcement Learning (DRL) paradigm. The investigation initially employs the DQN (Deep Q-Network) algorithm. Subsequently, it evolves toward an architecture incorporating LSTM (Long Short-Term Memory) cells to capture the temporal dependencies inherent to complex sequential decision-making problems. The experimental results demonstrate that the proposed approach not only generates high-quality solutions in dynamic scenarios but also effectively mitigates inventory failures, surpassing the limitations of traditional heuristics.
Palavras-chave:	PAB; controle de estoques; incertezas; aprendizado por reforço; BAP; inventory control; uncertainties; reinforcement learning.
Área(s) do CNPq:	Ciência da Computação
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	DEPARTAMENTO DE INFORMÁTICA/CCET
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
Citação:	SILVA, Victor Hugo Barros. Aprendizado por reforço aplicado ao problema de alocação de berços graneleiros com controle de estoque. 2026. 99 f. Tese (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2026.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/6964
Data de defesa:	26-Fev-2026
Aparece nas coleções:	TESES DE DOUTORADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO (ASSOCIAÇÃO UFMA/UFPI)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Victor_Hugo.pdf	Tese de Doutorado	5,44 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações