Modelagem não linear e controlador ator-crítico para manobrabilidade de um USV baseado em DLQT-I e programação dinâmica heurística dependente de ação

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/6091

Tipo do documento:	Dissertação
Título:	Modelagem não linear e controlador ator-crítico para manobrabilidade de um USV baseado em DLQT-I e programação dinâmica heurística dependente de ação
Título(s) alternativo(s):	Nonlinear modeling and actor-critic driver for maneuverability of a USV based on DLQT-I and action-dependent heuristic dynamic programming
Autor:	FURTADO, Victor Guimarães
Primeiro orientador:	FONSECA NETO, João Viana da
Primeiro coorientador:	SILVA, Yan Ferreira da
Primeiro membro da banca:	FONSECA NETO, João Viana da
Segundo membro da banca:	SILVA, Yan Ferreira da
Terceiro membro da banca:	SOUZA, Francisco das Chagas de
Quarto membro da banca:	MOURA, José Pinheiro de
Resumo:	Os derramamentos de derivados de petróleo provocam degradação ambiental, problemas socioeconômicos e graves danos à saúde humana. Em decorrência das dificuldades do monitoramento dos eventos em grandes áreas, a utilização de veículos aquáticos de superfície não tripulados (Unmanned Surface Vehicles- USVs) tornou-se imprescindível para a tarefa. A aplicação desses dispositivos demandam a sua instrumentalização com sensores para análise da qualidade da água, além de um sistema de orientação, navegação e controle (Guidance, Navigation and Control- GNC). Especificamente para viabilizar a demanda de manobrabilidade, apresenta-se o desenvolvimento da proposta de um sistema de controle online baseado em Programação Dinâmica Adaptativa (PDA) e Aprendizado por Reforço (AR). O desenvolvimento de um sistema de controle para manobrabilidade de USVs, apresenta empecilhos em sua implementação em decorrência das dificuldades da identificação do sistema para a modelagem matemática do processo por se tratar de um modelo não linear complexo, acoplado e com incertezas. As perturbações externas e possíveis variações paramétricas aumentam os entraves para sua elaboração. Nesse contexto, esta dissertação apresenta o projeto de um controlador ótimo adaptativo baseado em dados para controle das velocidades de USV completamente atuado, como controle de manobrabilidade. A metodologia desenvolvida para o projeto do controlador ótimo online agrega PDA e AR na técnica Programação Dinâmica Heurística Dependente de Ação (Action Dependent Heuristic Dynamic Programming- ADHDP), visando o cálculo da solução online implícita da equação de Hamilton-Jacobi-Bellman (HJB) na forma da Equação Algébrica de Riccati Discreta (Discrete Algebric Riccati Equation- DARE). O sistema utiliza o Aprendizado por Reforço por meio da estrutura ator-crítico, com uma abordagem de controle ótimo para cálculo da lei de controle ótima baseado nos dados da ação de controle e estados do processo. O controlador desenvolvido é um Rastreador Linear Quadrático Discreto com ação integral (DLQT-I) denominado ADHDP-DLQT-I e os seus resultados são avaliados em simulador do modelo não linear, resolvido pelo método Runge-Kutta. O desempenho do sistema ADHDP-DLQT-I é comparado com um controlador PID adaptativo sintonizado pelo método dos Mínimos Quadrados (Least Mean Square- LMS).
Abstract:	Oil spills cause environmental degradation, socio-economic problems, and severe harm to human health. Due to the challenges of monitoring such events over large areas, the use of Unmanned Surface Vehicles (USVs) has become essential for this task. The application of these devices requires equipping them with sensors for water quality analysis, as well as a Guidance, Navigation, and Control (GNC) system. Specifically, to enable maneuverability, this work presents the development of an online control system proposal based on Adaptive Dynamic Programming (ADP) and Reinforcement Learning (RL). The development of a control system for USV maneuverability presents implementation challenges due to the difficulties in system identification for mathematical modeling, as it involves a complex, nonlinear, coupled model with uncertainties. External disturbances and possible parametric variations further increase the obstacles to its design. In this context, this dissertation presents the design of an adaptive optimal controller based on data for controlling the speeds of a fully actuated USV, ensuring maneuverability. The methodology developed for designing the online optimal controller integrates ADP and RL within the Action Dependent Heuristic Dynamic Programming (ADHDP) technique, aiming to compute the implicit online solution of the Hamilton-Jacobi-Bellman (HJB) equation in the form of the Discrete Algebraic Riccati Equation (DARE). The system employs Reinforcement Learning using an actor-critic structure with an optimal control approach to compute the optimal control law based on control action data and process states. The developed controller is a Discrete Linear Quadratic Tracker with integral action (DLQT-I), referred to as ADHDP-DLQT-I, and its results are evaluated using a nonlinear model simulator solved via the Runge-Kutta method. The performance of the ADHDP-DLQT-I system is compared with an adaptive PID controller tuned using the Least Mean Square (LMS) method.
Palavras-chave:	derramamentos de derivados petróleo; manobrabilidade de USV; controle ótimo online; PDA; aprendizado por reforço; ADHDP-DLQT-I; oil Spills; USV maneuverability; online optimal control; ADP; reinforcement Learning; ADHDP-DLQT-I.
Área(s) do CNPq:	Engenharia Elétrica
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
Citação:	FURTADO, Victor Guimarães. Modelagem não linear e controlador ator-crítico para manobrabilidade de um USV baseado em DLQT-I e programação dinâmica heurística dependente de ação. 2025. 134 f. Dissertação (Programa de Pós-Graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2025.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/6091
Data de defesa:	26-Mar-2025
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
VictorFurtado.pdf	Dissertação de Mestrado	3,05 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações