Compartilhamento |
![]() ![]() |
Use este identificador para citar ou linkar para este item:
https://tedebc.ufma.br/jspui/handle/tede/6091
Tipo do documento: | Dissertação |
Título: | Modelagem não linear e controlador ator-crítico para manobrabilidade de um USV baseado em DLQT-I e programação dinâmica heurística dependente de ação |
Título(s) alternativo(s): | Nonlinear modeling and actor-critic driver for maneuverability of a USV based on DLQT-I and action-dependent heuristic dynamic programming |
Autor: | FURTADO, Victor Guimarães ![]() |
Primeiro orientador: | FONSECA NETO, João Viana da |
Primeiro coorientador: | SILVA, Yan Ferreira da |
Primeiro membro da banca: | FONSECA NETO, João Viana da |
Segundo membro da banca: | SILVA, Yan Ferreira da |
Terceiro membro da banca: | SOUZA, Francisco das Chagas de |
Quarto membro da banca: | MOURA, José Pinheiro de |
Resumo: | Os derramamentos de derivados de petróleo provocam degradação ambiental, problemas socioeconômicos e graves danos à saúde humana. Em decorrência das dificuldades do monitoramento dos eventos em grandes áreas, a utilização de veículos aquáticos de superfície não tripulados (Unmanned Surface Vehicles- USVs) tornou-se imprescindível para a tarefa. A aplicação desses dispositivos demandam a sua instrumentalização com sensores para análise da qualidade da água, além de um sistema de orientação, navegação e controle (Guidance, Navigation and Control- GNC). Especificamente para viabilizar a demanda de manobrabilidade, apresenta-se o desenvolvimento da proposta de um sistema de controle online baseado em Programação Dinâmica Adaptativa (PDA) e Aprendizado por Reforço (AR). O desenvolvimento de um sistema de controle para manobrabilidade de USVs, apresenta empecilhos em sua implementação em decorrência das dificuldades da identificação do sistema para a modelagem matemática do processo por se tratar de um modelo não linear complexo, acoplado e com incertezas. As perturbações externas e possíveis variações paramétricas aumentam os entraves para sua elaboração. Nesse contexto, esta dissertação apresenta o projeto de um controlador ótimo adaptativo baseado em dados para controle das velocidades de USV completamente atuado, como controle de manobrabilidade. A metodologia desenvolvida para o projeto do controlador ótimo online agrega PDA e AR na técnica Programação Dinâmica Heurística Dependente de Ação (Action Dependent Heuristic Dynamic Programming- ADHDP), visando o cálculo da solução online implícita da equação de Hamilton-Jacobi-Bellman (HJB) na forma da Equação Algébrica de Riccati Discreta (Discrete Algebric Riccati Equation- DARE). O sistema utiliza o Aprendizado por Reforço por meio da estrutura ator-crítico, com uma abordagem de controle ótimo para cálculo da lei de controle ótima baseado nos dados da ação de controle e estados do processo. O controlador desenvolvido é um Rastreador Linear Quadrático Discreto com ação integral (DLQT-I) denominado ADHDP-DLQT-I e os seus resultados são avaliados em simulador do modelo não linear, resolvido pelo método Runge-Kutta. O desempenho do sistema ADHDP-DLQT-I é comparado com um controlador PID adaptativo sintonizado pelo método dos Mínimos Quadrados (Least Mean Square- LMS). |
Abstract: | Oil spills cause environmental degradation, socio-economic problems, and severe harm to human health. Due to the challenges of monitoring such events over large areas, the use of Unmanned Surface Vehicles (USVs) has become essential for this task. The application of these devices requires equipping them with sensors for water quality analysis, as well as a Guidance, Navigation, and Control (GNC) system. Specifically, to enable maneuverability, this work presents the development of an online control system proposal based on Adaptive Dynamic Programming (ADP) and Reinforcement Learning (RL). The development of a control system for USV maneuverability presents implementation challenges due to the difficulties in system identification for mathematical modeling, as it involves a complex, nonlinear, coupled model with uncertainties. External disturbances and possible parametric variations further increase the obstacles to its design. In this context, this dissertation presents the design of an adaptive optimal controller based on data for controlling the speeds of a fully actuated USV, ensuring maneuverability. The methodology developed for designing the online optimal controller integrates ADP and RL within the Action Dependent Heuristic Dynamic Programming (ADHDP) technique, aiming to compute the implicit online solution of the Hamilton-Jacobi-Bellman (HJB) equation in the form of the Discrete Algebraic Riccati Equation (DARE). The system employs Reinforcement Learning using an actor-critic structure with an optimal control approach to compute the optimal control law based on control action data and process states. The developed controller is a Discrete Linear Quadratic Tracker with integral action (DLQT-I), referred to as ADHDP-DLQT-I, and its results are evaluated using a nonlinear model simulator solved via the Runge-Kutta method. The performance of the ADHDP-DLQT-I system is compared with an adaptive PID controller tuned using the Least Mean Square (LMS) method. |
Palavras-chave: | derramamentos de derivados petróleo; manobrabilidade de USV; controle ótimo online; PDA; aprendizado por reforço; ADHDP-DLQT-I; oil Spills; USV maneuverability; online optimal control; ADP; reinforcement Learning; ADHDP-DLQT-I. |
Área(s) do CNPq: | Engenharia Elétrica |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal do Maranhão |
Sigla da instituição: | UFMA |
Departamento: | DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET |
Programa: | PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET |
Citação: | FURTADO, Victor Guimarães. Modelagem não linear e controlador ator-crítico para manobrabilidade de um USV baseado em DLQT-I e programação dinâmica heurística dependente de ação. 2025. 134 f. Dissertação (Programa de Pós-Graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2025. |
Tipo de acesso: | Acesso Aberto |
URI: | https://tedebc.ufma.br/jspui/handle/tede/6091 |
Data de defesa: | 26-Mar-2025 |
Aparece nas coleções: | DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
VictorFurtado.pdf | Dissertação de Mestrado | 3,05 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.