PROGRAMAÇÃO  DINÂMICA HEURÍSTICA DUAL E REDES DE FUNÇÕES DE BASE RADIAL PARA SOLUÇÃO DA EQUAÇÃO DE
HAMILTON-JACOBI-BELLMAN EM PROBLEMAS DE CONTROLE ÓTIMO

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/517

Tipo do documento:	Dissertação
Título:	PROGRAMAÇÃO DINÂMICA HEURÍSTICA DUAL E REDES DE FUNÇÕES DE BASE RADIAL PARA SOLUÇÃO DA EQUAÇÃO DE HAMILTON-JACOBI-BELLMAN EM PROBLEMAS DE CONTROLE ÓTIMO
Título(s) alternativo(s):	DUAL HEURISTIC DYNAMIC PROGRAMMING AND RADIAL BASIS FUNCTIONS NETWORKS FOR SOLUTION OF THE EQUATION OF HAMILTON-JACOBI-BELLMAN IN PROBLEMS OPTIMAL CONTROL
Autor:	Andrade, Gustavo Araújo de
Primeiro orientador:	FONSECA NETO, João Viana da
Primeiro membro da banca:	Serra, Ginalber Luiz de Oliveira
Resumo:	Neste trabalho o principal objetivo é apresentar o desenvolvimento de algoritmos de aprendizagem para execução online para a solução da equação algébrica de Hamilton-Jacobi-Bellman. Os conceitos abordados se concentram no desenvolvimento da metodologia para sistemas de controle, por meio de técnicas que tem como objetivo o projeto online de controladores adaptativos são projetados para rejeitar ruídos de sensores, variações paramétricas e erros de modelagem. Conceitos de programação neurodinâmica e aprendizagem por reforço são abordados para desenvolver algoritmos onde a contextualização de determinado ponto de operação faz com que o sistema de controle se adapte e, dessa forma, apresente o desempenho de acordo com as especificações de projeto. Desenvolve-se métodos para a estimação online do crítico adaptativo concentrando os esforços em técnicas de estimação do gradiente da função valor do ambiente.
Abstract:	In this work the main objective is to present the development of learning algorithms for online application for the solution of algebraic Hamilton-Jacobi-Bellman equation. The concepts covered are focused on developing the methodology for control systems, through techniques that aims to design online adaptive controllers to reject noise sensors, parametric variations and modeling errors. Concepts of neurodynamic programming and reinforcement learning are are discussed to design algorithms where the context of a given operating point causes the control system to adapt and thus present the performance according to specifications design. Are designed methods for online estimation of adaptive critic focusing efforts on techniques for gradient estimating of the environment value function.
Palavras-chave:	Controle Ótimo Aprendizagem por Reforço Programação Dinâmica Aproximada Programação Heurística Dual, Redes de Função de Base Radial Optimal Control Reinforcement Learning Approximate Dynamic Programming Dual Heuristic Programming Radial Basis Function Neural Networks
Área(s) do CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma:	por
País:	BR
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	Engenharia
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
Citação:	ANDRADE, Gustavo Araújo de. DUAL HEURISTIC DYNAMIC PROGRAMMING AND RADIAL BASIS FUNCTIONS NETWORKS FOR SOLUTION OF THE EQUATION OF HAMILTON-JACOBI-BELLMAN IN PROBLEMS OPTIMAL CONTROL. 2014. 110 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luís, 2014.
Tipo de acesso:	Acesso Aberto
URI:	http://tedebc.ufma.br:8080/jspui/handle/tede/517
Data de defesa:	28-Abr-2014
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:

Arquivo	Tamanho	Formato
Dissertacao Gustavo Araujo.pdf	2,55 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações