APRENDIZAGEM POR REFORÇO E
PROGRAMACÃO DINÂMICA ADAPTATIVA PARA
PROJETO E AVALIAÇÃO DO DESEMPENHO DE
ALGORITMOS DLQR EM SISTEMAS MIMO

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/462

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Lopes, Leandro Rocha	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5257831636036405	por
dc.contributor.advisor1	FONSECA NETO, João Viana da	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0029055473709795	por
dc.date.accessioned	2016-08-17T14:53:16Z	-
dc.date.available	2011-05-11	pt_BR
dc.date.issued	2011-04-04	pt_BR
dc.identifier.citation	LOPES, Leandro Rocha. LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS. 2011. 130 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luis, 2011.	por
dc.identifier.uri	http://tedebc.ufma.br:8080/jspui/handle/tede/462	-
dc.description.resumo	Em decorrência do crescente desenvolvimento tecnológico e das consequentes aplicações industriais, técnicas de controle de alto desempenho e aprendizado por reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas também para melhorar o desempenho de controladores já implementados em sistemas do mundo real. As abordagens do aprendizado por reforço e do regulador linear quadrático discreto (DLQR) são conectadas pelos métodos de programação dinâmica adaptativa. Esta união é orientada para o projeto de controladores ótimos em sistemas multivariáveis (MIMO). O método proposto para sintonia de controladores DLQR fornece diretrizes para construção de heurísticas polarizadas que são aplicadas na seleção das matrizes de ponderação da recompensa instantânea. Investiga-se o desempenho das heurísticas associadas com a sintonia de controladores lineares discretos e aspectos de convergência que estão relacionados com as variações QR nos algoritmos de programação dinâmica heurística (HDP) e Ação Dependente (ADHDP). Os algoritmos e a sintonia são avaliados pela capacidade em estabelecer a política de controle ótimo que mapeia o plano-Z em um sistema dinãmico multivariável de terceira ordem.	por
dc.description.abstract	Due to the increasing of technological development and its associated industrial applications, control design methods to attend high performance requests and reinforcement learning are been developed, not only, to solve new problems, as well as, to improve the performance of implemented controllers in the real systems. The reinforcement learning (RL) and discrete linear quadratic regulator (DLQR) approaches are connected by adaptive dynamic programming (ADP). This connection is oriented to the design of optimal controller for multivariable systems (MIMO). The proposed method for DLQR controllers tuning can been heuristic guidance for biased variations in weighting matrices of instantenous reward. The heuristics performance are evaluated in terms of convergence of heuristic dynamic programming (HDP) and action dependent (AD-HDP) algorithms. The algorithms and tuning are evaluated by the capability to map the plane-Z in MIMO dynamic system of third order.	eng
dc.description.provenance	Made available in DSpace on 2016-08-17T14:53:16Z (GMT). No. of bitstreams: 1 Leandro Rocha Lopes.pdf: 1075564 bytes, checksum: 01e184ed6d7c65323c0dfc1515da19a3 (MD5) Previous issue date: 2011-04-04	eng
dc.format	application/pdf	por
dc.language	por	por
dc.publisher	Universidade Federal do Maranhão	por
dc.publisher.department	Engenharia	por
dc.publisher.country	BR	por
dc.publisher.initials	UFMA	por
dc.publisher.program	PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET	por
dc.rights	Acesso Aberto	por
dc.subject	Programação Dinâmica	por
dc.subject	Controle ótimo	por
dc.subject	HDP	por
dc.subject	Q-Function	por
dc.subject	ADHDP	por
dc.subject	Sistemas Multivariáveis	por
dc.subject	Convergência	por
dc.subject	DLQR	por
dc.subject	Dynamic Programming	eng
dc.subject	Optimal Control	eng
dc.subject	HDP	eng
dc.subject	Q-Function	eng
dc.subject	ADHDP	eng
dc.subject	Multivariable Systems	eng
dc.subject	Convergence	eng
dc.subject	DLQR	eng
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO	por
dc.title	APRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMO	por
dc.title.alternative	LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS	eng
dc.type	Dissertação	por
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:

Arquivo	Tamanho	Formato
Leandro Rocha Lopes.pdf	1,05 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações