Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/tede/462
Registro completo de metadados
Campo DCValorIdioma
dc.creatorLopes, Leandro Rochapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5257831636036405por
dc.contributor.advisor1FONSECA NETO, João Viana dapt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0029055473709795por
dc.date.accessioned2016-08-17T14:53:16Z-
dc.date.available2011-05-11pt_BR
dc.date.issued2011-04-04pt_BR
dc.identifier.citationLOPES, Leandro Rocha. LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS. 2011. 130 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luis, 2011.por
dc.identifier.urihttp://tedebc.ufma.br:8080/jspui/handle/tede/462-
dc.description.resumoEm decorrência do crescente desenvolvimento tecnológico e das consequentes aplicações industriais, técnicas de controle de alto desempenho e aprendizado por reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas também para melhorar o desempenho de controladores já implementados em sistemas do mundo real. As abordagens do aprendizado por reforço e do regulador linear quadrático discreto (DLQR) são conectadas pelos métodos de programação dinâmica adaptativa. Esta união é orientada para o projeto de controladores ótimos em sistemas multivariáveis (MIMO). O método proposto para sintonia de controladores DLQR fornece diretrizes para construção de heurísticas polarizadas que são aplicadas na seleção das matrizes de ponderação da recompensa instantânea. Investiga-se o desempenho das heurísticas associadas com a sintonia de controladores lineares discretos e aspectos de convergência que estão relacionados com as variações QR nos algoritmos de programação dinâmica heurística (HDP) e Ação Dependente (ADHDP). Os algoritmos e a sintonia são avaliados pela capacidade em estabelecer a política de controle ótimo que mapeia o plano-Z em um sistema dinãmico multivariável de terceira ordem.por
dc.description.abstractDue to the increasing of technological development and its associated industrial applications, control design methods to attend high performance requests and reinforcement learning are been developed, not only, to solve new problems, as well as, to improve the performance of implemented controllers in the real systems. The reinforcement learning (RL) and discrete linear quadratic regulator (DLQR) approaches are connected by adaptive dynamic programming (ADP). This connection is oriented to the design of optimal controller for multivariable systems (MIMO). The proposed method for DLQR controllers tuning can been heuristic guidance for biased variations in weighting matrices of instantenous reward. The heuristics performance are evaluated in terms of convergence of heuristic dynamic programming (HDP) and action dependent (AD-HDP) algorithms. The algorithms and tuning are evaluated by the capability to map the plane-Z in MIMO dynamic system of third order.eng
dc.description.provenanceMade available in DSpace on 2016-08-17T14:53:16Z (GMT). No. of bitstreams: 1 Leandro Rocha Lopes.pdf: 1075564 bytes, checksum: 01e184ed6d7c65323c0dfc1515da19a3 (MD5) Previous issue date: 2011-04-04eng
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUniversidade Federal do Maranhãopor
dc.publisher.departmentEngenhariapor
dc.publisher.countryBRpor
dc.publisher.initialsUFMApor
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETpor
dc.rightsAcesso Abertopor
dc.subjectProgramação Dinâmicapor
dc.subjectControle ótimopor
dc.subjectHDPpor
dc.subjectQ-Functionpor
dc.subjectADHDPpor
dc.subjectSistemas Multivariáveispor
dc.subjectConvergênciapor
dc.subjectDLQRpor
dc.subjectDynamic Programmingeng
dc.subjectOptimal Controleng
dc.subjectHDPeng
dc.subjectQ-Functioneng
dc.subjectADHDPeng
dc.subjectMultivariable Systemseng
dc.subjectConvergenceeng
dc.subjectDLQReng
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAOpor
dc.titleAPRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMOpor
dc.title.alternativeLEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMSeng
dc.typeDissertaçãopor
Aparece nas coleções:DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:
Arquivo TamanhoFormato 
Leandro Rocha Lopes.pdf1,05 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.