Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/tede/494
Registro completo de metadados
Campo DCValorIdioma
dc.creatorMaciel, Allan James Ferreirapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/9294927489743146por
dc.contributor.advisor1FONSECA NETO, João Viana dapt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0029055473709795por
dc.contributor.referee1Serra, Ginalber Luiz de Oliveirapt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0831092299374520por
dc.date.accessioned2016-08-17T14:53:22Z-
dc.date.available2013-04-03pt_BR
dc.date.issued2012-09-28pt_BR
dc.identifier.citationMACIEL, Allan James Ferreira. CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING. 2012. 121 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luís, 2012.por
dc.identifier.urihttp://tedebc.ufma.br:8080/jspui/handle/tede/494-
dc.description.resumoA união das metodologias de controle ótimo e de programação dinâmica tem impulsionado o desenvolvimento de algoritmos para realizações de sistemas de controle discreto do tipo regulador linear quadrático (DLQR). A metodologia utilizada neste trabalho é fundamentada sobre métodos de aprendizagem por reforço baseados em diferenças temporais e programação dinâmica aproximada. O método proposto combina a aproximação da função valor através do método RLS (mínimos quadrados recursivos) e iteração de política aproximada em esquemas de programação dinâmica heurística (HDP). A abordagem é orientada para a avaliação da convergência da solução DLQR e para a sintonia heurística das matrizes de ponderação 􀜳 e 􀜴da função de utilidade associada ao DLQR. É realizada a investigação das propriedades de convergência relacionadas à consistência, excitação persistente e polarização do estimador RLS. A metodologia contempla realizações de projetos de forma online de controladores DLQR e é avaliada em um sistema dinâmico multivariável de quarta ordem.por
dc.description.abstractThe union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices 􀜳 and 􀜴 of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system.eng
dc.description.provenanceMade available in DSpace on 2016-08-17T14:53:22Z (GMT). No. of bitstreams: 1 Dissertacao Allan James.pdf: 3170694 bytes, checksum: 054a9e74e81a7c2099800246d0b6c530 (MD5) Previous issue date: 2012-09-28eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUniversidade Federal do Maranhãopor
dc.publisher.departmentEngenhariapor
dc.publisher.countryBRpor
dc.publisher.initialsUFMApor
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETpor
dc.rightsAcesso Abertopor
dc.subjectProgramação Dinâmica Heurísticapor
dc.subjectControle Multivariávelpor
dc.subjectControle Ótimopor
dc.subjectRegulador Quadrático Linear Discretopor
dc.subjectMínimos Quadrados Recursivospor
dc.subjectControle Digitalpor
dc.subjectHeuristic Dynamic Programmingeng
dc.subjectMultivariable Controleng
dc.subjectOptimal Controleng
dc.subjectDiscrete Linear Quadratic Regulatoreng
dc.subjectRecursive Least Squareseng
dc.subjectDigital Controleng
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.titleCONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICApor
dc.title.alternativeCONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMINGeng
dc.typeDissertaçãopor
Aparece nas coleções:DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:
Arquivo TamanhoFormato 
Dissertacao Allan James.pdf3,1 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.