%0 Thesis %T Aprendizagem por Reforço e Programação Dinâmica Aproximada para Controle Ótimo: Uma Abordagem para o Projeto Online do Regulador Linear Quadrático Discreto com Programação Dinâmica Heurística Dependente de Estado e Ação. %U http://tedebc.ufma.br:8080/jspui/handle/tede/1879 %I Universidade Federal do Maranhão