@MASTERSTHESIS{ 2017:1512123330, title = {Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço}, year = {2017}, url = "https://tedebc.ufma.br/jspui/handle/tede/tede/2062", abstract = "Este trabalho apresenta o desenvolvimento e a implementação de um sistema de construção autônomo, no qual utiliza um robô móvel terrestre para construir estruturas tridimensionais a partir de blocos de diferentes tamanhos. Um planejamento de alto nível é proposto para gerar os planos de construção das estruturas. Esse algoritmo é baseado nos métodos de Aprendizado por Reforço, denominados de Finite Action-Set Learning Automata (FALA) e Parameterized Learnig Automata (PLA). A partir desse planejador, o usuário define os tipos de blocos empregados na construção e a forma final da estrutura. O planejador de alto nível é usado para resolver os seguintes problemas: 1) Gerar um diagrama ótimo de montagem, que consiste em uma lista de posições, orientações e tipos de blocos, respeitando a forma final especificada pelo usuário. Esse diagrama é gerado considerando a minimização da quantidade de blocos usados e obedecendo as restrições quanto ao posicionamento dos blocos; 2) Gerar um plano ótimo de execução que é usado pelo robô para realizar a tarefa de montagem da estrutura. Esse plano consiste em definir a sequência de procedimentos para a manipulação e para a montagem dos blocos. As trajetórias usadas para a realização do plano de execução são geradas por um planejador global composto pelo algoritmo A*. Ao finalizar o planejamento, o planejador global envia uma série de posições para um controlador de rastreamento de trajetória, chamado de eband local planner. Esse controlador de trajetória é usado para controlar a base móvel do robô durante sua navegação através do ambiente simulado ou real. O mapeamento do ambiente simulado e real e a localização do robô nesses ambientes é realizada através do algoritmo chamado de Real-Time Appearance-Based Mapping (RTAB-Map). O RTAB-Map usa informações de imagem e de odometria das rodas do robô para gerar o mapa e estimar a posição do robô em relação ao sistema de coordenadas global. Os robôs simulado e real utilizam os recursos do framework denominado de Robot Operation System (ROS). O ROS permite que diferentes aplicações comuniquem-se entre si, mesmo quando executadas em máquinas diferentes. Para demonstrar a eficiência das soluções obtidas pelo planejador de alto nível são realizados testes simulados e experimentais do sistema de construção autônomo. Durante esses testes são montadas diferentes tipos de estrutura (Torre, Barragem, Estação Espacial e Pirâmide). Os resultados mostram que o método de aprendizado por reforço é capaz de gerar diagramas de montagem e planos de execução (sequência de procedimentos) factíveis para a realização da tarefa em menor tempo possível.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET}, note = {DEPARTAMENTO DE INFORMÁTICA/CCET} }