Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/2062

Tipo do documento:	Dissertação
Título:	Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço
Título(s) alternativo(s):	Implementation of an Autonomous System of Construção de Structure using Learned by Reforço
Autor:	DANTAS, Diego de Oliveira
Primeiro orientador:	SANTOS, Sérgio Ronaldo Barros dos
Resumo:	Este trabalho apresenta o desenvolvimento e a implementação de um sistema de construção autônomo, no qual utiliza um robô móvel terrestre para construir estruturas tridimensionais a partir de blocos de diferentes tamanhos. Um planejamento de alto nível é proposto para gerar os planos de construção das estruturas. Esse algoritmo é baseado nos métodos de Aprendizado por Reforço, denominados de Finite Action-Set Learning Automata (FALA) e Parameterized Learnig Automata (PLA). A partir desse planejador, o usuário define os tipos de blocos empregados na construção e a forma final da estrutura. O planejador de alto nível é usado para resolver os seguintes problemas: 1) Gerar um diagrama ótimo de montagem, que consiste em uma lista de posições, orientações e tipos de blocos, respeitando a forma final especificada pelo usuário. Esse diagrama é gerado considerando a minimização da quantidade de blocos usados e obedecendo as restrições quanto ao posicionamento dos blocos; 2) Gerar um plano ótimo de execução que é usado pelo robô para realizar a tarefa de montagem da estrutura. Esse plano consiste em definir a sequência de procedimentos para a manipulação e para a montagem dos blocos. As trajetórias usadas para a realização do plano de execução são geradas por um planejador global composto pelo algoritmo A*. Ao finalizar o planejamento, o planejador global envia uma série de posições para um controlador de rastreamento de trajetória, chamado de eband local planner. Esse controlador de trajetória é usado para controlar a base móvel do robô durante sua navegação através do ambiente simulado ou real. O mapeamento do ambiente simulado e real e a localização do robô nesses ambientes é realizada através do algoritmo chamado de Real-Time Appearance-Based Mapping (RTAB-Map). O RTAB-Map usa informações de imagem e de odometria das rodas do robô para gerar o mapa e estimar a posição do robô em relação ao sistema de coordenadas global. Os robôs simulado e real utilizam os recursos do framework denominado de Robot Operation System (ROS). O ROS permite que diferentes aplicações comuniquem-se entre si, mesmo quando executadas em máquinas diferentes. Para demonstrar a eficiência das soluções obtidas pelo planejador de alto nível são realizados testes simulados e experimentais do sistema de construção autônomo. Durante esses testes são montadas diferentes tipos de estrutura (Torre, Barragem, Estação Espacial e Pirâmide). Os resultados mostram que o método de aprendizado por reforço é capaz de gerar diagramas de montagem e planos de execução (sequência de procedimentos) factíveis para a realização da tarefa em menor tempo possível.
Abstract:	This work presents the development and implementation of an autonomous construction system in which uses a terrestrial mobile robot for constructing three-dimensional structures from blocks of different size. A high level planning is proposed to generate the construction plans of the structures. This algorithm is based on Reinforcement Learning methods called Finite Action-Set Learning Automata (FALA) and Parameterized Learnig Automata (PLA). From this planner, the used types of blocks for the construction and the final composition of the structure is defined by the user. The high level planner is used to solve the following problems: 1) Generate an optimal assembly diagram, which consists of a list of positions, orientations and kind of blocks final, taken into account the design of the structure defined by the user. The minimal number of blocks and also the restriction of assembly is considered during the generation of the diagram; 2) Generate an optimal execution plan that can be used by the robot to accomplish the task of assembly. This plan is composed by the sequence of procedures for manipulating and assembling blocks. The trajectories generated by the global planner based on A* algorithm is used to accomplish the execution plan. After completion the execution plan, the global planner sends a series of positions to a path tracking controller, called eband local planner. This tracking controller is used to control the robot during it navigation through simulated or actual environment. The mapping of the simulated and real environments and the location of the robot in the environment is performed using the algorithm called Real-Time Appearance-Based Mapping (RTAB-Map). The RTAB-Map uses image and odometry information to generate the environment also estimate the position of the robot in relation to the global coordinate system. The simulated and actual robots use the framework called Robot Operation System (ROS). The ROS allows the communication between different applications even if they are performed in different machines. To demonstrate the efficiency of the obtained solutions using the high level planner, simulated and experimental tests of the autonomous construction system are performed. During these tests, different types of structure (tower, containment wall, space station and pyramid) are assembled. The results show that the reinforcement learning method is able to feasible assembly diagrams and execution plans (sequence of procedures) can be used to perform the task in a short period of time.
Palavras-chave:	Robótica Aprendizado por reforço Learning Automata Construção autônoma Robotics Reinforcement learning Autonomous construction
Área(s) do CNPq:	Engenharia de Software
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	DEPARTAMENTO DE INFORMÁTICA/CCET
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
Citação:	DANTAS, Diego de Oliveira. Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço. 2017. 115 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Maranhão, São Luís, 2017.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/2062
Data de defesa:	28-Ago-2017
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
DiegoOliveiraDantas.pdf	Dissertação	6,97 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações