Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/tede/4710
Tipo do documento: Dissertação
Título: Imputação de dados faltosos em séries Temporais Univariadas utilizando meta-aprendizado baseado em Rede Neural LSTM Híbrida
Título(s) alternativo(s): Imputation of Missing Data in Univariate Time Series using Meta-Learning based on Hybrid LSTM Neural Network
Autor: ALMEIDA, Mauricio Morais 
Primeiro orientador: ALMEIDA, João Dallyson Sousa de
Primeiro coorientador: QUINTANILHA, Darlan Bruno Pontes
Primeiro membro da banca: ALMEIDA, João Dallyson Sousa de
Segundo membro da banca: QUINTANILHA, Darlan Bruno Pontes
Terceiro membro da banca: DINIZ, João Otávio Bandeira
Quarto membro da banca: SERRA, Ginalber Luiz de Oliveira
Resumo: Séries temporais são dados coletado ao longo do tempo regularmente, descrevendo a média de um evento no tempo. Por esse, e outros motivos, as séries temporais vêm ganhando cada vez mais espaço em diversas áreas, tais como aplicações comerciais, naturais, médicas. Uma das principais problemáticas envolvendo séries temporais está na perda de dados e, para recuperá-los, existem diversas abordagens de imputação em séries temporais univariadas. Com objetivo de contribuir com a área de imputação em séries temporais, este estudo propõe um novo método de imputação de valores faltosos baseado em meta-aprendizado. Inicialmente, selecionou-se dez técnicas clássicas para imputar dados de séries temporais e a partir do erro construiu-se uma base de metadados, com as séries rotuladas em dez classes, conforme o menor erro obtido. Além das dez técnicas utilizadas, propôs-se uma nova técnica de imputação usando a rede Pix2Pix GAN, que imputa a partir de imagens de séries temporais. Somado a isso, foi proposta uma nova arquitetura de rede denominada HybridLSTM para recomendar, a partir dos metadados rotulados, a melhor técnica de imputação para uma determinada série. Assim, mostrou-se que a rede HybridLSTM sugeriu as melhores técnicas de imputação de dados a partir das características das séries, superando em diversas oportunidades as imputações de técnicas clássicas como interpolação linear e interpolação Akima. A técnica de imputação proposta foi avaliada em nove datasets diferentes e alcançou um ASMAPE médio de 9,51%, um máximo de 22,75% e um mínimo de 3,73%. Mostrou-se ainda que a abordagem de imputar dados por meio de janelamento utilizando várias técnicas em pequenas fatias de séries temporais é um campo promissor e, assim, abriu-se espaço para diversas outras pesquisas como a imputação de dados faltosos em séries temporais por meio de imagens e redes GANs.
Abstract: Time series are data collected over time in a regular manner, describing the average of an event over time. For this reason, among others, time series have been gaining increasing importance in various areas, such as business, natural, and medical applications. One of the main challenges involving time series is data loss, and to recover them, there are various approaches to imputing missing values in univariate time series. In order to contribute to the field of imputation in time series, this study proposes a new method of imputing missing values based on meta-learning. Initially, ten classical techniques were selected to impute time series data, and based on the error, a metadata set was constructed with the series labeled into ten classes according to the lowest obtained error. In addition to the ten techniques used, a new imputation technique using the Pix2Pix GAN network was proposed, which imputes based on images of time series. Furthermore, a new network architecture called HybridLSTM was proposed to recommend the best imputation technique for a given series based on the labeled metadata. It was shown that the HybridLSTM network suggested the best data imputation techniques based on the characteristics of the series, surpassing classical techniques such as linear interpolation and Akima interpolation in several instances. The proposed imputation technique was evaluated on nine different datasets and achieved an average ASMAPE of 9.51%, with a maximum of 22.75% and a minimum of 3.73%. It was also shown that the approach of imputing data through windowing using various techniques on small slices of time series is a promising field, opening up space for various other research areas such as imputing missing data in time series through images and GAN networks.
Palavras-chave: Séries Temporais;
imputação de dados;
meta-aprendizado;
Pix2Pix;
HybridLSTM.
Time series;
Convolutional Neural Networks;
Time Series Image;
Meta-Learning;
Imputation.
Área(s) do CNPq: Ciência da Computação
Idioma: por
País: Brasil
Instituição: Universidade Federal do Maranhão
Sigla da instituição: UFMA
Departamento: DEPARTAMENTO DE INFORMÁTICA/CCET
Programa: PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
Citação: ALMEIDA, Mauricio Morais. Imputação de dados faltosos em séries Temporais Univariadas utilizando meta-aprendizado baseado em Rede Neural LSTM Híbrida. 2023. 96 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2023.
Tipo de acesso: Acesso Aberto
URI: https://tedebc.ufma.br/jspui/handle/tede/tede/4710
Data de defesa: 5-Mai-2023
Aparece nas coleções:DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MAURICIOMORAISALMEIDA.pdfDissertação de Mestrado2,56 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.