Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://tedebc.ufma.br/jspui/handle/tede/tede/5255
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | JACOB JUNIOR, Antonio Fernando Lavareda | - |
dc.creator.Lattes | http://lattes.cnpq.br/4510520291728075 | por |
dc.contributor.advisor1 | SANTANA, Ewaldo Eder Carvalho | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0660692009750374 | por |
dc.contributor.advisor-co1 | LOBATO, Fábio Manoel França | - |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/8320014491229434 | por |
dc.contributor.referee1 | SANTANA, Ewaldo Eder Carvalho | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/0660692009750374 | por |
dc.contributor.referee2 | LOBATO, Fábio Manoel França | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/8320014491229434 | por |
dc.contributor.referee3 | BARROS FILHO, Allan Kardec Duailibe | - |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/0492330410079141 | por |
dc.contributor.referee4 | SILVA, Francisco Jose Da Silva e | - |
dc.contributor.referee4Lattes | http://lattes.cnpq.br/0770343284012942 | por |
dc.contributor.referee5 | CORTES, Omar Andres Carmona | - |
dc.contributor.referee5Lattes | http://lattes.cnpq.br/5523293886612004 | por |
dc.date.accessioned | 2024-04-24T15:03:26Z | - |
dc.date.issued | 2024-02-23 | - |
dc.identifier.citation | JACOB JUNIOR, Antonio Fernando Lavareda. Algoritmos genético para imputação múltipla de dados na classificação multirrótulo. 2024. 97 f. Tese (Programa de Pós-Graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024. | por |
dc.identifier.uri | https://tedebc.ufma.br/jspui/handle/tede/tede/5255 | - |
dc.description.resumo | Dados ausentes são um problema prevalente que requer atenção, uma vez que a maioria das técnicas de análise de dados não consegue lidar com isso. Esse problema é particularmente crítico em Classificação Multi-rótulo (MLC), onde poucos estudos têm investigado dados ausentes nesse domínio de aplicação. MLC difere da Classificação de Monorrótulo (SLC) ao permitir que uma instância seja associada a várias classes. A classificação de filmes é um exemplo didático, já que um filme pode ser classificado como “drama” e “biografia” simultaneamente. Um dos métodos mais comuns de tratamento de dados ausentes é por meio da imputação de dados, a qual busca valores plausíveis para preencher os ausentes. Nesse cenário, essa tese apresenta um novo método de imputação baseado em um algoritmo genético multiobjetivo para otimizar múltiplas imputações de dados, chamado Imputação Múltipla de Dados na Classificação Multirrótulo por meio de um Algoritmo Genético, ou simplesmente EvoImp. Aplicamos o método proposto em aprendizado multirrótulo e avaliamos seu desempenho usando seis bancos de dados sintéticos, considerando vários cenários de distribuição de valores ausentes. O método foi comparado com outras estratégias de imputação do estado-da-arte, como K-Means Imputation (KMI) e Weighted K-Nearest Neighbors Imputation (WKNNI). Os resultados comprovaram que o método proposto superou o baseline em todos os cenários, alcançando as melhores medidas de avaliação considerando: Exact Match, Acurácia e Hamming Loss. Os resultados superiores foram consistentes em diferentes domínios e tamanhos de conjuntos de dados, demonstrando a robustez do EvoImp. Assim, o EvoImp representa uma solução viável para o tratamento de dados ausentes em aprendizado multirrótulo. | por |
dc.description.abstract | Missing data is a prevalent problem that requires attention, as most data analysis techniques are unable to handle it. This is particularly critical in Multi-Label Classification (MLC), where only a few studies have investigated missing data in this application domain. MLC differs from Single-Label Classification (SLC) by allowing an instance to be associated with multiple classes. Movie classification is a didactic example since it can be “drama” and “bibliography” simultaneously. One of the most usual missing data treatment methods is data imputation, which seeks plausible values to fill in the missing ones. In this scenario, we propose a novel imputation method based on a multi-objective genetic algorithm for optimizing multiple data imputations called Multiple Imputation of Multi- label Classification data with a genetic algorithm, or simply EvoImp. We applied the proposed method in multi-label learning and evaluated its performance using six synthetic databases, considering various missing values distribution scenarios. The method was compared with other state-of-the-art imputation strategies, such as K-Means Imputation (KMI) and weighted K-Nearest Neighbors Imputation (WKNNI). The results proved that the proposed method outperformed the baseline in all the scenarios by achieving the best evaluation measures considering the Exact Match, Accuracy, and Hamming Loss. The superior results were constant in different dataset domains and sizes, demonstrating the EvoImp robustness. Thus, EvoImp represents a feasible solution to missing data treatment for multi-label learning. | eng |
dc.description.provenance | Submitted by Jonathan Sousa de Almeida (jonathan.sousa@ufma.br) on 2024-04-24T15:03:26Z No. of bitstreams: 1 AntonioFernandoLavaredaJacobJunior.pdf: 2311747 bytes, checksum: d479dcaf409dbe30f889fe10369550c0 (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2024-04-24T15:03:26Z (GMT). No. of bitstreams: 1 AntonioFernandoLavaredaJacobJunior.pdf: 2311747 bytes, checksum: d479dcaf409dbe30f889fe10369550c0 (MD5) Previous issue date: 2024-02-23 | eng |
dc.description.sponsorship | CNPq | por |
dc.format | application/pdf | * |
dc.language | por | por |
dc.publisher | Universidade Federal do Maranhão | por |
dc.publisher.department | DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFMA | por |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET | por |
dc.rights | Acesso Aberto | por |
dc.subject | valores ausentes; | por |
dc.subject | classificação multirrótulo; | por |
dc.subject | algoritmos genéticos. | por |
dc.subject | missing values; | eng |
dc.subject | multi-label classification | eng |
dc.subject | genetic algorithms. | eng |
dc.subject.cnpq | Ciências Exatas e da Terra | por |
dc.title | Algoritmos genético para imputação múltipla de dados na classificação multirrótulo | por |
dc.title.alternative | Genetic algorithms for multiple imputation of data in multi-label classification | eng |
dc.type | Tese | por |
Aparece nas coleções: | TESE DE DOUTORADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
AntonioFernandoLavaredaJacobJunior.pdf | Tese de Doutorado | 2,26 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.