Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/tede/4635
Tipo do documento: Dissertação
Título: Classificação de imagens de exames de endoscopia por cápsula utilizando transformers
Título(s) alternativo(s): Image classification of capsule endoscopy exams using transformers
Autor: LIMA, Daniel Lopes Soares 
Primeiro orientador: PAIVA, Anselmo Cardoso de
Primeiro coorientador: CUNHA, António Manuel Trigueiros da Silva
Primeiro membro da banca: PAIVA, Anselmo Cardoso de
Segundo membro da banca: CUNHA, António Manuel Trigueiros da Silva
Terceiro membro da banca: QUINTANILHA, Darlan Bruno Pontes
Quarto membro da banca: SILVA, Augusto Marques Ferreira da
Resumo: As doenças inflamatórias intestinais apresentam alta taxa de incidência na população, sendo umas das principais causas de internação hospitalar. Os vídeos obtidos por meio de cápsulas endoscópicas são essenciais para o diagnóstico de anomalias no trato gastrointestinal. Porém, devido à sua duração, que pode chegar a 10 horas, demandam grande atenção do especialista médico em sua análise. Técnicas de aprendizado de máquina têm sido aplicadas com sucesso no desenvolvimento de sistemas de diagnóstico auxiliados por computador desde a década de 1990. Na última década as Redes Neurais Convolucionais (CNNs) tornaram-se modelo de grande sucesso para reconhecimento de padrões em imagens. As CNNs usam convoluções para extrair características dos dados analisados, operando em uma janela de tamanho fixo e, portanto, tendo problemas para capturar relacionamentos em nível de pixel considerando os domínios espacial e temporal. Transformers, por sua vez, usam mecanismos de atenção, onde os dados são estruturados em um espaço vetorial que pode agregar informações de dados adjacentes para determinar o significado em um determinado contexto. Este trabalho propõe um método computacional para análise de imagens extraídas de vídeos obtidos por cápsulas endoscópicas, usando uma arquitetura baseada em Transformers, visando auxiliar o especialista médico no diagnóstico de anormalidades do trato gastrointestinal. A metodologia proposta foi aplicada em 41511 imagens WCE do dataset Kvasir-Capsule. Nos experimentos realizados para a classificação de 11 classes, os melhores resultados foram alcançados pelo modelo DeiT, que registrou taxas médias de 99,75% de acurácia, 98,17% de precisão, 98,31% de sensibilidade e 98,06% de f1-score.
Abstract: Inflammatory bowel diseases have a high incidence rate in the population, being one of the leading causes of hospitalization. Videos obtained through endoscopic capsules are essential for evaluating anomalies in the gastrointestinal tract. However, due to their duration, which can reach 10 hours, they demand great attention from the medical specialist in their analysis. Machine learning techniques have been successfully applied in developing computer-aided diagnostic systems since the 1990s, where Convolutional Neural Networks (CNNs) have become very successful for pattern recognition in images. CNNs use convolutions to extract features from the analyzed data, operating in a fixed- size window and thus having problems capturing pixel-level relationships considering the spatial and temporal domains. Otherwise, Transformers use attention mechanisms, where data is structured in a vector space that can aggregate information from adjacent data to determine meaning in a given context. This work proposes a computational method for analyzing images extracted from videos obtained by endoscopic capsules, using a transformer-based model that helps diagnose of gastrointestinal tract abnormalities. The proposed methodology was applied on 41511 WCE images from the Kvasir-Capsule dataset. In the experiments performed for the classification task of 11 classes, the best results were achieved by the DeiT model, which registered average rates of 99.75% of accuracy, 98.17% of precision, 98.31% of sensitivity and 98.06% of f1-score.
Palavras-chave: Trato Gastrointestinal;
WCE;
classificação;
transformers;
ViT;
DeiT.
GI Tract;
WCE;
classification;
transformers;
ViT;
DeiT.
Área(s) do CNPq: Ciências da Computação
Idioma: por
País: Brasil
Instituição: Universidade Federal do Maranhão
Sigla da instituição: UFMA
Departamento: DEPARTAMENTO DE INFORMÁTICA/CCET
Programa: PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
Citação: LIMA, Daniel Lopes Soares. Classificação de imagens de exames de endoscopia por cápsula utilizando transformers. 2023. 57 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2023.
Tipo de acesso: Acesso Aberto
URI: https://tedebc.ufma.br/jspui/handle/tede/tede/4635
Data de defesa: 24-Mar-2023
Aparece nas coleções:DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DanielLopesSoaresLima.pdfDissertação de Mestrado6,99 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.