Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/6579
Tipo do documento: Tese
Título: Classificação do estágio de glaucoma usando dados multimodais
Título(s) alternativo(s): Glaucoma stage classification using multimodal data
Autor: FERREIRA, Marcos Melo 
Primeiro orientador: BRAZ JUNIOR, Geraldo
Primeiro coorientador: CUNHA, António Manuel Trigueiros da Silva
Primeiro membro da banca: BRAZ JUNIOR, Geraldo
Segundo membro da banca: CUNHA, António Manuel Trigueiros da Silva
Terceiro membro da banca: RENNA, Francesco
Quarto membro da banca: NETTO SANTOS, Paulo Ivson
Quinto membro da banca: VERAS, Rodrigo de Melo Souza
Resumo: O glaucoma é a principal causa de cegueira irreversível no mundo. Seu diagnóstico precoce é desafiador devido à ausência de sintomas nos estágios iniciais, à necessidade de análise de múltiplos exames por profissionais especializados e ao baixo conhecimento da população sobre a doença. Embora a perda visual causada pelo glaucoma seja irreversível, sua progressão pode ser retardada quando identificada precocemente. Nesse contexto, métodos baseados em deep learning têm se mostrado promissores em tarefas de processamento de imagens médicas, como classificação e segmentação, oferecendo suporte potencial ao diagnóstico clínico. Neste trabalho, foi desenvolvido um método para classificação dos estágios do glaucoma a partir da utilização de retinografias e volumes de OCT. O método emprega uma arquitetura multimodal baseada em redes convolucionais e explora diferentes estratégias de fusão, tanto de mapas de características quanto de predições, com o objetivo de integrar de forma eficaz as modalidades. Além disso, foram investigadas regiões específicas de interesse — o nervo óptico, nas retinografias, e as camadas retinianas, nos volumes de OCT — como forma de aprimorar a representação dos dados e melhorar a acurácia da classificação. Os experimentos realizados demonstraram que os modelos multimodais alcançaram desempenhos superiores em relação aos unimodais, atingindo como melhor resultado um valor de Kappa de 0,88, o que indica um alto nível de concordância do método proposto em relação às avaliações de especialistas. Adicionalmente, os resultados evidenciaram que a retinografia exerce maior influência do que os volumes de OCT no processo de classificação, enquanto a captura direcionada das camadas da retina mostrou-se uma abordagem promissora para aumentar a precisão do modelo. De forma geral, o método proposto demonstrou potencial significativo como ferramenta de apoio à decisão clínica, contribuindo para o avanço de sistemas automatizados de diagnóstico e para a detecção precoce e precisa do glaucoma.
Abstract: Glaucoma is the leading cause of irreversible blindness worldwide. Its early diagnosis is challenging due to the absence of symptoms in the initial stages, the need for multiple exams to be analysed by specialised professionals, and the general lack of awareness about the disease among the population. Although the visual loss caused by glaucoma is irreversible, its progression can be slowed if the disease is detected in its early stages. In this context, deep learning methods have demonstrated promising results in medical image processing tasks, including classification and segmentation, offering potential support for clinical diagnosis. In this work, we developed a method for glaucoma stage classification that combines fundus photographs and OCT volumes. The method employs a multimodal convolutional architecture and explores various fusion strategies, both at the feature map and prediction levels, aiming to integrate multimodal information effectively. Additionally, specific regions of interest were investigated — the optic nerve in fundus photographs and the retinal layers in OCT volumes — to improve data representation and enhance classification accuracy. The experiments demonstrated that multimodal models outperformed unimodal approaches, achieving a Kappa score of 0.88, which indicates a high level of agreement of the proposed method with specialist assessments. Moreover, the results showed that fundus photography has a greater influence than OCT volumes in the classification process. At the same time, the targeted capture of retinal layers proved to be a promising strategy for further improving accuracy. Overall, the proposed method demonstrated significant potential as a clinical decision support tool, contributing to the advancement of automated diagnostic systems and enabling earlier and more accurate glaucoma detection.
Palavras-chave: Classificação de estágios de glaucoma;
Retinografia;
Tomografia de coerência óptica;
Deep learning;
Redes neurais convolucionais;
Modelos multimodais
Glaucoma grading stages;
Retinography;
Optical coherence tomography;
Deep learning;
Convolutional neural networks;
Multimodal models
Área(s) do CNPq: Sistemas de Informação
Idioma: por
País: Brasil
Instituição: Universidade Federal do Maranhão
Sigla da instituição: UFMA
Departamento: COORDENAÇÃO DO CURSO DE CIÊNCIAS DA COMPUTAÇÃO/CCET
Programa: PROGRAMA DE PÓS-GRADUAÇÃO DOUTORADO EM CIÊNCIA DA COMPUTAÇÃO
Citação: FERREIRA, Marcos Melo. Classificação do estágio de glaucoma usando dados multimodais. 2025. 96 f. Tese( Programa de Pós-graduação Doutorado em Ciência da Computação) - Universidade Federal do Maranhão, São Luís, 2025.
Tipo de acesso: Acesso Aberto
URI: https://tedebc.ufma.br/jspui/handle/tede/6579
Data de defesa: 19-Set-2025
Aparece nas coleções:TESES DE DOUTORADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO (ASSOCIAÇÃO UFMA/UFPI)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdfTese de Doutorado1,72 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.