Uma Abordagem Multi-Nível Baseada em Redes Neurais Convolucionais para Redução do Viés Algorítmico na Localização de Pontos Faciais

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/5108

Tipo do documento:	Tese
Título:	Uma Abordagem Multi-Nível Baseada em Redes Neurais Convolucionais para Redução do Viés Algorítmico na Localização de Pontos Faciais
Título(s) alternativo(s):	A Multi-Level Approach Based on Convolutional Networks for Algorithmic Bias Reduction in Facial Point Localization
Autor:	FREITAS, Ricardo Teles
Primeiro orientador:	AIRES, Kelson Rômulo Teixeira
Primeiro coorientador:	PAIVA, Anselmo Cardoso de
Primeiro membro da banca:	AIRES, Kelson Rômulo Teixeira
Segundo membro da banca:	PAIVA, Anselmo Cardoso de
Terceiro membro da banca:	GOMES, Herman Martins
Quarto membro da banca:	CLUA, Esteban Walter Gonzalez
Quinto membro da banca:	BRAZ JÚNIOR, Geraldo
Resumo:	A localização de pontos de referência facial é uma desafiadora tarefa no contexto da Visão Computacional cujo resultado é aproveitado em diversas aplicações faciais de alto-nível. Para a solução desse problema, modelos baseados em redes neurais convolucionais já atingem níveis de desempenho próximos à anotação humana. O principal critério adotado para a avaliação de desempenho desses modelos é a média da distância ponto-a-ponto, considerando a totalidade de um dataset, entre a anotação de um especialista e o valor estimado. Contudo, estudos recentes lançaram luz sobre um problema ainda pouco explorado na avaliação desses modelos relativos a aplica- ções faciais. Ele consiste na existência de significativas diferenças de desempenho dos modelos de análise facial quando avaliados os resultados entre diferentes grupos demográficos. Isso caracteriza um viés algorítmico que pode levar a uma discriminação ou favorecimento na análise de um grupo em relação aos outros. Este trabalho propõe uma abordagem de localização de pontos faciais que visa a redução das diferenças de desempenho entre grupos demograficamente distintos. A abordagem concentra-se em uma estratégia multi-nível baseada em redes neurais convolucionais para modelagem dos atributos faciais. O nível de cima é composto por um modelo de regressão de coor- denadas para detecção de subunidades da face. O nível de baixo utiliza as respostas de detecção para modelar a localização de cada ponto que compõe a subunidade correspondente. Os modelos foram treinados a partir dos datasets Helen, LFPW, AFW, e 300W desbalanceados com respeito a indivíduos com problemas neurológicos, e aplicados ao Toronto Neuroface, balanceado com portadores de ELA (Esclerose Lateral Amiotrófica), sobreviventes de derrame, e um grupo de controle. A comparação com o estado da arte de localização de pontos faciais revelou dois avanços significativos: a aplicação dos modelos do nível de baixo isolados e em condições de detecção de subunidades ideal foi capaz de reduzir as diferenças de desempenho entre todos os grupos, além de reduzir significativamente o erro geral; e a aplicação da abordagem multi-nível reduziu as diferenças de desempenho entre os grupos de controle e portado- res de ELA a níveis insignificantes, além de manter os resultados gerais comparáveis ao estado da arte. A abordagem demonstrou ser capaz de atenuar o viés algorítmico presente em modelos preditivos gerados a partir de um dataset desbalanceado.
Abstract:	Facial landmarks localization is a challenging task in the context of Vision Computing whose results are explored in many high-level facial applications. To solve this problem, convolutional neural networks models are capable of achieving performance levels close to human annotation. The main criteria adopted to evaluate these models is the average point-to-point distance, regarding the whole dataset, from an expert annotation and the predicted value. However, recent studies shed light on a problem still obscure in those models’ evaluations. The issue consists on the existence of significant performance differences of facial analysis models when applied to different demographic groups. This characterizes an algorithmic bias that may lead to discrimination or favoritism in the analysis of a group over another. This work proposes a face alignment approach aiming to reduce the performance gaps among demographically distinct groups with respect to facial landmarks location. The approach focuses on a multi-level strategy based on convolutional neural networks for face modeling. The top level comprises a coordinate regression model for facial subunit detection. The bottom level uses the responses to model the subunits landmarks coordinates. The models were trained with the unbalanced datasets Helen, LFPW, AFW, and 300W and applied in the Toronto Neuroface balanced with ALS (amyotrophic lateral sclerosis) patients, post-stroke patients, and a control group. The comparison with the state-of-the-art models for face alignment revealed two significant advances: the application of bottom-level models in ideal facial subunits detection conditions was capable of significantly reducing the performance gap among all groups, besides the overall error was significantly reduced as well; and the application of the multi-level approach reduced the performance gap between ALS and the control group to insignificant, besides the overall performance is comparable to the state-of-the-art. The approach showed to be capable of mitigating the algorithmic bias present in predictive models generated after an unbalanced dataset.
Palavras-chave:	Localização de Pontos Faciais; Viés Algorítmico; Redes Neurais Convolucionais Face Alignment; Algorithmic Bias; Convolutional Neural Networks
Área(s) do CNPq:	Processamento Gráfico (Graphics)
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	DEPARTAMENTO DE INFORMÁTICA/CCET
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO (ASSOCIAÇÃO UFMA/UFPI)
Citação:	FREITAS, Ricardo Teles. Uma Abordagem Multi-Nível Baseada em Redes Neurais Convolucionais para Redução do Viés Algorítmico na Localização de Pontos Faciais. 2023. 100 f. Tese( Programa de Pós-Graduação em Ciência da Computação (ASSOCIAÇÃO UFMA/UFPI) - Universidade Federal do Maranhão, São Luís, 2023.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/5108
Data de defesa:	29-Set-2023
Aparece nas coleções:	TESES DE DOUTORADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO (ASSOCIAÇÃO UFMA/UFPI)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Tese_Ricardo_Freitas_3_assinado_assinado.pdf	Tese de Doutorado	30,22 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações