CATCH-UP ESTATURAL EM CRIANÇAS NOS PRIMEIROS MIL DIAS DE VIDA: UM ESTUDO DE PREDIÇÃO USANDO APRENDIZAGEM DE MÁQUINA

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/6149

Tipo do documento:	Dissertação
Título:	CATCH-UP ESTATURAL EM CRIANÇAS NOS PRIMEIROS MIL DIAS DE VIDA: UM ESTUDO DE PREDIÇÃO USANDO APRENDIZAGEM DE MÁQUINA
Título(s) alternativo(s):	STATUS CATCH-UP IN CHILDREN IN THE FIRST THOUSAND DAYS OF LIFE: A PREDICTION STUDY USING MACHINE LEARNING
Autor:	FERREIRA, Cibelly de Fátima Vieira
Primeiro orientador:	SOUZA, Bruno Feres de
Primeiro coorientador:	THOMAZ, Erika Barbara Abreu Fonseca
Primeiro membro da banca:	SOUZA, Bruno Feres de
Segundo membro da banca:	THOMAZ, Erika Barbara Abreu Fonseca
Terceiro membro da banca:	ROCHA, Thiago Augusto Hernandes
Quarto membro da banca:	VIOLA, Poliana Cristina de Almeida Fonseca
Quinto membro da banca:	SILVA, Josenildo Costa da
Resumo:	Introdução: Apesar dos estudos de fatores associados, pouco se sabe sobre predições de catch-up estatural nos primeiros mil dias de vida, especialmente por Aprendizagem de Máquina (AM). Objetivo: Predizer a não ocorrência de catch-up estatural até 24 meses, de crianças que nasceram com comprimento abaixo do esperado para idade, por meio de técnicas de AM, a partir de dados sociodemográficos, do pré-natal, nascimento, hábitos, características dos pais e primeiro ano da criança. Métodos: Utilizaram-se os dados de pré-natal e nascimento Brazilian Ribeirão Preto and São Luís cohorts (BRISA), de duas cidades brasileiras. 659 crianças classificadas em baixa ou muito baixa estatura para idade ao nascer, segundo gráfico INTERGROWTH-21st, não gemelares, foram selecionadas e avaliadas. Aspectos hormonais, marcadores químicos de crescimento ou outras variáveis de difícil acesso/coleta não foram incluídos. No programa R studio, os algoritmos Linear Discriminant Analysis (LDA), Regularized Logistic Regression (RLR), Support Vector Machine (SVM) e Extreme Gradient Boosting (XGBoost) foram empregados para construir modelos de predição, com e sem o selecionador de atributos Boruta, em 5 diferentes cenários. Resultados: Neste estudo, a especificidade foi uma importante medida de desempenho. No cenário com junção de ambas as cidades para treino e teste (validação cruzada), os modelos em LDA e RLR com Boruta tiveram os melhores desempenhos em sensibilidade (72,8% e 72,7%), porém sem ganhos expressivos para acurácia≅ 68 e 69%, especificidade≅ 64% e 65%, precisão≅ 68%, F1 score≅70% e AUC ≅75%, cada. Entre todos, o cenário de São Luís, utilizando o LDA com Boruta teve o melhor desempenho de modo geral: acurácia de 70,9%, sensibilidade de 75%, precisão de 70,5%, F1 Score de 72,5% e AUC de 74,4%, porém com especificidade de 66,5%. A maior especificidade foi em RP, como treino, e SL, como teste (variando de 78,3% a 87,3%), no qual o LDA sem Boruta teve o maior valor obtido. Todos os modelos testados foram estatisticamente superiores à classe majoritária (até 51,5%). Das variáveis, o peso ao nascer, altura da mãe, estatura para idade ao nascer, peso para idade ao nascer, fumo tiveram grande contribuição para os modelos; grau de prematuridade apareceu em todos os cenários. Conclusão: Variáveis de fácil acesso relativas aos primeiros mil dias de vida foram capazes de predizer, com acurácia, o não catch-up estatural de crianças nascidas com déficit de comprimento até 24 meses. Intervenções precoces se tornam mais estratégicas, podendo causar impacto positivo ao longo da vida dessas crianças.
Abstract:	Introduction: Despite studies of associated factors, little is known about predictions of height catch-up in the first thousand days of life, especially through Machine Learning (ML). Objective: To predict the non-occurrence of height catch-up up to 24 months of age, in children who were born with a length below the expected for their age, through ML techniques, based on sociodemographic, prenatal, birth, habits, parental characteristics and child's first year data. Methods: Prenatal and birth data from the Brazilian Ribeirão Preto and São Luís cohorts (BRISA) from two Brazilian cities were used. 659 children classified as short or very short for their age at birth, according to the INTERGROWTH-21st chart, non-twins, were selected and evaluated. Hormonal aspects, chemical growth markers or other variables that were difficult to access/collect were not included. In the R studio program, the Linear Discriminant Analysis (LDA), Regularized Logistic Regression (RLR), Support Vector Machine (SVM) and Extreme Gradient Boosting (XGBoost) algorithms were used to build prediction models, with and without the Boruta feature selector, in 5 different scenarios. Results: In this study, specificity was an important measure of performance. In the scenario with both cities combined for training and testing (cross-validation), the models in LDA and RLR with Boruta had the best performances in sensitivity (72.8% and 72.7%), but without significant gains in accuracy ≅ 68 and 69%, specificity ≅ 64% and 65%, precision ≅ 68%, F1 score ≅ 70% and AUC ≅ 75%, each. Among all, the São Luís scenario, using LDA with Boruta, had the best performance in general: accuracy of 70.9%, sensitivity of 75%, precision of 70.5%, F1 Score of 72.5% and AUC of 74.4%, however specificity of 66.5%. The highest specificity was in RP, as training, and SL, as testing (ranging from 78.3% to 87.3%), in which LDA without Boruta had the highest value obtained. All models tested were statistically superior to the majority class (up to 51.5%). Of the variables, birth weight, maternal height, height for age at birth, weight for age at birth, and smoking had a great contribution to the models; degree of prematurity appeared in all scenarios. Conclusion: Easily accessible variables related to the first thousand days of life were able to accurately predict the lack of height catch-up of children born with length deficit up to 24 months. Early interventions become more strategic and can have a positive impact throughout the lives of these children.
Palavras-chave:	Saúde da Criança; Antropometria; Aprendizagem de Máquina Supervisionada; Aprendizagem por Probabilidade; Crescimento Corporal Child Health; Anthropometry; Supervised Machine Learning; Probability Learning; Growth
Área(s) do CNPq:	Saúde Publica
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal do Maranhão
Sigla da instituição:	UFMA
Departamento:	COORDENACAO DO CURSO DE ENGENHARIA DA COMPUTACAO/DCCET
Programa:	PROGRAMA DE PÓS-GRADUAÇÃO EM SAÚDE COLETIVA/CCBS
Citação:	FERREIRA, Cibelly de Fátima Vieira. Catch-up estatural em crianças nos primeiros mil dias de vida: Um estudo de predição usando aprendizagem de máquina.2025. 172 f. Dissertação( Programa de Pós-graduação em Saúde Coletiva/CCBS) - Universidade Federal do Maranhão, São Luís, 2025.
Tipo de acesso:	Acesso Aberto
URI:	https://tedebc.ufma.br/jspui/handle/tede/6149
Data de defesa:	28-Fev-2025
Aparece nas coleções:	DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM SAÚDE COLETIVA

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CIBELLY DE FÁTIMA VIEIRA FERREIRA.pdf	Dissertação de Mestrado	4,46 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Universidade Federal do Maranhão

Biblioteca Digital de Teses e Dissertações