@MASTERSTHESIS{ 2026:1535856093, title = {O uso da inteligência artificial (ia) para elaboração de minutas de sentença em processos dos Juizados Especiais Federais do Maranhão: estudo comparativo de qualidade, sob a perspectiva de Robert Alexy, em distintos cenários de utilização}, year = {2026}, url = "https://tedebc.ufma.br/jspui/handle/tede/7065", abstract = "Investiga-se empiricamente a qualidade argumentativa de sentenças elaboradas por inteligência artificial generativa em comparação com sentenças humanas nos Juizados Especiais Federais da Seção Judiciária do Maranhão (JEFs/SJMA). O desenho experimental compara, processo a processo, a sentença humana original a três sentenças sintéticas geradas pelo Gemini 2.5 Pro em três cenários: Livre (comando aberto), Dirigido (resultado indicado) e Controlado (relatório estruturado e prompt com balizas normativas). A amostra é estratificada em 300 processos das matérias responsabilidade civil bancária, benefício de prestação continuada ao idoso (BPC-I) e à pessoa com deficiência (BPC-PCD). As 1.200 sentenças foram submetidas a tríplice codificação independente por avaliador humano cego, Claude Opus 4.5 e GPT-4.5, sob rubrica alexyana de seis dimensões (D1–D6), totalizando 3.600 codificações. Os testes de Friedman, Wilcoxon e Bonferroni demonstram que os três cenários de IA apresentam maior conformidade textual com os padrões da rubrica D1–D6 do que as sentenças humanas, com altíssima significância estatística e tamanho de efeito muito grande (Friedman χ²(3) > 308; p < 10⁻⁶⁶), com hierarquia idêntica nos três avaliadores: livre > dirigida > controlada > humana. A correlação entre avaliador humano e Claude Opus 4.5 (r = 0,936) evidencia calibração robusta do instrumento. As maiores diferenças concentram-se em D3 (justificação externa empírica) e D5 (saturação argumentativa), dimensões correspondentes às exigências do art. 489, §1º, do CPC/2015 mais frequentemente fragilizadas no contencioso de massa. No estrato bancário (n=18), a sentença humana supera os Cenários Dirigido e Controlado em todos os avaliadores; o Cenário Livre, contudo, supera a sentença humana em dois dos três avaliadores, achado que impede a generalização da vantagem humana em matérias principiológicas para todos os modos de IA. O fluxo automatizado de verificação confirma 75,5% das marcações suspeitas em sentenças humanas como imprecisões materiais reais (209/277), padrão compatível com reutilização de minutas-modelo. Conclui-se que a integração da IA generativa ao contencioso de massa é empiricamente sustentável, desde que operada com protocolos diferenciados por complexidade argumentativa da matéria, a saber, modalidade controlada para demandas regradas e probatórias e modalidade aberta ou auxiliar para demandas com colisão principiológica, com revisão humana qualificada como condição necessária e inafastável.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM DIREITO/CCSO}, note = {DEPARTAMENTO DE DIREITO/CCSO} }