@MASTERSTHESIS{ 2025:1969927063, title = {Um método baseado em grandes modelos de linguagem generativos para a análise de similaridades entre marcas no contexto brasileiro}, year = {2025}, url = "https://tedebc.ufma.br/jspui/handle/tede/6120", abstract = "Uma marca tem o objetivo de identificar, de forma única e distintiva, os produtos e serviços oferecidos por uma empresa. Ela constitui um importante ativo intangível, atuando como instrumento fundamental para impedir práticas de concorrência desleal e fortalecer o posici- onamento competitivo das empresas no mercado. Contudo, o crescente número de pedidos de registro de marcas submetidos ao Instituto Nacional de Propriedade Intelectual (INPI) tem gerado desafios significativos, incluindo aumento no tempo de análise, inconsistências nas decisões e maior complexidade na identificação de conflitos entre marcas. Diante desse cenário, métodos automatizados para a análise de similaridade entre marcas tornam-se essenciais para aprimorar a eficiência, confiabilidade e agilidade dos processos realizados pelo instituto. Neste contexto, esta dissertação propõe um método baseado em Modelos de Linguagem de Grande Escala (LLMs) para classificar e explicar a similaridade entre marcas nominativas, considerando os critérios fonético, ideológico, distintivo e mercadoló- gico adotados pelo INPI. Para alcançar esse objetivo, o método foi estruturado em duas etapas principais: (1) desenvolvimento de um modelo classificador, capaz de identificar rapidamente e com precisão conflitos entre marcas; e (2) desenvolvimento de um modelo explicador, responsável por fornecer explicações detalhadas sobre os motivos pelos quais duas marcas são consideradas similares ou não. Para desenvolver este método proposto, foi criado um Conjunto de Dados de Arquivo de Marcas Conflitantes (do inglês, Conflicting Marks Archive Dataset - CMAD), composto por casos reais de conflitos entre marcas extraídos das publicações oficiais do INPI. Diferentes LLMs foram avaliados quanto à pre- cisão na classificação dos conflitos entre marcas e na geração de explicações fundamentadas sobre os casos analisados, sendo essas avaliações validadas por especialistas em Propriedade Intelectual (PI). Os resultados demonstraram que alguns dos modelos avaliados obtiveram desempenho expressivo, com acurácia próxima a 99%, F1-score superior a 98% e AUC acima de 99% na classificação dos conflitos. Além disso, as explicações fornecidas pelos modelos foram avaliadas por especialistas com média superior a 4, em uma escala de 0 a 5, demonstrando clareza e alinhamento com os critérios estabelecidos pelo INPI. Portanto, este estudo apresenta uma contribuição para a análise automatizada de similaridade entre marcas, destacando o potencial dos LLMs na otimização e aprimoramento dos processos relacionados à PI, reduzindo a subjetividade inerente à análise manual e ampliando a trans- parência nas decisões institucionais, possibilitando democratizar o acesso à proteção de marcas, especialmente beneficiando pequenas e médias empresas que enfrentam limitações financeiras ou técnicas, contribuindo diretamente para a redução de custos operacionais, prevenção de litígios de marcas e aceleração dos processos decisórios.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET}, note = {DEPARTAMENTO DE INFORMÁTICA/CCET} }