Compartilhamento |
![]() ![]() |
Use este identificador para citar ou linkar para este item:
https://tedebc.ufma.br/jspui/handle/tede/6120
Tipo do documento: | Dissertação |
Título: | Um método baseado em grandes modelos de linguagem generativos para a análise de similaridades entre marcas no contexto brasileiro |
Título(s) alternativo(s): | A method based on large generative language models for the analysis of similarities between brands in the Brazilian context |
Autor: | REIS, Igor Bezerra ![]() |
Primeiro orientador: | TELES, Ariel Soares |
Primeiro membro da banca: | TELES, Ariel Soares |
Segundo membro da banca: | COUTINHO, Luciano Reis |
Terceiro membro da banca: | WALTER, Cícero Eduardo de Sousa |
Resumo: | Uma marca tem o objetivo de identificar, de forma única e distintiva, os produtos e serviços oferecidos por uma empresa. Ela constitui um importante ativo intangível, atuando como instrumento fundamental para impedir práticas de concorrência desleal e fortalecer o posici- onamento competitivo das empresas no mercado. Contudo, o crescente número de pedidos de registro de marcas submetidos ao Instituto Nacional de Propriedade Intelectual (INPI) tem gerado desafios significativos, incluindo aumento no tempo de análise, inconsistências nas decisões e maior complexidade na identificação de conflitos entre marcas. Diante desse cenário, métodos automatizados para a análise de similaridade entre marcas tornam-se essenciais para aprimorar a eficiência, confiabilidade e agilidade dos processos realizados pelo instituto. Neste contexto, esta dissertação propõe um método baseado em Modelos de Linguagem de Grande Escala (LLMs) para classificar e explicar a similaridade entre marcas nominativas, considerando os critérios fonético, ideológico, distintivo e mercadoló- gico adotados pelo INPI. Para alcançar esse objetivo, o método foi estruturado em duas etapas principais: (1) desenvolvimento de um modelo classificador, capaz de identificar rapidamente e com precisão conflitos entre marcas; e (2) desenvolvimento de um modelo explicador, responsável por fornecer explicações detalhadas sobre os motivos pelos quais duas marcas são consideradas similares ou não. Para desenvolver este método proposto, foi criado um Conjunto de Dados de Arquivo de Marcas Conflitantes (do inglês, Conflicting Marks Archive Dataset - CMAD), composto por casos reais de conflitos entre marcas extraídos das publicações oficiais do INPI. Diferentes LLMs foram avaliados quanto à pre- cisão na classificação dos conflitos entre marcas e na geração de explicações fundamentadas sobre os casos analisados, sendo essas avaliações validadas por especialistas em Propriedade Intelectual (PI). Os resultados demonstraram que alguns dos modelos avaliados obtiveram desempenho expressivo, com acurácia próxima a 99%, F1-score superior a 98% e AUC acima de 99% na classificação dos conflitos. Além disso, as explicações fornecidas pelos modelos foram avaliadas por especialistas com média superior a 4, em uma escala de 0 a 5, demonstrando clareza e alinhamento com os critérios estabelecidos pelo INPI. Portanto, este estudo apresenta uma contribuição para a análise automatizada de similaridade entre marcas, destacando o potencial dos LLMs na otimização e aprimoramento dos processos relacionados à PI, reduzindo a subjetividade inerente à análise manual e ampliando a trans- parência nas decisões institucionais, possibilitando democratizar o acesso à proteção de marcas, especialmente beneficiando pequenas e médias empresas que enfrentam limitações financeiras ou técnicas, contribuindo diretamente para a redução de custos operacionais, prevenção de litígios de marcas e aceleração dos processos decisórios. |
Abstract: | A trademark aims to uniquely and distinctively identify the products and services offered by a company. It constitutes an important intangible asset, serving as a fundamental tool to prevent unfair competition practices and strengthen the company’s competitive position in the market. However, the increasing number of trademark registration applications submitted to the Brazilian National Institute of Industrial Property (INPI) has posed significant challenges, including longer review times, inconsistencies in decisions, and increased complexity in identifying trademark conflicts. In this context, automated methods for trademark similarity analysis have become essential to enhance the efficiency, reliability, and speed of the institute’s processes. This dissertation proposes a method based on Large Language Models (LLMs) to classify and explain the similarity between word marks, taking into account the phonetic, ideological, distinctive, and market-related criteria adopted by INPI. To achieve this goal, the method was structured into two main stages: (1) the development of a classification model capable of quickly and accurately identifying conflicts between trademarks; and (2) the development of an explanation model responsible for providing detailed justifications regarding why two trademarks are considered similar or not. To support this approach, a dataset named the Conflicting Marks Archive Dataset (CMAD) was created, comprising real trademark conflict cases extracted from INPI’s official publications. Several LLMs were evaluated for their accuracy in classifying conflicts and for generating well-founded explanations of the analyzed cases, which were validated by Intellectual Property (IP) specialists. The results showed that some of the evaluated models achieved outstanding performance, with accuracy close to 99%, F1-score above 98%, and AUC above 99% in the classification task. Furthermore, the explanations provided by the models received average ratings above 4 (on a scale from 0 to 5) from experts, demonstrating clarity and alignment with the criteria established by INPI. Therefore, this study contributes to the field of automated trademark similarity analysis by highlighting the potential of LLMs to optimize and enhance processes related to IP, reducing the subjectivity inherent to manual evaluation and increasing transparency in institutional decisions. The proposed method also facilitates broader access to trademark protection, especially for small and medium-sized enterprises facing financial or technical limitations, thus helping reduce operational costs, prevent trademark disputes, and accelerate decision- making processes. |
Palavras-chave: | marcas; propriedade intelectual; similaridade de marcas; modelos de linguagem de grande escala. trademarks; intellectual property; trademark similarity; large language models. |
Área(s) do CNPq: | Ciência da Computação |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal do Maranhão |
Sigla da instituição: | UFMA |
Departamento: | DEPARTAMENTO DE INFORMÁTICA/CCET |
Programa: | PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET |
Citação: | REIS, Igor Bezerra. Um método baseado em grandes modelos de linguagem generativos para a análise de similaridades entre marcas no contexto brasileiro. 2025. 97 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2025. |
Tipo de acesso: | Acesso Aberto |
URI: | https://tedebc.ufma.br/jspui/handle/tede/6120 |
Data de defesa: | 22-Abr-2025 |
Aparece nas coleções: | DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
IgorBezerraReis.pdf | Dissertação de Mestrado | 3,22 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.