Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://tedebc.ufma.br/jspui/handle/tede/tede/2110
Tipo do documento: | Dissertação |
Título: | Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
Título(s) alternativo(s): | Comparative Study of Sentiment Analysis Applied to Political News |
Autor: | CARVALHO, Caio Magno Aguiar de |
Primeiro orientador: | BARROS FILHO, Allan Kardec Duailibe |
Primeiro coorientador: | SANTANA, Ewaldo Eder Carvalho |
Primeiro membro da banca: | FONSECA, João Viana |
Segundo membro da banca: | AGUILAR, Paulo Armando Cavalcante |
Resumo: | No período eleitoral, grande parte da opinião pública sobre partidos e candidatos é formada a partir de notícias veiculadas através dos meios de comunicação de massa: TV, radio, jornal e principalmente internet, através de portais de notícias online. Entretanto, existe um debate sobre a verdadeira imparcialidade desses meios ao transmitir a informação aos telespectadores. Alguns acusam a mídia de favorecer algumas figuras políticas e suas agendas, enquanto outros reafirmam a imparcialidade deste meio de comunicação. Entretanto, julgar a parcialidade de notícias políticas é uma tarefa que está sujeita a subjetividade do avaliador, que nem sempre reflete a realidade. Neste contexto, os métodos providos pelo Processamento de Linguagem Natural, através do campo de estudo da Análise de Sentimento, podem trazer uma visão menos enviesada nessa discussão. Análise de Sentimento é campo que alia as ferramentas de mineração de texto com ferramentas aprendizagem de máquina afim de classificar textos de acordo com sentimento expresso: positivo, negativo ou neutro. Neste trabalho é proposto um estudo comparativo entre as técnicas de representação de texto, seleção de atributos e ferramentas de aprendizagem de máquina para se classificar notícias políticas coletadas em portais online sobre as eleições brasileiras de 2014 quanto a sua opinião/sentimento (positivo, negativo ou neutro). Neste estudo os classificadores Naïve Bayes, Support Vector Machines e Regressão Logística (ou MaxEnt) são avaliados juntamente com as técnicas de seleção de atributos Qui Quadrado, Categorical Proportional Difference e Categorical Probability Proportional Difference. Os experimentos conduzidos visam escolher a melhor representação vetorial do texto, o melhor método de seleção de atributos e o melhor classificador para a base de dados proposta. A avaliação é realizada através de validação cruzada medindo-se a acurácia média e seu desvio-padrão para cada experimento. Os resultados experimentais apontam para representação bag-of-words utilizando vocabulário de unibigrams selecionados pela técnica Categorical Probability Proportional Difference juntamente com o classificador MaxEnt, atigindo uma acurácia média de 84,45% com um desvio-padrão de 0.029. |
Abstract: | In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029. |
Palavras-chave: | Processamento de Linguagem Natural Análise de Sentimento Aprendizagem de Máquina Seleção de atributos |
Área(s) do CNPq: | Sistemas de Informação |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal do Maranhão |
Sigla da instituição: | UFMA |
Departamento: | DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET |
Programa: | PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET |
Citação: | CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018. |
Tipo de acesso: | Acesso Aberto |
URI: | https://tedebc.ufma.br/jspui/handle/tede/tede/2110 |
Data de defesa: | 20-Fev-2018 |
Aparece nas coleções: | DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CaioCarvalho.pdf | Dissertação | 577,62 kB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.