Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tedebc.ufma.br/jspui/handle/tede/tede/2110
Tipo do documento: Dissertação
Título: Estudo comparativo de análise de sentimentos aplicado à notícias públicas
Título(s) alternativo(s): Comparative Study of Sentiment Analysis Applied to Political News
Autor: CARVALHO, Caio Magno Aguiar de 
Primeiro orientador: BARROS FILHO, Allan Kardec Duailibe
Primeiro coorientador: SANTANA, Ewaldo Eder Carvalho
Primeiro membro da banca: FONSECA, João Viana
Segundo membro da banca: AGUILAR, Paulo Armando Cavalcante
Resumo: No período eleitoral, grande parte da opinião pública sobre partidos e candidatos é formada a partir de notícias veiculadas através dos meios de comunicação de massa: TV, radio, jornal e principalmente internet, através de portais de notícias online. Entretanto, existe um debate sobre a verdadeira imparcialidade desses meios ao transmitir a informação aos telespectadores. Alguns acusam a mídia de favorecer algumas figuras políticas e suas agendas, enquanto outros reafirmam a imparcialidade deste meio de comunicação. Entretanto, julgar a parcialidade de notícias políticas é uma tarefa que está sujeita a subjetividade do avaliador, que nem sempre reflete a realidade. Neste contexto, os métodos providos pelo Processamento de Linguagem Natural, através do campo de estudo da Análise de Sentimento, podem trazer uma visão menos enviesada nessa discussão. Análise de Sentimento é campo que alia as ferramentas de mineração de texto com ferramentas aprendizagem de máquina afim de classificar textos de acordo com sentimento expresso: positivo, negativo ou neutro. Neste trabalho é proposto um estudo comparativo entre as técnicas de representação de texto, seleção de atributos e ferramentas de aprendizagem de máquina para se classificar notícias políticas coletadas em portais online sobre as eleições brasileiras de 2014 quanto a sua opinião/sentimento (positivo, negativo ou neutro). Neste estudo os classificadores Naïve Bayes, Support Vector Machines e Regressão Logística (ou MaxEnt) são avaliados juntamente com as técnicas de seleção de atributos Qui Quadrado, Categorical Proportional Difference e Categorical Probability Proportional Difference. Os experimentos conduzidos visam escolher a melhor representação vetorial do texto, o melhor método de seleção de atributos e o melhor classificador para a base de dados proposta. A avaliação é realizada através de validação cruzada medindo-se a acurácia média e seu desvio-padrão para cada experimento. Os resultados experimentais apontam para representação bag-of-words utilizando vocabulário de unibigrams selecionados pela técnica Categorical Probability Proportional Difference juntamente com o classificador MaxEnt, atigindo uma acurácia média de 84,45% com um desvio-padrão de 0.029.
Abstract: In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029.
Palavras-chave: Processamento de Linguagem Natural
Análise de Sentimento
Aprendizagem de Máquina
Seleção de atributos
Área(s) do CNPq: Sistemas de Informação
Idioma: por
País: Brasil
Instituição: Universidade Federal do Maranhão
Sigla da instituição: UFMA
Departamento: DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
Programa: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
Citação: CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018.
Tipo de acesso: Acesso Aberto
URI: https://tedebc.ufma.br/jspui/handle/tede/tede/2110
Data de defesa: 20-Fev-2018
Aparece nas coleções:DISSERTAÇÃO DE MESTRADO - PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CaioCarvalho.pdfDissertação577,62 kBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.