@MASTERSTHESIS{ 2018:1653869865, title = {Estudo comparativo de análise de sentimentos aplicado à notícias públicas}, year = {2018}, url = "https://tedebc.ufma.br/jspui/handle/tede/tede/2110", abstract = "No período eleitoral, grande parte da opinião pública sobre partidos e candidatos é formada a partir de notícias veiculadas através dos meios de comunicação de massa: TV, radio, jornal e principalmente internet, através de portais de notícias online. Entretanto, existe um debate sobre a verdadeira imparcialidade desses meios ao transmitir a informação aos telespectadores. Alguns acusam a mídia de favorecer algumas figuras políticas e suas agendas, enquanto outros reafirmam a imparcialidade deste meio de comunicação. Entretanto, julgar a parcialidade de notícias políticas é uma tarefa que está sujeita a subjetividade do avaliador, que nem sempre reflete a realidade. Neste contexto, os métodos providos pelo Processamento de Linguagem Natural, através do campo de estudo da Análise de Sentimento, podem trazer uma visão menos enviesada nessa discussão. Análise de Sentimento é campo que alia as ferramentas de mineração de texto com ferramentas aprendizagem de máquina afim de classificar textos de acordo com sentimento expresso: positivo, negativo ou neutro. Neste trabalho é proposto um estudo comparativo entre as técnicas de representação de texto, seleção de atributos e ferramentas de aprendizagem de máquina para se classificar notícias políticas coletadas em portais online sobre as eleições brasileiras de 2014 quanto a sua opinião/sentimento (positivo, negativo ou neutro). Neste estudo os classificadores Naïve Bayes, Support Vector Machines e Regressão Logística (ou MaxEnt) são avaliados juntamente com as técnicas de seleção de atributos Qui Quadrado, Categorical Proportional Difference e Categorical Probability Proportional Difference. Os experimentos conduzidos visam escolher a melhor representação vetorial do texto, o melhor método de seleção de atributos e o melhor classificador para a base de dados proposta. A avaliação é realizada através de validação cruzada medindo-se a acurácia média e seu desvio-padrão para cada experimento. Os resultados experimentais apontam para representação bag-of-words utilizando vocabulário de unibigrams selecionados pela técnica Categorical Probability Proportional Difference juntamente com o classificador MaxEnt, atigindo uma acurácia média de 84,45% com um desvio-padrão de 0.029.", publisher = {Universidade Federal do Maranhão}, scholl = {PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET}, note = {DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET} }