UENP - Acervo Digital

ANÁLISE DE SENTIMENTO EM REDES SOCIAIS UTILIZANDO COMBINAÇÃO DE CLASSIFICADORES

Mostrar registro simples

dc.contributor.author AGUIAR, ERIKSON JÚLIO DE
dc.date.accessioned 2018-02-05T19:25:33Z
dc.date.available 2018-02-05T19:25:33Z
dc.date.issued 2017-12
dc.identifier.uri http://hdl.handle.net/123456789/240
dc.description.abstract Social networks are one of the largest means of communication currently, within which are generated all kinds of information that may be related to people, events, places and various other factors. Users within social networks express their opinions freely, leaving their personality and preferences exposed to the world. Therefore, sentiment analysis in social networks is becoming more frequent, since this type of information may be important for a company in discovering the preferences of its customers in relation to their products and services. The study proposes an approach to estimate sentiment in social networks for the portuguese language, focusing on Twitter; the method uses a machine learning algorithm approach that is called a committee, in which it combines the prediction of a set of six algorithms and defines the predicted value as the most voted among the algorithms, considering that the votes of the algorithms have weight. To perform this process, some tests are performed with a database of Portuguese tweets already labeled with the classes: negative (-1), neutral (0) and positive (1). To evaluate the performance of the techniques, the following performance metrics were used: accuracy, precision, recall, f1-score and error, the test base was classified using the algorithms and the results were analyzed according to the metrics proposed individually. In addition, sentiment analysis services available on the market were also tested, IBM Watson and Microsoft Text Analytics. The proposed method obtained an accuracy of approximately 86 % being superior to others in this respect. The next step was to perform the statistical analysis using some techniques, in order to verify if the proposed method has statistical difference for the other approaches presented, so it was concluded that the method has difference only for the following techniques: decision tree, IBM Watson and Microsoft Text Analytics, therefore demonstrating being statistically equivalent; the results of these tests were crucial to determine the significant differences of the method proposed for other techniques. pt_BR
dc.language.iso pt_BR pt_BR
dc.publisher As redes sociais são um dos maiores meios de comunicação atualmente, dentro delas são gerados todo o tipo de informação que podem estar relacionadas com pessoas, acontecimentos, lugares e diversos outros fatores. Os usuários dentro das redes sociais expressam suas opiniões de forma livre, deixam sua personalidade e preferências expostas para o mundo. Logo, a análise de sentimentos em redes sociais vem se tornando mais frequente, visto que esse tipo de informação pode ser importante para uma empresa descobrir as preferências de seus clientes em relação aos seus produtos e serviços. O trabalho propõe um método para estimar sentimentos em redes sociais para a língua portuguesa, tendo como foco o Twitter; o método utiliza de uma abordagem baseada em algoritmos de aprendizado de máquina que é denominado comitê, no qual combina a predição de um conjunto de seis algoritmos e define o valor predito como o mais votado entre eles, considerando que o voto entre eles tem peso. Para executar esse processo, são realizados alguns testes com uma base de dados de tweets em português já rotulada com as classes: negativo (-1), neutro (0) e positivo (1). Para avaliar o desempenho das técnicas, foi utilizado as seguintes métricas de desempenho: acurácia, precisão, recall, f1-score e erro, a base de teste foi classificada usando os algoritmos e analisados os resultados de acordo com as métricas propostas isoladamente. Além disso, também foram analisados os serviços de análise de sentimentos disponíveis no mercado, IBM Watson e Microsoft Text Analytics. O método proposto obteve uma acurácia de aproximadamente 86 % sendo superior aos outros nesse aspecto. O próximo passo foi realizar a análise estatística utilizando de algumas técnicas, com o propósito de verificar se o método proposto tem diferença estatística para as outras abordagens apresentadas, assim concluiu-se que o método proposto tem diferença apenas para os métodos: árvore de decisão, IBM Watson e Microsoft Text Analytics, portanto, para as outras técnicas são equivalentes estatisticamente; os resultados desses testes foram cruciais para determinar se o método proposto tem diferenças significativas para os demais. pt_BR
dc.subject Aprendizado de Máquina, Analise de Dados, Classificação de Sentimentos, Redes Sociais pt_BR
dc.title ANÁLISE DE SENTIMENTO EM REDES SOCIAIS UTILIZANDO COMBINAÇÃO DE CLASSIFICADORES pt_BR
dc.type TCC pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Navegar

Minha conta