dc.contributor.author |
AGUIAR, ERIKSON JÚLIO DE |
|
dc.date.accessioned |
2018-02-05T19:25:33Z |
|
dc.date.available |
2018-02-05T19:25:33Z |
|
dc.date.issued |
2017-12 |
|
dc.identifier.uri |
http://hdl.handle.net/123456789/240 |
|
dc.description.abstract |
Social networks are one of the largest means of communication currently, within which
are generated all kinds of information that may be related to people, events, places and
various other factors. Users within social networks express their opinions freely, leaving
their personality and preferences exposed to the world. Therefore, sentiment analysis
in social networks is becoming more frequent, since this type of information may be
important for a company in discovering the preferences of its customers in relation to
their products and services. The study proposes an approach to estimate sentiment in
social networks for the portuguese language, focusing on Twitter; the method uses a
machine learning algorithm approach that is called a committee, in which it combines
the prediction of a set of six algorithms and defines the predicted value as the most
voted among the algorithms, considering that the votes of the algorithms have weight.
To perform this process, some tests are performed with a database of Portuguese tweets
already labeled with the classes: negative (-1), neutral (0) and positive (1). To evaluate
the performance of the techniques, the following performance metrics were used: accuracy,
precision, recall, f1-score and error, the test base was classified using the algorithms and
the results were analyzed according to the metrics proposed individually. In addition,
sentiment analysis services available on the market were also tested, IBM Watson and
Microsoft Text Analytics. The proposed method obtained an accuracy of approximately
86 % being superior to others in this respect. The next step was to perform the statistical
analysis using some techniques, in order to verify if the proposed method has statistical
difference for the other approaches presented, so it was concluded that the method has
difference only for the following techniques: decision tree, IBM Watson and Microsoft
Text Analytics, therefore demonstrating being statistically equivalent; the results of these
tests were crucial to determine the significant differences of the method proposed for other
techniques. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.publisher |
As redes sociais são um dos maiores meios de comunicação atualmente, dentro delas são gerados todo o tipo de informação que podem estar relacionadas com pessoas, acontecimentos, lugares e diversos outros fatores. Os usuários dentro das redes sociais expressam suas opiniões de forma livre, deixam sua personalidade e preferências expostas para o mundo. Logo, a análise de sentimentos em redes sociais vem se tornando mais frequente, visto que esse tipo de informação pode ser importante para uma empresa descobrir as preferências de seus clientes em relação aos seus produtos e serviços. O trabalho propõe um método para estimar sentimentos em redes sociais para a língua portuguesa, tendo como foco o Twitter; o método utiliza de uma abordagem baseada em algoritmos de aprendizado de máquina que é denominado comitê, no qual combina a predição de um conjunto de seis algoritmos e define o valor predito como o mais votado entre eles, considerando que o voto entre eles tem peso. Para executar esse processo, são realizados alguns testes com uma base de dados de tweets em português já rotulada com as classes: negativo (-1), neutro (0) e positivo (1). Para avaliar o desempenho das técnicas, foi utilizado as seguintes métricas de desempenho: acurácia, precisão, recall, f1-score e erro, a base de teste foi classificada usando os algoritmos e analisados os resultados de acordo com as métricas propostas isoladamente. Além disso, também foram analisados os serviços de análise de sentimentos disponíveis no mercado, IBM Watson e Microsoft Text Analytics. O método proposto obteve uma acurácia de aproximadamente 86 % sendo superior aos outros nesse aspecto. O próximo passo foi realizar a análise estatística utilizando de algumas técnicas, com o propósito de verificar se o método proposto tem diferença estatística para as outras abordagens apresentadas, assim concluiu-se que o método proposto tem diferença apenas para os métodos: árvore de decisão, IBM Watson e Microsoft Text Analytics, portanto, para as outras técnicas são equivalentes estatisticamente; os resultados desses testes foram cruciais para determinar se o método proposto tem diferenças significativas para os demais. |
pt_BR |
dc.subject |
Aprendizado de Máquina, Analise de Dados, Classificação de Sentimentos, Redes Sociais |
pt_BR |
dc.title |
ANÁLISE DE SENTIMENTO EM REDES SOCIAIS UTILIZANDO COMBINAÇÃO DE CLASSIFICADORES |
pt_BR |
dc.type |
TCC |
pt_BR |