Title: Analýza příspěvků na sociální síti Twitter
Other Titles: Twitter post sentiment analysis
Authors: Hain, Jakub
Advisor: Ježek Karel, Prof. Ing. CSc.
Issue Date: 2019
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/37430
Keywords: sociální sítě;twitter;sentiment;klasifikace;maximální entropie;naivní bayes;svm;sumarizace;latentní sémantická analýza
Keywords in different language: social network;twitter;sentiment;classification;maximum entropy;naive bayes;svm;sumarization;latent semantic analysis
Abstract: Tato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné využití aplikace by melo být pro sociální sít Twitter v češtině. V textu jsou popsány jednotlivé metody strojového učení použité pro klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy). Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy. Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek). Sentiment byl testován na ohodnocených datech z českého Facebooku a anglických tweetech. Při testování na českých datech byly výsledky jednotlivých klasifikátoru srovnatelné kromě SVM. Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných výsledku.
Abstract in different language: This thesis focuses on sentiment analysis and data summarization. Final use of the application should be for social network Twitter in Czech language. The text shows several machine learning methods used for classification (Naive Bayes, Support Vector Machine and Maximum Entropy). Extractive summarization is implemented as Latent semantic analysis. Selection of sentences is implemented in 2 versions (Gong and Liu, Steinberger and Ježek). Sentiment was tested on classified data from Czech Facebook and English tweets. Testing on Czech data shows comparable results on all classifiers except SVM. Summarization was tested on English dataset. ROUGE-1 metric was used for verification. Both versions of LSA performed similarly.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
Hain_DP_Text_2019.pdfPlný text práce1,27 MBAdobe PDFView/Open
A16N0030Phodnoceni-ved.PDFPosudek vedoucího práce433,35 kBAdobe PDFView/Open
A16N0030Pposudek-op.PDFPosudek oponenta práce439,16 kBAdobe PDFView/Open
A16N0030Pobhajoba.PDFPrůběh obhajoby práce246,59 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/37430

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.