Název: Metody strojového učení pro analýzu sentimentu
Další názvy: Machine Learning for Sentiment Analysis
Autoři: Patočka, Michal
Vedoucí práce/školitel: Habernal, Ivan
Oponent: Steinberger, Josef
Datum vydání: 2013
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/7621
Klíčová slova: analýza sentimentu;strojové učení;výběr příznaků;mutual information;information gain;chi square;odds ratio;relevancy score;naive Bayes;maximum entropy;SVM;confusion matrix;nevyvážený dataset
Klíčová slova v dalším jazyce: sentiment analysis;machine learning;feature selection;mutual information;information gain;chi square;odds ratio;relevancy score;naive Bayes;maximum entropy;SVM;confusion matrix;imbalanced dataset
Abstrakt: Tato práce prozkoumává možnosti použití algoritmu strojového učení pro analýzu sentimentu v českém jazyce. Prozkoumávané techniky jsou testovány na datech získaných ze serveru heureka.cz. Kromě použití tří základních algoritmu strojového učení (Naive Bayes, Maximum Entropy a SVM), je představeno a implementováno pět metod selekce příznaků (Mutual information, Information gain, Chi square, Odds ratio a Relevancy score). V rámci několika navržených experimentů je prozkoumán vliv těchto algoritmů na úspěšnost klasifikace algoritmu strojového učení.
Abstrakt v dalším jazyce: In this work we analyse usage of machine learning algorithms for sentiment analysis in Czech language. We evaluate relevant techniques on dataset extracted from Czech server heureka.cz. Three basic machine learning algorithms (Naive Bayes, Maximum Entropy and SVM) and five implementations of feature selection algorithm (Mutual information, Information gain, Chi square, Odds ratio and Relevancy score) are tested in this work. In several experiments we evaluate influence of these algorithms on performance of machine learning classifiers.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
diploma-thesis.pdfPlný text práce704,99 kBAdobe PDFZobrazit/otevřít
A11N0121Pposudek-ved.pdfPosudek vedoucího práce351,87 kBAdobe PDFZobrazit/otevřít
A11N0121Pposudek-op.pdfPosudek oponenta práce265,45 kBAdobe PDFZobrazit/otevřít
A11N0121Pprubeh.pdfPrůběh obhajoby práce203,3 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/7621

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.