Název: | Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn |
Další názvy: | Clustering of texts based on their similarity using the Scikit-learn |
Autoři: | Smolík, Tomáš |
Vedoucí práce/školitel: | Skorkovská, Lucie |
Datum vydání: | 2013 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/10442 |
Klíčová slova: | klasifikace;učení bez učitele;shlukování;K-means;analýza hlavních komponent;latentní sémantická analýza |
Klíčová slova v dalším jazyce: | classification;unsupervised learning;clustering;K-means;principal component analysis;latent semantic analysis |
Abstrakt: | Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány dle určených kritérií. |
Abstrakt v dalším jazyce: | The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the experimental part, where some methods are tested according to specific criteria. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
BP_Smolik_final.pdf | Plný text práce | 555,3 kB | Adobe PDF | Zobrazit/otevřít |
smolik-v.pdf | Posudek vedoucího práce | 1,77 MB | Adobe PDF | Zobrazit/otevřít |
smolik-p.pdf | Průběh obhajoby práce | 847,49 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/10442
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.