Název: Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn
Další názvy: Clustering of texts based on their similarity using the Scikit-learn
Autoři: Smolík, Tomáš
Vedoucí práce/školitel: Skorkovská, Lucie
Datum vydání: 2013
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/10442
Klíčová slova: klasifikace;učení bez učitele;shlukování;K-means;analýza hlavních komponent;latentní sémantická analýza
Klíčová slova v dalším jazyce: classification;unsupervised learning;clustering;K-means;principal component analysis;latent semantic analysis
Abstrakt: Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány dle určených kritérií.
Abstrakt v dalším jazyce: The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the experimental part, where some methods are tested according to specific criteria.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_Smolik_final.pdfPlný text práce555,3 kBAdobe PDFZobrazit/otevřít
smolik-v.pdfPosudek vedoucího práce1,77 MBAdobe PDFZobrazit/otevřít
smolik-p.pdfPrůběh obhajoby práce847,49 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/10442

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.