Title: Agregátor novinových zpráv
Other Titles: News aggregator
Authors: Soběhart, Michel
Advisor: Konkol, Michal
Referee: Brychcín, Tomáš
Issue Date: 2014
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/13523
Keywords: RSS zprávy;novinky;novinové zprávy;agregátor;shlukování;Java;podobnost
Keywords in different language: RSS feeds;news;news feeds;agregator;clustering;Java;similarity
Abstract: Hlavním cílem bakalářské práce je vytvořit program, který shlukuje podobné novinové zprávy. Dalším cílem je vytvořit program pro stahování novinových dat z internetových zdrojů, která budou sloužit jako testovací data. Je potřeba navrhnout posloupnost zpracování dat, určení podobnosti a také princip clusterování dat. Poslední fází je určení správného prahu, po kterém jsou dva soubory podobné. Aplikace byla programována v objektově orientovaném jazyce Java. Při testování navržená aplikace dosáhla 96,85% F-míry.
Abstract in different language: The main goal of the bachelor thesis is to create a program, which clusters similiar RSS newspaper data. Next goal is to create a program for downloading newspaper data from internet sources, which will be used as testing data. Designing a sequence of data processing, determinating similiarities and also principle of the data clustering is required to design. The last phase is selecting the right threshold, after which two files are similar. The application was created using object-oriented Java language. After the testing proposed application has reached 96,85% F-measure.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:
File Description SizeFormat 
BP_Sobehart_agregator.pdfPlný text práce1,61 MBAdobe PDFView/Open
A11B0485P-hodnoceni.pdfPosudek vedoucího práce296,78 kBAdobe PDFView/Open
A11B0485P-posudek.pdfPosudek oponenta práce293,49 kBAdobe PDFView/Open
A11B0485P-obhajoba.pdfPrůběh obhajoby práce205 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/13523

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.