Title: Systém porovnání studijních programů českých univerzit
Other Titles: System for comparison of study programmes of czech universities
Authors: Hospaska, Martin
Advisor: Ježek Karel, Prof. Ing. CSc.
Referee: Fiala Dalibor, Doc. Ing. Ph.D.
Issue Date: 2017
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/27144
Keywords: univerzity;crawler;porovnání předmětů;webové stránky;uložíště dokumentů;elasticsearch;jsoup
Keywords in different language: universities;crawler;courses comparison;web pages;document database;elasticsearch;jsoup
Abstract: Výstupem této práce je aplikace webového crawleru a vlastní webové stránky, které slouží pro zobrazení dat získaných pomocí crawleru. Součástí práce je rovněž vybrané datové úložiště sloužící pro uchovávání a vyhledávání v~uložených datech. Po nasazení této práce na veřejně přístupný server je tak možné zájemcům o studium na vysoké škole nabídnout unikátní systém pro porovnávání předmětů vybraných univerzit. Text práce popisuje způsob vytvoření a následné využití kolekce předmětů vyučovaných na vybraných vysokých školách v ČR. Zaobírá se jak samotným stahováním informací z webů univerzit, tak jejich uložením v databázi a následným porovnáváním předmětů pomocí vytvořených webových stránek. Čtenář se v textu práce dozví, jakou strukturu mají webové stránky vybraných univerzit a jakým způsobem lze sestavit webový crawler, který dokáže z těchto stránek získávat data. Dozví se také o možnostech, jak stažená data uložit a následně s nimi pracovat. Pokud by si čtenář přál vytvořit webové stránky zobrazující stažená data, i o tomto se v textu dočte.
Abstract in different language: The goal of this diploma thesis is to create a web crawler and corresponding user interface, which presents the data obtained from the crawler. The created project also consists of a data storage used for preserving the retrieved data from the crawler. Target users of this platform are students. The aforementioned system should help them with comparing units taught at different universities. For this, the platform needs to be deployed and available on the public network. This paper describes how the units are collected using the implemented crawler and how the collected data are interpreted. For this, courses at selected universities in the Czech Republic are used as testing data. In more details, the process of downloading the information from universities pages and storing it in the data storage is explained. Finally, the way how the collected data are compared is described. In the scope of this thesis, the structure of pages of selected universities is described and the steps how to create a custom web crawler to collect data from these pages are given as well. The reader can also learn about different ways how the data can be exported. The steps how to create a custom user interface presenting the collected data are also given in the thesis.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
Hospaska_Martin_A15N0039P_DP.pdfPlný text práce1,89 MBAdobe PDFView/Open
A15N0039Phodnoceni-ved.PDFPosudek vedoucího práce331,64 kBAdobe PDFView/Open
A15N0039Pposudek-op.PDFPosudek oponenta práce664,62 kBAdobe PDFView/Open
A15N0039Pobhajoba.PDFPrůběh obhajoby práce218,81 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/27144

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.