Title: | Tvorba datových zdrojů pro bibliometrická měření |
Other Titles: | Creation of Data Sources for Bibliometric Analysis |
Authors: | Baratta, Štěpán |
Advisor: | Fiala Dalibor, Doc. Ing. Ph.D. |
Referee: | Dostal Martin, Ing. Ph.D. |
Issue Date: | 2019 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/37416 |
Keywords: | bibliografie;nosql;databáze;api |
Keywords in different language: | bibliography;nosql;database;api |
Abstract: | Cílem této práce je vytvoření rozsáhlého úložište obsahujícího data z různých datových zdrojů, které se zabývají sběrem publikačních a patentových bibliografických dat. Součástí práce je také umožnění přístupu k této vytvořené databázi pomocí aplikačního rozhraní, které poskytuje metody pro dotazování. Ve výsledném řešení byla použita nerelační databáze MongoDB a pro komunikaci s ní byl použit programovací jazyk Java. Podařilo se shromáždit přes 200 milionů záznamů ze 4 datových zdrojů, zejména z publikační databáze Microsoft Academic Graph. Z amerického patentového úřadu United States Patent and Trademark Office bylo získáno přes 3 miliony záznamů. Další část práce se zabývala vytvořením aplikace pro administraci datových zdrojů, která také umožnuje předzpracovávání dat a jejich nahrávání do databáze MongoDB. Jako nadstavba byla vytvořena webová aplikace, demonstrující fungování aplikačního rozhraní, umožnující jednoduché vizualizace výsledků. Jako součást měření byla provedena analýza hlavních datových zdrojů. |
Abstract in different language: | The main purpose of this thesis is to create a large repository concentrating data from various publicly available databases which store bibliographic information related to intellectual property rights. One part of this work focuses on enabling access to the created repository using an application interface, providing methods for querying. In the final solution, non-relational database MongoDB was used and Java programming language was used for communication with the database. Over 200 millions of records were acquired from multiple data sources, mainly from publication database Microsoft Academic Graph. Over 3 millions of records were acquired from the United States Patent and Trademark Office. Another part of this work focused on creating an application for administering the data sources. It also enables for data preprocessing and loading data to the MongoDB database. An additional web application was created to demonstrate the functioning of the application interface, enabling for simple visualization of the results. An analysis of the main data sources was created. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
thesis.pdf | Plný text práce | 4,43 MB | Adobe PDF | View/Open |
A17N0061Pposudek-op.PDF | Posudek oponenta práce | 348,54 kB | Adobe PDF | View/Open |
A17N0061Phodnoceni-ved.PDF | Posudek vedoucího práce | 473,02 kB | Adobe PDF | View/Open |
A17N0061Pobhajoba.PDF | Průběh obhajoby práce | 195,47 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/37416
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.